2016年9月14日 星期三

數學人如何從隨機事件中決策?

  人人都懂得決策:落雨就帶遮,無落雨就不帶遮;肚餓就食,不肚餓就不食;考試低過90分就報補習班,不低過90分就繼續自習……做,還是不做,有個標準釐定。

  然而,標準有時很含糊,或帶有主觀色彩。例如:熱就開冷氣,不熱就不開冷氣。若只關係到你一個人在睡房熱不熱,當然你話事。但要是關係到一間公司過百位員工熱不熱,這倒影響重大。究竟,怎樣才算熱?

  要答這個問題,首先要答:怎樣量度熱?很簡單,找工具,用溫度計。然而,溫度計是如何量度熱的呢?這裡涉及一個映射的過程:由於酒精遇熱澎漲,因此可以藉溫度計酒精的長度,映射熱的程度。從此,熱的程度可以轉化成長度。

  量化標準,是決策中很重要的一步。使標準得以量度,標準黑白分明,灰色地帶盡量縮小。

  然而,要是事件涉及隨機因素的話,就算標準定得壁疊分明,結果也未必說得準。舉例說:你想查出一枚硬幣是否老千硬幣,如是者你連擲10次公字,得出9次公和1次字。你敢不敢說這就是一枚老千硬幣?不。雖然你會很懷疑,但仍是不敢斬釘截鐵的說,因為負碌擲中9公1字還是有可能啊!

  話雖如此,你仍是相信「這枚硬幣有出千」多過「這枚硬幣無出千」,因為畢竟九公一字,「出千的可能性」的確比「沒有出千的可能性」高。

  換言之,面對隨機事件,事情不再只有「是」或「否」般涇渭分明,是與否之間也存在了「可能是」。就好似Facebook搞活動,有些朋友選「出席」,有些朋友選「缺席」,但總有些朋友他媽的選「可能出席」。而在這班「可能出席」的蛋散當中,出席的可能性各有高低,例如蛋散甲比蛋散乙更有可能出席。

  長短,以長度表示,以直尺量度;輕重,以重量表示,以磅秤量度;可能不可能,以可能性表示,那麼,又以什麼量度?正是:機會率。

  機會率是一個由0到1之間的數值,若以百分率表示,則是大部份人熟悉的0%至100%。從日常生活的對話中,也會以0%代表無可能;以100%代表一定;以50%代表機會一半一半,「是」與「否」的可能性相同;罰球命中率90%的雷阿倫比60%的奧尼爾,更有可能射入罰球。應用層面非常廣。

  回到老千硬幣的例子,或許你會質疑:只擲10次當然不能作準,不如擲100次。問題不在於次數,就算真的擲100次,若硬幣沒有出千,舉例說擲中90次公10次字的機會雖微,但還是有可能擲到啊。當然,若然你要我示範,或許我窮盡一生也沒法子成功。可是,放眼世界,誰敢說自第一枚硬幣鑄出來以後,若全地球人都擲100字公字,沒有人會擲中90公10字?負碌就是負碌,機會雖微,但終究還是可能,尤其是屢敗屢戰的話。

  或許你又會質疑:10次不夠便100次,100次都不夠便1000次,1000次都不夠便10000次……然而,問題是:誰都「不可能」擲「無限」次。

  有人提出另一條思路,向物理學求救:仔細分析硬幣的結構,以決定硬幣是否老千硬幣。沒錯,這是對的。然而,要是出老千的不是硬幣,而是擲硬幣的人早已訓練有素,那麼如果仔細分析這個人呢?要出手相助的不僅是物理學,似乎還需要解剖學。由此可見,在某些情況,仔細分析內在結構,也是「不可行」。

  活於「不可能」及「不可行」的框架之中,簡簡單單的「是與否」,也不是隨便可以答得出來,0%和100%很罕見,誰說得準?曾幾何時,也有不少人深信人類能夠在天上航行的機會率為0%,也有人深信100%能夠與自己的伴侶白頭到老,誰說得準?

  這話題開始有點離地,正如知道現在的狀態就夠,別要我證明自己存在。生活未必需要0%才代表否,100%才代表是。老師說:狗有四條腿。你拿隻三條腿的畸胎狗出來挑戰,沒趣。狗有四條腿,語言上習慣如此說,其實不代表狗100%都有四條腿,而是「大部份」狗都有四條腿。

  怎樣才算「大部份」呢?機會率為多少,我們才習慣有「信心」地說「是」呢?在統計學上,普遍使用95%。

  暫停!為什麼將機會率扯到統計學去了?機會率處理隨機事件,試問統計學實實在在的,處理已發生的事,有什麼隨機好說?例如統計一下班中40位學生數學考試的平均分,那就將40個數加起來,再除以40,何隨機之有?那裡需要機會率?假若計到69分,那麼這40個數的平均分就100%是69分啊!

  沒錯。這個例子也好,稍為改動,便能感受機會率於統計學中的重要性:那麼全港學生數學考試的平均分呢?理論上,資料一樣能夠蒐集,但實際上,卻是「不可行」了。既然不便一窺全豹,那就只好以偏概全。從整體中抽取樣本,以樣本代表整體。這當然是不準確,但這就是抽樣調查,目的不是奢求100%準確,求的是求樣本盡量接近整體,準確度95%已心滿意足。

  回到全港數學考試平均分的設例,假設統計員隨機從整體抽出100位學生,並計算出100位學生的平均分。統計員當然不會奢望這100位學生的平均分,就徹徹底底等如全港學生的平均分。然而,通過運算,統計員卻能計出一個範圍:整體學生平均分有高達95%的機會率在這個範圍之中。舉例說:統計員計出的範圍是60分至78分,這代表:高達95%的機會率,整體學生平均分就在60分與78分之間。換言之,有了這個範圍,真相雖不中亦不遠矣。

  話雖如此,你或許又會質疑:全港近900,000名學生,僅僅抽出100位,也難保沒被抽出的八十幾萬名學生的分數,舉例說,可以是全部0分。既然如此,不就大大高估了嗎?這問題的答案就存在於機會率之中,數學人沒奢望100%準確度,只求95%準確度。要是沒被抽出的八十幾萬名學生真的全部0分,那就代表已陷入那5%裡,不幸啊!就好似用一枚沒出千的硬幣,連擲了九公一字,被當作是出老千一樣。這也揭示統計不是做了一次,便以後不用做。要作檢查呢!

  先寫到這裡。面對隨機事件,結果具95%準確度,「我都接受!」

沒有留言:

張貼留言