收集到資料,又經分析整理後,就要進行推論了。統計推論(statistical inference),與數學中的推論大不相同。在數學裡,於給定某些假設下,按邏輯推導出某結果成立。至於所謂成立,是毫無例外的成立。除非推導過程中有誤,否則就不會找到反例。另一方面,若能找到反例,就表當初的推導過程中,必有錯誤。統計推論則是依據所收集到的資料,對某未知的事物,給出結論。結論包含很多種,如估計、預測及假設與檢定等。同樣的資料,因使用的方法不同,或設定的條件不同,推論可以不同。因收集到資料的不同,推論也可以不同。統計推論並非證明什麼事是對的,也常無法對未來,給出明確且必定正確的預測。由於不像數學中的斬釘截鐵,因此屢有人對統計推論感到迷惑。底下給一些例子。
有人請你預測投擲2公正骰子的和。你列舉所有可能的結果,並附上對應的機率。即出現2,3,…,12的機率,分別是1/36,2/36,…,1/36。你覺得這便是正確的預測,學了統計,你知道給出任何單一數字的預測,在這裡意義不大。像是雖然7出現的機率6/36=1/6最高,但若預測將出現7,則錯誤的機率,高達5/6(=1-1/6)。有什麼必要只給一個數字的預測呢?你這樣想。但就是會有些人對你的預測不滿意,覺得如此不確定,印證了量子力學裡的“不確定性原理”(uncertainty principle,有人稱“測不準原理”)。但你相當確定,你所給的預測,看似不明確,卻是正確的。只是如黃文璋(2013) 一文所指出,人們向來喜歡明確,排斥不確定性。醫生如果很科學的告訴病人,你得A病的機率是1/5,得B病的機率是2/7,…,病人恐怕一個個跑光了,另覓更有權威的醫生。
會進入股市裡交易,當然是想獲利。一個眾所皆知的股票獲利原理,就是低價買進,高價賣出。但何時會有低價?高價何時出現?或者說,未來股價究竟如何?有辦法預測嗎?在林旭英譯(2014)一書裡,有底下一段:
高盛裡頭的數學專家,絞盡腦汁要透過各種運算法,找出必勝的交易策略,但真的這麼做的交易員,卻注定是輸家。“相信運算法,就是相信未來是可被預測的。”他說。但只要看看2008年股市崩盤時,高盛內部的狀況就不難發現,原先你以為可被預測的事,其實根本不能。
“他說”中的那個“他”,指的書中一位名叫薩吉的電腦專家,來自俄國。而高盛(Goldman Sachs)為總部位於美國紐約的一家跨國銀行控股公司(bank holding company)。對充滿隨機性的股市,企圖以數學方法,找出必勝的買賣策略,當然是有如緣木求魚。未來並非不可被預測,但如前述預測投擲骰子所得和之例,有時統計預測就只能做到某一地步。這點與數學裡,習於以一函數,對某變數在時間t,給一明確的值,乃完全不同。而依這種數學預測方式來做決策,便會如前述所引文字中的斷言,注定是輸家。相對的,統計預測,雖看似不明確,但常較一表面上明確的預測,能提供更有用的推論。
對質數的探討歷史悠久,人們曾試圖找出質數製造機。有了,函數f(n)=n2-n+41便是。你看,f(1)=41,f(2)=43,f(3)=47,f(4)=53,f(5)=61皆為質數。繼續用6,7,…,代入,還果真都是。終於f(41)=412-41+41=412不是質數了。樂透彩頭獎號碼能預測嗎?是否有明牌?有較常出現的號碼嗎?前仆後繼,不斷有人根據過去開出的號碼,造出預測公式。那些公式也真能產生“過去的”頭獎號碼。只是如果頭獎號碼乃隨機產生,則類如質數製造機,適用過去的公式,對未來可能完全無用。事實上,隨機產生的號碼,即各次相互獨立,且每次每一組號碼出現的機率都相同,是最難被預測中的。即使收集再多過去的頭獎號碼,對預測未來,均毫無幫助。只有各次開獎的結果不獨立,或號碼非隨機產生,此時收集到的資料,對預測未來的開獎,才會有幫助。附帶一提,如同樂透彩開獎之設計,若個人電腦、提款卡等之密碼,採隨機產生,則將最難被破解。當然,附出的代價,便是自己很難記得住。可參考黃文璋(2004)一文。
在黃文璋(2010) 一文中,有底下一段:
政府各部門,他們人口估計之有效期,有時根本不超過兩年:
經建會完成最新人口推估,台灣人口將從民國111年開始零成長,較兩年前推估值提前四年,…
這是99年8月17日中國時報的一則新聞。你看,才經兩年,估計值便得往提前四年。
對有關人口的估計,僅不過兩年,便得做大幅度的修正,那政府各部門,如何依據經建會提供的人口估計,來制定政策?事實上,量子力學泰斗,丹麥的波耳(Niels Bohr,1885-1962,獲1922年諾貝爾物理獎)早就說過,“預測很難,尤其關於未來。”常會聽到諸如“我早就知道”,…,世上多的是事後諸葛。但既然是預測,當然是指未來。對於隨機現象做預測,或做各種推論時,誤差難以避免。須以更好的方法,及更清晰的概念,以儘量降低誤差。如此所做的預測,及所做的各種推論,才可能有參考價值。
參考文獻
1. 黃文璋(2004). 隨機與密碼. 數學傳播季刊, 28(2): 3-17.
2. 黃文璋(2010). 政府的統計可信嗎? 黃家小館(http://huang.nuk.edu.tw/cindex.htm).
3. 黃文璋(2013). 談不確定性. 黃家小館(http://huang.nuk.edu.tw/cindex.htm).
4. 林旭英譯(2014). 快閃大對決─一場華爾街起義(Flash Boys: A Wall Street Revolt,Michael Lewis原著). 早安財經文化有限公司, 台北市.