2015年3月21日 星期六

政治學傳統統計方法

政治學傳統統計方法

1031213王道一:三位政治學者事前彌封送交主持人的台北市長選舉預測及其根據:
1. 洪永泰教授 (臺大政治學系退休教授):柯52%、連47%、其他1%
第一種方法是分析每個里的政治版圖,據以計算催票率。然後按照「空中vs. 地面」的票源比例加入民調(空中)結果。最後按照人口數加權。第二種辦法是使用民意調查。但是,民意調查只能涵蓋部分選民(台北市大概是65%),所以必須考慮無法涵蓋的人。這邊,洪老師根據經驗的主觀猜測是有一半未涵蓋的人不會投票,剩下的人藍綠各半。因此,用65-35加權結果是柯53%、連46%,與第一種方法的結果相近。
[Joseph短評:這是最傳統的統計預測方法,對於這次台北市蠻準確的,但是依賴「經驗主觀猜測」未涵蓋的人的投票傾向,因此遇到舊經驗不適用的「新情況」時,可能就只好憑感覺了。]
2. 蔡佳泓教授 (政大選舉研究中心主任):柯50.87%
進行多層次分析(hierarchical analysis)來改良傳統的回歸模型。然後採用貝氏方法來根據現有資訊來更新我們對於母體參數的估計:用蒙地卡羅模擬馬可夫鏈的方式拆解估計複雜的條件機率。
貝氏估計的柯文哲得票率分配介於40-60%之間,中位數在50.87%、大幅低估最後結果。
不過,分配確實有一個較小的第二高峰在接近57%的地方。
[Joseph 短評:貝氏統計改良傳統統計學的缺陷,但是最終的結果會受到你所選擇的「先驗假說」影響。這可能是本次在三個預測中最不準的緣故。]
3. 洪耀南執行長 (未來事件交易所):柯53.9%、連42.8%、其他1%
採用未來事件交易所選前十天封關的得票率預測市場價格,來自於十八萬註冊會員中一萬名左右交易活躍的會員:柯53.9%、連42.8%、其他1%。
[Joseph 短評:採用預測市場收集眾人資訊,是最「簡單」的辦法,但是有兩個潛在問題:第一,只有十八萬註冊會員看得到市場價格,而其中只有一萬人參與交易。其他還不是會員的人即使有內部資訊,也無從得知目前預測市場價格偏離基本面、有獲利空間應該加入套利、修正價格。第二,由於採用假錢市場,因此不容易抵禦有心人士的操弄(不過會前跟洪執行長簡短交換意見中得知,價格對外公開的話,網站流量會大幅增加,使得維護與頻寬租用成本大增。) ] http://politics.ntu.edu.tw/?p=13114
洪老師對後輩預測方法的評論:
1. 佳泓的理論很好,但是現在是預研中心主任,應該多碰點實務了。
2. 未來事件交易所的「專家」到底是哪些人?(洪執行長指出這些人來自五湖四海、預測準確的專精領域也各不相同,但是有辦法在所下單的市場上準確率超過90%有三百多人)

EATON:所以,本次機率統計法可能存在不小偏誤,輸了傳統統計方法。若考量洪老師「主觀猜測是有一半未涵蓋的人不會投票,剩下的人藍綠各半。」調整為「剩下的人綠56%」(用iterative cut-and-try,逐步調整),那豈不是更接近57%?
若事前並無足夠證據證實「民調無法涵蓋的人跟民調問得到的人有很大的不同」時,「依經驗估計」或「用民調問得到的人」哪個估計數會比較好呢?若無法否定兩個母體的投票行為不同,是不是就應接受一樣?
我的逐步調整的意思是,先把第一次的加權數當作「民調無法涵蓋的人」參數值,然後再將新加權數再重新代入,iteration幾次,直到差異收斂到最小。

既然「民調無法涵蓋的人跟民調問得到的人有很大的不同」,那如何在事前評估哪個參數比較好?「依經驗估計」或「用民調問得到的人」?有甚麼證據能證明,這兩個母體的投票行為不同呢?若沒有證據,是不是就應接受一樣。我的逐步調整的意思是,先把第一次的加權數當作「用民調問得到的人」參數值,然後再將新加權數再代入,iteration幾次,直到差異收斂到最小。

沒有留言: