童振東 (陳主新) 標竿人生: 政治學傳統統計方法

2015年3月21日星期六

政治學傳統統計方法

政治學傳統統計方法

1031213王道一：三位政治學者事前彌封送交主持人的台北市長選舉預測及其根據：
1. 洪永泰教授（臺大政治學系退休教授）：柯52%、連47%、其他1%
第一種方法是分析每個里的政治版圖，據以計算催票率。然後按照「空中vs. 地面」的票源比例加入民調(空中)結果。最後按照人口數加權。第二種辦法是使用民意調查。但是，民意調查只能涵蓋部分選民(台北市大概是65%)，所以必須考慮無法涵蓋的人。這邊，洪老師根據經驗的主觀猜測是有一半未涵蓋的人不會投票，剩下的人藍綠各半。因此，用65-35加權結果是柯53%、連46%，與第一種方法的結果相近。
[Joseph短評：這是最傳統的統計預測方法，對於這次台北市蠻準確的，但是依賴「經驗主觀猜測」未涵蓋的人的投票傾向，因此遇到舊經驗不適用的「新情況」時，可能就只好憑感覺了。]
2. 蔡佳泓教授（政大選舉研究中心主任）：柯50.87%
進行多層次分析(hierarchical analysis)來改良傳統的回歸模型。然後採用貝氏方法來根據現有資訊來更新我們對於母體參數的估計：用蒙地卡羅模擬馬可夫鏈的方式拆解估計複雜的條件機率。
貝氏估計的柯文哲得票率分配介於40-60%之間，中位數在50.87%、大幅低估最後結果。
不過，分配確實有一個較小的第二高峰在接近57%的地方。
[Joseph 短評：貝氏統計改良傳統統計學的缺陷，但是最終的結果會受到你所選擇的「先驗假說」影響。這可能是本次在三個預測中最不準的緣故。]
3. 洪耀南執行長（未來事件交易所）：柯53.9%、連42.8%、其他1%
採用未來事件交易所選前十天封關的得票率預測市場價格，來自於十八萬註冊會員中一萬名左右交易活躍的會員：柯53.9%、連42.8%、其他1%。
[Joseph 短評：採用預測市場收集眾人資訊，是最「簡單」的辦法，但是有兩個潛在問題：第一，只有十八萬註冊會員看得到市場價格，而其中只有一萬人參與交易。其他還不是會員的人即使有內部資訊，也無從得知目前預測市場價格偏離基本面、有獲利空間應該加入套利、修正價格。第二，由於採用假錢市場，因此不容易抵禦有心人士的操弄(不過會前跟洪執行長簡短交換意見中得知，價格對外公開的話，網站流量會大幅增加，使得維護與頻寬租用成本大增。) ] http://politics.ntu.edu.tw/?p=13114
洪老師對後輩預測方法的評論：
1. 佳泓的理論很好，但是現在是預研中心主任，應該多碰點實務了。
2. 未來事件交易所的「專家」到底是哪些人？(洪執行長指出這些人來自五湖四海、預測準確的專精領域也各不相同，但是有辦法在所下單的市場上準確率超過90%有三百多人)

EATON：所以，本次機率統計法可能存在不小偏誤，輸了傳統統計方法。若考量洪老師「主觀猜測是有一半未涵蓋的人不會投票，剩下的人藍綠各半。」調整為「剩下的人綠56%」(用iterative cut-and-try，逐步調整)，那豈不是更接近57%？
若事前並無足夠證據證實「民調無法涵蓋的人跟民調問得到的人有很大的不同」時，「依經驗估計」或「用民調問得到的人」哪個估計數會比較好呢？若無法否定兩個母體的投票行為不同，是不是就應接受一樣？
我的逐步調整的意思是，先把第一次的加權數當作「民調無法涵蓋的人」參數值，然後再將新加權數再重新代入，iteration幾次，直到差異收斂到最小。

既然「民調無法涵蓋的人跟民調問得到的人有很大的不同」，那如何在事前評估哪個參數比較好？「依經驗估計」或「用民調問得到的人」？有甚麼證據能證明，這兩個母體的投票行為不同呢？若沒有證據，是不是就應接受一樣。我的逐步調整的意思是，先把第一次的加權數當作「用民調問得到的人」參數值，然後再將新加權數再代入，iteration幾次，直到差異收斂到最小。

沒有留言:

張貼留言

2015年3月21日 星期六

政治學傳統統計方法

沒有留言:

2015年3月21日星期六