總統選舉民調準不準?!掀牌囉~
自2017年起,中央研究院調查研究專題中心(以下簡稱本中心)即開始建立起 固定樣本 網路調查會員資料庫(online panel)。這些會員來自於本中心歷年所執行的、具全國代表性的機率抽樣調查,包括面訪調查、電話調查及手機簡訊線上調查等各種模式,徵詢完成調查的受訪者,是否願意成為會員、參與後續的線上問卷調查。因此,我們的會員樣本全然具有機率樣本(probability-based)優點特質。除此之外,這些會員來源的研究計畫領域相當多元,包括社會、政治、傳播、法律、公衛、環境科學等;而會員的黏著力也相當高,單一調查的問卷完成率落在40%~55%之間。迄今,會員人數共計為4.6萬人。
在今年1月進行總統選舉投票前,本中心有幸因應委託案而在選前以會員樣本執行了二次總統選舉線上調查(以下簡稱A、B計畫)。在徵詢委託單位的同意後,在此跟大家分享一下我們這二次的總統民調結果!當然,分享前要先吊一下書袋,檢閱相關的學術論點。其中,美國民意研究學會(The American Association for Public Opinion Research, AAPOR)在2016年成立任務小組,專責探究機率與非機率固定樣本線上調查之方法論,其在2022年發表的文章中指出,由於目標母體的基本人口特徵(如年齡、性別、教育程度等)是容易取得的資訊,故常被拿來做為修正偏誤(bias)的輔助變項;然而,這些變項並不保證與研究變項具有高度相關,甚或這些變項是否已包含了所有應納入的輔助變項。此外,大量的研究也發現,不論是機率樣本或非機率樣本,僅採用人口特徵變項來調整,並不足以修正偏誤,而應採用與研究變項「高度相關」的輔助變項來修正偏誤。
基於前述論點,我們在完成總統選舉選前調查後,將A、B兩個選前調查運用臺灣母體人口特徵變項之性別與年齡層(年輕會員略多一點)及A計畫選前調查詢問題_2020年總統投票抉擇(與本次研究變項高度相關)做為加權校正的輔助變項。處理程序說明如下:
1. 先以臺灣基本人口變項之性別及年齡層做事後分層加權調整(poststratification adjustment);
2. 再利用A計畫詢問題_2020年總統選舉投票抉擇之各組候選人支持率與當年總統選舉實際得票率之差距比,做為投票調整權值,進行加權校正。投票調整權值的計算方式,如下所示。
AB兩計畫的原始調查結果及加權校正後結果,如下表所示;而加權處理後,各黨候選人的支持度以紅字表示。若對照右邊的實際得票率,本中心加權後的估計值準確度高,結果相當漂亮呢!
參考文獻
The American Association for Public Opinion Research. 2022. Data Quality Metrics for Online Samples: Considerations for Study Design & Analysis. AAPOR.
撰文:侯佩君