對於一般選民來說,五花八門的民調數字是掌握選情的主要窗口。對於調查研究的專業社群來說,由於選舉會出現一翻兩瞪眼的最終結果,也是測試各家調查方法準確性的絕佳機會。有趣的是,台灣社會對民調抱持有一種「又期待又懷疑」的矛盾態度。
民調在台灣不僅是預測工具,甚至成為政黨提名的基礎,藍綠兩大黨採用民調作為初選工具,前陣子藍白合的鬧劇也環繞在民調規則的課題。即便在民調技術高度發達的美國也未見這種現象。然而另一方面,每當大小民調公布時,坊間也常跑出假民調或是民調ㄊ一ㄠˊ的質疑。
就筆者所知,臺灣多數定期發布民調的機構都具有一定的專業水準,雖然預測能力各有千秋,但應當並無許多人所懷疑隨意編造數字的情形。然而各機構分歧的數字的確讓許多關心政局的民眾感到疑惑。隨著法定民調封關日即將到來,筆者嘗試在此對民調本身內涵的問題做一些簡單說明。
當代民調怎麼做
民調核心的課題是如何抽取樣本以預測母體,也就是全體選民的投票意向。由於從「全體選民」中直接抽樣基本上是不可能的任務,因此必須仰賴底冊,所選取底冊與人口結構是否相符,是任何專業調查機構面臨的第一個課題。然而隨著通訊方式的快速變遷,如何建構底冊也成為重要挑戰。在住宅電話為主要通訊工具的時代,以電話簿搭配隨機跳號就可以取得吻合母體結構的樣本。
隨著手機的普及以及世代間通訊方式的落差,年輕人在家中普遍不具接聽住宅電話習慣,甚至許多家戶也沒有住宅電話而完全使用手機與網路通訊。以筆者對調查實務的理解,在沒有特別要求家中年輕人接電話的情況下,住宅電話抽樣甚至出現半數回答者是老人的情況。如何因應這個傳播趨勢成為各個調查機構重要的挑戰。最常見的做法是加入手機調查採取雙底冊的模式。
然而雙底冊模式仍然有幾個挑戰。首先,傳統住宅電話由於資訊相對完整,長期發展下對於接聽模式與實際支持關係等課題也累積相當完整資料,在分析上有清楚的依據,而手機的接聽模式、門號分布等則仍缺乏完整的依據。第二個課題則是手機與市話就應採取何種比例,目前並沒有一致的共識。學界公認的黃金標準是先透過住宅電話以戶中抽樣方式平衡掉接電話機率不等的現象,再加入無住宅電話的純手機族的手機樣本。然而這個做法由於成本高昂,主要還是學術機構使用。
目前坊間則是採取各種比較便利的折衷方案,方法從純手機(ET today)、純住宅電話(美麗島電子報)、各占一半(TVBS)、手機七成市話三成(匯流)、到手機三成市話七成等做法均有。對於何種做法為佳尚缺少完整學理依據,所憑藉的是各單位的經驗。除了電話外,嚴謹的網路調查也開始出現。與徒具噱頭的網路投票不同,嚴謹的網絡調查是先邀請大量民眾加入資料庫,再從資料庫中抽樣發送網路問卷。這個做法的準確性則高度仰賴一開始資料庫收集會員的程序。包括東森新聞雲以及菱周刊採取這個做法,目前所見預測能力也不遜於傳統電訪。
對於樣本偏離的問題,除了底冊的改變外就是仰賴加權。臺灣民調機構所發布的數字其實不是調查的原始數字,而是加權過後的數字。需要加權的原因在於不管採用手機或是市話,樣本均很難吻合母體,特別是年輕人無論住宅電話或是手機回答比例均普遍偏低。因此為了要校正這個誤差,各民調機構普遍發展出自己的加權公式。標準的作法是將樣本根據年齡、性別與戶籍地等母體資料比例進行校正。但究竟如何校正往往牽涉各家的「商業機密」,民調機構並不隨意公開,外界也難檢視加權的確實作法。
然而是否透過雙底冊與加權就高枕無憂了呢?實證結果也並不支持這樣的看法。2021年台大政治系洪永泰教授發表一篇論文(洪永泰,2021,〈雙底冊電話調查的估計成效評估:以選前調查為例〉。《選舉研究》28:2。頁95-125)挑戰了加權與雙底冊的預測效力。洪教授以2016與2020年總統大選的結果和民調原始資料比對,比較了選前未加權的住宅電話調查、加權過後的住宅與手機電話調查以及手機與住宅的雙底冊調查三種調查模式,結果發現未加權的住宅電話調查,這個原先預期最偏離母體的抽樣方式竟然估計成效最好,對結果預測效力最高。
相對的,無論市話手機雙底冊或是住宅電話加權,與最終結果的偏離程度都較大。進一步檢視這篇論文的數據,可以發現對各種方式對蔡英文的估計都沒有太大落差,手機會低估國民黨得票,而最明顯的落差則出現在對第三勢力的估計,也就是宋楚瑜的得票高估程度。無論如何這個結果顯示出民調機構對於如何因應通訊方式的變化仍有許多關卡需要克服。
到底準不準
大眾對於民調的關心通常會回到一個根本問題,就是到底準不準。除了前述抽樣與加權外,民調準不準還面臨一個更根本的挑戰,也就是不同政治傾向者是否有相同的受訪回答機率。這個課題有兩個面向。首先,由於調查時間與方法的限制,不同職業或生活型態的人被訪問的機率常常並不一致。以住宅電話而言,準時上下班的白領與公教受訪的機率會顯著高於晚間仍要在外工作的自由業與輪班勞工,如果兩類人政治傾向並不一致,就會產生誤差;而目前手機與網路調查中鄉村地區的樣本則明顯偏低,產生受訪者過度集中都會區的現象,也限制了結果的正確性。
另一方面,可能由於威權遺緒,民進黨支持者在以往普遍較不願意回答民調,也因此2010年之前民調機構在做選舉預測時普遍將民進黨民調加成來計算真實支持率。然而從2012年總統大選馬蔡對決開始,民進黨支持者較不願意表態的現象明顯消失,表態的落差主要出現在調查機構特別是媒體的機構效應;綠營選民全面性的隱藏投票意向的現象成為歷史。相對的,由於臺灣的媒體政治立場分明,不同政治立場的受訪民眾也很可能基於對調查機構的好惡而有不同的表態率,也造成親藍媒體與親綠媒體在調查結果上的明顯落差。
以調查實績來說,目前這些多樣的調查方法可說各有千秋,尚未看到哪個方法具有明顯預測上的優勢。另一方面,加權與抽樣程序中許多部份是各家機構不公開的商業機密,外界也無從進行評估。大體而言,個別調查的預測能力較為受限,但多數民調機構所呈現的共同趨勢則對選舉結果具有相當高的預測力。
在2012年總統大選,馬英九在選前絕大多數民調中都持續保持小幅度領先,而儘管很多人懷疑綠營是否有隱藏選民,最終也如預測以投票權人口的4.5%的幅度獲勝。2018年的「韓流」出現時,韓國瑜在選前一個月幾乎在所有民調中均領先,當時許多人懷疑綠營長期執政的高雄真有可能選出一個眷村出身的藍營市長,但開票結果顯示多數民調的預測是正確的。個別民調或有預測力差距,但背離整體趨勢的結果其實並不多見。
除了抽樣、底冊以及不同的表態傾向外,選制的影響也是一個關鍵課題。臺灣投票是以戶籍為基礎,不具不在籍投票制度,與國外登記制最大差異是不在籍選民必須返鄉投票。也因此是否在籍會顯著影響投票率,是否因此導致手機調查準確度沒有比住宅電話高。此外加權過程中預設不同性別、不同地區以及所有年齡層投票率一致,但就真實情況中未必如此。如果不同群體間出現明顯投票率落差,也會影響估計的結果。
結語
法定民調封關日在即,要如何解讀民調的結果?
由於各家取樣及加權方式有很大差異,避免將不同單位民調的結果直接比較,也避免對單一民調過度解讀。綜合各家呈現的趨勢是比較可靠的方法。除了個別民調機構發布數據之外,國外如美國知名的政治預測網站five thirty eight也以貝式統計整合各家民調而做出預測。如果不同單位發布的民調呈現相似的趨勢,一定程度可以推論選民反應出現變化。
相對的,如果某些趨勢只有在個別機構的結果中出現,就有留意是否來自於該機構特殊的取樣方式或機構效應。特別是台灣媒體喜歡就單一民調中特定小群體(性別、年齡、地域)的結果做解讀,雖然很具流量,但就統計上幾乎不具意義。同時,媒體特別是名嘴喜歡就民調數字起落的數字解讀為支持度的升降,並連結到同一時間的特定事件,也很可能為對抽樣誤差過度解讀。相對於媒體所呈現的聳動討論,筆者建議直接就整體趨勢進行觀察。Wikipedia對於台灣總統民調有非常完整且即時的整理,筆者建議關切選局的朋友不妨直接看整體數據分布而跳過媒體加油添醋的分析。
如果就整體民調趨勢的觀察,在11月底藍白合破局後幾乎所有民調不管調查方法為何都是賴蕭配保持領先,僅有一份呈現出賴蕭與侯趙配平手,但領先幅度則隨調查機構有所差異,其中許多份民調差距則在抽樣誤差範圍內。這意味著賴蕭雖然具有顯著較高的當選機率,但考量到前面所提到民調所蘊含諸多不確定性,差距也尚未達到足以推論對手無法翻盤的情況。
而儘管筆者認為賴蕭配獲勝機率較大,但也有兩個無法排除的變數。首先是各年齡層投票率的可能落差。在2020年選舉中年輕人的大量投票是幫助蔡英文取得史上新高票數的重要動力。相對地在2016年的選舉中年輕人投票率則顯著低於其他年齡層。如果這次年輕人投票率如同2016年般偏低,固然首當其衝是高度仰賴年輕選票的柯文哲,但由於民調整體趨勢也顯示賴蕭相對於侯趙在年輕選票上佔優勢。如果年輕人投票率偏低,不無可能會抵消賴蕭配在民調上的優勢。第二則是前兩次一面倒的選舉中藍營都有出現隱藏性選民,儘管此次情境有很大差異,但無法完全排除此次選舉仍有不願表態的藍營選民。
久違的緊繃選舉對所有民調機構而言都是久違的挑戰。然而就民主政治的發展而言,選舉本來就不是單純的競選與調查技術課題,在這意義上,民調僅應是輔助性工具,真正重要的還是競選過程中公民與政治領袖的對話過程。無論選情是緊繃或是一面倒,投票作為民主政治中公民價值的展現不應被預測的技術問題所遮蔽。
作者為政治大學社會系教授
- 對美國選舉結果的幾個觀察(二) - 2024 年 12 月 12 日
- 對美國選舉的幾個觀察 - 2024 年 11 月 14 日
- 一個被遺忘的課題──六都體制再檢討 - 2024 年 10 月 17 日