用统计学公式重新分析蓝白合民调数据以及调查方式存在的缺陷

假设支持柯侯配在选民中的比例为p1,支持候柯配的比例为p2,当分别选取N为调查样本数时(两党公布的民调似乎都是使用同一组样本,这使得两次抽样变得不独立,以下为了简化分析先假设抽样独立),二者的差值的误差应该为 
Z(CI)×sqrt(((1-p1)*p1+(1-p2)*p2)/N)  其中Z(CI)以CI为置信度的z-score, 由于两个组合的支持度无法事先得知,因此保守起见将p(1-p)取最大值 1/4,
使用以下程序计算置信度为0.95的取样结果差值的误差(参数n为样本数):
```python
import math
from statistics import NormalDist
def margin_of_error(n):
    return math.sqrt(1/2/n)*NormalDist().inv_cdf(0.95/2+0.5)

```

根据两党提供的六份民调数据算出以下表格:

日期      调查机构    柯侯        侯柯         差值      样本数    差值误差(极大值)
11-13        汇流       48.3%     46.10%    +2.20%     2046      ± 3.06%
11-14        联合报   41.00%   42.00%     -1.00%     1149       ± 4.09%
11-17        镜电视   46.60%   46.50%     +0.10%    1112       ± 4.16%
11-17        竞争力   46.01%   40.82%     +5.19%    1112       ± 4.16% 
11-17        民众党   44.00%   39.70%     +4.30%    1082       ± 4.21%
11-17        国民党   38.80%   38.20%     +0.60%    1484       ± 3.60% 

综上,按照双方签署的协议两个组合的比分是柯2点对比侯4点,既不是民众党主张的3:3,也不是国民党主张的1:5,但是需要说明的是以上假设两个组合的支持率是通过不重叠的两组样本进行调查,如果是同一组调查样本那么由于概率分布有关联性,难以计算出真正的差值误差,也就是这种调查方法不能计入到对比中来。
我查了下公开的4组非政党调查机构公布的调查方法,无一例外全部是同一组样本进行调查,推测两党内参民调大概率也没有进行分组独立调查。由于存在关联性,这6组民调数字也根本不具有统计学意义上的参考价值(从评估柯侯与侯柯差异性的角度)。因此如果两党要继续进行蓝白合民调的话,必须要分出独立的两组样本分别调查柯侯与侯柯的支持率,然后按照上面的方式计算差值误差,才能在统计学上说服广大选民
2
分享 2023-11-19

3 个评论

還是先給民眾黨篩選過的,去除了幾份不利的民調

這採樣時間也是跨度很大,每家都還不一樣

民調都是有加權的,不同民調加權方式還不一樣

本來就談不上"科學客觀"
这种重大政治问题用统计学误差来解决本身就是扯淡,双方都有自己的解释权,不过国民党棋高一着先让柯文哲签字画押再说,这样柯要反悔在中间选民当中的政治诚信几乎票掉光,就跟韩国瑜背弃高雄选总统一样,到时候完全可能中间选票要么不投要么投侯,浅蓝更是会全盘归队,最后柯只有靠铁板柯粉和抢民进党浅绿盘,到时候国民党还真有可能乱中取胜单独胜选。
>>这种重大政治问题用统计学误差来解决本身就是扯淡,双方都有自己的解释权,不过国民党棋高一着先让柯文哲签...

本身統計學誤差可以明確定義,用統計學誤差沒問題,只是可能有人貪婪狡猾,在民調抽樣上搞小動作,或出了結果又不承認。這樣倒不如一開始用談判方式確定誰正誰副。

要发言请先登录注册

要发言请先登录注册

发起人

状态

  • 最新活动: 2023-11-19
  • 浏览: 1555