关于“中国每小时可支配所得购买力比印度低”的探讨

原帖在:https://pincong.rocks/article/item_id-1132663__notification_id-1106393

里面@感謝習近平 转述了多伦多方脸的一个算法,得出了标题的结论,我找到了视频,在这里:https://www.youtube.com/watch?v=YZNZ2U1ttSQ


看了一下,槽点很多…………要讨论的话,要耗费很多时间去查数据,本不想回了,不过还是有点忍不住,毕竟这个结论有点反直觉,人之患在好为人师,说的就是我啊……

要写这篇文章挺费时间的,还好我今天闲的蛋疼。不过费了这么长的时间我也不甘心只做个回复,干脆新开一贴好了。

简单说,多伦多方脸的算法问题在于:

一)数据来源不统一;时间不统一;数据标准不统一;统计口径不统一。
他图中截取的average annual hours worked per worker是2017年的数据,而且里面没有印度,也没有中国,他另找了一个其他来源的印度工作时间,而且是2022年的;中国也另外找了一个信源,而且统计的是“周工作日”,他再换算成天。
你实际查一下就知道,即使都是average annual hours worked per worker,不同信源的数据都有不同,所以同一个数据采集自不同的来源,这会带来一定的误差。

后面他计算收入的时候,也用的不是2017年的,要拿来对比,我认为应该找一个同时包含中印的数据,并且用同一年的数据对比,会更好一些。

比如我查到了这个:https://clockify.me/working-hours
这个数据里同时有中国和印度,并且数据也比较新,是2023年的。但是在这个数据里,中印的数据是这样:
中国:2392
印度:2480
也就是说这份数据中,印度人的工作时间还超过了中国人。

同样的错误发生在在计算“人均每小时可支配收入”的时候。
在计算“可支配收入”的时候,他用的数据是“2023年阿根廷预估家庭可支配收入”,这里不仅是“预估”,而且是“家庭可支配收入”,然后他去除以阿根廷人口,显然这个数据是错误的。

而在计算中国数据时他采用的是“中国官方发布的2022年人均可支配收入

在印度方面采用的是“2022-2023年度人均国民净收入

你用错误计算的阿根廷2023年人均预估收入,去对比中国的2022年人均可支配收入,与印度的人均国民净收入,又有什么意义呢?这能比出个啥??


二)算法本身的问题

我们现在知道了他的算法,就可以自己来算了。
他的算法是:用人均PPP/人均GDP,代表物价指数;用人均可支配收入/人均工作时间,代表单位时间收入;最后用后者/前者,得到购买力指数,数据越大代表单位时间工作收入的购买力越强。

我们分别来找这四个参数,并且遵循两个原则:
1,尽量使用同一年的数据,如果做不到,那么至少符合下一条
2,所有国家的同一个参数务必来自同一个信源的同一张数据表格里,避免不同信息来源带来的数据偏差

为了对比,并且证明我说他的算法有问题,我们还增加了几个其他的国家,美国、日本、韩国,分别是世界第一强国,东亚第二大国,和东亚/世界TOP3工作时长国家,另外删除视频中对比的阿根廷,因为我没有找到包含阿根廷的人均可支配收入数据的全面的数据表

以下是数据和信源

1,2022年人均PPP(国际元),数据来自世界银行:https://data.worldbank.org. cn/indicator/NY.GDP.PCAP.PP.CD
中国:21476
印度:8379
美国:76399
日本:45573
韩国:50070

2,2022年人均GDP(现价美元),数据来自世界银行:https://data.worldbank.org. cn/indicator/NY.GDP.PCAP.CD
中国:12720
印度:2389
美国:76399
日本:33815
韩国:32255

3,2022年人均可支配收入,这个是最难找的数据,数据来自TradinEconomics
https://tradingeconomics.com/country-list/disposable-personal-income
但是这里面的单位非常混乱,有的是人均(比如中国),有的是总数(比如印度)还需要计算一下。
汇率数据来自xe.com
中国:49283人民币(2022-12,按当月1日汇率换算为6934美元)
印度:272995370(百万卢比)/1425775850(人口,数据来自联合国估算)=191471卢比(2022-12,按当月1日汇率换算为2354美元)
美国:也需要计算,过程略,约为61069美元
日本:449000日元(2023-8,按当月1日汇率换算为3154美元)————此处数据存疑,我认为小数点点错了,应为31540美元比较合理,后续按照31540美元计算
韩国:计算过程略,数据为2022-12,按当月1日汇率换算为32400美元

4,2017年人均工作时间。数据来自:
https://en.wikipedia.org/wiki/List_of_countries_by_average_annual_labor_hours#cite_note-:0-1
(实际上是整理自:https://ourworldindata.org/working-hours)
中国:2174
印度:2117
美国:1765
日本:1738
韩国:2063

然后,我们就用手头的数据,代入公式:(2022近似人均可支配收入/2017人均工作时间)/(2022人均PPP国际元/2022人均GDP现价美元)最后得到所谓的“人均小时可支配购买力指数”是这样:

中国:1.89
印度:0.32
美国:34.6
日本:13.47
韩国:10.12

所以我们得出了什么结论呢?
1,中国“人均小时可支配购买力”是印度的5.9倍
2,美国是中国的18.3倍
3,日本是中国的7.12倍
4,韩国是中国的5.35倍
5,美国是日本的2.56倍

怎么说呢………………
首先,彻底推翻原视频的结论,我们也看到了,从不同的信源拿数据,误差有多大,而在相同信源中,中印工作时间是差不多的,而人均可支配收入是差很多的。
其次,你要说美日韩之间有这么大的差异,我觉得不合理,各位葱友怎么看?

所以总的来说,我认为这个算法并不合理,算出来的东西没有参考意义。

至于为什么不合理,我觉得主要是因为PPP已经根据购买力调整过了,而人均可支配收入是一个误差非常大的数值,远没有人均净收入更准确(当然按照方脸的说法,净收入又不足够揭露事实的真相),这样经过多次的累积计算,得出的指数基本上失去了参考价值。

如果有谁比我还闲的蛋疼,可以试着计算一下欧洲德法意西这几个典型国家,估计数字更离谱。
10
分享 2023-11-07

71 个评论

老同志拉拉杂杂这么多连个数据分析也没有

这可比不了刚来的小留学生

他/她都知道贵党数据会让计算模型崩溃(data science课堂作业)

要发言请先登录注册

要发言请先登录注册