对品葱知名用户天下无贼点赞记录的数据分析

首先声明: 笔者和@天下无贼 并无个人恩怨,虽然在若干话题下,我跟天下无贼有过不甚愉快的互动,我对天下无贼立场、观点、讨论方式、对线策略等,也不能完全认同,但笔者坚定的支持按照个人意愿,在遵守论坛使用规则的前提下,参与品葱的各种讨论的权利。以下分析单纯是出于个人兴趣,而且数据获得是品葱公开的用户数据。 笔者在分析结果的展示中,会尽量避免个人的主观意见,单纯的展示数据和分析结果。 如果本文章违反了论坛使用规定,或者伤害到个人情感,可以开诚布公的告知我,我会酌情修改/删除。 谢谢。

notes: 如果有人感兴趣, 想要进一步analyze,或者想要验证/复现此次分析结果,可以通过私信索要数据和代码。

Without further ado, let's begin. 


Section 1. 数据获取

在品葱的个人账号页面,选取了“送出的赞”,这一栏目数据作为此次分析用途。


https://telegra.ph/file/1e61feb753de666ebb478.jpg?width=1264&height=1231
原因如下:
1. 该数据栏目结构相对简单,不需要太过于复杂的数据清洗,即可获得结构清晰的数据源;
2. 该数据栏目包含赞(+1)和踩(-1),两类数据,可以反映用户使用行为的某些统计学特征;
3. 用户天下无贼在品葱高频度的活跃度,生产了不错的数据量,有助于提高分析结果的鲁棒性;

使用该数据集的不足:
1. 仅仅是反映了对于特定文章评论的方向性(binary)意见,因此分析仅仅停留在使用行为层面,无法深入到观点层面;
2. 在对使用行为的时序分析中,因为利用其他使用行为作为交叉分析,因此对时间尺度上的行为会有遗漏;
3. 点踩和点赞 只是用户意见的代理指标(proxy),可能无法反应用户的真实想法。

简单介绍下所使用数据集的概览(summary)

时间跨度:2021年9月5日 - 2023年10月31日
数据长度: 929条目
数据列目: 6列, 依次为 score赞踩数据(+1为赞,-1为踩, 0为点赞后又取消), user_name用户名(赞踩对象用户名), user_repu(赞踩对象声望值),user_vote(赞踩对象游戏币数), question_type(赞踩问题类型), question_id(赞踩的文章id)


notes: 数据清洗中,有一个很有意思的事情, 我发现品葱的该html页面对数据使用的分隔符为“•”,为十六进制的'\x95'特殊符号,并不符合UTF-8编码标准,因此在清洗过程中还给制造了一些小小麻烦,可能是因为笔者在html方面几乎白痴。

下面截图为清洗后的数据框概览:

https://telegra.ph/file/cc0b7fe50cab269a5c593.jpg?width=1112&height=745


Section 2.  赞踩行为单向分析结果

https://telegra.ph/file/c87c176c7b0ad6b632189.jpg?width=1177&height=799

从单纯的赞踩行为,可以看到,在929条赞踩数据中, 68.89%为点赞行为, 28.74%为点踩行为, 2.36%为点赞后取消行为。 

从赞踩数据的时序数据来看, 从2010年9月到2022年10月之前,赞踩数据都相对稀疏,进入到2023年之后,赞踩数据开始逐渐密集,尤其是2023年2-4月,2023年10月下旬,两个时间段的赞踩数据量占到了整个数据集的83%, 应可针对这两个时间段的国内外热点事件进行交叉分析。


https://telegra.ph/file/8122231487847f3d402ac.jpg?width=1093&height=625
按照赞踩记录的日期进行单日累加,并且对过去一周的赞踩行为进行了移动求和,得到了每日的周累计赞踩活动数据。 从上图可以看到一样的赞踩行为活跃度,此图标能更加方便identify到一些高密度的活动时期。

https://telegra.ph/file/79170241ffa8d0c29e5c6.jpg?width=1104&height=1039

讲单日活动数据和周累计活动数据放到一个视图下,可以更加明显的看到以上规律。 

以下为单日赞踩数据最高的前十个日期: 

2023-10-31 13
2023-10-20 13
2022-12-12 12
2023-10-22 11
2022-08-06 11
2022-09-05 10
2022-02-07 10
2023-02-27 10
2023-04-06 9
2023-03-14 9

可以看到2023年10月31日 和 2023年10月20日 均为为一天13条, 
其次为2022年12月12日,一天为12条, 以此类推


Section 3.  赞踩行为节假日活跃分析结果

在对赞踩数据进行时序分析之前,笔者先建立了一个2021年9月到2023年10月31日的日期时序作为数据框的index,然后将原始数据集中的活跃日期进行类别标签处理,再join到新建的数据框之中,这样就得到了一个每日活跃的新的数据列 Active, Active=0为当日未进行任何赞踩,Active=1为当日有赞踩行为。

然后对于每一个日期进行加节假日判断,产生新的两列数据, week_day和is_holiday。 在进行这项操作时,用到了由清华大学pip源提供的chinese_calendar包,对日期进行一键处理,这里点个赞。

下图为新的vote时序数据框的概览:
https://telegra.ph/file/118819d0d142855762cff.jpg?width=1086&height=924


比如数据的第一行2022年9月19日列, Active=0为当日不活跃, weekday='Sunday' 当日为星期日, week_sum=6 前一周累计赞踩数据为6, is_holiday=True当日为非周末节假日, holiday_name='mid-autumn festival' 当日为中秋节

根据以上数据集得到如下分析结果:

缺席率
清明节      80.000%
劳动节      78.571%
端午节      71.429%
公历新年   66.667%
国庆节     51.852%
中秋节     50.000%
所有日期  49.174%
非节假日  48.043%
春节        44.444%

按照缺席率来看, @天下无贼用户在清明节期间赞踩活跃缺席率为80%, 也就是过去3年的累计清明节天数中,有80%的天数,用户没有进行任何赞踩行为;

其次的缺席率为劳动节, 78.57%的劳动节假期,用户没有任何赞踩行为;

端午节为71.43%, 公历新年为66.67%, 国庆节和中秋节约为一半的缺席率。

而所有的非节假日中,用户的赞踩行为缺席率为48.04%

在所有的节假日中,春节的缺席率最低, 为44.44%


对于每周的工作日和双休日进行分析:

天下无贼用户在一周之内活跃量统计:

Friday           63
Thursday       60
Sunday          58
Tuesday         58
Wednesday    56
Monday         55
Saturday       50

以上结果中 该用户在星期五活跃度最高,在过去3年内,有63个周五产生了赞踩使用记录。
活跃度最高的第三名为周日,有58个周日都产生了赞踩记录。


以下为不活跃的weekday天数统计:

Saturday      62
Monday        58
Wednesday   56
Sunday         55
Tuesday        55
Thursday      52
Friday          49

可以看到最不活跃的为周六,有62个星期六没有产生任何赞踩行为,其次为58个周一没有赞踩行为,然后是周三。


从以上数据可以得出一个结论, 该用户在周日赞踩行为最为活跃,在周六的赞踩行为最为不活跃, 工作日中周四的赞踩行为最为活跃,周一的赞踩行为最为不活跃。

https://telegra.ph/file/6b1d61b9202eea2de2b20.jpg?width=1123&height=438

以上结果显示, 天下无贼一周赞踩累计,最活跃的周均在2023年发生, 其中2023年10月29日一周,发生44次赞踩记录, 其次为2023年3月5日一周,赞踩记录为41条。 


Section 4.  赞踩对象分析

因为品葱赞踩记录中,包含赞踩对象的用户名,威望,游戏币等信息,获得以下分析结果。

https://telegra.ph/file/5ea9ef752c2a4c36dd2a8.jpg?width=1107&height=637


上图为天下无贼累计点赞前十名用户,在所有点赞记录中, 用户@疯狂习近平获得了累计43条点赞, yogafire获得了17条点赞, 蘑菇云和王匪沪宁均获得14条点赞。

同理相反,可以获得累计点踩前十名用户:
https://telegra.ph/file/9d113b80f3470490e0177.jpg?width=1089&height=618

从上可以看到, @天下无贼 累计点踩次数最多的用户为@打狗棒专打共党,累次踩31次,  @事已至此先吃饭吧 累计被踩12次, 笔者本人也不幸上榜,被累计点踩5次,不过再次声明,笔者和@天下无贼 无个人恩怨,虽然经常意见相左。


下图为交叉赞踩行为, 也就是针对一个用户,点赞和点踩两类记录之和,产生@天下无贼对该用户的net_vote 净点赞数
https://telegra.ph/file/d2ff5c4d97fd9a80ca007.jpg?width=1098&height=666

对@事已至此先吃饭吧,有两次点赞,12次点踩,净点赞数量为-10, 对fb_china_today,有3次点赞9次点踩,净点赞数为-6




https://telegra.ph/file/dc2bcd7399c97f3263072.jpg?width=1101&height=855


Section 5.  Predictive Analysis 预测性分析


最后对@天下无贼 的净点赞次数(up_vote - down_vote), 进行了一个简单的SLR预测模型,模型采用的OLS线性回归方法,模型如下:


net_vote 净点赞数 = α + β1* user_repu 用户声望 + β2*user_vote用户游戏币 + ε

值得指出的是,以上模型中, user_repu和user_vote 两个数据存在显著正相关性,将两列数据放入模型中,可能引入多重共线性偏差(multi-collinearity bias), 但是因为模型自变量非常少,当前数据集中直接可用的量化质量只有这两个,况且计量经济学前辈John Tukey  曾经说过: multi-collinearity is god's will.  因此笔者还是选择使用两个自变量作为建模输入。 

以下为OLS回归结果:

https://telegra.ph/file/053c6574d27e402e42613.jpg?width=1090&height=900



从上述结果中可以看到,  x1自变量(用户声望 user_repu)对净点赞数有95%的统计学显著性, 用户声望每提高1个单位, @天下无贼净点赞数同时增加0.39次,  也就是说,用户声望越高,@天下无为用户越可能送出更多的净点赞数。 而x2自变量 (用户游戏币 user_vote) 并没有显著的预测效果。 整个OLS模型对于@天下无贼用的净点赞记录的预测效率仅为R-squared = 6.5%。


此次分析的不足和待改进之处环:
1.  仅仅使用了赞踩行为数据集,无法全面客观反应用户的实际观点,态度,行为方式等。
2.  接下来可使用text mining的一些技术手段,对留言/回复中的情绪方向进行处理和分析。
3.  整合此次分析中一个通用型框架,来对品葱任意用户进行赞踩行为分析。
4.  在遵守品葱用户使用行为规范的前提下, 使用网页爬虫手段来自动获取页面数据,进行清晰并形成结构化的数据集。
5.  优化提升分析结果展示的用户可阅读性。


结束。

再次声明,以上分析结果仅为笔者个人兴趣, 并非针对特定用户, 在结果展示中,也尽量只讨论分析结果,不做个人主观观点输出, “一千个人眼中有一千个哈姆雷特”, 葱油们如果能从笔者拙略的分析中,获得一些自己观点和见解,那是各位的权利和自由。 

谢谢各位,如果有任何批评,建议,问题, 可以在留言中互动。

再次声明,若本文伤害到某些葱油的感受,可以通过留言/私信 方式告知笔者。
50
分享 2023-11-01

87 个评论

哈哈 有意思 这就没了吗?
>>哈哈 有意思 这就没了吗?

还有还在编辑呢
哈哈,楼主和我有相同的习惯,就是对某人感兴趣,会去统计他的行为规律,不过我只对现实中的人,在现实中做记录和分析。

我发现研究人很有意思!能领悟体会很多东西。
首先感谢题主努力

用数据分析小同志们的行为是有趣的课题
在twitter用得很多, 我常说本站压力测试, 小同志领导努力都是颜色革命时候的助力一部分原因也在于此
既然出现了我的id

也就直说了

基于他的发言 逻辑 对CCP的态度,我高度怀疑他的身份 所以对乌贼 看到带有五毛倾向的帖子 每日必踩。

乌贼还以颜色
点踩我的回复。

这是一场暗战。哈哈
>>哈哈,楼主和我有相同的习惯,就是对某人感兴趣,会去统计他的行为规律,不过我只对现实中的人,在现实中做...


哈哈哈谢谢,单纯是突发奇想,随便练练手
大日本高科技 新注册用户 (待解除)
天下无贼的意思就是把全天下的反贼全杀光  这个北京太监坏透了
哈哈哈哈哈哈哈,学以致用!非常好。这位同学我要关注下,以后有机会可以合作搞点高大上的研究,数据我负责提供。
>>哈哈哈谢谢,单纯是突发奇想,随便练练手


我每隔一段时间,就会研究一个周围我觉得特殊的人,可能这人在别人眼里很普通,但是我能发觉这人非同寻常的地方,比如突出的智商情商方面的优点等等。
每经历过一个人的阶段性研究,总能有对人性人生新的体会,会有一种思想进化了的感觉。
过程有些费脑,甚至有时候都会觉得是一种类似强迫症一样的负担了,但每次总有一些感悟方面的收获,这是我的一个爱好。

所以有算命的人看过我手相之后,说我:思虑过度。
在品葱我最看不惯两个人:
1、王匪沪宁2、天下无贼,对王匪沪宁长篇大论的劝降书通常无视之,对天下无贼是能踩则踩。
题主一定是一位成功人士
>>题主一定是一位成功人士


过奖了,顶多是靠手艺吃饭,没啥成功不成功的。
>>哈哈哈哈哈哈哈,学以致用!非常好。这位同学我要关注下,以后有机会可以合作搞点高大上的研究,数据我负责...

感谢! 目前感兴趣一些开源项目,承德的那位同行给我很大启发和鼓舞。
看到给王沪宁点赞我就知道是那个公安黑皮狗天下无贼,王沪宁和黑皮狗乌贼这俩一个跟婊子一样软刀子外宣小骂大帮忙一个跟条狗一样死缠烂打,果然婊子配狗天长地久,匪裆搞破坏是多层次多方面的
不得不惊叹楼主为科学分析无贼兄的第一人,不过据我对他浅薄的观察看,他点踩最多的几个用户都是和他有较多争论的,比如@打狗棒专打共党 这位仁兄就经常嘲讽无贼,受到了他的重点针对,楼主最近也和无贼有过很多争论,他的点赞数据更能看出他的观点倾向
先给楼主点个赞,以后有项目可以合作。

单从数据来看,天下无贼不像职业网警,大概率是国内对现实不满又无奈同时习惯病态杠精的人,很可能是体制内某清闲单位,我大胆猜下是高校行政人员。 

总体来说,他对论坛也是负作用的。
>>在品葱我最看不惯两个人:1、王匪沪宁2、天下无贼,对王匪沪宁长篇大论的劝降书通常无视之,对天下无贼是...


降还是要降的,当然在中国这里投降了还可以跑到海外继续反
>>先给楼主点个赞,以后有项目可以合作。单从数据来看,天下无贼不像职业网警,大概率是国内对现实不满又无奈...


作为长期观察他的人 我有点发言权

他的言论主要点评国内政策但是不会上升到批评CCP和中央。偶或批评地方政府

对CCP 对包子等等 都是以捧为主。
对美日等明显在反。
他完全不会出现在乳包乳共的帖子。
最重要的是他的话术 很明显的有CCP文宣的味道
有可能不是网警 但也大概率是在文宣部门工作 他们也有类似的任务
>>哈哈,楼主和我有相同的习惯,就是对某人感兴趣,会去统计他的行为规律,不过我只对现实中的人,在现实中做...

能讲讲吗
有意思,不过他这个账号应该是他们部门公用的。
数据分析有点意思的。回归分析那块太过儿戏,帖主应该没有受过系统的计量训练。标题也令人费解,“使用”什么的“行为”?根据内容,改成为“点赞行为分析”更好。
>>既然出现了我的id也就直说了基于他的发言 逻辑 对CCP的态度,我高度怀疑他的身份 所以对乌贼 看到...


我来帮帮场子
>>既然出现了我的id也就直说了基于他的发言 逻辑 对CCP的态度,我高度怀疑他的身份 所以对乌贼 看到...


是的, 类似的常给他点赞打配合的做一些简单的网络拓扑分析 (centrality clique 之类)
不难认出来那些是小同志

https://telegra.ph/file/5ea9ef752c2a4c36dd2a8.jpg?width=1107&height=637
这都是颜色革命的参考数据集
天下无贼这个人绝对是专业五毛,职业水军。
>>数据分析有点意思的。回归分析那块太过儿戏,帖主应该没有受过系统的计量训练。标题也令人费解,“使用”什...


感谢大佬指教!!  本人确实对计量一知半解,仅仅学到ARIMA GARCH这个程度, 明白一些stationarity的基础概念, 不过都不扎实,也正希望认真的从头开始学习伍德里奇那本计量,还望大佬多给点指导! 品葱果然苍龙卧虎

还有回归那个模型,我确实是纯搞笑的,哈哈哈哈,我是赌大概品葱没有几个能看得懂,show-off 下 哈哈哈。。。
你们玩data science的也太闲了吧

这大概够一个期末projects交上去的程度了
>>是的, 类似的常给他点赞打配合的做一些简单的网络拓扑分析 (centrality clique 之类...



我也曾经观察过给他点赞的 前国家领导人名字的都是统一代号?
太高科技了,厉害厉害!我一般都是用最笨的办法:你敢说一句习近平傻逼么!?哈哈
>>我也曾经观察过给他点赞的 前国家领导人名字的都是统一代号?


点赞没关系

有专门的算法来分析这种交互

类似google早年的page rank可以比较准确的区别偶尔点赞还是故意配合
偶尔看过他的回复,每当有国内负面消息,他都给出一个看似客观理性的分析,得出这是一个正常事件,试图以此阻止大家的讨论热情。
从分析来看,乌贼确实身在中国,假期喜欢出去玩,周末宅在家。假期不键政说明不是服刑人员,周末键政说明不是五毛,和高赞互动说明虽然性格不讨喜,但是还是符合主流意见。从我看到的情况,在什么习下李上,什么年内攻台,什么经济已经崩溃问题上,他比某些人还是强的多😄
valenhasu 黑名单 回复 zsy2023
已隐藏
>>哈哈,楼主和我有相同的习惯,就是对某人感兴趣,会去统计他的行为规律,不过我只对现实中的人,在现实中做...


这不就是stalker吗😄
楼主辛苦了。
我看到有若干姨粉和无贼有关系,楼主能不能做一些类似的分析?
真爱粉
>>这不就是stalker吗😄


一般的人也配被我 stalked?大部分人和我照面10分钟,我都能看到他骨头里。
>>既然出现了我的id也就直说了基于他的发言 逻辑 对CCP的态度,我高度怀疑他的身份 所以对乌贼 看到...

哈哈哈 感觉在玩狼人杀
哈哈哈 主角怎么不来说两句
>>哈哈哈 感觉在玩狼人杀

这是真实的狼人杀,这个可是没有剧本的。。。
>>这不就是stalker吗😄


小魔女是女性吧
>>哈哈哈 主角怎么不来说两句


主角通常这时候通常不会出现,暗战
這帖天下無賊並沒有進來發言,有點落寞……
>>這帖天下無賊並沒有進來發言,有點落寞……


今天让我教训了一顿,可能生闷气呢吧
>>這帖天下無賊並沒有進來發言,有點落寞……

此人在国内,正在睡觉。
>>既然出现了我的id也就直说了基于他的发言 逻辑 对CCP的态度,我高度怀疑他的身份 所以对乌贼 看到...

打起来打起来
>>小魔女是女性吧


是知性😄
>>這帖天下無賊並沒有進來發言,有點落寞……

要考虑到时差。楼主大概是在美东,无贼是在北京,这帖子发出来的时候无贼应该还在睡觉。
他曾经还不像现在这样臭名昭着,我22年底的时候也和他炒过一次,发现他有神经错乱的特点。
>>点赞没关系有专门的算法来分析这种交互类似google早年的page rank可以比较准确的区别偶尔点...


我知道中间逻辑。
我也是看频繁点赞的id
而且特别有趣的是 给乌贼高赞的id 好像从来没有给我点过赞。当然也没有点过踩。即使我和他们并没有任何讨论争论交集。


这就耐人寻味了
天下乌贼这坨屎是一个标准的支那猪,而且还有皇汉的倾向,别的本身没有,刚精和卖菊花的本事倒是一流。
草XD
而且好認真,分析質量也不錯XDD
wwwwwww

不過如果只是一個吃飽了撐著的DS愛好者都能做到這個程度
建議各位(尤其是真身在牆內者)在品蔥操作時注意節奏啊
不然會像這樣,什麼時候忙也會被挖出來
>>作为长期观察他的人 我有点发言权他的言论主要点评国内政策但是不会上升到批评CCP和中央。偶或批评地方...


雖然屏蔽他有一段時間了,但依我看他可能不是宣傳,是真的信那一套的。但不是粉紅那種信,只是一般某部門或事業單位做了有段時間,知道土共的問題,但畢竟的人家發工資,萬一哪天被查到,只要不辱包,頂多也只能說是私下對一些政策不滿這個程度。何況平時官腔習慣了,說話局味重也正常。
據我個人了解,土共其實對私下罵黨並不是那麼在意,只要不公開宣稱,低調就可以放過去。但包子不行,不能罵他,要掀翻池塘的。
你真是個練武奇材

不過一身功夫拿來分析這個Id不覺得太大材小用了嗎
雖然看不懂,但感覺挺厲害的(爆米花
对,可以分析一下哪些是毛毛,这样可以给新来的葱油提醒提醒
>>是的, 类似的常给他点赞打配合的做一些简单的网络拓扑分析 (centrality clique 之类...
sdfva235sef 新注册用户 (待解除)
This account is registered to reply to this post and won’t be used later. Please don’t expect any reply. Below are some comments. Can’t guarantee the absence of mistakes. Please take what you need and judge for yourself how legit each piece is.

1. Descriptive: might be interesting to look at
  a) Interactive behavior: does he only like posts by a certain group of users, who exclusively like back within a clique?
  b) Comparison with users he likes the most / that like him the most: are there similar patterns between their behavior and his (active days, liking behavior, etc.)?
  c) Comparison with other users, or users known not to be 50 cents: Do they differ at the descriptive level?
  d) Authorship attribution (text analysis): Look for inconsistencies or evidence suggesting different people posting under his account.

2. Identification
  a) SE: cluster or at least use robust ones. See  https://economics.mit.edu/sites/default/files/2022-09/When%20Should%20You%20Adjust%20Standard%20Errors%20for%20Clustering.pdf
  b) Multicolinearity: calculate VIF and examine its level; If severe, try dropping vars that lack predictive power.
  c) OVS
    i. # of posts each user writes (after his account was created, which likely correlates with repu; Or set Y = # posts liked / # all posts; beta regression or something else considering that Y belongs to [0,1]
    ii. # of likes he received by each user
  d) Note that likes differ by post type (article, question, article reply, question reply…) Might estimate at a more granular level by distinguishing between them.

3. Specification: instead of user level, you could also predict his behavior (like, none, dislike) at post level
  a) Y = -1, 0, 1 -> multinomial probit or something suitable?
  b) Control for post chars like length of post, # of views, # of likes (in total or by others in his clique), creator FE, time FE, (and others that you can possibly assign using ML, like topic, sentiment, political stance, radicalism etc.)

4. Robustness check
这论文写的非常好
尤其是data analysis做的很专业,limitation也写的很好
当然如果以英国标准的纯学术而论,如果把这篇文章看作一个小paper的话,我认为有以下几个改进之处
1.请更明确地表明你的research aims/questions以及(if applicable) hypotheses.
2.在基于前面这一点的基础之上,可否给出一个至少有框架性的methodology
3.那么顺便再多要求一点,在methodology前面写一些必要的literature review
>>这论文写的非常好尤其是data analysis做的很专业,limitation也写的很好当然如果以...


感谢建议。 没有用dissertation的范式,首先就是心血来潮,直接就上手开干了; 其次,品葱的页面并不支持markdown,所以没法写出LaTex风格的格式,目录,图片编码 Appendix啥的都比较费劲,也就随便写写了。 不过还是感谢你的建议。
AAPLTSLA 回复 sdfva235sef 新注册用户 (待解除)
>>This account is registered to reply to this post a...


这是哪个大模型的回复呀,建议都非常不错, 确实启发了我在clique方面做一些工作
>>是的, 类似的常给他点赞打配合的做一些简单的网络拓扑分析 (centrality clique 之类...


这个表总体可以看作品葱有影响力晶格列表,有可能有冤枉的,但肯定不多。其中一个的行为哪方面都像包子的孝子贤孙。
看数据感觉天下无贼是个工作较为轻松,较为宅,假期经常出去玩估计是陪家人,生活还不错的人
总结的不错,有些东西我都没有注意,大部分结论正确,下面是我的一些讨论

1,其实你用踩赞来分析,是有很大偏差的,因为我是一个不喜欢点赞的人😂所以从根上说,你说的对:点踩和点赞 只是用户意见的代理指标(proxy),可能无法反应用户的真实想法。
2,你知道为什么我给疯狂习近平点赞最多吗?因为他曾经直接对我说:“你发帖同意我的观点,但是怎么那么吝啬点赞呢?” 哈哈,所以我那一段时间,特别多给他点了很多赞,就这么简单,不是我认为他的发言三倍优秀于yogafire兄。所以你也明白了,我上面说的,我不喜欢点踩点赞,是真的,所以你从点踩点赞分析我这个人,误差很大。
3,你又知道为什么我给打狗棒专打共党点了那么多踩吗?其实他自己已经说了,他对我“每日必踩”,我曾经建议他互相拉黑,也向管理员提起请求互相拉黑,但是他和管理员都没有同意😅,所以无奈,我也只好对他“每日必踩”,无论他说什么,这只是一种报复而已。类似的,排名第二被踩的事已至此先吃饭吧也是这个理由,你看他也承认了,他对我“能踩就踩”,我也不过是报复回去而已。别说,你这篇文章引这二位发言,证明了对我确实有成见,并且确实通过点踩来攻击我,说明我的报复是正确的,没冤枉他们😁
而排名第三的fb_china_today,我没有无厘头的点踩他,因为我发现他并没有对我“每日必踩”或者“能踩就踩”,基本上踩的还是具体的发言,算是对事不对人吧,我也基本上对他也是对事不对人。
4,由于以上3点,所以你对“用户声望与净点赞数的关系”分析,基本上是没意义的。因为点赞第一名和点踩前两名,都是我由于其他原因,有意为之的,他们给你的研究造成了太大的误差。
类似的,如果你把我踩赞的频繁度去和热点事件挂钩,恐怕研究结果也不会太准确,另外即使没有上述三点,我也觉得这个频繁度似乎应该和论坛的帖子数量变化幅度更契合一点才对。
5,按照一周的时间分析,我没有明显的休息日,这个对,符合我“喜欢每天来品葱玩一会”的事实


我没有注意到的:
1,我的点赞竟然比点踩多,如我上面所说,我其实不习惯点赞,而且点踩都是主动有意的报复,想不到不知不觉竟然点了这么多赞。
2,对于节日缺勤率我也不太清楚为什么是这样的数据,想了想,春节不仅是长假,而且一般都要留在老人身边,不能出去旅游,所以缺勤率低是可以解释的。但是清明节缺勤率高确实没想明白,因为我并没有清明扫墓的习惯,这有点怪异,可能只能归于偶然,因为清明节只放一天,其实和普通周末也没什么大的区别。
>>总结的不错,有些东西我都没有注意,大部分结论正确,下面是我的一些讨论1,其实你用踩赞来分析,是有很大...


节假日分析的结果是由于数据量过小,导致偏差可能很大。
数据分析?可这一套下来,意义不大啊?
Meltdown 回复 sdfva235sef 新注册用户 (待解除)
>>This account is registered to reply to this post a...

这么深入细致的研究,能发IEEE/ACM会议吗?
1   如果本文不是ChatGPT生成的,只能理解为楼主爱的太深太浓。

2 按照缺席率来看, @天下无贼用户在清明节期间赞踩活跃缺席率为80%,
-----------------------------------------
因为常年看恐怖片和恐怖小说,我首先怀疑的是他早就死了,心中有未了之事,所以灵体不散,每天在品葱徘徊。

3 品聪说是对个人隐私保护的很好,但其实不需要管理员,只要一个普通用户就可以扒出所有的信息,并进行分析。其实很可怕。

4 分析赞和踩其实用处不大,应该把发言的每一个帖子扒下来进行语义分析,得出偏正面,偏负面等结果,最终形成一个数字画像。
>>这么深入细致的研究,能发IEEE/ACM会议吗?


完了,葱站也开始学学校里面水文章啦,XD
>>1   如果本文不是ChatGPT生成的,只能理解为楼主爱的太深太浓。2 按照缺席率来看, @天下无...


只要我能看见你的行为,我总能得出一些东西的,而我得出的东西会不会对你构成实际威胁,需要具体看待。总的来说,我通过社会工程的方法找到了一些葱油的墙内账号,这是值得警惕的。
>>我每隔一段时间,就会研究一个周围我觉得特殊的人,可能这人在别人眼里很普通,但是我能发觉这人非同寻常的...

是用电脑统计记录么
zsy2023 回复 valenhasu 黑名单
>>研究一下我的 valengosu 我绝对是你这辈子都见不到的华人中的佼佼者


越愚蠢和肤浅的人,就越是容易被看透看穿,因为缺陷太明显,很容易分析长短板。越聪明的人,越难以看明白,一是善于伪装,这是属于表象,二是做事不怎么留瑕疵,做事周密,这是属于实事。你在论坛上表现尚可,我不亲自接触,无法给出结论。-----以上算是我对你的夸奖。

人在网络上和现实中是有区别的,但现实中的表情举止语言,可以做到完全反应一个人的真实情况,无论他怎样表现。
确实好像是这样……
>>作为长期观察他的人 我有点发言权他的言论主要点评国内政策但是不会上升到批评CCP和中央。偶或批评地方...
让他发帖骂一下习近平看看敢不敢骂
>>节假日分析的结果是由于数据量过小,导致偏差可能很大。
节假日休息,不用上班
>>从分析来看,乌贼确实身在中国,假期喜欢出去玩,周末宅在家。假期不键政说明不是服刑人员,周末键政说明不...

不过如果作为五毛,本来就无脑反对那些,一切都是圣上英明。所以从结论反推他强我觉得不太行
我感觉他是北京的,对北京有“特殊感情”, 很喜欢抬杠的他为数不多破大防几次中,就有那次大家传北京开始大规模肛拭子测核酸,一开始还行,后面大家明显是知道是假的还在揶揄他,他就破防了
>>让他发帖骂一下习近平看看敢不敢骂


如您所愿:习近平是个大傻逼

你莫非是练法轮功的,永远不会说:“法轮大法是邪教”?😂😂
>>我感觉他是北京的,对北京有“特殊感情”, 很喜欢抬杠的他为数不多破大防几次中,就有那次大家传北京开始...


我在品葱“破防”“开盒”“露馅”了不知道多少次,我自己一次也没记住,都是各位认为我破防,认为我被开盒了,还有认为我的个人信息已经被扒了什么的…………
>>如您所愿:习近平是个大傻逼你莫非是练法轮功的,永远不会说:“法轮大法是邪教”?😂😂


您真是什么时候都不忘搅浑水。品葱的共识就是反对中共和习近平,自然可以用骂习近平的方式做筛选。而反对法轮功可不是品葱的共识。
>>作为长期观察他的人 我有点发言权他的言论主要点评国内政策但是不会上升到批评CCP和中央。偶或批评地方...

仅就这一点,据我自己的观察,不一定有任务或或者文宣部门,但大概率是体制内或仰慕体制的。
>>您真是什么时候都不忘搅浑水。品葱的共识就是反对中共和习近平,自然可以用骂习近平的方式做筛选。而反对法...

不,我的意思是用这种方法是很愚蠢的

只有基于信仰的信徒才会拒绝对信仰口出恶言,但是我相信绝大部分五毛粉红对于骂习近平一句脏话毫不介意,所以用这种方法来筛选,很可笑
因为每次发言都比较容易获得赞,懂得什么样的发言容易获得热度,所以声望才会高。天下无贼比较容易看到声望高用户的发言,喜欢踩他们,也算是情理之中啦。

另外 不是Without further ado嘛
>>因为每次发言都比较容易获得赞,懂得什么样的发言容易获得热度,所以声望才会高。天下无贼比较容易看到声望...


you are right! 写错了!
感觉分析了一通,好像啥也没分析
我突然挺想被你分析一番的😂
>>感觉分析了一通,好像啥也没分析


数据限制,接下来准备通过text mining进行一些语义分析,情绪方向,word cloud等分析
valenhasu 黑名单 回复 zsy2023
已隐藏
>>感谢大佬指教!!  本人确实对计量一知半解,仅仅学到ARIMA GARCH这个程度, 明白一些sta...


共同探讨。不想看书可看视频,youtube上ASU的教授Nicolai Kuminoff讲的挺好的,就是按伍德里奇那本书讲的。

要发言请先登录注册

要发言请先登录注册