18大,19大,20大高频词对比

之前发了篇文章:一组有意思的对比:18大和20大高频词
https://pincong.rocks/article/id-47583__sort_key-agree_count__sort-DESC

有人说你拿全文和实录的演讲稿对比不准确。

我想了下有道理,且我都不知道source里的18大数据是哪儿来的。
于是乎,求人不如求己,我自己做好了。

报告/实录报告source:
十八大全文:http://dj.xmdh.com/zxxx/ShowArticle.asp?ArticleID=254
十九大实录:https://finance.sina. cn/china/gncj/2017-10-18/detail-ifymvuyt4098830.d.html
十九大全文:http://www.gov. cn/zhuanti/2017-10/27/content_5234876.htm
二十大实录:
找了两个,感觉差不多:
http://www.cb.com. cn/index/show/jj/cv/cv12536067107
https://news.ifeng.com/c/8K9l4qcZtaw

分析方式
1. 微词云分词
https://fenci.weiciyun.com/cn/?ut=wcysitetry&
原因一是因为方便,二是因为基于语义的分类更加准确。比如含有“市场”两字的,并不一定是同一个意思:
https://telegra.ph/file/303b8c5b7c74e0c945a42.gif

2. 手工
这种就简单粗暴了,直接word里搜索,词频就等于出现的次数除以总字数

分析结果
微词云能输出所有词的次数和频率,因为太长我也不知道怎么加附件,就直接放上一个贴里的关键词统计吧:

https://telegra.ph/file/88d2e8db6841843465156.gif

结论就大家自己得出好了。
我想提醒的一点是,不要仅仅看出现次数,因为报告的词数差距挺大的,而且词频更能说明这个词在整篇文章里的重要性。
如果大家对其他词的频率变化感兴趣,可以自己去试试看,并浪费不了多少时间。
3
分享 2022-10-17

8 个评论

所以外媒也是这种方法,就被误导了。

包子讲话里安全涵盖范围太广了,新冠、香港、国防、经济、粮食、卫生这是我记得的几个方面,其中新冠、香港、粮食、卫生和外媒以为的中国战狼毫无关联。

所以我们听的都是要走开放路线,某些媒体就觉得中国更加集权。或者说轮子为了证明中国集权战狼,想了一堆方法终于找到这个办法。

要发言请先登录注册

要发言请先登录注册

发起人

即使身处在粪坑,人也不应该吃屎,更不应该讨论原味的屎还是巧克力味的屎好吃

状态

  • 最新活动: 2022-10-17
  • 浏览: 6579