来领新装备:突破一切文字审查·改
让手无寸铁的市民,能穿上密码学的铠甲
请关注这个工具
https://han5.cc
可以把你想说的任何内容加密编码成无法被审核和识别的常用汉字
可以穿透任何场合的文字审查,含微博,知乎,QQ,微信等
编码以后,一切自动审查系统都将彻底失效
即使人工审查也需要审查者获取到密钥,成本将指数级增加
加密算法使用256位AES,没有密钥无法解码
密钥长度需要不小于11个汉字
安全可靠,美国军方都在用
如果需要在公开场合发布言论,如微博,知乎,就需要公布密钥。
建议将密钥放在标题或者评论里面,
并将个人简介改为:https://han5.cc,密钥试试标题或评论里找
这一类的提示性文字。
密钥本身可以直接使用歌词或古诗词,任意字符都可,长度够就可以
更优秀的密钥是不明示的密钥,如:天王???,宝塔???
推荐下载到本机使用。
有能力的伙伴,欢迎部署供他人使用的服务器
下载和源码在站点里面都能找到
本软件服务截至目前不违法任何国内现行法律
如果你认可我们做的事情,请考虑为这个项目贡献力量
推广和开发都是很重要的帮助
承诺永久开源永久免费
对了、这个编码叫做汉五码
这个名字纪念一个没吹响的哨子
||
V
我是原楼主的同伴。
我追加一点说明。
---
Q:关于为什么是汉字乱码,而不是看起来像人话的中文?
A:因为真正的敌人,是自动审查程序,而不是人工审查者。
有的伙伴的被请去喝茶,被封群,封朋友圈。
为什么呢?
发生这些,没有一个是审查者肉眼一条条看通信线路,看某个群,看某人的朋友圈,
然后抓到受害者的。全国每天有多少通信?多少流量?
他们如果人工一条线路一条线路的看,还要阅读所有的记录,恰巧找到你说了反贼信息,
这么算,你被抓的概率比中彩票还要低。
他们怎么看到你的呢?
1.腾讯有触发程序和扫描程序
2.敏感词会触发警报,一个都漏不掉
3.后台审查团队会监视你的群和翻看你的聊天记录,这个团队不是腾讯的人
4.人工鉴别后,有的没问题,放了;有的封号解散群;有的给公安查水表;有的给国宝;有的给国安
5.给国宝国安的是大佬,从此就被一盯一了,网络生命完结
总之这些都是被程序识别了,含有某敏感词,某谐音词,某隐喻,触发了警报,
然后引来了审查者,审查者人工翻看通信记录后,你就被请喝茶了。
---
Q:为什么我说“维尼熊”“刁斤干”、摩斯码也会被抓到?
A:你用谐音,用变形字,用火星文,用乱序,都没有用。因为:
1.你的对手是专业做审查的,吃这碗饭的,他们知道的黑话比你多。
2.你一个反贼群,不会只说一句话,就算某一句真的躲过了敏感词识别,一群人七嘴八舌的说,总有一句会触发警报,引来审查者。
3.他们的敏感词词库比你能想到的大的多,他们不怕误报,宁可错报一千也没关系,误报了无非花几秒钟多看一眼而已,人工看过就不会封错。
4.摩斯码,变形码这类的东西,做个傅里叶变换当场就废了,初中生都会,何况花了百亿美元的团队?想用这个骗过去,你在搞笑?
---
继续Q:为什么不搞模拟自然语言?
A:因为重点是如何不引来审查者,如何不让审查者发现你,
而不是审查者盯上你以后怎么办。
人工审查者盯上你以后,你没有任何办法。
你如果有办法让你的密文伪装成正常聊天,
逼真到一个大活人一句一句看都找不出异常的程度,
那恭喜你,你这个叫做“通过了图灵测试”,
你至少可以和传说版的Jeff Dean打个平手了。
但,
这是不可能的。
所以不要做没有意义努力,
把时间和精力用到刀刃上。
---
Q:那我用密码有没有用呢?会引来审查者码?
A:当然有用!会!
效果是:
审查者即使看到了你的记录,如果你用的密码靠谱的话,
他们只是能知道“这个群里的人都在说密码,很可能是反贼”
他们无法知道你们说了什么。
所以他们只好像回帖里面某个观众说的:
“把你们查水表抓起来,严刑拷打”
方能得知你们通信的内容。
这很费劲,很麻烦,
所以他们如果觉得你“不够危险”
很可能就放过你了,上报,有人找个小本本标记你身份证号一下,
等你成气候了,或者有证据证明你是条比较大的魚的时候,
再把你抓起来严刑拷打。
你用主流密码,都会引来审查。DES,AES,RSA,PGP都会!
因为:
汉字文本有极强的分布频率,
你看看你说一句”人话“
里面有几个”是“,几个”的“、几个”你“?几个”不“?
目前常用的密码都是所有元素趋于平均分布的,
找不出特别的规律,”没有规律“是密码是否优秀的指标之一,
因为越没有规律的密码,越不容易被破解。
但是,
恰恰”人话“很有规律,汉语更他妈的有规律。
汉字的最常用的200个字,占了日常通信内容的60%+
所以机器可以很容易的区分,哪是人话,哪是密码。
一个几乎弱智的字符频率统计就区分了,
然后密码引来审查者,
你们群聊的被解散,
私聊的被标注,喝茶,拷打(看你是多大魚决定)。
但即使这样,有密码也比没有密码好得多。
---
Q:那你们的汉五码呢?
A:首先我们使用了成熟的普通密码,
在此基础上我们又继续进行了加工,
妄图可以”不引来“审查者,
因为让审查程序扫描的时候发现不了你,
才是真正有用的事情,
而不是密文多么像“人话”。
经过一些小规模的实验,
汉五码是有用的,
但显然还远没有彻底解决问题,
不过至少现有的粗粒度审查系统对它几乎没有命中率。
然后
即使我们做的不够好,
我也要把我们的方向说清楚,
这样可以让大家能向有用的方向努力。
---
Q:反贼这么惨?真的一无所有吗?
A:绝不是这样的,大家不要盲目悲观。
听我说。
学过一点算法都知道时间复杂度。
他们要审查全微信系统、
全微博系统、全网所有的流量。
并且这是个持续不断的流,无法离线演算,
明天的数据量只会比今天多,不会比今天少。
大O括号里面那个n就是他们最大的障碍,并且是永恒存在的。这个n太大了。
对于全网,全范围,普遍的审查,他们永远只能选择O(n)级别的算法。
所以有些观众说的,分词法,人工智能,都只可局部部署(比如爬品葱全站然后分析),都是无法全网部署的,在可以预见的未来几年都不可能。再说一次,这个n太太太大了。
总结一下,朝廷有地利,反贼有天时。其实天时比地利大。就看反贼的人和不和了。
有句老话:小隐于野,大隐与市。
还有句老话:大鱼弱智。
以下是我同伴的说法,他是个弱受嘴瓢说不清楚,我看了生气,补充了以上这些。:
汉字集的使用不是为了隐写,是为了对抗模式识别。
为什么要先对付模式识别,而不是拟合自然语言呢?简单的说是这样:人工审查不可怕,因为用户总比审查者多。自动化审查才是真正的敌人,一旦可以被自动化,就等于对方有机枪我们没有,有多少人都没用。
为什么不用base64,因为可以被模式识别。拉丁字母邻数字符号加权即可。
为什么不用utf-*因为可以模式识别,有些字地球没几个人认识,正常通信根本不会发。出现即是特征。
为什么是这些字?因为这255个字是现代汉语里面组词最多的,也都是常见字,对它们搞模式匹配命中率会非常低。这是统计过很多文字流以后挑选出的。
请关注这个工具
https://han5.cc
可以把你想说的任何内容加密编码成无法被审核和识别的常用汉字
可以穿透任何场合的文字审查,含微博,知乎,QQ,微信等
编码以后,一切自动审查系统都将彻底失效
即使人工审查也需要审查者获取到密钥,成本将指数级增加
加密算法使用256位AES,没有密钥无法解码
密钥长度需要不小于11个汉字
安全可靠,美国军方都在用
如果需要在公开场合发布言论,如微博,知乎,就需要公布密钥。
建议将密钥放在标题或者评论里面,
并将个人简介改为:https://han5.cc,密钥试试标题或评论里找
这一类的提示性文字。
密钥本身可以直接使用歌词或古诗词,任意字符都可,长度够就可以
更优秀的密钥是不明示的密钥,如:天王???,宝塔???
推荐下载到本机使用。
有能力的伙伴,欢迎部署供他人使用的服务器
下载和源码在站点里面都能找到
本软件服务截至目前不违法任何国内现行法律
如果你认可我们做的事情,请考虑为这个项目贡献力量
推广和开发都是很重要的帮助
承诺永久开源永久免费
对了、这个编码叫做汉五码
这个名字纪念一个没吹响的哨子
||
V
我是原楼主的同伴。
我追加一点说明。
---
Q:关于为什么是汉字乱码,而不是看起来像人话的中文?
A:因为真正的敌人,是自动审查程序,而不是人工审查者。
有的伙伴的被请去喝茶,被封群,封朋友圈。
为什么呢?
发生这些,没有一个是审查者肉眼一条条看通信线路,看某个群,看某人的朋友圈,
然后抓到受害者的。全国每天有多少通信?多少流量?
他们如果人工一条线路一条线路的看,还要阅读所有的记录,恰巧找到你说了反贼信息,
这么算,你被抓的概率比中彩票还要低。
他们怎么看到你的呢?
1.腾讯有触发程序和扫描程序
2.敏感词会触发警报,一个都漏不掉
3.后台审查团队会监视你的群和翻看你的聊天记录,这个团队不是腾讯的人
4.人工鉴别后,有的没问题,放了;有的封号解散群;有的给公安查水表;有的给国宝;有的给国安
5.给国宝国安的是大佬,从此就被一盯一了,网络生命完结
总之这些都是被程序识别了,含有某敏感词,某谐音词,某隐喻,触发了警报,
然后引来了审查者,审查者人工翻看通信记录后,你就被请喝茶了。
---
Q:为什么我说“维尼熊”“刁斤干”、摩斯码也会被抓到?
A:你用谐音,用变形字,用火星文,用乱序,都没有用。因为:
1.你的对手是专业做审查的,吃这碗饭的,他们知道的黑话比你多。
2.你一个反贼群,不会只说一句话,就算某一句真的躲过了敏感词识别,一群人七嘴八舌的说,总有一句会触发警报,引来审查者。
3.他们的敏感词词库比你能想到的大的多,他们不怕误报,宁可错报一千也没关系,误报了无非花几秒钟多看一眼而已,人工看过就不会封错。
4.摩斯码,变形码这类的东西,做个傅里叶变换当场就废了,初中生都会,何况花了百亿美元的团队?想用这个骗过去,你在搞笑?
---
继续Q:为什么不搞模拟自然语言?
A:因为重点是如何不引来审查者,如何不让审查者发现你,
而不是审查者盯上你以后怎么办。
人工审查者盯上你以后,你没有任何办法。
你如果有办法让你的密文伪装成正常聊天,
逼真到一个大活人一句一句看都找不出异常的程度,
那恭喜你,你这个叫做“通过了图灵测试”,
你至少可以和传说版的Jeff Dean打个平手了。
但,
这是不可能的。
所以不要做没有意义努力,
把时间和精力用到刀刃上。
---
Q:那我用密码有没有用呢?会引来审查者码?
A:当然有用!会!
效果是:
审查者即使看到了你的记录,如果你用的密码靠谱的话,
他们只是能知道“这个群里的人都在说密码,很可能是反贼”
他们无法知道你们说了什么。
所以他们只好像回帖里面某个观众说的:
“把你们查水表抓起来,严刑拷打”
方能得知你们通信的内容。
这很费劲,很麻烦,
所以他们如果觉得你“不够危险”
很可能就放过你了,上报,有人找个小本本标记你身份证号一下,
等你成气候了,或者有证据证明你是条比较大的魚的时候,
再把你抓起来严刑拷打。
你用主流密码,都会引来审查。DES,AES,RSA,PGP都会!
因为:
汉字文本有极强的分布频率,
你看看你说一句”人话“
里面有几个”是“,几个”的“、几个”你“?几个”不“?
目前常用的密码都是所有元素趋于平均分布的,
找不出特别的规律,”没有规律“是密码是否优秀的指标之一,
因为越没有规律的密码,越不容易被破解。
但是,
恰恰”人话“很有规律,汉语更他妈的有规律。
汉字的最常用的200个字,占了日常通信内容的60%+
所以机器可以很容易的区分,哪是人话,哪是密码。
一个几乎弱智的字符频率统计就区分了,
然后密码引来审查者,
你们群聊的被解散,
私聊的被标注,喝茶,拷打(看你是多大魚决定)。
但即使这样,有密码也比没有密码好得多。
---
Q:那你们的汉五码呢?
A:首先我们使用了成熟的普通密码,
在此基础上我们又继续进行了加工,
妄图可以”不引来“审查者,
因为让审查程序扫描的时候发现不了你,
才是真正有用的事情,
而不是密文多么像“人话”。
经过一些小规模的实验,
汉五码是有用的,
但显然还远没有彻底解决问题,
不过至少现有的粗粒度审查系统对它几乎没有命中率。
然后
即使我们做的不够好,
我也要把我们的方向说清楚,
这样可以让大家能向有用的方向努力。
---
Q:反贼这么惨?真的一无所有吗?
A:绝不是这样的,大家不要盲目悲观。
听我说。
学过一点算法都知道时间复杂度。
他们要审查全微信系统、
全微博系统、全网所有的流量。
并且这是个持续不断的流,无法离线演算,
明天的数据量只会比今天多,不会比今天少。
大O括号里面那个n就是他们最大的障碍,并且是永恒存在的。这个n太大了。
对于全网,全范围,普遍的审查,他们永远只能选择O(n)级别的算法。
所以有些观众说的,分词法,人工智能,都只可局部部署(比如爬品葱全站然后分析),都是无法全网部署的,在可以预见的未来几年都不可能。再说一次,这个n太太太大了。
总结一下,朝廷有地利,反贼有天时。其实天时比地利大。就看反贼的人和不和了。
有句老话:小隐于野,大隐与市。
还有句老话:大鱼弱智。
以下是我同伴的说法,他是个弱受嘴瓢说不清楚,我看了生气,补充了以上这些。:
汉字集的使用不是为了隐写,是为了对抗模式识别。
为什么要先对付模式识别,而不是拟合自然语言呢?简单的说是这样:人工审查不可怕,因为用户总比审查者多。自动化审查才是真正的敌人,一旦可以被自动化,就等于对方有机枪我们没有,有多少人都没用。
为什么不用base64,因为可以被模式识别。拉丁字母邻数字符号加权即可。
为什么不用utf-*因为可以模式识别,有些字地球没几个人认识,正常通信根本不会发。出现即是特征。
为什么是这些字?因为这255个字是现代汉语里面组词最多的,也都是常见字,对它们搞模式匹配命中率会非常低。这是统计过很多文字流以后挑选出的。
81 个评论
感覺有兩個問題。
一是加密後密文過長,越長越不好,不利於隱蔽也不利於傳播。
二是PC端這種東西其實意義不大。要的是手機端後台隨時選定破譯,墻內根本沒多少PC用戶,全是微抖快。
一是加密後密文過長,越長越不好,不利於隱蔽也不利於傳播。
二是PC端這種東西其實意義不大。要的是手機端後台隨時選定破譯,墻內根本沒多少PC用戶,全是微抖快。