【RFC-066】由品葱方面统一进行语言指纹消除

变更内容：

品葱方面增加自动消除语言指纹选项，默认勾选，也许可选十种甚至九种语言风格，比如编程随想风格，恶俗垃圾话
设立不强制遵守的回答规范，也可以像BBCode一样，例如，对分割线的使用

先假设未来可能会增加更多丰富的格式比如分割线，自动消除功能如下
对于语句内容，往谷歌翻译的效果上靠，这个可以不做
对于时间数字单位，统一用某种方法表示
对于回答格式，比如每段话习惯空一行，空两行；诸如此类，都进行规范化
对于部分词语，进行统一替换，例如，“我”全换成“俺”，“你”变成“恁”
对于标点符号，统一换成全角字符，例如，我们让,都变成，
对于代码，这个已经有很多资料

变更理由：语言指纹能够泄露真实身份
https://pincong.rocks/article/575
语言指纹识别和反检测
"他们最近在实时监控品葱"，有没有技术党能来展开解释一下注意事项？
比如有用户计划删除自己所有回答评论，https://pincong.rocks/article/1531

讨论时间：长期有效
变更步骤：由开发者委员会决定

分享 2019-05-12

31 个评论

产品经理8964

这个功能太梦幻了，你自己做出来给大家演示一下吧

谷雨解字了解一下？
https://pincong.rocks/article/1540

另外号码重复了
https://pincong.rocks/article/1515

~~虚空假面~~ ^? 回复产品经理8964

不行，会暴露我的语言习惯，必须集体完成

产品经理8964 回复 ~~虚空假面~~ ^?

你自己去研究一下实现这个功能的难度，其他我就不多说了，我是不在乎什么语言指纹的。

~~我是支那人~~ ^?

已隐藏

~~虚空假面~~ ^? 回复 ~~我是支那人~~ ^?

标点替换是一瞬的事，会第二语言的可以用谷歌翻译，不会的可以中译英再译回来，可是其他的不知道怎么办，，，
我觉得可以实现一个迫真编译器了，，，就叫做P语言

~~我是支那人~~ ^? 回复 ~~虚空假面~~ ^?

已隐藏

~~虚空假面~~ ^? 回复 ~~我是支那人~~ ^?

~~已删除~~

产品经理8964

我共你港，Google都做不出你说这个东西来

~~虚空假面~~ ^? 回复 ~~我是支那人~~ ^?

你说的对，频率这个我不知道怎么解决，召唤@小钙

~~虚空假面~~ ^? 回复产品经理8964

和推翻共产党哪个难度更大？编程随想没被分析出来，解决方法之一也许是少在墙内公开发表意见。

小钙回复 ~~虚空假面~~ ^?

可以通过句法分析，把所有可能是第一人称省略主语的地方加上主语，不过很难，谷歌翻译都不能做到，所以只能靠翻译到语法不同得语言，再翻译回来，比如英语永远需要主语，再翻译回来的时候所有「我」的频率都会变化

匿名用户回复 ~~虚空假面~~ ^?

@小钙刚刚已经跟你对过话了，你也是老熟人，但说实话真看不出来你是谁。

匿名用户

@支字头在哪呢
http://archive.is/dbsVO
不谢

小钙回复匿名用户

@我是什么意思？人脑储存统计数据的方式是recurrent的，而不是像计算机那样的RAM，所以无法一瞬找到statistical patterns，这也是为什么机器学习能够在很多领域里一瞬完成专家需要学习数年才能完成的事情。

~~虚空假面~~ ^? 回复小钙

recurrent是什么意思？类似于 recurrent neural network 吗

~~虚空假面~~ ^? 回复匿名用户

为什么你会觉得我像支字头？这个也是语言指纹吗

小钙回复 ~~虚空假面~~ ^?

大脑的记忆就是通过recurrent states储存的，所以是distributed，可以看作是RNN的hidden states

匿名用户

为什么要提到RNN？似乎@小钙有生物学背景，但据我所知，人工神经网络的设计并不严格遵循人类大脑的工作方式。

目前的NLP水平无法实现这样的任务。购买谷歌翻译服务执行中文到英文再到中文的翻译，并允许用户在此过程后修改它们，可能是一个更好的方法。

anonym

大兄弟，这是被迫害妄想症的表现。。。

小钙回复匿名用户

我只是说人脑无法一瞬做出ML可以做到的statistical pattern finding，因为工作记忆储存方式不一样。另外关于神经网络之间的联系，其实已经有研究在做了，比如最近在Science发的一篇文章就是可以直接通过CNN进行gradient search来生成图片去控制猴子的视觉皮层的神经元活动，而且这个CNN可以解释60%以上的firing rate patterns，说明人工神经网络和生物神经网络是有关联的。

如果是翻译的话，不如直接自己拿去翻译，翻译完之后改改发上来，拿脚本就能实现编辑框自动翻译