【RFC-066】由品葱方面统一进行语言指纹消除
变更内容:
先假设未来可能会增加更多丰富的格式比如分割线,自动消除功能如下
对于语句内容,往谷歌翻译的效果上靠,这个可以不做
对于时间数字单位,统一用某种方法表示
对于回答格式,比如每段话习惯空一行,空两行;诸如此类,都进行规范化
对于部分词语,进行统一替换,例如,“我”全换成“俺”,“你”变成“恁”
对于标点符号,统一换成全角字符,例如,我们让,都变成,
对于代码,这个已经有很多资料
变更理由:语言指纹能够泄露真实身份
https://pincong.rocks/article/575
语言指纹识别和反检测
"他们最近在实时监控品葱",有没有技术党能来展开解释一下注意事项?
比如有用户计划删除自己所有回答评论,https://pincong.rocks/article/1531
讨论时间:长期有效
变更步骤:由开发者委员会决定
- 品葱方面增加自动消除语言指纹选项,默认勾选,也许可选十种甚至九种语言风格,比如编程随想风格,恶俗垃圾话
- 设立不强制遵守的回答规范,也可以像BBCode一样,例如,对分割线的使用
先假设未来可能会增加更多丰富的格式比如分割线,自动消除功能如下
对于语句内容,往谷歌翻译的效果上靠,这个可以不做
对于时间数字单位,统一用某种方法表示
对于回答格式,比如每段话习惯空一行,空两行;诸如此类,都进行规范化
对于部分词语,进行统一替换,例如,“我”全换成“俺”,“你”变成“恁”
对于标点符号,统一换成全角字符,例如,我们让,都变成,
对于代码,这个已经有很多资料
变更理由:语言指纹能够泄露真实身份
https://pincong.rocks/article/575
语言指纹识别和反检测
"他们最近在实时监控品葱",有没有技术党能来展开解释一下注意事项?
比如有用户计划删除自己所有回答评论,https://pincong.rocks/article/1531
讨论时间:长期有效
变更步骤:由开发者委员会决定
31 个评论
这个功能太梦幻了,你自己做出来给大家演示一下吧
谷雨解字了解一下?
https://pincong.rocks/article/1540
另外号码重复了
https://pincong.rocks/article/1515
谷雨解字了解一下?
https://pincong.rocks/article/1540
另外号码重复了
https://pincong.rocks/article/1515
已隐藏
我共你港,Google都做不出你说这个东西来
可以通过句法分析,把所有可能是第一人称省略主语的地方加上主语,不过很难,谷歌翻译都不能做到,所以只能靠翻译到语法不同得语言,再翻译回来,比如英语永远需要主语,再翻译回来的时候所有「我」的频率都会变化
@我是什么意思?人脑储存统计数据的方式是recurrent的,而不是像计算机那样的RAM,所以无法一瞬找到statistical patterns,这也是为什么机器学习能够在很多领域里一瞬完成专家需要学习数年才能完成的事情。
为什么要提到RNN?似乎@小钙 有生物学背景,但据我所知,人工神经网络的设计并不严格遵循人类大脑的工作方式。
目前的NLP水平无法实现这样的任务。 购买谷歌翻译服务执行中文到英文再到中文的翻译,并允许用户在此过程后修改它们,可能是一个更好的方法。
目前的NLP水平无法实现这样的任务。 购买谷歌翻译服务执行中文到英文再到中文的翻译,并允许用户在此过程后修改它们,可能是一个更好的方法。
大兄弟,这是被迫害妄想症的表现。。。
我只是说人脑无法一瞬做出ML可以做到的statistical pattern finding,因为工作记忆储存方式不一样。另外关于神经网络之间的联系,其实已经有研究在做了,比如最近在Science发的一篇文章就是可以直接通过CNN进行gradient search来生成图片去控制猴子的视觉皮层的神经元活动,而且这个CNN可以解释60%以上的firing rate patterns,说明人工神经网络和生物神经网络是有关联的。
如果是翻译的话,不如直接自己拿去翻译,翻译完之后改改发上来,拿脚本就能实现编辑框自动翻译
如果是翻译的话,不如直接自己拿去翻译,翻译完之后改改发上来,拿脚本就能实现编辑框自动翻译
反对。
这和中共用星号替换敏感词是同一类行为。
这和中共用星号替换敏感词是同一类行为。
我还以为这是已经实现的功能,吓了我一跳,好歹以前也做过机器学习和决策数这类的内容
果然菜是原罪,在品葱也要被鄙视,那么您能不能具体指出哪里有问题呢。这篇文章里似乎没有提到机器学习?
不是只有我有这个疑问,我看了https://pincong.rocks/question/3821下的回答觉得挺害怕的
不是只有我有这个疑问,我看了https://pincong.rocks/question/3821下的回答觉得挺害怕的
不同好吧?星号替换敏感词减少了信息量,你不能从星号中看出来屏蔽了什么。但是规范化,你看一下比如markdown的linting,我想表达的是这个意思,而且是可选的
這些替換能掩蓋語言特徵,深表懷疑。
先把精力集中在其他急需解決的問題上,比如搜索,相關內容推薦,首頁條目平衡算法。。。。。。
先把精力集中在其他急需解決的問題上,比如搜索,相關內容推薦,首頁條目平衡算法。。。。。。
哪里有问题
果然菜是原罪,在品葱也要被鄙视,那么您能不能具体指出哪里有问题呢。这篇文章里似乎没有提到机器学习? 不是只有我有这个疑问,我看了https://pincong.rocks/question/3821下的回答觉得挺害怕的
尝试了科学文字
尝试了科学文字