华人科学家会如何玩坏机器学习领域?

我们知道纳米材料领域已经被华人科学家玩坏了
水灌得太多而总经费太少(没有应用)

那么人工智能/机器学习目前华人科学家也占据了半壁江山,
不过机器学习应用应该比纳米材料强多了,“被灌水裕度“应该更大
再这么灌下去最终会是什么景象呢?
理念是刀槍不入的 中腋舔王不知足
用機器學習來預測韭菜成為反賊的可能性,大於50%直接就地掩埋
(54)发明名称 基于长短期记忆网络的V2ray流量识别方法

(57)摘要 本发明涉及基于长短期记忆网络的V2ray流 量识别方法,属于计算机网络安全领域。主要为 了解决基于卷积神经网络的方法将数据转化为 图片后训练出模型的可解释性较差,且未利用到 加密流量在时间序列特征的问题。本发明首先从 交换机获取V2ray流量和普通流量的数据链路层 数据包并对数据包进行标注,其次去除不包含有 用信息和冗余的数据包;然后将可能对模型训练 造成影响的字节置零,对数据包的长度进行调 整;最后使用这些预处理过的数据训练长短期记 忆网络。该方法无需进行特征提取和选择,对 V2ray流量的时间序列关系进行了学习,具有较 好的识别效果。

https://files.catbox.moe/vmzj04.pdf
我倒是觉得学术界整体都有点注水的倾向,不过乱枪打鸟,做的人多了,也就能出一些成果。

其实机器学习很多都是靠各种企业供养的。Google和亚马逊的实验室成果算是比较好的,不过都没法变现,赚钱是靠广告业务和卖东西。那么问题来了,各位觉得Google和亚马逊的广告有多智能?我敢说没人工智能广告和网店业务照样赚大钱。可是大企业不会说我们赚钱是靠垄断地位,而是说多少利润和机器学习相关。因此佣金就跑到大数据专家的口袋里,真要是能创造二十万年薪出来就是扯淡,但是树大好乘凉,而且和互联网泡沫不同,机器学习的企业大户是很有利润的,所以还不算泡沫。

我说这些是为了说明机器学习本身应用场景有限,没有商用场景胡乱注水,不会有什么有价值的成果。语音识别二十多年前就有商用产品了(IBM的VIAVOICE),发展到现在,我这篇回复全靠语音输入,语速正常不用广播腔的话,改错字的时间跟我手打差不多。大数据二数据的水实在灌的太多了。

随便举个例子,网评员的作用,ai就没法代替。顶多过滤个关键字,比regex强不了多少。
生活与命运 仿生中国人会翻越电子墙吗
GAN+NLP的全自动化网评员,天朝局域网里那么多鲜活的样本都可以当作训练资料。

基于CNN的更加精准的面部识别模型,包括对戴口罩人群的面部识别,武汉肺炎刚爆发那阵不是有人披露过新立项的科研题目嘛,其中就包括这个。
但是CNN再精确是可以攻击的,新时代的赛博隐形。

楼上提到的LSTM识别流量这个我记得在讨论VPN的楼里看到过,这帮人为了给GFW添砖加瓦真是无所不用其极。
網路的應用部分都是騙經費的,直接向俄羅斯爸爸進口局域內網技術,任何翻牆都沒用了
何必搞啥機器學習...
crayfish 正闰经权
再这么灌下去,最终当然是水漫金山啦。
水水水水水水水水水水水水水水水水水水
NZRdlClr5 嗆聲完了改回來了
要是説研究質量的話,ML,尤其是supervised ML就是要數據,大量的數據,數據越多就越準確
所以可以不顧隱私收集大量真正的國民數據的中國其實是有優勢的
人臉識別之類的,海量數據灌下去,NN架構做得再難看都能有點起色
所以灌水應該還不至於,只是應該很多項目會被用來作惡
不過説到底,現階段的AI只不過是一種工具,就看用的人是不是惡人了
惡人用什麽都會拿來作惡
但這些海量數據灌出來的AI的確可能比只能得到少量(還可能有偏見)數據的外國AI有優勢,如果將來有機會落到善人手裏也可以拿來行善,所以稱不上是AI給玩壞了
机器学习还是一个企业主导的领域吧,不容易被大水漫灌。苹果的人脸识别,自动HDR算法,特斯拉的自动驾驶,Nvdia的DLSS 2.0,等等等等
初中肄业上清华 庆父不死,,鲁难未已
我觉应该改个标题:集权政府如何玩坏人工智能?
fgT4ZJ0dQAcn 新注册用户 那拉绮玉
我们既然活在一个不可预测的世界里,那么我们到底是怎样从这个世界里学习,并且越来越强大?

要发言请先登录注册