ChatGPT的词库数据来源是不是基于谷歌翻译?

试了试各种基本没有日常网络使用者的语言,比如爱尔兰语,苏格兰语,卢旺达语,伊博语,ChatGPT基本都能够进行输入-输出。谷歌进行支持的几门冷门非官方语言比如维吾尔语和鞑靼语也都能处理,且综合来看都比较通顺,没有大的语法或者词汇问题。

但众所周知谷歌翻译多少年来从来都没有支持过藏语。当中加了无数根本没有日常书面使用者的非洲语言和美洲语言,但就是没有藏语。于是我试着让他翻译单个藏语单词,一直处于im sorry 状态,更别谈语句了。让他写give an example of tibetan倒是可以,但词和词义是完全无法对上的,根本就是完全虚假的答案。

使用swadesh list中纳瓦特尔语的单词,基本也是同样的结果。部分单词在刷新多遍之后能够给出“释义”,但根本牛头不对马嘴。give an example也是错漏百出,其余的就是根本无法处理。

所以我好奇这玩意儿输出所用的词库数据真的是谷歌翻译吧?

要发言请先登录注册