NLP帖子标题相似度计算算法
可以用这个算法来查找类似的帖子标题,从而快速合并
[[NLP]基于Simaese LSTM的句子相似度计算
https://blog.csdn.net/android_ruben/article/details/78427068
这篇博文中所用的已经训练好的模型(需要用百度网盘下载)
https://kexue.fm/archives/4304
这个训练好的模型(三个GB左右)是百度网盘分享的,需要想办法找人帮忙下载并分享到github或者gitlab上去。
或者可以下载原始数据,自己训练模型
https://ai.tencent.com/ailab/nlp/data/Tencent_AILab_ChineseEmbedding.tar.gz
[[NLP]基于Simaese LSTM的句子相似度计算
https://blog.csdn.net/android_ruben/article/details/78427068
这篇博文中所用的已经训练好的模型(需要用百度网盘下载)
https://kexue.fm/archives/4304
这个训练好的模型(三个GB左右)是百度网盘分享的,需要想办法找人帮忙下载并分享到github或者gitlab上去。
或者可以下载原始数据,自己训练模型
https://ai.tencent.com/ailab/nlp/data/Tencent_AILab_ChineseEmbedding.tar.gz