品蔥有dataset 可以提供嗎?
一直想拿品蔥的完整數據看看,嘗試 train 一下 dataset,看看能不能夠做出一個鑒別五毛的模型,但是站主提供的sql應該是不包括被刪掉的帖子的,請問站主可否開放完整數據呢?
字數字數字數字數字數字數
字數字數字數字數字數字數
字數字數字數字數字數字數
字數字數字數字數字數字數
字數字數字數字數字數字數
字數字數字數字數字數字數
5 个评论
这个是不现实的,顶多屏蔽一些机器人复读机,而且误杀率肯定会想百度贴吧的智障审查系统一样高,想让AI理解很多极其隐晦的政治黑话基本上是可控核聚变那一档的科技。
已转移水区,水区内容不会在首页出现。若您认为本次转移有误,请在本帖操作栏中选择「投诉 - 请求移出水区」;发帖投诉或直接回复管理员不会得到处理。
【理由】重复:没有深度和广度拓展的重复性话题,请善用搜索功能,或适度拓展话题
【理由】重复:没有深度和广度拓展的重复性话题,请善用搜索功能,或适度拓展话题
每周数据备份:https://gitlab.com/pin-cong/data,查找因“多次发表中文世界反复出现的观点”而被封禁的用户
每周数据备份:,查找因“多次发表中文世界反复出现的观点”而被封禁的用户
但是那些被封禁用戶的帖子會不會出現在備份中呢?
这个是不现实的,顶多屏蔽一些机器人复读机,而且误杀率肯定会想百度贴吧的智障审查系统一样高,想让AI理...
我的意願是對那些低級五毛打個高一點的分,然後把他們在帖子中的位置壓低而已。