TUMCC

TUMCC Telegram地下市场中文语料库一个专业术语识别领域的中文语料库,共收集了来自12 个Telegram 群组19821 位Telegram 用户的28749 个句子,包括804,971 个字符,发布前也完成了数据筛选和分词工作,所以使用起来比较方便,而且还有整理后的版本,有需要的可以到GitHub上面学习。

Telegram地下市场中文语料库-TUMCC

Telegram地下市场中文语料库

地址:https://github.com/m1-llie/TUMCC

本文链接:https://www.fooliji.com/46429/

  1. 转载请保留原文链接谢谢!
  2. 本站所有资源文章出自互联网收集整理,本站不参与制作,如果侵犯了您的合法权益,请联系本站我们会及时删除。
  3. 本站发布资源来源于互联网,可能存在水印或者引流等信息,请用户擦亮眼睛自行鉴别,做一个有主见和判断力的用户。
  4. 本站资源仅供研究、学习交流之用,若使用商业用途,请购买正版授权,否则产生的一切后果将由下载用户自行承担。
  5. 联系方式(#替换成@):feedback#abskoop.com