一、Python中文数据处理库
中文复合事件的概念与显式模式 包括条件事件、因果事件、 顺承事件、反转事件等事件抽取, |
|
识别出图片中的中文文本 | |
文本挖掘和预处理工具(文夲清洗 、新词发现、情感分析、 实体识别链接、句法分析等) 无监督或弱监督(种子词)方法 |
|
汉字数字(中文数字)-阿拉伯数字转换工具 |
搜集、整理、发布 中文 自然语言处 理语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展 |
数据量3G;纯文本,每行一篇,JSON格式 name是微信公众号名字, |
|
百度知道问答语料库包括超过580万的问题 ,938万的答案5800个分类标签。 基于该问答语料库可支持多种应用,如闲聊问答逻輯挖掘。 |
|
整理知识图谱相关学习资料 | |
基于依存句法与语义角色标注的事件三元组抽取 | |
利用网络上公开的数据构建一个小型的证券知识图谱/知识库 |
|
大规模中文知识图谱数据 | |
针对某一事件话题下的新闻报道集合通过使用docrank算法,对新闻报道进行重要性识别并通过新闻报道时间挑选出时间线上重要新闻。 |
发布了68 篇原创文章 · 获赞 21 · 访问量 2万+