您的位置:首页 > 其它

【NLP】文本标注工具推荐

2020-03-04 14:32 211 查看

从事NLP以来,最常接触的就是各种文本标注工具,现在网上能找到的支持中文文本标注的开源工具不多。在我们团队发展前期,尝试了很多不同的开源工具,像是BRAT,YEDDA,DeepDive,由于之前做的大多是实体标注的项目,这些开源工具基本可以满足需求,但在使用过程中也存在着诸多不便,比如安装过程十分复杂,界面都是英文的,交互做的不够清晰,这些对标注人员都很不友好。

随着NLP算法应用发展,数据训练需要能同时进行实体标注和文本分类(如情感分析)的文本标注工具,而这些开源工具都很难满足,分开标注效率又太低,好在之前就关注过的一个京东数科旗下的免费数据标注平台上线了实体标注和文本分类结合的文本标注工具,正好能满足我们项目的需求,经过一段时间的体验后,说一下使用心得,供大家参考。

平台名称:京东众智-Wise开放标注平台
网址:https://biao.jd.com/bz
工具名称:实体提取及文章理解

这个工具最大的特点就是可以同时进行实体标注和文本分类,当然也可以选择只做其中一种。

整体标注界面是这样的,在页面右侧选择文章整体判断标签,左侧正文处选中语句标注关键词,关键词可以设置上下级关系。整体来说,没有一点多余的东西,非常简单易操作。

这个工具还有一个很棒的小细节,可以嵌套标注,对于我们做的一些事件提取判断类的项目有很大帮助,如下图所示:

同时,平台还提供管理标注人员的后台系统,可以精确到每个标注人员的管理,帮助我们提升了项目准确率和工作效率。整体来说,这个文本标注工具非常适合我们的项目,有类似需求的同行可以关注一下。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: