发现了一款比较方便标注的工具
https://github.com/jiesutd/SUTDAnnotator ,使用python2编写的界面,相对比较轻量,适合个人使用。但如果是团体使用的,还是web界面的会比较好。
运行Annotator_backup.py得到如下界面:open导入文件,选中要标注的词语,按下已设定好的快捷键A-V,即可完成对应的标注
修改添加上自己所需的实体名:在对应的快捷键的右边输入实体名,按下remap按钮即可重新分配快捷键对应的实体名
导出结果:export
其他更详细的操作参照github中的描述
将标注好的ann文件转成常用的训练样本的格式,以下有python3实现
<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">