BERT命名实体识别代码链接:
GitHub - kamalkraj/BERT-NER: Pytorch-Named-Entity-Recognition-with-BERT
数据集train.text 中的数据格式:
Dev数据集测试命令行:
python run_ner.py --data_dir=/data --bert_model=bert-base-cased --task_name=ner --output_dir=out_basess --max_seq_length=128 --do_train --num_train_epochs 5 --do_eval --warmup_proportion=0.1
运行结果截图:
Test 数据集测试命令行:
python run_ner.py --data_dir=/data --bert_model=bert-base-cased --task_name=ner --output_dir=out_basestest --max_seq_length=128 --do_train --num_train_epochs 5 --do_eval --eval_on test --warmup_proportion=0.1
运行结果截图:
从实验结果开看,我比链接中显示的结果要略差一点,F1值低一些。我这边服务器的GPU配置是两个1080ti。
注:
Accuracy(准确率):预测正确的元素个数/总的元素个数
Precision(查准率): 预测正确的实体个数/预测的实体总个数
Recall(召回率):预测正确的实体个数/标注的实体总个数
F1 值:F1 = 2 *准确率 * 召回率 / (准确率 + 召回率)