手机知网 App
24小时专家级知识服务
打 开
中国文学
基于DA-BERT-CRF模型的古诗词地名自动识别研究——以金陵古诗词为例
古诗词地名实体识别不仅有助于深度挖掘古诗词文本之间的关联,而且有助于绘制中国诗歌版图分布,推动空间维度的中国古典文学研究。文章围绕南京城系统采集有关古诗词数据,采用BIOES方法进行地名实体标注。针对古诗词领域训练数据匮乏、以字代词等问题,提出一种采用数据增强方法,同时融合预训练模型与条件随机场方法的古诗词地名识别模型,简称DA-BERT-CRF模型。文章将训练数据采用实体交叉互换方法进行数据增强处理,然后通过预训练模型BERT得到古诗词地名的上下文语义信息,最后利用条件随机场CRF实现地名标签约束并生成全局最优地名序列。文章提出的DA-BERT-CRF模型十折交叉实验平均精确率、平均召回率和平均F值分别为86.49%、90.44%、88.35%。
0 105
开通会员更优惠,尊享更多权益
手机阅读本文
下载APP 手机查看本文
图书馆杂志
网络首发
论文一键智能排版
排版交给我们,时间留给研究
立即查看 >
相似文献
图书推荐
相关工具书

搜 索