手机知网 App
24小时专家级知识服务
打 开
戏剧电影与电视艺术
融合GCN远距离约束的非遗戏剧术语抽取模型构建及其应用研究
[目的]针对非遗传统戏剧提出一种效果更优的术语抽取模型,并构建出传统戏剧术语库。 [方法]本文首先从术语类别、语义结构和文本长度上分析了戏剧语言特征。根据以上语言特征,本文以BERT-BiLSTM-CRF模型为基础,在BERT获得的字符表示上加入了词性和领域特征。之后在BiLSTM后加入图卷积网络(GCN),更好地捕捉句子中远距离词语的约束关系。 [结果]结果表明融合GCN和外部特征的术语抽取模型F1值达到91.11%,比主流的BERT-BiLSTM-CRF高出1.3%。 [局限]本文仅选择了百度百科、非遗官网作为实验数据,并未验证将模型扩展到其他来源的自由文本中的识别效率。戏剧术语中某些类别的训练集偏少,且实验数据和模型中外部特征的选择不够全面。 [结论]本文根据传统戏剧语言特征,提出了一种融合GCN和外部特征的戏剧术语抽取模型,构建了传统戏剧术语库,并将模型应用于术语库的扩充,为后续构建传统戏剧知识图谱打下基础。
0 142
手机阅读本文
下载APP 手机查看本文
数据分析与知识发现
网络首发
相似文献
图书推荐
相关工具书

搜 索