摘要
命名实体识别通常利用词向量模型提取词向量空间作为固定全局特征,通过单一神经网络进行训练并测试结果,特征提取单一,泛化能力不佳。针对上述问题,使用神经网络集成,将多个双向长短时记忆神经网络进行有效结合、综合决策。将ε不敏感损失函数引入到双向长短时记忆神经网络中,证明其能保证个体分类器的差异性。通过实验分析不同的词特征提取、神经网络模型结构、模型参数对个体分类器差异性的影响,通过理论分析和实验研究对集成学习在命名实体识别领域中个体分类器差异性带来的有益效果进行研究。通过实验结果验证了个体分类器差异性与集成学习的提升度之间的密切联系。
-
单位中国矿业大学; 中国矿业大学(北京); 中国科学院