摘要

本发明提供一种在线互动问答文本特征构造方法和系统,涉及文本特征挖掘技术领域。本发明基于BERTopic模型设计了领域适用的主题特征构造方法,该方法对文档嵌入模型进行改进,即融入任务自适应预训练方法,实现了语义信息的精准捕捉;同时,提出基于相似性动态集成的交互特征构造方法,通过动态集成将多种相似度算法进行有机结合,得到相似度矩阵,提高了多维度挖掘交互信息的准确性;且设计融合多头注意力机制和门控机制的问答文本特征重要性自适应判别模型,考虑了不同文本特征的差异化预测或分类性能,自适应地赋予多维文本特征差异性权重,进而生成多维问答文本特征矩阵。本发明提高了构造问答文本特征的精度和泛化性。