一种融合D＿BBAS方法的重复缺陷报告检测

曾方; 谢琪<sup>*</sup>; 崔梦天

doi:10.19734/j.issn.1001-3695.2022.05.0241

摘要

为了更有效地获得缺陷报告的非结构化信息的特征，提出一种D＿BBAS(Doc2vec and BERT BiLSTM-attention similarity)方法，它基于大规模缺陷报告库训练特征提取模型，生成能反映深层次语义信息的缺陷摘要文本表示集和缺陷描述文本表示集；利用这两个分布式的表示集计算出缺陷报告对的相似度，从而得到两个新的相似度特征；这两个新特征将与基于结构化信息生成的传统特征结合后参与重复缺陷报告的检测。在著名开源项目Eclipse、NetBeans和Open Office的缺陷报告库上验证了D＿BBAS方法的有效性，其中包含超过50万个缺陷报告。实验结果表明，相比于代表性方法，该方法的F1值平均提升了1.7%,证明了D＿BBAS方法的有效性。

单位
西南民族大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-20 20:28

一种融合D＿BBAS方法的重复缺陷报告检测

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友