摘要
随着软件的规模和复杂度持续上升,在软件开发中不可避免地会引入缺陷,而如何对软件进行缺陷预测也成为了软件工程研究的热点领域之一。现有的软件缺陷预测方法主要根据源码结构提取预测信息而忽视了软件缺陷报告的作用,而软件缺陷的相关报告广泛存在于各软件技术论坛上,也是软件缺陷预测的重要依据。因此本文提出了一种基于爬虫的软件缺陷预测方法,其主要手段是通过爬虫获取技术论坛中用户提交的缺陷报告信息,并通过机器学习技术的处理,指导开发人员在开发过程中避免相关缺陷,提高软件质量。
-
单位南京大学; 计算机软件新技术国家重点实验室