摘要

诸如Stack Overflow这种软件开发问答网站已成为开发者在编程中寻找问题解决方案的主要手段,它们通过众包的方式为开发者提供解决方案和代码片段作为参考。自动识别代码片段的用途将为软件开发问答网站的知识抽取提供支持。通过对Stack Overflow上的问题及代码片段进行研究,总结出4种问题类型和8种代码片段类型。在此基础上,实现基于朴素贝叶斯的自动分类方法。实验表明,8个类型代码片段的分类准确率都在50%以上,整体准确率达到70%以上。