摘要

目前软件领域中软件开发问答网站应用广泛,但是针对网站用户的API讨论情况的研究较少。对于用户在问答网站中的API讨论在句式、语义上的研究,将帮助后续研究人员更好地构造自然语言处理程序,自动化提取网站中用户讨论的核心内容,开展其他方面的研究。收集Java与Android API集合,定义规则生成API的别名库,使用文本匹配的方法对Stack Overflow帖子中的API进行实体识别。人工分析Stack Overflow中用户对10个常用API的讨论后,得到API常以导入语句和赋值表达式的形式出现在不规范句子中,在规范语句中作为主语和宾语,用户倾向于讨论程序错误、原理及用法介绍和同类API对比,以及用户习惯省略方法参数或过长的全限定名的结论。