面向专家示例的Stack Overflow本体构造和推理研究

作者:阮书鹤; 钟林辉*; 高荣锦; 祝艳霞; 陈浩然; 卢腾骏; 夏子豪
来源:计算机应用研究, 2023, 40(12): 3736-3741.
DOI:10.19734/j.issn.1001-3695.2023.03.0145

摘要

Stack Overflow是一个计算机领域的IT技术问答网站,为了获取问答网站中的专家示例并将其应用于API挖掘中。首先采用Scrapy爬虫框架技术获取Stack Overflow问答网站中的结构化数据,并存储在关系模式中;再使用本体建模工具Protégé构建本体,然后使用D2RQ工具实现对关系数据库的知识抽取,将关系模式转换为三元组形式的本体模型;同时,提出了一个面向专家示例的子本体抽取算法,用于从原本体中抽取出专家示例推理相关的子本体,并提出了若干条专家示例推理规则,能推导出专家所编写的代码示例。实验结果证明,从Stack Overflow本体模型中抽取的专家示例能提高API调用序列挖掘的准确率。

全文