摘要
针对目前软件项目开发过程中无法充分利用已有业务资源,进而导致开发效率低、能力弱等问题,通过研究业务资源之间的关联,提出一种基于业务流程的认知图谱:首先通过正式文档抽取业务知识,提出建立知识层级的方法并对其进行修正;然后通过代码特征挖掘与代码实体相似度判断构建代码网络模型;最后利用实际业务数据进行实验验证,并同向量空间模型、多样化排序、深度学习等方法进行对比。最终构建的基于业务流程的认知图谱在代码检索方面优于目前基于文本匹配的方法和深度学习算法,分别在前K准确率(precision@5)、平均精度均值(Mean Average Precision,mAP)、归一化折扣增益值(Normalized Discounted Cumulative Gain,?-NDCG)三项指标上高过第二名多样化排序算法4.3、0.38、2.74个百分点,有效解决了潜在业务词汇识别、业务认知推理表示等多个问题,提升了代码检索效果与业务资源利用率。
- 单位