摘要

将代码转化为程序依赖图进行比较是代码相似度比对的方法之一。论文针对传统查找方法效率较低,耗时较长的问题,提出一种基于频繁子图挖掘的代码相似度比对方法。该方法用频繁子图挖掘的过程对程序依赖图进行处理,并用一种吸收马尔科夫链的模型描述该过程;在此基础上,用一种Horvitz-Thompson估计的方法估算相似比。测试结果表明,和传统的方法相比,这种方法可以有效提升准确率和效率,适用于更大规模的代码段。

  • 单位
    中国人民解放军陆军工程大学; 中国人民解放军防化学院