摘要

代码克隆检测问题是软件工程领域一个基础的研究课题,在代码片段推荐、软件项目维护等应用领域发挥着重要的作用。随着在线代码库中代码规模的快速增长,以及信息检索、机器学习领域的快速发展,代码克隆检测的研究也取得新的进展。介绍代码克隆检测的基本概念与主流方法,重点介绍近几年基于信息检索、机器学习的代码克隆检测的主要方法,对基于token的融合信息检索与深度学习的方法进行实验。