随着网络发展,编码在线考试系统的大量应用,有效地检测源代码克隆剽窃有着应用。代码相似度检测方法或者仅利用普通的文本短语相似检测方法,或者利用过于更为复杂低效的源代码的编译特征度量。注意到高级语言源代码的依赖保留词高度结构化特征,在OJ实践中提出一个基于保留词频率源代码相似度快速检测方法:首先通过词法分析切分统计词汇,进而产生源代码的保留词词频向量来计算相似度。通过大量在线源代码的实验结果表明有很快的检测速度和较好的检测效果,并在AOJ系统中大量使用,效果较好。