摘要

作业抄袭检测是文本抄袭检测的一个重要分支。针对教学过程中普遍存在的作业抄袭现象,本文在详细分析计算机相关课程作业抄袭特征的基础上,提出一种基于聚类的抄袭检测算法,通过Winnowing方法获取作业抽样指纹,避免分词带来的误差和效率问题;使用不对称相似度衡量作业间的相似程度,获得抄袭作业清单;引入聚类方法对作业中抄袭片段进行启发式合并,降低干扰信息给文本定位造成的影响。

全文