基于Python的作业相似度检测的研究与实现
随着互联网的快速发展,信息共享的途径不断增多,高校作业雷同现象越来越多。为了解决这一问题,基于Python环境主要依赖Jieba分词库以及Gensim工具包,实现了对高校学生电子作业雷同的检测。通过对待查重文件的预处理、生成分词列表以及利用gensim工具包对工作流程进行分析,通过TF-IDF算法进行关键字提取,训练模型计算出文本相似度,并应用在实践教学里,高校教师可根据查重结果对学生针对不同的情况进行教学安排,可以培养学生独立自主完成作业的习惯,促进良好学风的建设。