论文查重的规则主要包括以下几个方面:
文本相似性:
查重系统通过与学术文献数据库的比对,计算论文与现有文献的相似性。通常,当相似性超过特定界限时,会被认为是抄袭或剽窃行为。
参考文献:
学术论文常引用其他文献,查重系统也会检查引用是否规范。不当引用或未标注引用同样被视为学术不端。
文本构造与语言:
查重还会审视文本构造和语言的相似性,包括段落布局、句式结构和词汇运用等方面。
图形与数据:
论文中的图形和数据,如图表、统计数据等,也是查重的对象。抄袭或篡改图形、数据同样构成学术不端。
公正性:
查重工作应保持公正,不偏不倚。无论是学生还是教育工作者,都应受到相同的查重准则和原则的约束。
隐私权保护:
在查重过程中,应尊重作者的隐私权。查重工具应遵守隐私保护法规,确保作者的个人信息和研究成果不被外泄。
不同的查重系统可能有不同的查重算法和数据库,因此同一篇论文用不同的查重系统,被标红判定为抄袭的地方也会有差异。例如,知网查重系统对连续13个字符重复的内容会进行标红,而paperpass则是将句子相似度超过40%的内容标红。
此外,查重系统通常会对论文进行分层处理,按照篇章、段落、句子等层级分别创建指纹,并与资源库中的文献进行比对。这种分层多阶指纹结构有助于提高查准率和检全率。
在查重时,一般要求整篇论文上传,但并非所有内容都属于查重范围。例如,参考文献和附录一般不查重,而封面、原创性声明、页眉页脚、脚注、公式、图片等通常也不列入检测范围。
不同高校对论文查重率的要求不同,一般要求本科生的论文查重率不得高于30%,硕士生和博士生的论文查重率分别不得高于20%和10%。
最后,建议在撰写论文时遵循学术诚信原则,避免抄袭和剽窃行为,确保论文的原创性。