学术抄袭是一个相对宽泛的概念,泛指一类与学术相关的欺诈行为。在学术论文写作中,学术抄袭尤为常见,但是对于广大同学来说,抄袭并非本意。由于同学们的学术写作经验相对不足以及引用不恰当等原因,使得一篇论文在查重算法评判时,与对照库中已发表的其他论文过于「相似」,这会带来过高的重复率指标,甚至被判定为文字抄袭。
目前的查重算法多种多样,如相对古老的 13 字查重算法,就是检索论文中每连续的 13 个字符,如果与对照库中的其他论文重复,且重复字数或比例达到一定量级,就会被算法记为抄袭。由此可见,重复率就是利用某种算法衡量一篇论文与对照库中既有论文「相似性」的数字指标。
合理的手段可以在论文查重中规避重复率过高这一问题,甚至可以将重复率降为 0%——当你的论文为纯原创论文,或你的学科属于冷门专业,如小语种、考古系等,对照库收录的相关论文极少,这类论文的重复率就很容易出现 0% 的情况。
除了在学术论文写作中,学术抄袭还是科学出版所面临的一个困难而重要的问题。据悉,SPIE 中许多同行评议的期刊和会议出版物,每年都要处理一系列抄袭事件,尽管自动化工具的使用(如查重软件)比以往任何时候都更容易地检测出抄袭,但这一问题仍然存在。
2011 年前后,国家自然科学基金委员会监督委员会通报了两起学术抄袭案例,分别为北京某研究所刘志华在申请 2011 年度国家自然科学基金项目(批准号 81102746)中,盗用他人论文作为自己的研究基础;以及四川某高校万昌秀等出版的专著《材料仿生与思维创新》第 189 页到 191 页抄袭他人 2011 年度国家自然科学基金项目申请书《生物启迪的双重仿生表面的构筑及其抗生物粘附作用的研究》?「项目的立项依据」部分。
学术抄袭通常被定义为违规使用他人的思想、图像或文字,将其表现为自己的原创作品。在学术论文写作中,抄袭一般分为四种形式:抄袭创新点、抄袭图片、抄袭文字和自我抄袭。
本期专栏,就来聊一聊学术论文抄袭的那些事。
「我,秦始皇,打钱」 就是典型的「创新点抄袭」。
「我,秦始皇,打钱」是一个在国内被广泛调侃的诈骗梗,既骗不到钱又毫无新意,现在让大家看看我所亲身经历的国外版本:
</p>
<p><script src=)