论万方数据的论文相似性检测系统

今天得知万方数据近期推出了论文相似性检测系统beta。在官方的新闻稿中指出这套系统基于数字化期刊全文数据库、学位论文全文数据库等万方数据核心数据资源,通过Web模式,快速灵活进行单篇论文检测;为了满足广大科研机构对论文评估的需求,6月率先在国内推出了支持批量检测、断点续传等功能的检测客户端。目前国内近百家高等学府和核心期刊出版机构已将该系统纳入内部论文、稿件的评审系统,进一步提高了学术水平和稿件质量,推动了学术创新。

在万方数据之前已经有很多论文相似性检测系统并且已经运用于中国各大高校的硕博毕业论文的检测了。万方数据的这套系统在创新性方面应该并没有太大的突破,不过最大的优势应该还是基于万方数据目前强大的核心数据资源。但是我觉得对于这套系统的意义说的好囧,搞出了一个系统就能提高学术水平和稿件质量?就能推动学术的创新?这明显是一种治标不治本的做法。近几年来论文抄袭、剽窃等学术造假行为屡见不鲜,但为什么会出现这种现象呢?在目前高校的硕博生培养中,发表若干篇论文、撰写毕业论文都是硬性指标,但是要知道目前高校连年疯狂扩招,我们学校硕博生合起来就比本科生多很多,这么多人都在搞学术研究,都要写论文,都要发表文章,怎么办?

由此现在社会出现了一个很奇怪的现象。以前是报社杂志社给稿件撰写人提供稿费,现在是撰稿人给报社杂志社缴纳版面费,甚至动用金钱、关系等各种资源,就是为了一篇论文能顺利发表。现在评职称也是要发表论文的。但是全国一共就那么多的期刊杂志,能容纳的稿件是有限的,需要发表论文的人却远远大于目前国内期刊杂志所能容纳的量,由此论文质量下降,各种抄袭、剽窃也再所难免。

我觉得现在中国还有一个很奇怪的现象,就是把参考文献的引用作为了涉嫌论文抄袭、剽窃的挡箭牌。有不少已发表的论文,基本上没有什么新观点,但是你又不能说他抄袭,因为他在参考文献里都注明了一些观点的出处,让你无话可说。

当然,也有人说不能拿制度方面存在的问题来为学术造假找借口。这固然是对的,学术抄袭、剽窃毕竟是个人主观造成的。但是我们既然实施了扩招,既然选择了以论文为衡量某些核心评价的依据,就必须去承担由此造成的后果。论文相似性检测系统的不断完善,短期内会对论文抄袭剽窃给予一定的打击,但是从长远角度看,道高一尺魔高一丈,只要人发挥主观能动性,总会想出办法来绕过这套系统的检测。提高学术水平,推动学术创新,需要一系列不同层次的措施相互配合,才能起到良好的效果。