淘宝怎么找相似宝贝(决定论文生死的查重平台们,原来是这么判断重复的)

本报记者邹王亚赛

2019年翟天临论文造假事件让高校开始关注论文的重复率。时至今日,他的微博依然绕不开这个话题。

"让我们来一次幸运抽奖,并帮助支付体重检查费."

网友Epochigo_在5月24日留下的评论已经获得了超过25000个赞。

毕竟对于准毕业生来说,查重不仅是学业的要求,也是生活费用的威胁。

目前大部分高校的官方查重平台是CNKI。矛盾的是,知网并不开放个人测试的名额,很多学校也不会提供一两次免费查重的机会因此,很多学生在定稿前,不得不通过自己的渠道多次查重修改。

这些非官方渠道,如果是知名老字号,不一定便宜。



如果是在淘宝上盲目找店,可能要冒一些风险。

打着“知网官方”旗号的渠道,要么买到的是假货,要么可能是非法手段获得的免费名额。据《新京报》报道,一些在校学生发现,他们的知网账户被盗后,他们免费查重的机会被未知论文占据了。

不知名的第三方渠道,会有转卖论文的风险。澎湃湃文章中透露了“真实数字”。一个同学怀疑自己的论文被查重网站卖了,被别人买去当本科论文提交。结果他的论文在学校检查毕业论文质量时,发现查重率高达90%。

查重平台结果不一样,知网评分低

即使避开了这些坑,准毕业生也会遇到一个大问题:为什么每个平台的查重结果都不一样?如下图所示,6个查重平台对翟天临硕士论文的查重结果差距最大可达62%。



所以很多往届毕业生都会留下“论文部比知网严格”的印象。

这个印象可能是对的。

在知乎上,“PaperYY检查软件靠谱吗?”在这个问题下,133位网友分享了他们在CNKI和PaperYY的论文查重结果。可见,知网检测到的重复比例在大多数情况下确实较低。



淘宝怎么找相似

但也有例外。

网友不忘写,她室友的论文在PaperYY上找到的抄袭比例是4%,结果知网找到了60%。这位同学对比了两份查重报告后得出结论:知网比PaperYY多了一个“大学生论文联合比对数据库”,而我舍友恰好采用了学姐论文的结构,内容被抄袭,所以知网计算的抄袭率这么高。

平台间的差异:论文对比数据库和查重方法

这位网友的结论大概是对的。

论文对比库的范围是影响因素之一。比如PaperPass免费版的重复率往往偏高。学术不端网认为,这是因为PaperPass主要依靠网络资源库,网络上任何一句话都可以找到类似的句子。“最简单的就像百度搜索,你搜索的每一句话都会出现一系列相关内容”。

知网会更注重与学术论文的对比。下图中,以知网所包含的对比库类型为参照,我们可以看到,作为官方查重将采用的三个平台,会比“论文系统”更接近知网的配置。



各平台查重规则不一样,但“因为没有官方说法,所有算法模型都是网上传的”,建国云官方号在知乎问题“万方论文如何查重,与知网对比”中写道。

简进一步解释说:知网的查重算法有两个要点。一是引用文献占段落5%及以上;满足这个条件后,如果一个句子连续重复13个单词,那么这个句子就会被标记为红色,也就是判断为抄袭。万方的评判标准比较简单。如果一个句子中连续10个单词与库中的文章重复,该句子将被标记为红色。

这个判断规则的不同,基本是各类查重平台分析的共识。

另外,知乎大作家吴志根在他的专栏《论文查重减重策略:学术论文重复现象分析》中补充了一点。基于他的观察,知网还采用了“语义模糊算法”,即这种算法比逐字逐句更注重句子的中心意思和关键词。也就是说,同一段文字,如果只是另一种表达方式,就会被知网判定为重复。

这些额外的查重规则可能是知网会显得更“智能”的原因。准毕业生只能通过其他平台的反馈不断预测和逼近知网的结果,一次又一次的摸索和修正。

编辑:颜路

校对:刘伟

您可以还会对下面的文章感兴趣

使用微信扫描二维码后

点击右上角发送给好友