电子预印本文献库论文数破百万

来源:http://www.timer-motor.com 作者:科技中心 人气:144 发布时间:2020-03-16
摘要:Ginsparg表示,100万篇文章是一个自然的里程碑,但物理学家或许更偏好其他数值上的标志。“100万被赋予意义只是因我们碰巧有10个手指头才发生这样的十进制事件。一些人认为,220=1

Ginsparg 表示,100万篇文章是一个自然的里程碑,但物理学家或许更偏好其他数值上的标志。“100万被赋予意义只是因我们碰巧有10个手指头才发生这样的十进制事件。一些人认为,220= 1048576是一个更重要的数字。同时,它还是1兆字节所含有的字节数。”

自1991年启动以来,arXiv成为物理、数学等领域成果的世界最大“集散地”。每个人都能在这里发表论文,并且不需要完整的同行评议。但论文需要接受质量控制程序。一个计算机程序会对论文进行最终检查:将该论文的文本内容与其他发表在arXiv上的论文进行比较。目标是标记可能存在较高剽窃风险的论文。

澳门新葡萄京集团3522,1991年8月,arXiv作为一种“电子公告板”宣告成立。它用了17年的时间累积了50万篇草稿,但此后仅用了6年便将拥有的论文数翻番。如今,研究人员每个月会向arXiv提交约8000篇论文,平均下来每天要提交250余篇。该文献库的管理人员在进行简单的质量控制检查后,会分批发布未经同行评议的原始草稿。

“文本重叠”是技术用语,有时它也能证明论文是“清白的”。例如,一篇综述文章可能引用大量内容,或作者会再利用和略微修改之前文章的语句。arXiv剽窃监测系统会让这类论文通过。“这是一个非常智能的机器。”美国康奈尔大学物理学家、arXiv创始人Paul Ginsparg说,“它有特殊的方法检测大块引用、斜体字文本、引号内容以及数学定理陈述,以避免出现主动错误信息。”

2014年12月29日,在管理人员休完假归来并将12月24日之后提交的草稿更新至文献库后,arXiv的论文数突破了100万篇。通过判断arXiv主页上目前所展示论文的流水数,具有里程碑意义的第100万篇草稿是由来自美国密歇根州立大学的Ashwini Maurya于格林尼治标准时间2014年12月26日7点34时19分提交的。

澳门新葡萄京集团3522 1

arXiv.org是一个非常流行的预印本文献库。物理学家、数学家和计算机科学家通常会将论文草稿上传至该文献库,以便在同行评议前公开分享他们的研究发现。如今,该文献库已拥有100万余篇研究论文。

Ginsparg和该校物理学博士生Daniel Citron比较了1991~2012年提交给arXiv 的75.7万篇文章。结果发现,一篇论文引用的已发表内容越多,其被引用率就可能越低。他们还注意到,“文本再使用”惊人地普遍。过滤掉综述文章和合理引用后,每16位arXiv作者中,就有1位存在大段抄袭其已发表文章的行为。更令人担忧的是,每1000位作者中就有1人从其他论文中抄袭了近1段文字,但没有标注出处。

澳门新葡萄京集团3522 2

另外,作者在向arXiv提交论文时,会注明自己的居住国。因此这将揭示哪些国家剽窃率最高。不过,Ginsparg表示,其研究中的文本重叠并不一定是剽窃。数据显示,来自美国、加拿大以及欧洲和亚洲少数工业化国家的研究人员提交的论文占arXiv论文的最大份额,而且剽窃率也更低。例如,有20%的保加利亚作者被标记,这是新西兰的8倍多。日本约为6% (269 / 4759),而伊朗超过15%。

本文由澳门新葡萄京集团3522发布于科技中心,转载请注明出处:电子预印本文献库论文数破百万

关键词:

最火资讯