中国数学领域首次被曝涉嫌论文批量造假:牵涉65篇,虚构作者,相互抄袭
Original 李贤煥
DeepTech深科技
学术界臭名昭著的论文工厂的身影再一次被捕捉,这一次批量生产的论文进入到了数学领域,在以往,这被认为是相对 “纯净” 的学科,而作者则主要来自国内。
署名为 Smut Clyde 的学术打假人在关注学术诚信的网站 For Better Science 上发文爆料,一批数学领域的论文显示出一致的造假痕迹,包括虚构国外作者、论文内容出现虚假数学公式,且问题论文之间频繁相互引用、抄袭。其中部分论文已被期刊撤稿。
截至发稿,已有 65 篇论文牵涉其中(包含 21 篇已被撤稿),署名作者人数达到 77 人,分别来自国内 44 家高校。被质疑涉嫌造假论文列表:http://suo.im/5yJKqg
图 | 65 篇疑似造假论文列表中文版
该文章作者 Smut Clyde 曾曝出多起学术造假事件,全程参与的还有另外一位揭假者,一直以 Tiger BB8 为名活跃在论文打假领域。两人此前曾与前斯坦福大学助理研究员伊丽莎白 · 毕克 (Elisabeth Bik) 联手,揭露了多起生物、医学领域的学术造假。其中,最明显的一个特点是图片复制或是伪造图表等现象。而在数学领域,至少论文工厂批量产出问题论文的现象还是首次发现。这批论文集中出现了十余个国外作者,声称来自多个多个不同国家的高校,但两人进一步调查却发现,这些位于国外的作者无一例外都是被虚构出来的。同时在论文内容方面,频频出现虚假数学公式和反复抄袭,论文之间互相引用,操作手法如出一辙。这批论文牵涉到 44 个国内高校,分布广泛,上到浙江大学、对外经济贸易大学这样的中国一流学府,下到普通专科院校,统统出现在了名单当中。中国论文作者则包括了高校的一线教师、研究员,也有 3 名高校学院院长级的人物牵涉其中。此外数十篇疑似问题论文可能涉及省级、甚至国家级科研基金的资金支持,统计下来,这批论文有 14 篇注明得到了国家自然科学基金的资助,2 篇提到获得国家重点基础研究发展计划(973计划)资助,省级的科学基金则涉及到了黑龙江、四川、山西、河南、河北、新疆等。5 月 18 日,Retraction Watch 撤稿观察网站上刊出关于三篇论文的撤稿消息,分别将三位中国学者牵涉其中。这三篇论文分别发在了 Journal of Inequalities and Applications,Advances in Difference Equations,Fixed Point Theory and Applications,涉及到的中国作者分别是李志强(河南大学商学院副院长)、sheng pang(浙江财经大学),以及闫振海(河南财经政法大学统计学院)。图 | 3 篇撤稿论文信息(来源:Retraction Watch)Retraction Watch 网站指出,三篇论文存在类似的问题,包括抄袭、伪造同行评议。近年来,中国学者涉嫌论文造假的事件频出,抄袭和伪造同行评议这两种手法比较常见。但吊诡的是,三篇论文均有外国合作者,并且指向同一个人:Beatriz Ychussie。根据论文信息, Beatriz Ychussie 本应来自丹麦罗斯基勒大学数学学院,但 Retraction Watch 指出,罗斯基勒大学已经声明该校并无此人,他的身份就此成谜。撤稿信息发出至今已经一个多月了,Beatriz Ychussie 和三位中国学者均未对撤稿事件作出回应。DeepTech 就此事致电闫振海所在的河南财经政法大学,一名学术委员会工作人员表示,校方已就撤稿事件对闫振海进行了内部处罚,但具体结果并未对外公布。包括闫振海在内,此次曝出的 65 篇论文中有 8 位作者来自河南财经政法大学,学术委员会工作人员表示会根据线索展开调查。打假者顺着名字继续搜索 Web of Science 数据库,发现 Beatriz Ychussie 一共只有 4 篇署名论文,除了上述 3 篇被撤稿的文章,最后一篇共同论文的作者一栏同样出现了一个中国人的名字:周口师范学院黄锦锦。在打假人联系论文出版社后,这篇署名黄锦锦、Beatriz Ychussie 的论文已于上周被期刊撤稿。一个神秘作者带出了 4 篇撤稿论文,合著者全部来自中国,这让人很难不产生怀疑。TigerBB8 告诉 DeepTech,看到这则消息后的第一反应就是:Beatriz Ychussie 是个虚构的作者。TigerBB8 所在的团队有着丰富的打假经历,根据过往经验,如果这是有组织进行的批量论文造假,那么身份不明的神秘作者也可能成批存在。果然,以问题论文之间的抄袭、引用关系作为线索,一连串来自日本、泰国、尼日利亚、埃及、巴西、墨西哥和澳大利亚的作者陆续出现在了问题论文名单中,情况开始变得更加明朗。TigerBB8 猜测,在论文作者栏加上国外作者的名字,一方面可能是西方的名字可以像有了光环一样,易于获得期刊编辑的信任,让论文顺利发表。讽刺的是,也正是花样百出的造假手段,让国外出版社在面对国内学者论文时变得更加谨慎。另一方面,这种编造出来的 “国际合作” 对中国高校体系的学者来说,在升职方面同样可能提供额外的收益。蹊跷的是,根据目前整理所得,这批问题论文最早从 2013 年开始出现,一直持续到 2020 年,但 2018 年是一道明显的分界线。外国 “神秘作者” 集中出现在了 2018 年以前发表的论文当中;从 2018 年开始,神秘作者又集体消失,似乎意味着论文工厂的运作手段发生了转变。造成这一现象的原因未明,只能依靠推测。Tiger BB8 认为,2018 年后或许是论文工厂业务顺利,发起论文来变得更加自信。“2018 年以后,可能他们已经知道无论递什么破论文,都能得到发表。意味着这个时候这些期刊里的内线已经打通,或是期刊本身只要收钱就能发表。”来自各国的神秘机构、神秘作者频繁出现,还只是这批问题论文的疑点之一。在论文内容方面,频频出现的虚假数学公式和反复抄袭,论文之间互相引用,如同乱炖一般,论文内容不同犹如口味各异,但操作手法却如出一辙。这进一步显示出,问题论文可能来自论文工厂的批量产品。此前在数学领域,至少论文工厂批量产出问题论文的现象没有发现过,直到这次。TigerBB8 介绍:“我们感觉到他们其实挺会写论文的。”他们在仔细阅读和对照后发现,一些论文的摘要、简介和结论写的很完善且工整。不认真对照,或是在数学家以外的人看来,可能真的就觉得是一篇很规矩的论文。但实际上中间的推导过程就可能是乱七八糟的。Tiger BB8 辗转将其中一篇论文发给一位国内数学领域的院士审阅,该院士直接指出:这里面的公式是错的。Tiger BB8 分析称,他们在经过详细梳理之后发现,这一系列论文工厂的生产在最开始时是有 “原材料” 的:在内容上,论文抄袭的源头集中到了几篇正常论文上。在论文列表里,发布时间最早的问题论文的原材料都是正常的论文,即通过抄袭正常论文生产出早期产品。这些正常的论文就包括乔蕾(河南财经政法大学)与邓冠铁(北京师范大学教授)于 2013 年合著的论文;以及乔蕾与黄锦锦(周口师范学院)于 2012 年合著的论文(doi:10.1155/2012/203096)Tiger BB8 判断,在正常论文的基础上,或是掐头去尾,或是摘取论文的头尾,拼凑出新的问题论文,“真的像炒菜一样乱搅”。每篇正常论文通常能关联到 3 篇甚至更多的问题论文。其中乔蕾与黄锦锦合著的正常论文被抄袭之后,得到三篇问题论文,目前已有一篇被撤稿;乔蕾与邓冠铁合著正常论文也被引用、抄袭产生 3 篇论文,其中一篇已被撤稿,另外两篇也存在虚构作者和作者机构的嫌疑。这时候,乔蕾这个名字就进入了打假人的视线,他自己的论文多次与问题论文产生关联。他的合作者也牵涉到了问题论文漩涡当中,黄锦锦曾与乔蕾在 2012 年合作发表过正常论文,而黄锦锦后续的两篇论文则出现了抄袭、虚构作者的情况,其中一篇已被出版社撤稿。DeepTech 查询发现,乔蕾于 2010 年在北京师范大学获得博士学位,其导师正是邓冠铁教授。两位打假者把邓、乔的论文反复检查多次,发现他们的署名论文本身并未发现造假痕迹,但论文被集中地引用、抄袭,这种现象并不常见,以至于 Tiger BB8 在采访中表达了自己怀疑:邓、乔对这批问题论文的存在是否知情?在他看来存在这样的可能性,但目前没有任何证据能够支持这一观点。DeepTech 就此事邮件联系乔蕾、邓冠铁,截止发稿未获回应。回到这批问题论文,两位打假人将所有论文进行梳理后发现,通过抄袭正常论文产出问题论文只是第一步,后续的问题论文之间则存在更加频繁的抄袭和虚假引用。按照 Smut Clyde 的原话说,“他们越来越自信,认为自己的工作不应该被埋没,所以他们也开始引用自己的问题论文”。比如来自河南财经政法大学的徐刚、赵涛和成都信息工程大学杨拍合著论文(doi: 10.1186/1687-2770-2013-262)被引用次数为 5,而这 5 篇论文全部上榜,且悉数被撤稿处理。河南科技大学杨德五与河南财经政法大学任煜东的合著论文(doi: 10.1007/s12044-014-0167-6)在声称受到了乔蕾的国家自然科学基金资助的基础之上,论文本身被质疑存在抄袭。同时论文进一步被 11 次引用,其中 8 篇在后来遭到撤稿。图 | 左侧论文内容正常,右侧论文存在疑似造假痕迹,红线表示抄袭关系,灰线表示引用,中间黑点表示论文已被撤稿。访问链接可获得完整列表:http://suo.im/6b0PhU
论文列表右侧灰色线条连接的论文表示两篇论文之间存在引用关系,红色线条则意味着赤裸裸的抄袭。在密密麻麻的引用、抄袭关系当中,这些问题论文或多或少地都被代表着抄袭、引用的线条勾连。
打假者强调:有些论文之所以被列入名单中,并不是因为文章本身存在抄袭,而是因为它们引用了现在已经被撤回的论文,而且这些论文依此被证明存在虚假引用的情况。在杂乱的引用、抄袭链条中,薛定谔的名字频频出现,成为了这批问题论文的绝对核心。通过简单统计,在 65 篇论文中,仅标题出现薛定谔(Schrödinger、-Sch)的论文就有 34 篇,占比超过一半。对薛定谔及延伸的概念进行粗暴地替换,是这批问题论文不断 “繁衍” 的一大特点。比如将 “Schrödingerean predator-prey system” 与“the Schrödinger-prey operator”两个概念在替换中产生新的问题论文。Tiger BB8 表示,这也是在通过原材料生产新论文之后的又一典型操作。“甚至我们认为薛定谔已经成了这批论文生产过程中的胡椒粉、调味料。”“薛定谔”这个看起来 “高大上” 的抽象概念,不见得能在数十篇论文的帮助下产出更多的研究成果,不过确实让这批问题论文成为围绕薛定谔展开的一次狂欢。这些错综复杂的引用、抄袭逻辑共同构成了这批问题论文的脉络,而正好顺着这些脉络,这几十篇藏在学术角落的问题论文被两人连根拔起,进一步画出论文的生产流程:以正常论文为 “原材料”,通过抄袭和虚假引用生产第一批问题论文,在衍生出来的论文之间进一步“混搭” 产出更多问题论文,最后署上来自不同学校、机构的作者名字,同时提交给不同的期刊去发表。在除去了两个来自行业公司的作者后,统计下来的作者来自 44 个机构,作者总数达到 77 个,在这 60 余篇论文当中,河南财经政法大学牵涉到了 14 篇论文,哈尔滨工程大学的作者也参与到了 10 篇论文当中。高校院长级别的人物也牵涉其中,路勇为哈尔滨工程大学动力与能源工程学院副院长;李志强为河南大学商学院副院长;孙建国为哈尔滨工程大学计算机科学与技术学院副院长。DeepTech 就此事邮件联系 3 位副院长,截至发稿未获回复。
在已经整理出来的 65 篇论文里,孙建国的名字 7 次出现在论文作者栏中,合作者也来源广泛,除了同校同事,还有来自国外的神秘作者,以及像贵州职业技术学院这样的专科院校老师。孙建国本人关联的两项国家自然科学基金(NSFC 61202455, 61472096)、一项教育部高等学校博士学科点专项科研基金(20112304120025) 也被列在涉事论文中。其中两篇论文已经分别于今年 1 月、4 月被期刊撤稿,撤稿原因为抄袭、伪造同行评议和作者身份存疑。图 | 孙建国已被撤稿信息(来源:Retraction Watch)
DeepTech 就孙建国撤稿事件在联系哈尔滨工程大学时,该校教育督导委员会表示不接受媒体采访,继续致电该校新闻办公室,对方表示已记录采访申请,后续会尽快给出答复。截止发稿,哈尔滨工程大学尚未作出回复。这 44 个机构分布广泛,上到浙江大学、对外经济贸易大学这样的中国一流学府,下到普通专科院校,统统出现在了名单当中。其中不少作者在论文当中提到他们的研究获得了省级、获国家自然科学基金会等机构的支持,统计下来,这批论文有 14 篇注明拿到了国家自然科学基金的资助,省级的科学基金则涉及到了黑龙江、四川、山西、河南、河北、新疆等。如前文所说,在 2018 年之前,诸多论文作者栏出现了来自国外高校的神秘作者。而在 2018 年之后的论文中,国外作者基本退场,轮到国内来自不同地方、不同高校的作者之间“通力合作”。相比于不同论文之间千丝万缕的“联系”,这些在问题论文中共同署名的作者反而少了很多共同点。在地域上,国内的合作者常常分隔几地,横跨上千公里“合作写论文”。而检索知网发现,很多合作者完全没有合作发表过中文论文,却一起发表了这些英文论文,这为他们之间合作关系的真实性画上了问号。如果说网络让远程合作成为可能,不同学校、机构间的巨大差异也让这些合作变得更加可疑。比如浙江大学数学科学学院 Xu Chen与湖南高速铁路职业技术学院的张磊(音译)之间的合作。浙江大学在中国高等教育体系排名中属于绝对的头部,而资料显示,湖南高速铁路职业技术学院则是一个专科院校。且两人在学科背景上也沾不上边,张磊所在的铁道建筑系和数学相去甚远,两人合作研究 “薛定谔” 的画面也是疑点之一。因为在浙江大学数学科学学院的网页上没有看到名字拼写符合 Xu Chen 的教师,打假人推测 Xu Chen 很可能是捏造的,让浙江大学无辜躺枪。再比如,河南财经政法大学、天津工业大学、海南工商职业学院的作者一起,在薛定谔的身上产生了研究兴趣,他们三人除了学校排名、地域差距巨大,三人的学科各异,天津工业大学的穆静(音译)甚至来自于学校的管理学院。“这些专科院校的老师突然研究起了薛定谔,很难不让人起疑心。”这些论文把五湖四海的作者汇聚在了一起,除了在同一篇文章上署名,多数文章里的合作者几乎没有共同点,显示出团购论文的迹象。此前,数学界的一个普遍认识是,数学论文可能会出错,但不会像需要实验或数据的自然科学那样造假。因为数学的证明和计算都是明摆着的,同行随时能够查验,无法欺骗。但这种共识,可能被这批来自国内的问题论文所打破。