当地时间5月14日,Science在其线上新闻专栏Science Insider发文称,大量低质论文正在借公共数据库和AI技术之便,涌入学术期刊。
统计学家Matt Spick在担任Scientific Reports副主编时发现,大量采用美国国家健康与营养调查(NHANES)等公开数据的低质论文,正在涌入评审流程,“有时甚至一天(能收到)两篇”。这些论文的形式极为相似:先选定一种健康状况以及与之可能相关的环境或生理因素,再确定特定人群,随后围绕这些要素迅速形成一篇论文。Spick称,“感觉每一种可能的组合都有人在研究”。
Matt Spick团队在PubMed、Scopus这两个论文数据库的147 种期刊中,找到了341篇遵循上述“套路”的论文,不过这些论文的时间分布有明显区别。2014年到2021年期间,平均每年仅有4篇相关论文。但从2022年起这类论文发表量激增,截至2024年10月,论文研究团队关注的期刊上共发表了190篇相关论文。
Spick团队的报告指出,近年来基于NHANES数据库的低质论文泛滥,可能是“论文工厂”的运作、人工智能生成文本的滥用以及大型公共数据库的成熟共同促成的。
此外,Spick团队还发现,近期发表的使用NHANES数据的论文,大多出自中国研究人员之手。在2021年之后发表的这类论文中,有92%的论文第一作者来自中国机构,而在2021年之前的论文中,这一比例仅为8%。Spick分析称,中国科研人员所面临的压力和激励机制,为“论文工厂”提供了机会。
西北大学的Reese Richardson表示,其他研究人员在一些课题中也发现了类似现象,”这种免费数据源让几乎任何人都可以采用已知的研究方法,然后换上新的变量,以一种‘疯狂研究’的姿态创造出新的‘发现’。”目前已有出版商撤回了部分涉及NHANES数据的问题论文,并表示将加强审查。
Richardson指出,这些论文反映出科学出版和研究奖励方式中存在的普遍问题。“文中提及的所有出版商都收取了这类论文的发表费用,每家可能在1000美元左右。”他补充道,研究人员为了自身职业发展,往往选择发表更多的论文而不是更高质量的论文。他警告说,“除非我们从根本上调整科学发表的激励机制,否则问题只会越来越严重。”
2025海外优青申请人可以扫描下方二维码,添加时代学者小编微信(微信号:shidaixuezhe2),申请加入微信交流群。