全球权威报告被扒:参考文献造假!居然也被 AI 骗了……
健康
健康 > 正文

全球权威报告被扒:参考文献造假!居然也被 AI 骗了……

这次 AI 骗了波大的。

不是学术论文,而是全球级别的政策报告。

据 Retraction Watch 报道,世界银行发布的一份关于肥胖/粮食系统的官方报告,被发现引用了至少 14 条根本不存在的文献。

图片

在这之前,这份报告已经被下载了 133 次,现在已经从官网撤下审查。

国际组织权威报告

AI 这波骗了个大的

这份报告名为 Nourishing Tomorrow: Addressing Obesity Through Food Systems in South Asia,发布在世界银行开放知识库,主要分析南亚不同食品体系如何影响肥胖相关趋势。

报告的四位作者中,三位是世界银行员工,还有一位是印度某医学院的副教授。

一名巴基斯坦的科研人员在某个科研群里看到这份报告,有人提了一句,说其中某些引用看起来怪怪的,他顺手一查就发现:

148 条学术类引用里,有至少 14 条在数据库里找不到对应文章。

218 条政策/报告/新闻类引用里抽查 32 条,至少 14 条无法验证来源。

世界银行官方给出的回复是:「我们要求研究人员恪守高标准的职业规范,包括准确使用来源。该报告已从网站撤下审查,并将重新发布时附上更正说明。」

官方并没有具体解释这些假引用是怎么混进来的,但查不到 + 看起来格式很像的引用错误模式在如今的科研环境里,确实是 AI 幻觉的典型特征。

有些人可能要问,这可是有全球权威的组织,报告结论要为国际政策提供依据的,居然也会被假文献骗到?

但仔细想想你会发现,这类报告反而更容易被钻空子。

看起来权威的报告

可能更容易被 AI 钻空子

首先,这类报告通常先确定主题(比如上面的肥胖、食品系统、南亚、公共卫生影响),这往往属于政策层面的命题,并不是学术假设。

在学术论文里,一条引用可能决定结论,但在政策报告里,很多引用只是用来说明已有研究关注这个问题:

已有研究表明……

大量文献指出……

也就是说,引用是背景材料,不是核心证据,写作目标是「证明我这句话不是拍脑袋」,而不是「这是一条必须被复核的数据来源」,所以存在性比准确性更容易被默认。

其次,这类宏观综合型报告,并不像单一疾病机制研究,往往文献跨度大、学科交叉多、很多作者也不是每个子领域的专家。

这就很适合 AI 发挥了:用看起来真实的期刊名、合理的研究方向、标准的引用格式,把不同领域的文献逻辑缝合起来,但没人真正熟到能一眼识别真假。

而且这类报告的目标读者往往是政策制定者、管理层、跨部门协调者,报告作者就会刻意避免复杂的方法学、过多技术细节、或是过长的原文引用说明,整体引用存在感低,但量大,这也是 AI 假文献最容易隐身的环境。

哪些医学研究方向

容易被 AI 假文献污染?

回到医学研究本身,我们盘点了一些容易被 AI 假文献污染的研究方向,如果有你的领域,记得擦亮双眼。

需要说明的是,这不是这些学科本身的问题,只是它们的写作结构与评价体系刚好和 AI 的生成逻辑高度重合,更容易被钻空子。

公共卫生 / 全球健康 / 健康政策:天然引用密集型,文献来源杂(医学期刊、政策报告),而且很多结论不依赖单篇关键研究,写这类研究基本属于 AI 的舒适圈。

社会医学 / 医学人文:学科论证往往靠叙述,而不是靠复现,很多经典观点反复被引用,却很少被回溯源头,这时候就很容易让 AI 很贴心地帮你补上一篇「你最需要的研究」。

营养学 / 生活方式医学 / 慢病流行病学:热门方向比较稳定(炎症、肠道菌群、代谢),AI 在这些关键词上几乎不会出离谱的错误;研究结论比较容易预测:……相关……可能通过某机制……仍需更多研究,这也是 AI 擅长的语气。

医疗管理 / 卫生经济学:这类引用往往是概念支撑,而不是证据核心,典型场景是成本效益分析、系统框架、管理模式,容易忽略原始研究核查。

那哪些学科相对安全?

强实验复现依赖,单篇文献决定性强,圈子小,作者高度可识别,稍有问题就会被同行直接打脸。

但注意,这只是相对,不是绝对免疫。

因为 AI 污染往往的不是前沿发现,而是背景、共识、综述、框架,这些内容一旦被污染,就很难被单次纠错清干净,防不胜防。

最终要破此局,无他,唯有亲手搜索而已。

来源:丁香园

亲爱的凤凰网用户:

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

第三方浏览器推荐:

谷歌(Chrome)浏览器 下载

360安全浏览器 下载