Nature-专栏:让-AI-一键写系统性综述的话-ChatGPT-远远不够-一百年以后再看
人工智能工具正在帮助科研人员快速整合和理解大量科学文献,但完全自动化的高质量文献综述生成仍面临挑战,虽然能提升研究效率,但也存在生成低质量综述的风险,需谨慎使用,所以说现阶段还是人眼看论文靠谱。

网络的普及,加上文献数量的爆炸式增长,如今的科研人员要面临的一个主要难题就是,尽管可能已经收集了足够的数据来帮助理解某个复杂的领域或系统,但由于信息量的巨大,人类无法全面地阅读和理解所有文献。
就像是面对一个巨大的图书馆,虽然每本书都包含了宝贵的知识,但没有人能够阅读所有的书籍并从中获得一个完整的认知。

因此,尽管科学的进步为我们提供了大量的数据,但如何有效地整合和理解这些数据仍然是一个亟待解决的问题。
最近 Nature 上有一篇专栏文章,介绍了一些现有的、文献综述自动化生成的方法,并指出了这类方法主要面临的困境及用户痛点。

尽管身处 ChatGPT 时代,但想要完全没有人类参与,让 AI「一键」完成系统性综述生成,集查询、整理、文献筛选、总结归纳等于一身,并且没有幻觉错误,仍然是一项不可能完成的任务。
用 AI 做文献综述
几十年来,研究人员们一直在尝试提升「将大量相关研究汇编成综述」的速度,由于工作量过大,很多综述在提交的时候往往就已经过时了。
ChatGPT 等大模型展现出的超强语言理解能力,也再次激发了人们对于自动化综述的兴趣,今年 9 月,美国初创公司 FutureHouse 构建了一个新系统,宣称能够在几分钟内生成一个比维基百科更准确的科学知识综合页面,并且已经为大约 17,000 个人类基因(human gene)生成了维基百科风格的条目,其中大部分在此前缺乏详细的描述介绍。

一些科学文献搜索引擎也已经开始引入 AI 驱动能力,来帮助用户通过查找、排序和总结出版物来制作叙述性文献综述,但目前质量普遍比较低。
大多数研究人员都认可,离实现自动化「金标准综述」还有很长的路要走,整个过程涉及严格的程序来搜索和评估论文,还包括元分析来合成结果,或许 10 年、甚至 100 年后才能略有进展。
计算机辅助评审
几十年来,计算机软件一直在辅助研究人员搜索和解析研究文献。
早在大型语言模型(LLMs)出现之前,科学家们就开始使用机器学习和其他算法来帮助识别特定研究,或快速从论文中提取发现,但类似 ChatGPT 这样的大模型让自动综述的能力显著提升。
不过,研究人员表示,要求 ChatGPT 或其他 AI 聊天机器人从头开始撰写学术文献综述,是相当不现实的。
如果模型被要求对某个主题的研究进行综述,LLM 可能会从一些可信的学术研究、不准确的博客中,或是其他未知的信息来源中整合信息,而不会对最相关、最高质量的文献进行权衡。
LLMs 的运行机制,即通过反复生成对查询在统计上合理的单词,决定了模型对同一个问题会生成不同的答案,并「幻想」出一些错误信息,比如众所周知的「不存在」的学术引用,和人类进行综述的过程可以说是毫无相似之处。

一个更复杂的过程是检索增强生成(RAG),包括将预先选定的论文语料库上传到 LLM,并要求模型从中提取关键点,并基于这些研究给出答案,可以在一定程度上减少幻觉现象,但无法完全消灭幻觉。
RAG 的过程中,还可以设置信息来源,类似 Consensus 和 Elicit 等专门的、AI 驱动的科学搜索引擎就是这样做的,虽然大多数公司没有透露系统工作的确切细节,但大体上就是将用户的问题转化为对学术数据库(如 Semantic Scholar 和 PubMed)的搜索,并返回最相关的结果。
基于搜索结果,大型语言模型(LLM)会总结这些研究,并将其综合成一个「带引用来源」的答案,用户可以根据具体需要选择要引用的工作。
丹麦南部大学奥登塞分校的博士后研究员 Mushtaq Bilal 认为,这些工具肯定能让提升综述和写作的效率,并且还自己开发了一个工具 Research Kick。
至少搜索引擎引用的内容是绝对真实存在的,用户可以进一步点击查看,自己分辨。
不同的辅助工具有不同的特点,例如 Scite 系统可以快速生成支持或反驳某个主张的论文的详细分解,Elicit 等系统可以从论文的不同部分提取间接(方法、结论等)。

大多数 AI 科学搜索引擎不能全自动地生成准确的文献综述,其输出更像是「一个本科生通宵达旦,然后总结出几篇论文的主要观点」,所以研究人员最好使用这些工具来优化综述过程中的部分环节。
但这种工具还有一些缺点,例如只能搜索开放获取的论文和摘要,而非文章的全文,Elicit 搜索约 1.25 亿篇论文,Consensus 包含超过 2 亿篇。
大部分研究文献都处于付费墙后,而且搜索大量全文计算量很大,让 AI 应用运行数百万篇文章的全部文本将需要很多时间,计算成本也会非常高。
系统性综述仍然很难
叙述性地总结文献已经非常难了,如果想把相关工作系统性地综述更是难上加难,一个专业的研究人员也需要花费数月甚至数年才能完成。
根据 Glasziou 团队的分析,系统综述包括至少 25 个仔细的步骤,在梳理文献后,研究人员必须从长列表中筛选出最相关的论文,然后提取数据,过滤出可能存在偏见的研究,并综合结果。
这些步骤通常还需要另一位研究人员进行重复,以检查不一致性。
在 ChatGPT 出现之前,Glasziou 开始尝试创造科学界的世界纪录:在两周内完成一篇系统综述。
Glasziou 和其他几位同事,包括 Marshall 和 Thomas,已经开发了计算机工具来提高效率,当时可用的软件包括 RobotSearch,能够快速从一系列研究中识别出随机试验;RobotReviewer 可以帮助评估研究是否存在因为未充分盲化而产生偏见的风险。
第一次尝试最终总共用了九个工作日;后来团队又将该记录缩短到了五天。这个过程还能变得更快吗?

Elicit 是一家专注于帮助研究人员进行系统综述而不仅仅是叙述性综述的公司,但该工具并不提供一键式系统综述,而是自动化其中某些步骤,包括筛选论文和提取数据等。
大多数使用 Elicit 进行系统综述的研究人员都会上传使用其他搜索引擎找到的相关论文,但用户普遍担心这类工具可能无法满足研究的两个基本标准:透明度和可复制性。
如果不理解具体的算法,那就不算是系统综述,而只是一篇简单的综述文章。
今年早些时候,Glasziou 团队成员 Clark 领导了一项系统综述,研究了使用生成式 AI 工具辅助系统综述的研究,最终团队只找到了 15 项已发表的研究,并将 AI 的性能与人进行充分对比。
这些尚未发表或同行评审的结果表明,这些 AI 系统可以从上传的研究中提取一些数据,并评估临床试验的偏差风险。
现有的模型在阅读和评估论文方面似乎做得还不错,但在所有其他任务上表现得非常糟糕,包括设计和进行完善彻底的文献搜索。
潜在风险
自动化信息合成也伴随着风险。
研究人员多年来就知道许多系统评价存在冗余或质量差等问题,而人工智能可能会使这些问题变得更糟;作者可能会有意或无意地使用人工智能工具来快速完成不遵循严格程序或包含低质量工作的评审,并得到误导性的结果。
除了综述别人的工作外,Glasziou 表示,这类模型还可以促使研究人员快速检查以前发表的文献,找出其中的错误,来继续提高研究人员的水平。
甚至在未来,人工智能工具可以通过寻找 P-hacking 等明显迹象来帮助标记和过滤掉质量较差的论文。
Glasziou 将这种情况视为一种平衡:人工智能工具可以帮助科学家做出高质量的评审,但也可能会让部分研究者快速生成不合格的论文,目前还不知道会对出版的文献产生什么影响。
有些研究者认为,合成和理解世界知识的能力不应仅仅掌握在不透明的营利性公司手中,希望未来可以看到非营利组织构建并仔细测试人工智能工具,小心谨慎地,尽可能保证每次提供的答案都是正确的。
参考资料:
https://www.nature.com/articles/d41586-024-03676-9
-
聚合入口app黑科技-聚合入口app黑科技免费观看版v2.4.1
在如今的数字时代,智能手机和各类APP已经成为我们日常生活中不可或缺的一部分。尤其是聚合入口APP黑科技-聚合入口APP黑科技免费观看版v2 4 1,它为广大用户提供了一个全新的应用体验,极大地提升了
2025-12-01 19:52:15 -
亚欧mv洲高清砖砖专区-亚欧mv洲高清砖砖专区高清资源免费看v8.9.6
在当今信息化时代,线上娱乐已经成为许多人日常生活的一部分。特别是对于学生、上班族、大学生等群体,如何方便快捷地获取高质量的影音资源,成为了他们最大的需求之一。亚欧mv洲高清砖砖专区-亚欧mv洲高清砖砖
2025-12-01 19:41:31 -
18款免费深夜禁用黄app入口-18款免费深夜禁用黄app入口无需会员版v6.4.7
在现代社会,智能手机已成为我们生活的一部分,娱乐方式也不断多样化。对于许多热衷于寻找“深夜娱乐”的用户来说,18款免费深夜禁用黄app入口-18款免费深夜禁用黄app入口无需会员版v6 4 7提供了一
2025-12-01 19:33:54 -
福利院私人永久伊甸hd-福利院私人永久伊甸hd免费播放国语版v6.9.3
在现代社会中,在线影音平台已成为人们放松娱乐的重要方式。而在这些平台中,福利院私人永久伊甸hd-福利院私人永久伊甸hd免费播放国语版v6 9 3无疑吸引了大量观众的关注。其丰富的内容、高清的画质以及便
2025-12-01 19:22:54 -
成品人片a观看入口-成品人片a观看入口无限次数版v5.3.0
在网络视频的快速发展下,越来越多的观众开始寻求便捷和高质量的观影体验。成品人片a观看入口-成品人片a观看入口无限次数版v5 3 0正是满足这一需求的完美选择。用户可以通过这一入口轻松访问各类热门视频,
2025-12-01 19:13:54 -
杏花免费观看完整版-杏花免费观看完整版在线观看完整版v12.15.13
随着现代网络的迅猛发展,越来越多的观众通过互联网享受各种电影和剧集内容。在这一趋势下,《杏花免费观看完整版-杏花免费观看完整版在线观看完整版v12 15 13》成为了许多人热议的话题。这部作品不仅因其
2025-12-01 19:04:14
-
男二也要被爆炒吗N-作者筏喻:精彩不容错过
:一部不容错过的精彩之作在众多网络文学作品中,男二也要被爆炒吗 N以其独特的魅力脱颖而出,作者筏喻用其精彩的笔触为读者编织了一个令人沉醉的故事世界。这部作品首先吸引人的是其新颖的设定。通常,在传统的故
2024-09-29 16:06:45 -
我爱搞内容丰富网友:海量资源应有尽有轻松找到喜欢的内容!
“我爱搞”平台因其内容的多样性和丰富性受到了广泛的好评。网友们纷纷表示,无论你喜欢哪种类型的内容,打开“我爱搞”,总能轻松找到你感兴趣的资源。平台上不仅涵盖了影视剧、综艺节目等娱乐内容,还有各种新奇有
2024-10-13 10:30:31 -
魅影iOS官方版下载安装详细教程:轻松完成魅影App安装-享受流畅使用体验
魅影iOS官方版是一款备受用户青睐的应用软件,凭借其简洁的界面和强大的功能,已成为众多iPhone用户的必备工具。如果你也想体验这款应用并在iPhone设备上顺利安装,那么了解如何下载安装魅影iOS官
2024-11-12 10:12:39 -
“水神芙宁娜激战史莱姆:友热议新风向游戏界的逆袭传奇”
江湖传闻,水神芙宁娜与史莱姆的激战,早已掀起一场网络论战的风暴。这场看似荒诞不经的较量,却成为游戏界的新宠,令人啼笑皆非。你听说了吗?那场战斗简直是一场视觉盛宴,水神芙宁娜如狂风暴雨般席卷史莱姆军团,
2024-09-23 16:14:32 -
九幺玩命加载中怎么办-如何解决游戏加载缓慢的技术问题
在这个快速发展的时代,网络游戏早已成为许多人日常生活的一部分。而当我们在享受这些游戏时,最不想遇到的就是那种“九幺玩命加载中”的情况。无论是在激烈的对战中,还是在想要快速进入游戏的时刻,加载时间过长都
2024-11-18 18:59:06 -
xboxone欧版-xboxone欧版无限次数版v13.13.7
xboxone欧版在这款影视资源观看手机软件里面,用户想看的内容都可以查找到,在这里不仅提供了高清的影片,还有离线缓存的功能能够帮助用户更好地看剧,在xboxone欧版软件中,用户的信息都是经过保密存
2025-01-10 17:02:15 -
国产DB624色谱柱8m入口-解析国产色谱柱的特点和优势
国产DB624色谱柱8m入口,作为国内色谱柱市场的重要产品,具有许多独特的优势和特点。本文将从国产色谱柱的历史渊源、技术优势和行业应用等方面展开解析,带您全面了解国产色谱柱的魅力所在。国产色谱柱的历史
2024-10-27 13:00:43 -
“机机对机机手机免费下载版:功能丰富-下载无忧”
机机对机机手机免费下载版:轻松体验,功能丰富,下载无忧。如今,手机应用市场上有着大量的应用和游戏,用户可以根据自己的喜好自由选择。而在众多应用中,机机对机机手机免费下载版因其独特的功能和便捷的下载方式
2024-09-02 10:29:00 -
如何轻松打开魅影B站-探索无限精彩内容:带你走进B站的魅力世界
如今,视频网站已经成为我们日常生活的一部分,其中B站作为年轻人最常使用的影音平台之一,因其丰富的内容和互动性而备受喜爱。在B站上,有一个非常受欢迎的板块,那就是魅影。魅影作为B站的一个专区,汇聚了大量
2024-11-13 13:42:41 -
雷电将军被丘丘人抓去繁衍后代:掌管着雷电之力
据古代传说,雷电将军是天界的一位强大神将,掌管着雷电之力,为神界带来了无尽的力量和威严。然而,就在一次意外的时候,雷电将军在执行任务的途中,被狡猾的丘丘人抓住并带到了他们的部落。丘丘人是一个体型矮小但
2024-09-29 13:38:18
















