中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低

2025-05-25 10:51:15 来源:IT之家 A+A-

5月23日消息,据外媒 TechCrunch 今日报道,在 Anthropic 于旧金山举办的首场开发者活动“Code with Claude”上,CEO 达里奥・阿莫代伊表示,现在的 AI 模型产生“幻觉”的频率可能比人类还低

注:所谓“幻觉”是指 AI 虚构内容却以事实的形式呈现出来。

阿莫代伊强调,AI 出现幻觉并不会阻碍 Anthropic 迈向 AGI 的目标。“这取决于你用什么标准衡量,但我怀疑 AI 模型的幻觉频率可能低于人类,只是它们出错的方式更出人意料。”

阿莫代伊一向是业界对 AGI 持最积极态度的声音之一。他说:“人们总想找出 AI 能力的‘上限’,但目前根本看不到这样的限制。”

不过,并非所有人都认同这种看法。谷歌 DeepMind CEO 哈萨比斯本周指出,当前的 AI 模型“漏洞百出”,连一些基本问题都回答错误。

也有迹象表明,在处理复杂推理任务时,一些新模型的幻觉反而更严重。比如 OpenAI 的 o3和 o4-mini 版本幻觉率就比此前的推理模型更高,甚至连 OpenAI 自己也搞不清楚原因。

阿莫代伊还提到,人类本身也经常出错。因此,他认为 AI 出错并不说明它“不够聪明”。不过他也坦言,AI 以极高信心讲出错误信息,确实容易引发问题

(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

月之暗面回应KimiK2.5 Cursor使用并感谢马斯克发声

月之暗面就KimiK2.5在Cursor编辑器的使用情况作出回应,确认该模型已支持在Cursor中调用并完成代码生成、补全...[详细]

2026-03-29 10:52:06

软银拟在美建AI数据中心 全球最大投660亿美元

软银集团宣布计划在美国建设全球规模最大的AI数据中心,总投资额约660亿美元,选址聚焦电力资源丰富且网络延迟...[详细]

2026-03-29 10:52:06

WordPress.com接入AI智能体 可代写及优化SEO

WordPress.com日前宣布接入AI智能体功能,支持为用户代写博客文章并自动优化搜索引擎排名要素。该智能体基于...[详细]

2026-03-29 10:52:06

彭博社称马斯克派xAI工程师争夺xAI OpenAI客户

彭博社报道,马斯克已派遣旗下xAI的工程师团队主动接触部分OpenAI的企业客户,试图以算力优惠与定制化模型服务...[详细]

2026-03-29 10:52:06

美国男子用AI诈骗写歌+机器人刷量骗千万美元版税被抓

美国执法部门日前逮捕一名男子,其利用生成式AI创作歌曲并借助机器人账号在流媒体平台大量刷播放量,以此骗取超...[详细]

2026-03-29 10:52:06

联系方式

商务QQ:19667318