中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

杨立昆离任后指Meta模型存在刷榜行为 涉竞赛排名争议

2026-01-10 12:21:31 来源:IT之家 A+A-

据海外科技媒体及社交平台消息,知名AI科学家杨立昆(Yann LeCun)在离开Meta相关职务后,公开指称Meta的某模型在基准测试中通过非常规手段提升成绩,存在“刷榜”嫌疑。这一说法在AI研究与工业界激起较多讨论,也使Meta模型在公开榜单上的排名真实性成为关注议题。

杨立昆在其社交账号与访谈中提到,Meta的部分模型在参加某些公开AI能力评测时出现与常规表现不一致的成绩跃升,疑似利用规则漏洞或针对性优化来抬高排名。他并未透露具体模型名称与测试项目细节,但强调此类做法会削弱基准测试的公信力,并对研究生态造成误导。Meta方面目前未就此作出详细回应,仅表示公司遵循各评测机构规则,并持续优化模型表现。部分参与相关评测的第三方机构称,已注意到外界质疑,正检视测试流程与数据提交的合规性。

从行业角度看,顶尖实验室间的模型性能竞争常伴随榜单排名的变动,而“刷榜”指通过非通用能力提升方法获取高分,可能影响外界对技术水平的客观认知。杨立昆的离任身份与学术声誉,使他的指称受到较高重视,也促使业界重新审视公开基准测试的防操控机制。如果调查确认存在违规优化,不仅涉事模型成绩可能被撤销,还会对相关机构的公信力造成影响。另一方面,该事件也提醒研究者在引用榜单数据时应结合多维度验证,避免单一排名作为技术实力的绝对依据。

综合来看,杨立昆在离任后指Meta模型存在刷榜行为,已将竞赛排名的真实性与评测机制的稳健性问题推至前台。无论最终调查结果如何,这一争议为AI社区提供了关于如何维护评测公正性与研究透明度的讨论契机。后续Meta的回应、相关机构的核查进展及行业规则的调整方向,仍值得持续追踪,或将影响未来公开基准测试的设计与采信方式。

Tags:Meta
(责任编辑:Diy92)

推荐阅读 相关文章

谷歌2025“复仇爽文”迎大结局 从至暗时刻到王者归来

2025年,谷歌用一系列关键突破与业绩反弹,为过去几年的"至暗时刻"写下"复仇爽文"式的大结局,实现从承压到领跑的...[详细]

2026-01-01 09:01:52

医生警示:AI聊天机器人与精神病病例或存关联

有医生提出警示,AI聊天机器人的使用可能与某些精神病病例的出现或加剧存在关联,引发医学界、心理学界与科技伦...[详细]

2026-01-01 09:01:52

扎克伯格率 Meta 闯“地狱模式” 高强度押注AI求王者归来

2025年,扎克伯格将Meta带入由他亲自定义的"地狱模式",以极限节奏推进人工智能战略,在组织、资源与绩效上全面变...[详细]

2026-01-01 09:01:52

Hengbot正式推出Sirius机器狗:集成OpenAI,踢足球、可跳舞

6月26日消息,Hengbot 推出了Sirius 机器狗,该机器狗主打敏捷运动,可踢足球、跳舞,同时集成了OpenAI大语言模型,可...[详细]

2025-06-27 09:54:28

小米首款AI眼镜正式发售:超级小爱、看一眼支付、第一人称相机,最低售价1999元起

6月26日消息,在小米人车家全生态发布会上,小米首款AI眼镜正式发布。小米AI眼镜重量40g,可选三种镜框,支持线下和...[详细]

2025-06-27 09:54:28

杨立昆离任后指Meta模型存在刷榜行为 涉竞赛排名争议

据海外科技媒体及社交平台消息,知名AI科学家杨立昆(Yann LeCun)在离开Meta相关职务后,公开指称Meta的某模型在基...[详细]

2026-01-10 12:21:31

扎克伯格率 Meta 闯“地狱模式” 高强度押注AI求王者归来

2025年,扎克伯格将Meta带入由他亲自定义的"地狱模式",以极限节奏推进人工智能战略,在组织、资源与绩效上全面变...[详细]

2026-01-01 09:01:52

1亿美元值了 Meta成功挖走三名OpenAI研究人员

6月26日消息,据《华尔街日报》周三报道,在OpenAICEO奥尔特曼日前指控Meta 试图挖角后,MetaCEO马克・扎克伯格已...[详细]

2025-06-27 09:54:28

苹果将发布Metal4 API,助力Mac游戏性能大幅提升

6月10日消息,在 WWDC2025 上,苹果公司发布了针对AppleSiliconMac 的Metal4API,尽管苹果并未详细透露未来游戏的...[详细]

2025-06-13 08:09:31

英国多组织建议监管机构限制Meta利用人工智能进行风险评估

6月9日消息,据卫报报道,互联网安全活动人士向英国通信监管机构 Ofcom 发出呼吁,要求限制人工智能在关键风险评...[详细]

2025-06-11 08:22:38

联系方式

商务QQ:19667318