中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

杨立昆离任后指Meta模型存在刷榜行为 涉竞赛排名争议

2026-01-10 12:21:31 来源:IT之家 A+A-

据海外科技媒体及社交平台消息,知名AI科学家杨立昆(Yann LeCun)在离开Meta相关职务后,公开指称Meta的某模型在基准测试中通过非常规手段提升成绩,存在“刷榜”嫌疑。这一说法在AI研究与工业界激起较多讨论,也使Meta模型在公开榜单上的排名真实性成为关注议题。

杨立昆在其社交账号与访谈中提到,Meta的部分模型在参加某些公开AI能力评测时出现与常规表现不一致的成绩跃升,疑似利用规则漏洞或针对性优化来抬高排名。他并未透露具体模型名称与测试项目细节,但强调此类做法会削弱基准测试的公信力,并对研究生态造成误导。Meta方面目前未就此作出详细回应,仅表示公司遵循各评测机构规则,并持续优化模型表现。部分参与相关评测的第三方机构称,已注意到外界质疑,正检视测试流程与数据提交的合规性。

从行业角度看,顶尖实验室间的模型性能竞争常伴随榜单排名的变动,而“刷榜”指通过非通用能力提升方法获取高分,可能影响外界对技术水平的客观认知。杨立昆的离任身份与学术声誉,使他的指称受到较高重视,也促使业界重新审视公开基准测试的防操控机制。如果调查确认存在违规优化,不仅涉事模型成绩可能被撤销,还会对相关机构的公信力造成影响。另一方面,该事件也提醒研究者在引用榜单数据时应结合多维度验证,避免单一排名作为技术实力的绝对依据。

综合来看,杨立昆在离任后指Meta模型存在刷榜行为,已将竞赛排名的真实性与评测机制的稳健性问题推至前台。无论最终调查结果如何,这一争议为AI社区提供了关于如何维护评测公正性与研究透明度的讨论契机。后续Meta的回应、相关机构的核查进展及行业规则的调整方向,仍值得持续追踪,或将影响未来公开基准测试的设计与采信方式。

Tags:Meta
(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

欧盟启动对 AI 全产业链反垄断审查 英伟达 Meta 等巨头成为重点调查对象

欧盟委员会正式宣布对人工智能全产业链发起反垄断审查,英伟达、Meta 等科技巨头被列为首批重点调查对象。审...[详细]

2026-03-16 07:26:24

Meta雷朋联名智能眼镜去年销量超700万副 较上次公布销量实现近三倍增长

近日,Meta与雷朋(Ray-Ban)联合发布的智能眼镜交出亮眼市场成绩单——2025年销量突破700万副,相比双方...[详细]

2026-02-25 07:22:36

TrendForce预估Meta Ray-Ban Display将带动今年全球AR眼镜出货量至95万台

市场研究机构TrendForce最新预测显示,Meta与Ray-Ban合作推出的智能眼镜系列——Meta Ray-Ban Disp...[详细]

2026-02-14 18:55:59

扎克伯格不惧泡沫论调 Meta预计今年支出最高1350亿美元 双倍加码AI投入

Meta首席执行官扎克伯格近日公开表示,公司对于外界有关人工智能领域存在泡沫的讨论并不担忧,并披露Meta预计20...[详细]

2026-02-14 18:55:59

Meta因性暗示内容暂停青少年使用AI伙伴,将推家长监管

Meta公司近日宣布,将在全球范围内暂时阻止青少年使用其AI聊天伙伴功能,并承诺在新版本中引入家长监管功能。据...[详细]

2026-02-02 07:43:21

联系方式

商务QQ:19667318