据海外科技媒体及社交平台消息,知名AI科学家杨立昆(Yann LeCun)在离开Meta相关职务后,公开指称Meta的某模型在基准测试中通过非常规手段提升成绩,存在“刷榜”嫌疑。这一说法在AI研究与工业界激起较多讨论,也使Meta模型在公开榜单上的排名真实性成为关注议题。
杨立昆在其社交账号与访谈中提到,Meta的部分模型在参加某些公开AI能力评测时出现与常规表现不一致的成绩跃升,疑似利用规则漏洞或针对性优化来抬高排名。他并未透露具体模型名称与测试项目细节,但强调此类做法会削弱基准测试的公信力,并对研究生态造成误导。Meta方面目前未就此作出详细回应,仅表示公司遵循各评测机构规则,并持续优化模型表现。部分参与相关评测的第三方机构称,已注意到外界质疑,正检视测试流程与数据提交的合规性。
从行业角度看,顶尖实验室间的模型性能竞争常伴随榜单排名的变动,而“刷榜”指通过非通用能力提升方法获取高分,可能影响外界对技术水平的客观认知。杨立昆的离任身份与学术声誉,使他的指称受到较高重视,也促使业界重新审视公开基准测试的防操控机制。如果调查确认存在违规优化,不仅涉事模型成绩可能被撤销,还会对相关机构的公信力造成影响。另一方面,该事件也提醒研究者在引用榜单数据时应结合多维度验证,避免单一排名作为技术实力的绝对依据。
综合来看,杨立昆在离任后指Meta模型存在刷榜行为,已将竞赛排名的真实性与评测机制的稳健性问题推至前台。无论最终调查结果如何,这一争议为AI社区提供了关于如何维护评测公正性与研究透明度的讨论契机。后续Meta的回应、相关机构的核查进展及行业规则的调整方向,仍值得持续追踪,或将影响未来公开基准测试的设计与采信方式。











