科技中国

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

Meta 推出 Apollo 开源模型,让 AI “看懂”视频

2024-12-18 17:11:15 来源:IT之家 A+A-

12 月 18 日消息,Meta 携手斯坦福大学,推出全新 AI 模型系列 Apollo,显著提升机器对视频的理解能力。

注:尽管人工智能在处理图像和文本方面取得了巨大进步,但让机器真正理解视频仍然是一个重大挑战。

视频包含复杂的动态信息,人工智能更难处理这些信息,不仅需要更多的计算能力,而且如何设计最佳 AI 视频解读系统,也存在诸多困难。

在视频处理方面,研究人员发现,保持每秒恒定的帧采样率能获得最佳结果。因此 Apollo 模型使用两个不同的组件,一个处理单独的视频帧,而另一个跟踪对象和场景如何随时间变化。

此外,在处理后的视频片段之间添加时间戳,有助于模型理解视觉信息与文本描述之间的关系,保持时间感知。

在模型训练方面,团队研究表明训练方法比模型大小更重要。Apollo 模型采用分阶段训练,按顺序激活模型的不同部分,比一次性训练所有部分效果更好。

此外 Meta 公司还不断优化数据组合,发现 10~14% 的文本数据,其余部分略微偏向视频内容,可以更好地平衡语言理解和视频处理能力。

Apollo 模型在不同规模上均表现出色,较小的 Apollo-3B 超越了 Qwen2-VL 等同等规模的模型,而 Apollo-7B 超过更大参数的同类模型,Meta 已开源 Apollo 的代码和模型权重,并在 Hugging Face 平台提供公开演示。

参考

  • Meta's new Apollo models aim to crack the video understanding problem

  • Meta AI Releases Apollo: A New Family of Video-LMMs LARge Multimodal Models for Video Understanding

  • Apollo: An Exploration of Video Understanding in Large Multimodal Models

Tags:Meta
(责任编辑:Diy92)

推荐阅读 相关文章

训练时间可缩短一半,阿里云正式推出自驾模型加速框架PAI-TurboX

6月23日消息,阿里云今日宣布推出面向自动驾驶领域模型的训练、推理加速框架PAI-TurboX。据介绍,该框架可提升...[详细]

2025-06-25 09:37:18

小米:我们无计划造油车

6月23日消息,今日有网友在小米创办人、董事长兼CEO雷军的评论区询问:"雷总,咱啥时候组建车队?",雷军回复称:"这是...[详细]

2025-06-25 09:37:18

广汽三大自主品牌即将推出赛马机制,但资源不会平均分配

6月23日消息,据第一财经报道,广汽集团董事长、总经理冯兴亚上周就广汽集团改革等多个热点话题进行了回应。过...[详细]

2025-06-25 09:37:18

李想、雷军互发“贺电”,分别祝贺小米 YU7、理想 i8销量大卖

6月23日消息,今天中午,雷军在微博上介绍了小米首款SUV"为何不是最热门的6座车"。随后,理想汽车CEO李想转发这则...[详细]

2025-06-25 09:37:18

据称自动驾驶科技公司文远知行已悄悄提交香港上市申请

6月23日消息,据界面新闻今日援引知情人士消息,自动驾驶科技公司文远知行已秘密提交香港上市申请。查询获悉,文...[详细]

2025-06-25 09:37:18

1亿美元值了 Meta成功挖走三名OpenAI研究人员

6月26日消息,据《华尔街日报》周三报道,在OpenAICEO奥尔特曼日前指控Meta 试图挖角后,MetaCEO马克・扎克伯格已...[详细]

2025-06-27 09:54:28

苹果将发布Metal4 API,助力Mac游戏性能大幅提升

6月10日消息,在 WWDC2025 上,苹果公司发布了针对AppleSiliconMac 的Metal4API,尽管苹果并未详细透露未来游戏的...[详细]

2025-06-13 08:09:31

英国多组织建议监管机构限制Meta利用人工智能进行风险评估

6月9日消息,据卫报报道,互联网安全活动人士向英国通信监管机构 Ofcom 发出呼吁,要求限制人工智能在关键风险评...[详细]

2025-06-11 08:22:38

据称 Meta公司正计划投资Scale AI,价值预计超过100亿美元

6月8日消息,彭博社今日报道称,Meta 正在就投资 AI 初创公司 Scale AI 进行谈判,这笔融资的价值有望超过100亿美...[详细]

2025-06-10 07:22:44

Ray-Ban Meta 智能眼镜即将推出同声传译功能,支持四语言和离线使用

4 月 24 日消息,Meta 公司今日宣布,将向所有 Ray-Ban Meta 智能眼镜用户推出一项全新的实时翻译功能。此前该...[详细]

2025-04-24 09:47:12

联系方式

商务QQ:19667318