中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

腾讯混元开放 WorldCompass 框架 为首款面向世界模型的强化学习再训练工具

2026-03-13 07:37:11 来源:IT之家 A+A-

腾讯混元宣布开源 WorldCompass,首个面向世界模型的强化学习后训练框架,旨在为构建具空间与时间一致性的多模态世界模拟提供训练支撑,回应生成式 AI 在复杂环境建模与决策泛化上的技术需求,在开源社区与 AI 研究前沿中被视为方法论层面的突破。据官方消息,该框架支持多智能体交互轨迹优化与长期目标保持,现场测试显示训练稳定性较基线方案提升。此举在世界模型研究方向引起讨论,为观察开源力量推动通用 AI 基础设施建设的路径提供实例,促使研究者重新审视后训练阶段对模型常识与因果推理的塑造作用,后续可留意社区贡献与应用案例扩展。

WorldCompass 在架构上融合强化学习的策略梯度优化与世界模型的序列预测能力,可在虚拟环境中生成具备时空连续性的状态转移数据,用于训练智能体在未见场景中的泛化策略。消息称其提供可插拔的环境编码器与奖励塑形模块,现场测试显示对稀疏奖励任务的学习效率改善明显。技术分析表明该框架降低世界模型与决策模型联合训练的协调难度,使研究者可聚焦场景先验与策略改进,而不必重复构建训练管线,从而加速具备长程推理能力的智能体研发。

从通用 AI 基础设施视角看,该开源在强化学习与世界模型结合研究中引起关注,成为研判开源框架降低前沿探索门槛的参考样本,其通过标准化后训练流程与模块化设计提升实验可复现性,促使行业重新审视基础研究工具共享对技术跃迁的催化作用。此举不仅丰富混元在 AI 开源生态的影响力,也为跨机构协作攻克通用智能难题提供共用平台,后续可跟踪框架在机器人、自动驾驶等场景的迁移成效,评估其对世界模型实用化的推动价值。

Tags:WorldCompass
(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

腾讯混元开放 WorldCompass 框架 为首款面向世界模型的强化学习再训练工具

腾讯混元宣布开源 WorldCompass,首个面向世界模型的强化学习后训练框架,旨在为构建具空间与时间一致性的多模...[详细]

2026-03-13 07:37:11

联系方式

商务QQ:19667318