中国科技网

苹果
当前位置: 首页 > 苹果 > 正文

消费级硬件设备即可运行 HuggingFace 公布4.5亿参数开源机器人模型SmolVLA

2025-06-14 09:09:01 来源:IT之家 A+A-
6月9日消息,HuggingFace现已公布4.5亿参数开源机器人模型SmolVLA,该模型主打高普适性,可在MacBookPro等的消费级硬件设备上运行,旨在帮助开发者降低入门成本。当下,业界机器人模型通常采用"视觉-语言-行动"设计,此类模型尝

6月9日消息,HuggingFace现已公布4.5亿参数开源机器人模型SmolVLA,该模型主打高普适性,可在MacBookPro等的消费级硬件设备上运行,旨在帮助开发者降低入门成本。

当下,业界机器人模型通常采用“视觉-语言-行动”设计,此类模型尝试在单一架构中整合感知能力、语言理解与行动决策,从而让机器人实现自主执行复杂任务。不过相应模型训练成本极高,目前大多数模型仍为闭源项目,训练过程中依赖昂贵硬件、大量工程资源和大规模私有数据集。

为此,HuggingFace 推出SmolVLA这一轻量级开源模型,使用公开数据集进行训练,并可在消费级硬件设备上运行,旨在降低爱好者入门成本,推动通用机器人智能体的研究进展。

据介绍,SmolVLA在模型架构上结合Transformer 结构与 flow-matching 解码器,并采用了四项关键优化技术:一是跳过视觉模型中一半层数,以提升推理速度并减小模型体积;二是交替融合自注意力与交叉注意力模块,提高多模态信息整合效率;三是减少视觉Token 数量以提升处理效率;四是采用更轻量的SmolVLM2作为视觉编码器,从而进一步降低硬件要求。

图源HuggingFace

而在训练策略方面,SmolVLA首先通过通用操作数据进行预训练,再针对特定任务进行微调,以提升适应能力。因此虽然SmolVLA的训练数据远少于现有其他VLA模型,但HuggingFace 表示,该模型在模拟环境和真实场景中的表现与大型模型相当,甚至在部分任务上实现“超越”

此外,HuggingFace 透露SmolVLA还引入“异步推理架构”,将感知处理与动作执行进行解耦,使机器人在面对快速变化的环境时能做出更及时的响应,大幅提升其实用性。

HuggingFace 强调,用户使用MacBookPro 笔记本电脑等消费级硬件即可运行SmolVLA-450M模型,无需花费大成本采购专用AI训练服务器。同时用户也可以考虑采购HuggingFace 推出的低成本机器人平台等降低成本。

HuggingFace 援引自家进行的多项基准测试验证SmolVLA的性能,在LIBERO与Meta-World 等模拟测试平台上,SmolVLA的表现据称优于Octo、OpenVLA等业界竞品,而在使用真实机器人SO-100和SO-101进行抓取、放置、堆叠与分类任务中,SmolVLA也展现出更好的性能。

目前,SmolVLA的基础模型已在HuggingFace 平台上线,完整训练方法也同步在GitHub 上公开,附项目页面如下。

本文内容为中国科技网·( www.diy92.com )编辑或翻译,转载请务必注明来源。
分享:

相关文章

  • " />

    月之暗面回应KimiK2.5 Cursor使用并感谢马斯克发声

    月之暗面就KimiK2.5在Cursor编辑器的使用情况作出回应,确认该模型已支持在Cursor中调用并完成代码生成、补全与优化任务,并感谢马斯克此前对该模型应用潜力的公开肯定。KimiK2.5为月之暗面推出的代码优化与多语言理解模[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    软银拟在美建AI数据中心 全球最大投660亿美元

    软银集团宣布计划在美国建设全球规模最大的AI数据中心,总投资额约660亿美元,选址聚焦电力资源丰富且网络延迟低的区域。该中心将部署自研及合作方的高性能AI芯片集群,面向大模型训练与超大并发推理需求,具备液冷散热与模[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    WordPress.com接入AI智能体 可代写及优化SEO

    WordPress.com日前宣布接入AI智能体功能,支持为用户代写博客文章并自动优化搜索引擎排名要素。该智能体基于大语言模型,可分析主题关键词、用户意图与竞争内容结构,生成符合SEO规范的稿件,同时提供标题、摘要与内链布局建[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    彭博社称马斯克派xAI工程师争夺xAI OpenAI客户

    彭博社报道,马斯克已派遣旗下xAI的工程师团队主动接触部分OpenAI的企业客户,试图以算力优惠与定制化模型服务争取其迁移至xAI平台。xAI依托与特斯拉、SpaceX共享的基础设施,可提供低延迟推理与大规模训练资源,并在部分垂[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    美国男子用AI诈骗写歌+机器人刷量骗千万美元版税被抓

    美国执法部门日前逮捕一名男子,其利用生成式AI创作歌曲并借助机器人账号在流媒体平台大量刷播放量,以此骗取超千万美元版税收入。作案过程中,该男子通过AI模型批量生成旋律与歌词,伪装成独立音乐人上传作品,并操控数千个虚[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    35岁亚马逊被裁员工自白:学AI裁员仍失业但建议了解AI

    一位35岁亚马逊前员工公开发文自白,称尽管在裁员前积极学习AI相关技能,仍因岗位优化被裁且暂未找到新工作,但他仍建议职场人主动了解AI。其经历反映AI技术迭代引发岗位结构调整的现实,部分重复性任务被自动化替代,而掌握AI[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    何小鹏称图灵芯片出货破20万 今年目标近百万

    小鹏汽车董事长何小鹏透露,旗下自研图灵芯片累计出货已突破20万颗,今年目标接近百万颗。图灵芯片定位于智能座舱与辅助驾驶融合计算,采用多核异构架构,可在单一SoC上并行处理感知、决策与交互任务,降低系统复杂度与功耗。[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    宇树科技拟3年发布人形机器人模型 通用人形基础版

    国内机器人公司宇树科技宣布,计划在未来三年内推出系列人形机器人模型,首阶段将发布通用人形基础版,具备双足行走、手臂抓取与视觉导航能力,采用模块化关节与可更换末端执行器设计。该基础版定位为多场景开发与二次集成平[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    Mistral AI推Forge系统 让模型服务企业需求

    法国Mistral AI近日推出Forge系统,为企业提供可定制的大模型服务框架,支持按需裁剪模型规模与功能模块,并集成私有部署与数据隔离机制。Forge系统基于Mistral自研多模态模型,允许企业通过少量样本微调快速适配客服、法律[详细]
    2026-03-29 10:52:06 科技中国
  • " />

    TrendForce预测2030年ASIC占AI服务器近四成

    市场研究机构TrendForce预测,至2030年专用集成电路ASIC将占据AI服务器整体出货量近四成,较目前份额显著提升。ASIC因针对特定模型结构优化电路与数据流,可在推理与部分训练任务中实现更高能效比与更低时延,适配大模型部署[详细]
    2026-03-29 10:52:06 科技中国