中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎的加持

2025-05-10 11:21:40 来源:IT之家 A+A-

5月9日消息,阿里巴巴开源了 ZeroSeARch 大模型,官方称其无需搜索即可激励搜索能力

附阿里对该模型的介绍大意如下:

我们提出了一种名为 ZeroSearch 的强化学习框架,通过不依赖真实搜索引擎来提升大型语言模型的搜索能力。

在监督式微调的基础上,我们将 LLM 转化为一个能够生成相关或噪声文档的检索模块,响应查询。

为了更好地激发模型的推理能力,我们引入了课程化展开机制,通过让模型面对越来越复杂的检索任务,逐步培养其思考能力。

我们在多个领域内外的数据集上进行了大量实验,结果显示,ZeroSearch 在没有任何 API 费用的情况下,优于基于真实搜索引擎的模型

此外,它能够很好地在不同规模的基础型和指令微调型 LLM 上泛化,并支持多种强化学习算法。

官方披露的信息显示,在7大问答数据集评测中,其性能与谷歌搜索相当甚至实现超越,且成本降低87.93%。

通过 SerpAPI 使用谷歌搜索训练64,000个查询的费用大约为586.70美元,而使用14B 参数的模拟 LLM 在四个 A100GPU 上训练仅需70.80美元。

目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。

开源地址:https://github.com/Alibaba-nlp/ZeroSearch

(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

月之暗面回应KimiK2.5 Cursor使用并感谢马斯克发声

月之暗面就KimiK2.5在Cursor编辑器的使用情况作出回应,确认该模型已支持在Cursor中调用并完成代码生成、补全...[详细]

2026-03-29 10:52:06

软银拟在美建AI数据中心 全球最大投660亿美元

软银集团宣布计划在美国建设全球规模最大的AI数据中心,总投资额约660亿美元,选址聚焦电力资源丰富且网络延迟...[详细]

2026-03-29 10:52:06

WordPress.com接入AI智能体 可代写及优化SEO

WordPress.com日前宣布接入AI智能体功能,支持为用户代写博客文章并自动优化搜索引擎排名要素。该智能体基于...[详细]

2026-03-29 10:52:06

彭博社称马斯克派xAI工程师争夺xAI OpenAI客户

彭博社报道,马斯克已派遣旗下xAI的工程师团队主动接触部分OpenAI的企业客户,试图以算力优惠与定制化模型服务...[详细]

2026-03-29 10:52:06

美国男子用AI诈骗写歌+机器人刷量骗千万美元版税被抓

美国执法部门日前逮捕一名男子,其利用生成式AI创作歌曲并借助机器人账号在流媒体平台大量刷播放量,以此骗取超...[详细]

2026-03-29 10:52:06

联系方式

商务QQ:19667318