中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

谷歌 Gemini2.5API 正式推出“隐式缓存”,开发者成本最高降低75%

2025-05-10 11:21:40 来源:IT之家 A+A-

5月10日消息,科技媒体 WinBuzzer 昨日发布博文,报道称谷歌为其 Gemini2.5API,推出了“隐式缓存”功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低75%。

该功能适用于 Gemini2.5Pro 和 Gemini2.5Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低75%。

注:与2024年5月推出的“显式缓存”不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini2.5Flash 需1024个 Token,Gemini2.5Pro 则需2048个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini2.5及2.0模型,允许开发者自定义缓存内容和生存时间。

谷歌此举虽宣称成本节省75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

(责任编辑:Diy92)

推荐阅读 相关文章

传OpenAI拟扩员至8000人 年底从4500人增加

有消息称OpenAI计划在今年底前将员工规模从目前的约4500人扩充至8000人,扩员重点集中在模型安全、多模态研发...[详细]

2026-03-28 09:34:26

马斯克宣布Grok Computer智能体即将上线

马斯克日前在社交平台宣布,xAI开发的Grok Computer智能体即将上线,定位为具备自主任务执行与多工具调用能力的...[详细]

2026-03-28 09:34:26

MiniMax高峰期限流 MiniMax M2.7模型热度超预期

MiniMax官方确认,因M2.7模型在近期高峰时段用户请求量远超预期,已启动临时限流措施以保障服务稳定性。M2.7模...[详细]

2026-03-28 09:34:26

小米MiMo大模型联合多Agent框架 首周限免开放

小米发布MiMo大模型并与自研多Agent框架深度整合,首周面向开发者与特定用户限免开放。MiMo在多轮对话、跨模...[详细]

2026-03-28 09:34:26

美团开源LongCat大模型 Flash-Prover 刷新SOTA

美团近日宣布开源LongCat大模型及其配套Flash-Prover推理验证框架,LongCat在多项长文本理解与生成任务中刷新...[详细]

2026-03-28 09:34:26

月之暗面回应KimiK2.5 Cursor使用并感谢马斯克发声

月之暗面就KimiK2.5在Cursor编辑器的使用情况作出回应,确认该模型已支持在Cursor中调用并完成代码生成、补全...[详细]

2026-03-29 10:52:06

软银拟在美建AI数据中心 全球最大投660亿美元

软银集团宣布计划在美国建设全球规模最大的AI数据中心,总投资额约660亿美元,选址聚焦电力资源丰富且网络延迟...[详细]

2026-03-29 10:52:06

WordPress.com接入AI智能体 可代写及优化SEO

WordPress.com日前宣布接入AI智能体功能,支持为用户代写博客文章并自动优化搜索引擎排名要素。该智能体基于...[详细]

2026-03-29 10:52:06

彭博社称马斯克派xAI工程师争夺xAI OpenAI客户

彭博社报道,马斯克已派遣旗下xAI的工程师团队主动接触部分OpenAI的企业客户,试图以算力优惠与定制化模型服务...[详细]

2026-03-29 10:52:06

美国男子用AI诈骗写歌+机器人刷量骗千万美元版税被抓

美国执法部门日前逮捕一名男子,其利用生成式AI创作歌曲并借助机器人账号在流媒体平台大量刷播放量,以此骗取超...[详细]

2026-03-29 10:52:06

联系方式

商务QQ:19667318