中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

谷歌 Gemini2.5API 正式推出“隐式缓存”,开发者成本最高降低75%

2025-05-10 11:21:40 来源:IT之家 A+A-

5月10日消息,科技媒体 WinBuzzer 昨日发布博文,报道称谷歌为其 Gemini2.5API,推出了“隐式缓存”功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低75%。

该功能适用于 Gemini2.5Pro 和 Gemini2.5Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低75%。

注:与2024年5月推出的“显式缓存”不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini2.5Flash 需1024个 Token,Gemini2.5Pro 则需2048个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini2.5及2.0模型,允许开发者自定义缓存内容和生存时间。

谷歌此举虽宣称成本节省75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

(责任编辑:Diy92)

推荐阅读 相关文章

训练时间可缩短一半,阿里云正式推出自驾模型加速框架PAI-TurboX

6月23日消息,阿里云今日宣布推出面向自动驾驶领域模型的训练、推理加速框架PAI-TurboX。据介绍,该框架可提升...[详细]

2025-06-25 09:37:18

小米:我们无计划造油车

6月23日消息,今日有网友在小米创办人、董事长兼CEO雷军的评论区询问:"雷总,咱啥时候组建车队?",雷军回复称:"这是...[详细]

2025-06-25 09:37:18

广汽三大自主品牌即将推出赛马机制,但资源不会平均分配

6月23日消息,据第一财经报道,广汽集团董事长、总经理冯兴亚上周就广汽集团改革等多个热点话题进行了回应。过...[详细]

2025-06-25 09:37:18

李想、雷军互发“贺电”,分别祝贺小米 YU7、理想 i8销量大卖

6月23日消息,今天中午,雷军在微博上介绍了小米首款SUV"为何不是最热门的6座车"。随后,理想汽车CEO李想转发这则...[详细]

2025-06-25 09:37:18

据称自动驾驶科技公司文远知行已悄悄提交香港上市申请

6月23日消息,据界面新闻今日援引知情人士消息,自动驾驶科技公司文远知行已秘密提交香港上市申请。查询获悉,文...[详细]

2025-06-25 09:37:18

小米 澎湃OS3系统将支持NFC刷卡上岛 拓展便捷交互解锁智慧场景新体验

8月28日消息,小米澎湃OS3系统今日正式发布,小米产品总监MIUI/HyperOS体验总负责人金...[详细]

2025-12-24 14:04:05

荣耀 MagicOS10.0系统将支持更多产品开关智慧运存功能 主打听劝优化个性流畅体验

8月28日消息,目前各手机厂商已开启新系统的预热,小米在今日便推出了澎湃HyperOS3系...[详细]

2025-12-24 14:04:05

大眼橙 C3Air/C3D/C3Ultra 系列投影仪发布 轻携高清多场景畅享 预售专享价699元起

8月28日消息,大眼橙投影今日发布了C3系列投影仪新品,包括C3Air、C3D、C3Ultra 三款,...[详细]

2025-12-24 14:04:05

小米 澎湃OS3系统“手表”部分功能预计10月陆续开始推送

8月28日消息,小米澎湃OS3系统今日正式发布,官方在发布会的最后公布了Beta 版推送计...[详细]

2025-12-24 14:04:05

大疆发布DJIMic3进阶迷你无线麦克风 支持最高4发8收 1299元起

8月28日消息,大疆今日发布DJIMic3进阶迷你无线麦克风,售价1299元起。轻巧易用,一体收...[详细]

2025-12-24 14:04:05

联系方式

商务QQ:19667318