科技中国

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

谷歌 Gemini2.5API 正式推出“隐式缓存”,开发者成本最高降低75%

2025-05-10 11:21:40 来源:IT之家 A+A-

5月10日消息,科技媒体 WinBuzzer 昨日发布博文,报道称谷歌为其 Gemini2.5API,推出了“隐式缓存”功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低75%。

该功能适用于 Gemini2.5Pro 和 Gemini2.5Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低75%。

注:与2024年5月推出的“显式缓存”不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini2.5Flash 需1024个 Token,Gemini2.5Pro 则需2048个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini2.5及2.0模型,允许开发者自定义缓存内容和生存时间。

谷歌此举虽宣称成本节省75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

(责任编辑:Diy92)

推荐阅读 相关文章

豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

5月23日消息,从豆包公众号获悉,豆包今日宣布在 App 端上线实时视频通话功能,用户在"打电话"界面点击视频按钮即...[详细]

2025-05-25 10:51:15

今年前4月我国智能家居类消费品新增3万种,同比增长1985.5%

5月23日消息,市场监管总局今日发布统计数据,今年1—4月,我国消费品新增809.8万种,同比...[详细]

2025-05-25 10:51:15

联想展出国内首个轮胎 AI 质检智能体方案,效率较人工提升1.5倍

5月23日消息,据联想官方今日消息,在上周的2025中国国际橡胶轮胎暨汽车配件展览会上,联想展出国内首个轮胎 AI ...[详细]

2025-05-25 10:51:15

京东内部的智能体数量已超1.4万个,JoyAgent2.0发布

5月23日消息,京东云城市大会于5月20日在上海举行,京东云发布 JoyAgent 智能体2.0。京东集团技术委员会主席、...[详细]

2025-05-25 10:51:15

0.103秒!全球最快魔方机器人问世,解魔方比眨眼还快

5月23日消息,科技媒体 scitechdaily 昨日发布博文,报道称来自普渡大学的工程团队研发 Purdubik’s Cube ...[详细]

2025-05-25 10:51:15

小米 YU7车型将全系搭载1000万Clips版本端到端辅助驾驶

6月23日消息,小米汽车今日宣布,小米YU7全系出厂即搭载1000万Clips 版本端到端辅助驾...[详细]

2025-06-25 09:37:18

小米 YU7将搭载晕车舒缓模式,全系标配静音夹层玻璃

6月23日消息,小米首款SUV——YU7将于6月26日19时正式发布,小米汽车官方今日预热称,小...[详细]

2025-06-25 09:37:18

哈啰官宣将与蚂蚁集团、宁德时代合作研发L4级自动驾驶技术

6月23日消息,哈啰官方账号今日发文宣布哈啰正式进军Robotaxi 赛道。 图源:哈啰官方...[详细]

2025-06-25 09:37:18

汽车经销商会:呼吁汽车生产厂家缩短返利兑现账期,优化返利政策

6月23日消息,全联汽车经销商商会今日发布《关于呼吁汽车生产厂家优化返利政策缩短...[详细]

2025-06-25 09:37:18

训练时间可缩短一半,阿里云正式推出自驾模型加速框架PAI-TurboX

6月23日消息,阿里云今日宣布推出面向自动驾驶领域模型的训练、推理加速框架PAI-Tur...[详细]

2025-06-25 09:37:18

联系方式

商务QQ:19667318