中国科技网

AI
手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

谷歌 Gemini2.5API 正式推出“隐式缓存”,开发者成本最高降低75%

2025-05-10 11:21:40 来源:IT之家 A+A-

5月10日消息,科技媒体 WinBuzzer 昨日发布博文,报道称谷歌为其 Gemini2.5API,推出了“隐式缓存”功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低75%。

该功能适用于 Gemini2.5Pro 和 Gemini2.5Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低75%。

注:与2024年5月推出的“显式缓存”不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini2.5Flash 需1024个 Token,Gemini2.5Pro 则需2048个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini2.5及2.0模型,允许开发者自定义缓存内容和生存时间。

谷歌此举虽宣称成本节省75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

(责任编辑:Diy92)

推荐阅读 相关文章

训练时间可缩短一半,阿里云正式推出自驾模型加速框架PAI-TurboX

6月23日消息,阿里云今日宣布推出面向自动驾驶领域模型的训练、推理加速框架PAI-TurboX。据介绍,该框架可提升...[详细]

2025-06-25 09:37:18

小米:我们无计划造油车

6月23日消息,今日有网友在小米创办人、董事长兼CEO雷军的评论区询问:"雷总,咱啥时候组建车队?",雷军回复称:"这是...[详细]

2025-06-25 09:37:18

广汽三大自主品牌即将推出赛马机制,但资源不会平均分配

6月23日消息,据第一财经报道,广汽集团董事长、总经理冯兴亚上周就广汽集团改革等多个热点话题进行了回应。过...[详细]

2025-06-25 09:37:18

李想、雷军互发“贺电”,分别祝贺小米 YU7、理想 i8销量大卖

6月23日消息,今天中午,雷军在微博上介绍了小米首款SUV"为何不是最热门的6座车"。随后,理想汽车CEO李想转发这则...[详细]

2025-06-25 09:37:18

据称自动驾驶科技公司文远知行已悄悄提交香港上市申请

6月23日消息,据界面新闻今日援引知情人士消息,自动驾驶科技公司文远知行已秘密提交香港上市申请。查询获悉,文...[详细]

2025-06-25 09:37:18

涡轮5090与双风扇5060 AFOX元富推出首批两款RTX50系显卡

8月22日消息,硬件制造商AFOX元富官网现已上线首批两款英伟达GeForceRTX50"Blackwel...[详细]

2025-08-27 07:23:11

入门电源等原因导致 AMD RX9070XT显卡首次报告16针接口熔化

8月22日消息,科技媒体WccfTech 昨日发布博文,报道称AMDRadeonRX9070XT显卡首次出现1...[详细]

2025-08-27 07:23:11

4K IPS面板 小米REDMI显示器A27UType-C版2026开售:售价1399元

8月21日消息,小米REDMI显示器A27UType-C版2026现已开售,首销到手价1399元,国补价1189...[详细]

2025-08-27 07:23:11

将推出LunarLake 终端游侠X1Air 壹号本秋季新品发布会定档9月8日,

8月21日消息,壹号本ONE-NETBOOK昨日宣布该企业秋季新品发布会将于9月8日举行,届时将...[详细]

2025-08-27 07:23:11

建议零售价 ×2:华硕“猫扇”显卡RTX508016GBNoctuaOC以16599元上市

8月21日消息,华硕与猫头鹰推出的联名显卡GeForceRTX508016GBGDDR7NoctuaOCEdition ...[详细]

2025-08-27 07:23:11

联系方式

商务QQ:19667318