谷歌正式推出了新一代Tensor Processing Unit(TPU)8t与8i系列芯片,针对AI工作负载进行了精细化分工。其中,TPU 8t(Training)专为大规模模型训练设计,拥有极高的浮点运算能力与内存带宽,旨在加速千亿乃至万亿参数大模型的迭代速度;而TPU 8i(Inference)则专注于智能体(Agent)推理场景,针对低延迟、高吞吐量的在线服务进行了深度优化,能够支持海量的并发请求,确保用户在调用AI助手时获得丝滑的体验。
这一“训推分离”的芯片策略,反映了谷歌对AI产业趋势的深刻洞察。随着OpenAI Workspace Agents等智能体应用的爆发,推理端的算力需求正呈指数级增长,且对成本与能效比的要求极高。TPU 8i的推出,正是为了满足这一新兴市场需求,通过定制化的指令集与架构设计,大幅提升智能体在执行复杂任务(如代码生成、流程自动化)时的响应速度,巩固谷歌在AI基础设施领域的领先地位。
配合谷歌内部75%新代码由AI生成的现状,TPU 8系列芯片的落地将进一步提升其研发效率。强大的自研芯片不仅能降低对英伟达GPU的依赖,还能通过软硬件协同优化,构建起一道难以逾越的技术护城河。随着TPU 8t/8i在谷歌云上的开放使用,更多的企业与开发者将能够基于这一高性能底座,训练自己的专属模型或部署智能体应用,推动整个AI生态向更高效、更智能的方向演进。


