在今年5月的I/O大会上,谷歌宣布了Trillium,这是谷歌自研设计的第六代张量处理单元(TPU)。现在,Trillium已经进入预览版,可供谷歌云客户使用。TPU是驱动AI的核心,使谷歌的设备和应用尽可能有用,而Trillium则是迄今为止最强大和最可持续的TPU。
什么是TPU?
TPU(张量处理单元)是谷歌专门为加速AI计算任务设计的ASIC(应用特定集成电路)。为了更好地理解Trillium的独特之处,我们需要了解一下不同类型的计算处理器:CPU、GPU和TPU。
CPU、GPU和TPU的区别
- CPU(中央处理单元)
- 特点:通用芯片,可以处理多种任务。
- 用途:适合多种计算任务,但对特定任务的性能可能不如专用芯片。
- 例子:几乎每部智能手机和笔记本电脑中都有CPU。
- GPU(图形处理单元)
- 特点:专门用于加速图形渲染和AI工作负载的芯片。
- 用途:在图形密集型应用和AI计算中表现出色。
- 例子:高端游戏系统和某些台式机中常见。
- TPU(张量处理单元)
- 特点:谷歌自研的ASIC,专为AI计算任务设计。
- 用途:在运行基于AI的计算任务时,性能远超CPU和GPU。
- 例子:谷歌的数据中心中使用,支持谷歌的搜索、YouTube和DeepMind的大型语言模型等服务。
为什么谷歌创建TPU?
- 历史背景:CPU在20世纪50年代末发明,GPU在90年代末出现。谷歌在约10年前开始考虑TPU,因为语音识别服务的质量大幅提升,如果每个用户每天只与谷歌交谈三分钟,就需要将数据中心的计算机数量翻倍。
- 需求:谷歌需要比当时可用的现成硬件更高效的东西,并且需要从每块芯片中获得更多的处理能力。
- 解决方案:谷歌决定自行设计TPU,以满足这些需求。
Trillium TPU的特点
- 高性能
- 计算能力:与上一代TPU v5e相比,Trillium每芯片的峰值计算性能提高了4.7倍。
- 意义:Trillium能够以比上一代快4.7倍的速度完成运行复杂数学所需的全部计算,处理更大、更复杂的工作负载。
- 高能效
- 可持续性:Trillium是谷歌迄今为止最可持续的TPU,能效比上一代TPU高67%。
- 意义:随着对AI的需求持续飙升,行业需要可持续地扩展基础设施。Trillium使用更少的电力来完成相同的工作。
Trillium的实际应用
- 医疗领域:客户使用Trillium进行RNA分析,以诊断各种疾病。
- 多媒体转换:客户使用Trillium将书面文本快速转换为视频。
- 未来潜力:Trillium进入预览版,谷歌期待看到更多创新应用的出现。
Trillium TPU是谷歌在AI计算领域的又一重大突破。它不仅在性能上远远超过上一代TPU,还在能效方面取得了显著进步。随着Trillium进入预览版,谷歌云客户将能够利用这一强大的工具,推动更多创新和发展。无论是医疗、多媒体还是其他领域,Trillium都有望带来革命性的变化。(来源)