- Google的Ironwood TPU秤達到9216芯片,具有記錄1.77pb共享內存
- 雙模體架構提供4614 TFLOPS FP8和192GB HBM3E每芯片
- 增強的可靠性冷卻和AI輔助設計功能可以大大提高推理工作量
Google在最近的Hot Chips 2025活動中關閉了機器學習會議,並詳細介紹了其最新的張量處理單元Ironwood。
該芯片於2025年4月在Google Cloud首次在Google Cloud上揭示,是該公司的第一個TPU,主要是為大型推理工作負載而不是培訓而設計的,而不是作為其第七代TPU硬件到達。
每個鐵木芯片都集成了兩個計算模具,可提供4,614個Tflops的FP8性能 – HBM3E的八個堆棧每芯片提供192GB的內存能力,並配上7.3TB/s帶寬。
1.77pb的HBM
Google已構建了1.2Tbps的I/O帶寬,可讓系統在沒有膠水邏輯的情況下每個吊艙最多擴展9,216個芯片。該配置達到了高達42.5個性能。
內存能力也令人印象深刻。 Ironwood在POD上提供了1.77%的直接尋址HBM。該級別為共享內存超級計算機設置了新記錄,並通過將機架鏈接在一起的光電路開關啟用。
硬件可以重新配置失敗的節點,從檢查點恢復工作負載。
芯片集成了旨在穩定性和彈性的多個功能。這些包括信任的片上的根源,內置的自我測試功能以及減輕無聲數據損壞的措施。
包括邏輯維修功能以提高製造產量。在整個體系結構中都可以看到對RAS或可靠性,可用性和可維護性的強調。
冷卻是由Google第三代液體冷卻基礎設施支撐的冷板溶液來處理的。
Google聲稱,與Trillium相比,每瓦的性能提高了兩倍。動態電壓和頻率縮放進一步提高了各種工作量的效率。
Ironwood還將AI技術納入其自己的設計中。它用於幫助優化Alu電路和平面圖。
已經添加了第四代Sparsecore,以加速嵌入和集體操作,並支持推薦引擎等工作負載。
Google雲數據中心的Hyperscale已經進行了部署,儘管TPU仍然是一個內部平台,直接無法直接提供給客戶。
在2025年熱芯片上評論會議, 服務霍姆瑞安·史密斯(Ryan Smith)說:“這是一個很棒的演講。Google看到需要創建高端AI計算。現在,該公司在各個級別上都在各個級別上進行創新,從芯片到互連,再到物理基礎架構。即使是最後一個熱門芯片的2025年播放,這在Google上均播放了舞台。
您可能還喜歡
#Ironwood #TPU詳細信息顯示了Google迄今為止使用9216芯片的1.77pb共享內存的最強大的超級計算機設置了新的世界紀錄