AI Hypercomputer

隆重推出 Ironwood，這是我們迄今最強大、功能最佳且能源效率最高的 TPU，專為大規模驅動思考型 (thinking) 和推論型 (inferential) 的 AI 模型而打造。

AI Hypercomputer

這套超級運算系統支撐著 Google Cloud 上所有的 AI 工作負載，透過充分整合的硬體、開放式軟體和彈性的使用模式，供您自訂當中的元件。

網誌：隆重推出 Ironwood TPU 和 AI Hypercomputer 的創新技術

總覽

AI 技術最佳化硬體

您可以根據工作負載層級的目標，選擇最合適的運算、儲存空間和網路選項。無論是提高處理量、縮短延遲時間、更快取得結果，還是降低 TCO，AI Hypercomputer 都能助您輕鬆達成。進一步瞭解 Google Cloud TPU、Google Cloud GPU、Google Cloud Storage、Titanium 和 Jupiter 網路。

使用 Google Cloud TPU 強化 LLM

瞭解 Google Cloud 特別設計的 AI 加速元件 Google Cloud TPU 如何讓 LLM 工作負載發揮最佳效能。

觀看影片

開放軟體

AI Hypercomputer 經過最佳化調整，可支援最常見的工具和程式庫，例如 Pytorch 和 JAX。此外，客戶還能使用 Cloud TPU Multislice 和 Multihost 設定等技術，以及 Google Kubernetes Engine 等代管服務。因此，客戶能為常見的工作負載提供立即可用的部署作業，例如 SLURM 自動化調度管理的 NVIDIA NeMO 架構。

GKE 中的開放原始碼 LLM - Llama 2 等

瞭解如何運用 GKE 中的開放原始碼 LLM (Llama 2 等)，打造更優質的生成式 AI 平台遊戲。

觀看影片

靈活運用

客戶可以透過彈性消費模型選擇固定費用，並提供承諾使用折扣或動態隨選模型，滿足自身業務需求。動態工作負載排程器可協助客戶取得所需容量，避免分配過多資源，因此客戶只需依用量付費。此外，Google Cloud 的成本最佳化工具會自動使用資源，減少工程師須手動處理的工作。

最佳化 AI/機器學習工作負載的資源存取情形和經濟效益

瞭解 Dynamic Workload Scheduler 服務如何最佳化 AI 工作負載執行作業。

閱讀網誌

運作方式

Google 發明 TensorFlow 等多項技術，是人工智慧領域的領導品牌。您知道嗎？您可以在自己的專案運用 Google 技術。瞭解 Google 在創新 AI 基礎架構領域的歷程，以及如何將這項技術用於工作負載。

Google Cloud AI 超級電腦架構圖，旁邊是 Google Cloud 產品經理 Chelsie 的相片

常見用途

執行大規模 AI 訓練作業

強大、可擴充且高效的 AI 訓練

AI 超級電腦架構讓您得以選擇根據訓練需求採用最合適的底層基礎架構。

操作說明

強大、可擴充且高效的 AI 訓練

AI 超級電腦架構讓您得以選擇根據訓練需求採用最合適的底層基礎架構。

其他資源

強大、可擴充且高效的 AI 訓練

運用 ML Productivity Goodput，以 Google 技術評估大規模訓練的成效。

客戶實例

Character.AI 運用 Google Cloud 擴大規模

「我們需要 GPU 生成對使用者訊息的回應。隨著平台使用者越來越多，我們也需要更多 GPU 來提供服務。透過 Google Cloud，我們可以進行實驗並找出適合特定工作負載的平台。這些解決方案讓我們能夠更靈活地選擇最有價值的解決方案。」Character.AI 創始工程師 Myle Ott

1:36

提供 AI 技術輔助應用程式

運用開放架構提供有 AI 技術輔助的體驗

Google Cloud 致力確保開放架構在 AI 超級電腦架構中順利運作。

操作說明

運用開放架構提供有 AI 技術輔助的體驗

Google Cloud 致力確保開放架構在 AI 超級電腦架構中順利運作。

其他資源

運用開放架構提供有 AI 技術輔助的體驗

藉助 Google Cloud 的開放式軟體生態系統，您可以透過最慣用的架構和工具建構應用程式，同時享有 AI 超級電腦架構的成本效益優勢。

客戶實例

Priceline：協助旅客收集獨特體驗

與 Google Cloud 合作導入生成式 AI 後，我們用聊天機器人就能提供個人化旅遊規劃服務。我們的目標不只是為顧客安排行程，更是協助他們打造獨一無二的旅遊體驗。」Martin Brodbeck，Priceline 技術長

以符合成本效益的方式大規模提供模型

以更具成本效益的方式大規模提供 AI

Google Cloud 提供領先業界的 AI 模型成本效益/效能，以及加速器選項，可滿足任何工作負載需求。

操作說明

以更具成本效益的方式大規模提供 AI

Google Cloud 提供領先業界的 AI 模型成本效益/效能，以及加速器選項，可滿足任何工作負載需求。

其他資源

以更具成本效益的方式大規模提供 AI

搭載 NVIDIA L4 GPU 的 Cloud TPU v5e 和 G2 VM 執行個體可為多種 AI 工作負載提供高效能及符合成本效益的推論服務，包括最新的 LLM 和生成式 AI 模型。這兩項產品能大幅提高成本效益，成果遠勝於先前的模型。再加上 Google Cloud 的 AI 超級電腦架構，客戶得以擴大部署規模，成為業界領先的佼佼者。

Cloud TPU v5e 加快大規模 AI 推論作業

客戶實例

AssemblyAI 運用 Google Cloud 提高成本效益

「我們的實驗結果顯示，Cloud TPU v5e 是最符合成本效益的加速器，可針對模型執行大規模推論。每一美元的效能比 G2 高出 2.7 倍，比 A2 執行個體高出 4.2 倍。」Domenic Donato

AssemblyAI 技術副總裁

Writer Efficiently 使用 Google Cloud GPU 上提供 AI 解決方案