常見用途
驅動即時推論
使用 Cloud Run GPU 搭配 Gemma 3、Llama 3.2 等開放原始碼模型或經過微調的自訂模型,來驅動即時推論。您可以建構聊天機器人、即時生成文件摘要等,還能因應流量突然激增的情況調整資源。另外,在 Cloud Run functions 中使用 GPU 時,數據資料學家不必具備大量底層基礎架構知識,也能執行 Python 指令碼及進行事件導向推論。
驅動即時推論
使用 Cloud Run GPU 搭配 Gemma 3、Llama 3.2 等開放原始碼模型或經過微調的自訂模型,來驅動即時推論。您可以建構聊天機器人、即時生成文件摘要等,還能因應流量突然激增的情況調整資源。另外,在 Cloud Run functions 中使用 GPU 時,數據資料學家不必具備大量底層基礎架構知識,也能執行 Python 指令碼及進行事件導向推論。
定價
Cloud Run 的定價方式 | 按用量計費,搭配一律免費的方案,進位至最接近的 100 毫秒倍數。如未使用,就無須付費。 | |
---|---|---|
SKU | 超過免費方案額度後的價格 (無折扣) | 免費 |
CPU | 每 vCPU-秒 $0.00001800 美元 | 每月前 240,000 vCPU-秒免費 |
記憶體 | 每 GiB-秒 $0.00000200 美元 | 每月前 450,000 GiB-秒免費 |