Cloud Monitoring 的配額與限制

本文列出 Cloud Monitoring 適用的配額和系統限制。

  • 配額會指定您可使用的可計數共用資源數量。配額是由 Cloud Monitoring 等 Google Cloud 服務定義。
  • 系統限制是無法變更的固定值。

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud Quotas 系統會執行下列操作:

在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。

配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。

如要調整大部分配額,請使用 Google Cloud 控制台。 詳情請參閱「要求調整配額」。

監控資源也有系統限制。 系統限制無法變更。

使用者定義的指標

Cloud Monitoring 的「指標管理」頁面提供相關資訊,可協助您控管可計費指標的支出金額,同時不影響可觀測性。「指標管理」頁面會回報下列資訊:

  • 以位元組和樣本為準的計費方式,在指標網域和個別指標的擷取量。
  • 指標的標籤和基數相關資料。
  • 每個指標的讀取次數。
  • 在警告政策和自訂資訊主頁中使用指標。
  • 指標寫入錯誤率。

您也可以使用「指標管理」頁面排除不必要的指標,藉此省下擷取這些指標的費用。如要進一步瞭解「指標管理」頁面,請參閱「查看及管理指標用量」。

類別 上限
每項專案的自訂指標描述元數量1 10,000
每個自訂、外部和工作負載指標描述元的標籤 30
每個 Prometheus 指標描述元的標籤 200
標籤鍵的字串長度 100
標籤值的字串長度 1024
寫入要求中含有的時間序列數2 200
將資料寫入單一時間序列的速率3 每 5 秒 1 個資料點
每項自訂分布指標的直方圖值區 200
每項專案的工作負載、Prometheus 和外部4 指標描述元 25,000
各項受控資源中自訂指標產生的有效時間序列5 200,000
各項受控資源中工作負載指標產生的有效時間序列5 200,000
各項受監控資源中,Prometheus 產生的有效時間序列5 1,000,000
各項受控資源中外部指標產生的有效時間序列5 200,000
可建立指標描述元的速率 每項專案每分鐘 6,000 次

1 這項限制由 Cloud Monitoring 設定,其他服務設定的上限可能較低。自訂指標是指寫入 custom.googleapis.com 的指標。
2 在單一要求的各個時間序列中,您只能寫入一個資料點,因此這項限制也等同於每項要求的寫入資料點上限。
3 Cloud Monitoring API 要求將資料點寫入時間序列的結束時間至少必須間隔 5 秒。您可以將資料點批次寫入時間序列,前提是系統會依序寫入這些資料點。
4 外部指標是指寫入 external.googleapis.com 的指標。
5 如果您是在過去 24 小時內將資料點寫入時間序列,該時間序列即為有效。該列中指定的限制,是指單一受監控資源 (例如單一 gce_instance VM 或單一 k8s_container 容器) 中,所有使用者定義指標 (自訂、工作負載、Prometheus 或外部) 的有效時間序列總數。不過 global 受控資源不在此限,各項使用者定義指標的限制配額會分開計算。這項安全限制適用於整個系統,因此無法調整。

Monitoring API 配額和限制

類別 上限
API 用量限制

如要查看 API 配額和限制,請執行下列任一操作:

API 頁面權杖的有效期限 24 小時

Monitoring API 配額簡介

Monitoring API 有時間序列擷取要求和時間序列查詢的頻率配額限制。擷取要求是寫入時間序列資料的呼叫,查詢是擷取時間序列資料的呼叫。其他 Monitoring API 端點也會受到內部限制的影響,這些端點無法處理以高頻率發出的要求。

如要減少服務寫入時間序列資料時發出的 API 要求數量,請使用一個 API 要求寫入多個時間序列的資料。建議您在每個要求中至少寫入 10 個物件。 如要進一步瞭解如何批次處理 API 要求,請參閱 timeSeries.create

如果批次處理 API 要求後,您仍需要提高 Monitoring API 配額限制,請與Google Cloud 支援團隊聯絡。

其他配額限制為固定值,如本頁面中所述。

詳請請參閱處理配額一文。

資料保留

超過保留期限的指標資料點會從時間序列中刪除。

類別
自訂、外部和代理程式指標類型產生的資料點保留期限,包括:
  • 自訂指標、前置字元 custom.googleapis.com
  • Google Cloud Managed Service for Prometheus 的指標,前置字元為 prometheus.googleapis.com2
  • 代理程式指標、前置字串 agent.googleapis.com,包括
    processes/count_by_stateprocesses/fork_state
    其餘 processes 指標的保留期限不同,請參閱下一個項目。
  • 外部指標 (前置碼 external.googleapis.com)
  • OpenTelemetry 和其他工作負載指標,前置字串為 workload.googleapis.com
24 個月1
程序健康狀態指標類型產生的資料點保留期限:agent.googleapis.com/processes
,但 count_by_statefork_state 除外,如前一個項目所述。
24 小時
部分 Google Cloud 服務的資料點保留時間,包括下列類別中的大多數指標:
  • Compute Engine 指標,前置字串為 compute.googleapis.com
  • GKE 和 GKE Enterprise 指標,前置字元為 kubernetes.io
  • Cloud Storage 指標,前置字元 storage.googleapis.com
  • BigQuery 指標,前置字元為 bigquery.googleapis.com
  • Cloud SQL 指標,前置字元為 cloudsql.googleapis.com
  • 內部、HTTPS 和 L7 負載平衡器指標,前置字元為 loadbalancing.googleapis.com
24 個月1
所有其他指標類型產生的資料點保留期限,包括: 6 週
API 頁面權杖的有效期限 24 小時

1 指標資料在原始的取樣頻率時保留 6 週,然後降低取樣至 10 分鐘間隔以擴充儲存空間。
2 Google Cloud Managed Service for Prometheus 指標資料在原始的取樣頻率時保留 1 週,然後降低取樣至 1 分鐘間隔,保留 5 週,接著降低取樣至 10 分鐘間隔以擴充儲存空間。

資源群組

類別
每個指標範圍的資源群組數 500
電子郵件報告中的群組數量上限1 10

1 設定 Cloud Monitoring 電子郵件報告時,您可以要求取得資源群組使用情況的相關資訊。由於電子郵件報告程式有其限制,產生的報告中僅包括 10 個群組的資訊。

受監控專案的限制

Cloud Monitoring 官方支援每個指標範圍最多 375 個專案 Google Cloud

每個指標範圍最多可新增 3,500 個專案 Google Cloud ,但您可能會遇到效能問題,特別是查詢自訂指標或歷史資料時。Cloud Monitoring 僅保證每個指標範圍最多 375 個 Google Cloud 專案的查詢和圖表效能。

如要提高 Google Cloud 每個指標範圍的專案配額,請申請增加「受監控的專案 / 監控指標範圍」配額。詳情請參閱管理配額的相關文件。

建立及更新指標描述元的限制

Cloud Monitoring 會對建立新指標、為現有指標新增標籤名稱,以及刪除指標,強制執行每分鐘的速率限制。通常只有在首次與 Cloud Monitoring 整合時,才會達到這項速率限制,例如將現有的成熟 Prometheus 部署作業遷移至 Cloud Monitoring 時。這並非資料點擷取速率限制。只有在建立前所未見的指標,或為現有指標新增標籤名稱時,才會套用這項速率限制。

這項配額是固定的,但只要在每分鐘的限制內建立新指標和指標標籤,任何問題都應會自動解決。

快訊的限制

類別 政策類型1
每個指標範圍的快訊政策 (指標和記錄的總和) 2 500 指標、記錄
每個以指標為準的快訊政策的條件 6 指標
每個以 SQL 為基礎的警告政策 (公開預先發布版) 的條件 1 SQL
以 SQL 為基礎的警告政策查詢執行時間上限 (公開測試版) 5 分鐘 SQL
缺少指標條件的評估時間範圍上限3
1 天 指標
指標門檻值條件的評估時間上限3
23 個小時 30 分鐘 指標
指標門檻值條件中使用的篩選器長度上限
2,048 個 Unicode 字元 指標
預測條件監控的時間序列數量上限
64 指標
最短預測期間 1 小時 (3,600 秒) 指標
最長預測期間 2.5 天 (216,000 秒) 指標
每個快訊政策的通知管道 16 全部
記錄快訊的事件發生率上限4
每 5 分鐘發生 1 起事件 記錄
記錄快訊的事件數量上限
每個以記錄為準的快訊政策每天最多 20 個事件 記錄
記錄快訊的每個事件最多可發送 5 則通知
每個事件每天最多 20 則通知 記錄
每個專案同時觸發的快訊政策數量上限
80,000 全部
每個快訊政策中同時存在的未解決事件數量上限
1,000 全部
事件沒有新資料時,系統自動關閉事件的
時間長度
7 天 指標、SQL
事件的效期上限 (如果未手動關閉) 7 天 記錄
保留已結案的事件 13 個月 不適用
保留未結案的事件 無限期 不適用
每個指標範圍的通知管道 4,000 不適用
每次延後最多可延後多少快訊政策 16 全部
保留延後項目 13 個月 不適用
1指標:以指標資料為準的快訊政策;記錄:以記錄訊息為準的快訊政策 (記錄快訊)
2ApigeeApigee Hybrid 與 Cloud Monitoring 深度整合。所有 Apigee 訂閱層級 (Standard、Enterprise 和 Enterprise Plus) 的快訊限制,都與 Cloud Monitoring 相同:每個指標範圍 500 個。
3條件評估的最長時間是比對期間和持續時間範圍值的總和。舉例來說,如果對齊週期設為 15 小時,時間範圍設為 15 小時,則評估條件時需要 30 小時的資料。
4 如果以記錄為準的快訊政策查詢會擷取標籤值,則每個擷取值組合都會代表各自的事件時間軸。舉例來說,假設以記錄為準的快訊政策會擷取標籤的值,而標籤可以有兩個值。完成這項設定後,系統會在同一 5 分鐘內,為每個標籤值建立一個事件。
5如果是記錄快訊,當 Monitoring 收到符合篩選條件的記錄項目,且距離最近一次通知已過至少 5 分鐘時,就會針對未結事件傳送新通知。每個事件每天最多會傳送 20 則通知。系統會將每則通知傳送至快訊政策的所有已設定通知管道。

簡訊限制

簡訊傳送限制會以 24 小時為週期計算。

類別
簡訊驗證碼數量 40
每個電話號碼的簡訊驗證碼數量 5
簡訊快訊訊息數量 2,500
每個電話號碼的簡訊快訊訊息數量 200

綜合監控的限制

類別
每個指標範圍的運作時間檢查 * 100
每次公開運作時間檢查的 ICMP Ping 數量上限 3
每個指標範圍的綜合監控 100
*這項限制適用於運作時間檢查設定的數量,每項運作時間檢查設定中都包含測試指定資源狀態的間隔時間。
如要瞭解如何提高這項限制,請參閱「使用 Google Cloud 控制台管理配額」。

圖表的限制

類別
每個指標範圍 的資訊主頁 1000
資訊主頁中的圖表數 100
資訊主頁版本記錄保留設定 90 天
圖表上的線條數 50*
資料表中的資料列 300
*基於效能考量,我們設下這項限制。如果圖表中有超過 50 個時間序列,工具列會新增一個紅點圖示。圖示的工具提示會顯示訊息「To improve performance, we've limited the time series displayed in this chart」。如要顯示所有時間序列,請展開工具提示,然後選取標示為「顯示所有時間序列」的按鈕。

服務等級目標

類別
每項服務的服務等級目標數 500