Compute Engine インスタンスのプロビジョニング モデル


このドキュメントでは、Compute Engine インスタンスのプロビジョニング モデルについて説明します。デプロイ オプションの詳細については、ワークロードに対する Compute Engine のデプロイ戦略を選択するをご覧ください。

プロビジョニング モデルにより、インスタンスの可用性、ライフサイクル、料金が決まります。これらのモデルを理解していれば、ワークロードに最適なオプションを選択できます。

利用可能なプロビジョニング モデル

コンピューティング インスタンスを作成するときに、次のいずれかのプロビジョニング モデルを指定できます。プロビジョニング モデルを指定しない場合、Compute Engine はデフォルトで標準プロビジョニング モデルを使用します。

次の表は、各プロビジョニング モデルのユースケースと料金を比較するのに役立ちます。

標準 スポット Flex Start(プレビュー 予約で制限
概要
  • リソースの可用性に基づいて、インスタンスをすぐに作成できます。
  • インスタンスの停止または削除のタイミングを制御できます。
  • リソースの可用性に基づいて、インスタンスをすぐに作成できます。
  • インスタンスの停止または削除のタイミングを制御できます。ただし、Compute Engine が容量を再利用するためにインスタンスをいつでも停止または削除することも許可します。
  • ゾーン マネージド インスタンス グループ(MIG)を作成したら、Compute Engine にリクエストして、GPU がアタッチされたインスタンスを MIG に追加します。Compute Engine は、リソースの可用性に基づいてインスタンスのプロビジョニングをスケジュールします。
  • インスタンスを削除するタイミングを制御できます。ただし、停止、一時停止、再作成はできません。インスタンスは最大 7 日間実行されます。その後、Compute Engine はそれらを削除します。
  • 将来の日付で容量を予約して、GPU が接続されたインスタンスを作成できます。 Google Cloud がリクエストを承認すると、Compute Engine は予約を作成します。予約期間の開始時に、予約と一致する GPU インスタンスを作成して予約を使用できます。
  • 承認された予約期間中は、必要に応じてインスタンスを停止、再起動、削除、再作成して予約を使用できます。予約期間が終了すると、Compute Engine は予約を削除し、予約を使用するインスタンスを停止または削除します。
ユースケース 次のようなワークロードなど、安定性と継続的な運用を必要とするワークロードに最適です。
  • ウェブサーバー
  • データベース
  • エンタープライズ アプリケーション
  • 開発とテスト
次のような中断を許容できるワークロードに最適です。
  • バッチ処理
  • ハイ パフォーマンス コンピューティング(HPC)
  • 継続的インテグレーションと継続的デプロイ(CI / CD)
  • データ分析
  • メディアのエンコード
  • オンライン推論
安定性を必要とし、7 日以内で実行する必要があるワークロード(次のワークロードなど)。
  • 小規模モデルの事前トレーニング
  • モデルの微調整
  • HPC シミュレーション
  • バッチ推論
安定性と特定の実行時間を必要とするワークロード(次のようなワークロード)に最適です。
  • 最大 90 日間続くワークロードの場合:
    • モデルの事前トレーニング ジョブ
    • モデルのファインチューニング ジョブ
    • HPC シミュレーション ワークロード
    • 推論ワークロードの短期的な増加の見込み
  • 90 日を超えるワークロードの場合:
    • トレーニング ワークロード
    • 推論ワークロード
料金 インスタンスに対して標準料金が発生します。詳細については、VM インスタンスの料金をご覧ください。 ほとんどの vCPU、GPU、ローカル SSD は 60 ~ 91% の割引で利用できます。詳細については、Spot VM の料金をご覧ください。 インスタンスで使用するマシン ファミリーに応じて、vCPU と GPU の割引率が最大 53% になります。Dynamic Workload Scheduler(DWS)の料金をご覧ください。 インスタンスで使用するマシン ファミリーに応じて、vCPU と GPU の割引率が最大 53% になります。また、インスタンスの作成用に容量を予約する方法に応じて、次のように料金が発生します。
割り当て インスタンスを作成すると、標準割り当てが消費されます。 インスタンスを作成すると、プリエンプティブル割り当て が消費されます。プロジェクトにプリエンプティブル割り当てがない場合は、標準割り当てが使用されます。Google Cloud の無料枠クレジットは Spot VM に適用されません。 MIG がグループにインスタンスを追加すると、プリエンプティブル割り当てが消費されます。プロジェクトにプリエンプティブル割り当てがない場合は、標準割り当てが使用されます。 割り当ては、予約バインド プロビジョニング モデルには適用されません。

インスタンスの可用性とライフサイクル

次の表に、各プロビジョニング モデルのコンピューティング インスタンスの可用性とライフサイクルを示します。

標準 スポット Flex Start(プレビュー 予約で制限
作成の前提条件 作成の前提条件はありません。 作成の前提条件はありません。 作成の前提条件はありません。

インスタンスを作成するには、まず次のいずれかの方法で容量を予約する必要があります。

選択した配信日時に、Compute Engine はリクエストされた容量をプロビジョニングします。その後、インスタンスを作成して容量を使用できます。
サポートされているマシンシリーズ A4X、A4、A3 Ultra を除くすべてのマシンシリーズを使用できます。 次のマシンシリーズを除き、任意のマシンシリーズを使用できます。
  • M2 と M3
  • ベアメタル インスタンス
次のマシンシリーズのみを使用できます。
VM を作成するために容量を予約する方法に応じて、次のマシンシリーズのみを使用できます。
インスタンスの可用性 リクエストされたリソースが使用可能であれば、いつでもインスタンスを作成できます。 リクエストされたリソースが使用可能であれば、いつでもインスタンスを作成できます。 インスタンスを作成するには、 MIG でサイズ変更リクエストを作成する必要があります。Compute Engine は、 DWS を使用して、リソースの可用性に基づいてリクエストされた容量のプロビジョニングをスケジュールします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。 インスタンスを作成できるのは、将来の日付の容量を予約した後のみです。リクエストされた日になると、Compute Engine はリクエストされた容量を配信します。この容量を使用してインスタンスを作成できます。カレンダー モードで将来の予約を使用してリソースを予約すると、Compute Engine は DWS を使用してリクエストされた容量をプロビジョニングします。DWS を使用すると、GPU などの需要の高いリソースを取得できます。
インスタンスの存続期間 次のケースを除き、インスタンスを停止または削除するタイミングを制御できます。
  • インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。
  • まれに、ホストエラーによりインスタンスが停止することがあります。
次のケースを除き、インスタンスを停止または削除するタイミングを制御できます。
  • Compute Engine は、容量を再利用するために、いつでもインスタンスを停止または削除する可能性があります。このプロセスは「プリエンプション」と呼ばれます。
  • インスタンスが使用するマシンタイプがライブ マイグレーションをサポートしていない場合、Compute Engine はホスト メンテナンス イベント中にインスタンスを停止します。
  • まれに、ホストエラーによりインスタンスが停止することがあります。
プロビジョニングされたインスタンスは、選択した実行期間(最大 7 日間)実行されます。インスタンスの停止、一時停止、再作成はできません。

Compute Engine は、次のいずれかの条件が満たされた場合にインスタンスを削除します。
  • インスタンスの削除をリクエストします。
  • インスタンスが実行期間の終了に達した。
次のケースを除き、インスタンスを停止または削除するタイミングを制御できます。
  • Compute Engine は、ホスト メンテナンス イベント中にインスタンスを停止します。
  • リクエストされた容量をプロビジョニングするために自動的に作成された予約が、確約された予約期間の終了を迎えます。その時点で、Compute Engine は予約を削除し、予約を使用するインスタンスを停止または削除します。
  • まれに、ホストエラーによりインスタンスが停止することがあります。

次のステップ