予約を使用する

TPU 予約がある場合は、予約済みリソースを使用して、予約のプロパティと一致する TPU を作成できます。このアクションは、予約の使用と呼ばれます。GKE の使用時に TPU 予約を使用する方法については、GKE のドキュメントの TPU 予約をご覧ください。

特定の予約を使用する

gcloud alpha compute tpus queued-resources create コマンドを使用してリソースを作成する場合は、--reservation フラグを使用して、使用する予約の名前を指定します。カレンダー モードで作成された将来の予約の場合は、--provisioning-model フラグreservation-bound に設定する必要があります。

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

プレースホルダ変数を置き換えます。

  • QUEUED_RESOURCE_ID: キューに格納されたリソース リクエストのユーザー割り当て ID。
  • TPU_NAME: キューに格納されたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID(名前)。
  • ZONE: TPU VM を作成するゾーン。サポートされているゾーンの詳細については、リージョンとゾーンをご覧ください。
  • ACCELERATOR_TYPE: 作成する Cloud TPU のバージョンとサイズを指定します。TPU の各バージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
  • SOFTWARE_VERSION: Cloud TPU ソフトウェアのバージョン
  • RESERVATION_URL: 予約の URL。次のいずれかの値を指定します。
    • 予約がプロジェクト内にある場合: RESERVATION_NAME
    • 予約が別のプロジェクトにあり、プロジェクトで使用できる場合: projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

一致する任意の予約を使用する

--reserved フラグを使用すると、アクセラレータ タイプ、プロジェクト ID、ゾーンに基づいて使用する予約を自動的に決定できます。

CreateNode

CreateNode API を使用して一致する予約を使用するには、--reserved フラグを指定して gcloud alpha compute tpus tpu-vm create コマンドを使用します。

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

プレースホルダ変数を置き換えます。

  • TPU_NAME: TPU の名前。
  • ZONE: TPU VM を作成するゾーン。予約ゾーンと一致する必要があります。
  • ACCELERATOR_TYPE: 作成する Cloud TPU のバージョンとサイズを指定します。TPU の各バージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
  • SOFTWARE_VERSION: Cloud TPU ソフトウェアのバージョン

キューに格納されるリソース

キューに登録されたリソースを使用して一致する予約を使用するには、--reserved フラグを指定して gcloud alpha compute tpus queued-resources create コマンドを使用します。

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

プレースホルダ変数を置き換えます。

  • QUEUED_RESOURCE_ID: キューに格納されたリソース リクエストのユーザー割り当て ID。
  • TPU_NAME: キューに格納されたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID(名前)。
  • ZONE: TPU VM を作成し、予約が存在するゾーン。
  • ACCELERATOR_TYPE: 作成する Cloud TPU のバージョンとサイズを指定します。TPU の各バージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
  • SOFTWARE_VERSION: Cloud TPU ソフトウェアのバージョン

予約の使用状況を確認する

共有予約の使用状況を確認できるのは、オーナー プロジェクトからのみです。コンシューマー プロジェクトにいる場合は、オーナー プロジェクトに切り替えて予約の使用状況を確認する必要があります。

予約の使用状況を確認するには、gcloud compute reservations describe コマンドを使用します。

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

プレースホルダ変数を置き換えます。

  • RESERVATION_NAME: 予約の名前。
  • PROJECT_ID: インスタンスが含まれているプロジェクトの ID。
  • ZONE: 予約が存在するゾーン。

プロジェクト内のすべての予約を一覧表示するには、gcloud compute reservations list コマンドを使用します。

gcloud compute reservations list --project=PROJECT_ID

次のプレースホルダ変数を置き換えます。

  • PROJECT_ID: プロジェクトの ID。

次のステップ