予約を使用する
TPU 予約がある場合は、予約済みリソースを使用して、予約のプロパティと一致する TPU を作成できます。このアクションは、予約の使用と呼ばれます。GKE の使用時に TPU 予約を使用する方法については、GKE のドキュメントの TPU 予約をご覧ください。
特定の予約を使用する
gcloud alpha compute tpus queued-resources
create
コマンドを使用してリソースを作成する場合は、--reservation
フラグを使用して、使用する予約の名前を指定します。カレンダー モードで作成された将来の予約の場合は、--provisioning-model
フラグも reservation-bound
に設定する必要があります。
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reservation=RESERVATION_URL \ --provisioning-model=reservation-bound # Only required for calendar mode
プレースホルダ変数を置き換えます。
- QUEUED_RESOURCE_ID: キューに格納されたリソース リクエストのユーザー割り当て ID。
- TPU_NAME: キューに格納されたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID(名前)。
- ZONE: TPU VM を作成するゾーン。サポートされているゾーンの詳細については、リージョンとゾーンをご覧ください。
- ACCELERATOR_TYPE: 作成する Cloud TPU のバージョンとサイズを指定します。TPU の各バージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
- SOFTWARE_VERSION: Cloud TPU ソフトウェアのバージョン。
- RESERVATION_URL: 予約の URL。次のいずれかの値を指定します。
- 予約がプロジェクト内にある場合:
RESERVATION_NAME
- 予約が別のプロジェクトにあり、プロジェクトで使用できる場合:
projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME
- 予約がプロジェクト内にある場合:
一致する任意の予約を使用する
--reserved
フラグを使用すると、アクセラレータ タイプ、プロジェクト ID、ゾーンに基づいて使用する予約を自動的に決定できます。
CreateNode
CreateNode API を使用して一致する予約を使用するには、--reserved
フラグを指定して gcloud
alpha compute tpus tpu-vm create
コマンドを使用します。
gcloud alpha compute tpus tpu-vm create TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --version=SOFTWARE_VERSION \ --reserved
プレースホルダ変数を置き換えます。
- TPU_NAME: TPU の名前。
- ZONE: TPU VM を作成するゾーン。予約ゾーンと一致する必要があります。
- ACCELERATOR_TYPE: 作成する Cloud TPU のバージョンとサイズを指定します。TPU の各バージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
- SOFTWARE_VERSION: Cloud TPU ソフトウェアのバージョン。
キューに格納されるリソース
キューに登録されたリソースを使用して一致する予約を使用するには、--reserved
フラグを指定して gcloud alpha compute tpus
queued-resources create
コマンドを使用します。
gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \ --node-id=TPU_NAME \ --zone=ZONE \ --accelerator-type=ACCELERATOR_TYPE \ --runtime-version=SOFTWARE_VERSION \ --reserved
プレースホルダ変数を置き換えます。
- QUEUED_RESOURCE_ID: キューに格納されたリソース リクエストのユーザー割り当て ID。
- TPU_NAME: キューに格納されたリソース リクエストの割り当て時に作成される TPU のユーザー割り当て ID(名前)。
- ZONE: TPU VM を作成し、予約が存在するゾーン。
- ACCELERATOR_TYPE: 作成する Cloud TPU のバージョンとサイズを指定します。TPU の各バージョンでサポートされているアクセラレータ タイプの詳細については、TPU のバージョンをご覧ください。
- SOFTWARE_VERSION: Cloud TPU ソフトウェアのバージョン。
予約の使用状況を確認する
共有予約の使用状況を確認できるのは、オーナー プロジェクトからのみです。コンシューマー プロジェクトにいる場合は、オーナー プロジェクトに切り替えて予約の使用状況を確認する必要があります。
予約の使用状況を確認するには、gcloud compute
reservations describe
コマンドを使用します。
gcloud compute reservations describe RESERVATION_NAME \ --project=PROJECT_ID --zone=ZONE
プレースホルダ変数を置き換えます。
- RESERVATION_NAME: 予約の名前。
- PROJECT_ID: インスタンスが含まれているプロジェクトの ID。
- ZONE: 予約が存在するゾーン。
プロジェクト内のすべての予約を一覧表示するには、gcloud compute reservations
list
コマンドを使用します。
gcloud compute reservations list --project=PROJECT_ID
次のプレースホルダ変数を置き換えます。
- PROJECT_ID: プロジェクトの ID。