Consommer une réservation

Si vous avez une réservation de TPU, vous pouvez utiliser vos ressources réservées pour créer des TPU correspondant aux propriétés de la réservation. Cette action est appelée consommation d'une réservation. Pour en savoir plus sur l'utilisation d'une réservation TPU lorsque vous utilisez GKE, consultez la section Réservation TPU dans la documentation GKE.

Consommer une réservation spécifique

Lorsque vous créez des ressources avec la commande gcloud alpha compute tpus queued-resources create, utilisez l'option --reservation pour spécifier le nom de la réservation à consommer. Pour les réservations futures créées en mode agenda, vous devez également définir l'indicateur --provisioning-model sur reservation-bound:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

Remplacez les variables d'espace réservé suivantes :

  • QUEUED_RESOURCE_ID: ID attribué par l'utilisateur à la requête de ressource mise en file d'attente.
  • TPU_NAME: ID (nom) attribué par l'utilisateur au TPU créé lors de l'allocation de la requête de ressources mise en file d'attente.
  • ZONE: zone dans laquelle créer la VM TPU. Pour en savoir plus sur les zones compatibles, consultez la section Régions et zones.
  • ACCELERATOR_TYPE: spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
  • SOFTWARE_VERSION: version logicielle de Cloud TPU.
  • RESERVATION_URL: URL de la réservation. Spécifiez l'une des valeurs suivantes :
    • Si la réservation se trouve dans votre projet : RESERVATION_NAME
    • Si la réservation se trouve dans un autre projet et que votre projet peut l'utiliser : projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

Consommer toute réservation correspondante

Vous pouvez utiliser l'indicateur --reserved pour déterminer automatiquement la réservation à utiliser en fonction du type d'accélérateur, de l'ID de projet et de la zone.

CreateNode

Pour utiliser une réservation correspondante à l'aide de l'API CreateNode, exécutez la commande gcloud alpha compute tpus tpu-vm create avec l'option --reserved:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

Remplacez les variables d'espace réservé suivantes :

  • TPU_NAME: nom du TPU.
  • ZONE: zone dans laquelle créer la VM TPU, qui doit correspondre à la zone de réservation.
  • ACCELERATOR_TYPE: spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
  • SOFTWARE_VERSION: version logicielle de Cloud TPU.

Ressources en file d'attente

Pour consommer toute réservation correspondante à l'aide de ressources mises en file d'attente, exécutez la commande gcloud alpha compute tpus queued-resources create avec l'option --reserved:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

Remplacez les variables d'espace réservé suivantes :

  • QUEUED_RESOURCE_ID: ID attribué par l'utilisateur à la requête de ressource mise en file d'attente.
  • TPU_NAME: ID (nom) attribué par l'utilisateur au TPU créé lors de l'allocation de la requête de ressources mise en file d'attente.
  • ZONE: zone dans laquelle créer la VM TPU et où se trouve la réservation.
  • ACCELERATOR_TYPE: spécifie la version et la taille du Cloud TPU à créer. Pour en savoir plus sur les types d'accélérateurs compatibles avec chaque version de TPU, consultez la section Versions de TPU.
  • SOFTWARE_VERSION: version logicielle de Cloud TPU.

Vérifier l'utilisation des réservations

Vous ne pouvez vérifier l'utilisation d'une réservation partagée que depuis son projet propriétaire. Si vous travaillez dans un projet client, vous devez basculer vers le projet propriétaire pour vérifier l'utilisation des réservations.

Pour connaître la partie de la réservation utilisée, utilisez la commande gcloud compute reservations describe:

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

Remplacez les variables d'espace réservé suivantes :

  • RESERVATION_NAME: nom de la réservation.
  • PROJECT_ID: ID du projet contenant la réservation.
  • ZONE: zone où se trouve la réservation.

Pour répertorier toutes les réservations d'un projet, exécutez la commande gcloud compute reservations list:

gcloud compute reservations list --project=PROJECT_ID

Remplacez la variable d'espace réservé suivante:

  • PROJECT_ID : ID du projet

Étape suivante