Opciones de consumo de Cloud TPU

En este documento, se proporciona una descripción de las opciones de consumo que se admiten para Cloud TPU. Las opciones de consumo son los métodos que se usan para solicitar la capacidad. Cuando elijas una opción de consumo, ten en cuenta los siguientes factores:

  • La rapidez con la que necesitas la capacidad
  • Por cuánto tiempo necesitas la capacidad
  • Si necesitas la capacidad por un período fijo o flexible
  • Si se puede adelantar tu capacidad
  • Precios

Si usas las APIs de Cloud TPU, para cada método de consumo, necesitas una cuota según demanda o preemptible para la cantidad de núcleos de Cloud TPU que deseas usar. Existen diferentes cuotas predeterminadas bajo demanda y usurpables para cada versión de TPU. Para obtener más información, consulta Cuotas de Cloud TPU.

Si usas TPU con Google Kubernetes Engine (GKE), usas la cuota de la API de Compute Engine, que es una cuota diferente. Para obtener más información sobre las cuotas que usas para las TPU en GKE, consulta Asegúrate de tener una cuota de TPU.

Opción de consumo Cómo funciona Mejor uso para Versiones y zonas de TPU compatibles Tipo de cuota para la API de Cloud TPU
Reservas a largo plazo

Solicitas recursos de TPU por adelantado durante un año o más. Estos recursos se reservan para tu uso exclusivo durante ese período.

Las reservas proporcionan el nivel más alto de garantía de capacidad y son rentables, con un precio más bajo que los recursos on demand.

Las reservas de TPU a largo plazo tienen un descuento por compromiso de uso (CUD) adjunto. Los CUD proporcionan precios con descuento a cambio de la compra de un contrato de compromiso de uso. Para obtener más información, consulta Solicita una reserva a largo plazo.

Las reservas a largo plazo son ideales para trabajos de entrenamiento de larga duración y cargas de trabajo de inferencia. Todas las versiones de TPU: Consulta Regiones y zonas de TPU Cuota según demanda
Reservas a corto plazo (reservas futuras en el modo de calendario) (Versión preliminar)

Solicitas recursos de TPU para una hora de inicio y una duración específicas, de entre 1 y 90 días. Estos recursos se reservan para tu uso exclusivo durante ese período.

Las reservas proporcionan el nivel más alto de garantía de capacidad y son rentables, con un precio más bajo que los recursos on demand.

Para obtener más información, consulta Cómo solicitar una reserva a corto plazo con el modo de calendario.

Las reservas a corto plazo son una buena opción para las cargas de trabajo de entrenamiento y experimentación que requieren horarios de inicio precisos y tienen una duración definida.

v6e (Trillium) para el entrenamiento y la publicación: asia-northeast1-b, us-east5-a

v5p para el entrenamiento y la entrega: us-east5-a

v5e para el entrenamiento: us-west4-a

v5e para la publicación: us-central1-a

No se requiere cuota
A pedido

Solicitas que los recursos de TPU se usen lo antes posible y durante el tiempo que desees.

La opción bajo demanda ofrece la mayor flexibilidad. No se apropiarán los recursos on demand, pero no hay garantía de que haya suficientes recursos de TPU disponibles para satisfacer tu solicitud. La opción a demanda es la predeterminada cuando creas recursos de TPU. Para obtener más información sobre cómo crear y usar TPUs on demand, consulta Administra recursos de TPU.

La opción On demand es adecuada para trabajos urgentes y cargas de trabajo que requieren una hora de finalización flexible. Todas las versiones de TPU: Consulta Regiones y zonas de TPU Cuota según demanda
Flex-start (versión preliminar)

Solicitas recursos de TPU por un período específico, hasta 7 días, sin necesidad de reservar capacidad con anticipación.

Los recursos de inicio flexible se entregan desde un grupo dedicado de capacidad, por lo que la disponibilidad de estos recursos es mayor que la de los recursos on demand. Para obtener más información sobre el uso de Flex-start con TPU, consulta Cómo solicitar Cloud TPU con Flex-start.

Para obtener más información sobre el uso de Flex-start con Google Kubernetes Engine (GKE), consulta Acerca del aprovisionamiento de GPU y TPU con el modo de aprovisionamiento de inicio flexible.

El inicio flexible es ideal para la experimentación, las pruebas a pequeña escala, el aprovisionamiento dinámico de TPU para cargas de trabajo de inferencia, el ajuste fino de modelos y las ejecuciones de cargas de trabajo que duran menos de 7 días.

v6e (Trillium) para el entrenamiento y la publicación: asia-northeast1-b, us-east5-a

v5e para el entrenamiento: us-west4-a

v5e para la publicación: us-central1-a

Cuota interrumpible
Spot

Solicitas recursos de TPU que podrían interrumpirse.

Las VMs Spot están disponibles a un precio mucho más bajo que los recursos a pedido. Las VMs Spot pueden ser más fáciles de obtener que los recursos on demand, pero se pueden interrumpir (apagar) en cualquier momento. No hay límite para la duración del tiempo de ejecución. Para obtener más información sobre las VMs Spot de TPU, consulta Administra VMs Spot de TPU.

Spot es una buena opción para programar cargas de trabajo de menor prioridad, como el entrenamiento previo del modelo, el ajuste fino del modelo y los trabajos de simulación que toleran interrupciones de disponibilidad. Todas las versiones de TPU: Consulta Regiones y zonas de TPU Cuota interrumpible

¿Qué sigue?

Comienza a usar las TPU con lo siguiente: