Cómo solicitar aumentos de cuota para Amazon Bedrock (y que te los aprueben)

Published: (March 19, 2026 at 12:11 PM EDT)
4 min read
Source: Dev.to

Source: Dev.to

Estás viendo errores como estos en tu app:

ThrottlingException: Too many requests, please wait before trying again.

El problema son las cuotas de Amazon Bedrock: RPM (requests por minuto) o TPM (tokens por minuto).
La solución es solicitar un aumento. En esta guía encontrarás el proceso completo: cómo revisar tus límites actuales, qué métricas extraer de CloudWatch y una plantilla lista para pegar en el Support Center.

Tiempos: AWS Support tiene un SLA de 48 h, pero abre el caso con al menos 72 h de antelación.
Idioma: Escribe el caso en inglés; se resuelve más rápido. La plantilla al final ya está en inglés.

Paso 1: Revisa tus cuotas actuales

  1. Ve a AWS Console → Service Quotas → AWS Services → Amazon Bedrock.
  2. Busca tu modelo y revisa los valores de RPM y TPM aplicados. Si la cuota fue aumentada antes, verás el valor real, no el default de AWS.
  3. También puedes ver si ya tienes una solicitud en vuelo en la pestaña Pending quota requests.

Paso 2: Extrae tu uso real desde CloudWatch

  1. Ve a CloudWatch → Metrics → All metrics → AWS/Bedrock.
  2. Usa el inference profile ID como dimensión ModelId, no el ID del modelo base.
  3. Selecciona un periodo de 1 minuto y recopila las siguientes métricas:
MétricaEstadísticaQué te dice
InvocationsSumLlamadas por minuto (tu RPM real)
InputTokenCountSumTokens de entrada por minuto
OutputTokenCountSumTokens de salida por minuto
InvocationThrottlesSumRequests rechazados por cuota
EstimatedTPMQuotaUsageAverage / Max% de cuota TPM consumida

CloudWatch Metrics - AWS/Bedrock

Con esos datos calcula:

  • Steady State TPM/RPM = promedio en horario normal
  • Peak TPM/RPM = máximo observado
  • Avg tokens per request = total tokens / total invocaciones

Si InvocationThrottles > 0 o EstimatedTPMQuotaUsage supera el 80 % de forma sostenida, inclúyelo en el caso — es tu mejor argumento.

Paso 3: Redacta el caso

Utiliza la siguiente plantilla (texto plano, en inglés) y completa los valores obtenidos en el paso anterior antes de abrir el ticket.

AWS Account Manager: (optional but recommended)
AWS Solutions Architect: (optional but recommended)

Business Context
[What your company does, its scale, and industry.]

Business Objective
[Specific goal: e.g., process N requests/minute for real-time inference.]

Architecture Overview
[How your system works and which AWS services are involved.]

Current Usage Baseline
[Your CloudWatch numbers here.]

Current usage:
  Input modalities:  Text / Image / Audio / Video
  Output modalities: Text / Image / Audio / Video
  Steady State TPM:  ...
  Peak TPM:          ...
  Steady State RPM:  ...
  Peak RPM:          ...
  Avg Input Tokens per Request:  ...
  Avg Output Tokens per Request: ...

Requested Quota
[Exact quota name from Service Quotas + value needed.]

Expected usage after quota increase:
  Input modalities:  Text / Image / Audio / Video
  Output modalities: Text / Image / Audio / Video
  Steady State TPM:  ...
  Peak TPM:          ...
  Steady State RPM:  ...
  Peak RPM:          ...
  Avg Input Tokens per Request:  ...
  Avg Output Tokens per Request: ...

Justification
[Tie your baseline to the business need. Lead with throttle data if you have it.]

Inference scope
[Global or region-only. If region-only, explain why.]

Paso 4: Abre el caso de soporte

  1. Ve al AWS Support Center.
  2. Navega a Support interactions y describe tu necesidad en el chat.
  3. Al final aparecerá el botón Create case; selecciónalo y completa:
  • Case type: Service limit increase
  • Service: Service Limit Increase
  • Category: General

Bonus: automatiza esto con Kiro

Todo el proceso (consultar cuotas, extraer métricas de CloudWatch, calcular los números y generar el borrador del caso) se puede hacer de forma asistida con el proyecto AWS Quota Request Power para Kiro. Incluye un steering file específico para Bedrock con la lógica de RPM, TPM y perfiles de inferencia. Si usas Kiro, vale la pena echarle un vistazo.

0 views
Back to Blog

Related posts

Read more »