Mis mejores utilidades, ahora en tu móvil.

Accede a todas mis herramientas y proyectos de forma rápida, optimizada y en un solo lugar.

Calculadora de Costes de LLMs. Estimador de Precios de APIs de IA

Herramienta online gratuita para estimar el coste de llamadas a APIs de modelos de lenguaje. Compara GPT-4o, Claude, Gemini, Llama y más con precios reales por millón de tokens.

~750 palabras

~375 palabras

Coste por Petición

$0.00
x 1,000

Coste Total Estimado

$0.00
Input Output
Estudio de Utilidades

¿Quieres tener esta utilidad en tu web?

Personaliza colores y modo oscuro para WordPress, Notion o tu propio sitio.

Preguntas Frecuentes

¿Cómo se calcula el coste de una API de LLM?
Las APIs de LLM cobran de forma separada por los tokens de entrada (el prompt) y los tokens de salida (la respuesta). El coste total por petición es: (tokens entrada × precio entrada + tokens salida × precio salida) / 1.000.000. Multiplica por el número de peticiones para obtener el coste mensual total.
¿Qué son los tokens y cómo se relacionan con las palabras?
Un token es la unidad básica de texto que procesa un modelo de lenguaje. En promedio, 1 token equivale a aproximadamente 0,75 palabras en inglés, es decir, 1.000 tokens ≈ 750 palabras. Los precios se indican por millón de tokens ($/1M), que es la unidad estándar en todos los proveedores.
¿Por qué los tokens de salida son más caros que los de entrada?
Generar texto (salida) requiere que el modelo calcule cada token de forma secuencial, lo cual es computacionalmente más costoso que leer la entrada. La mayoría de los proveedores cobran entre 3 y 5 veces más por los tokens de salida que por los de entrada.
¿Cómo puedo reducir los costes de la API de un LLM?
Usa el modelo más pequeño que cumpla tus requisitos de calidad. Cachea los prompts repetidos cuando sea posible. Minimiza la longitud del prompt de sistema y evita contexto innecesario. Para tareas simples de clasificación o extracción, modelos más pequeños como GPT-4o mini o Gemini Flash ofrecen un ahorro significativo.

# Cómo funciona el precio de las APIs de LLM

Las APIs de modelos de lenguaje cobran en función del uso de tokens, no por tiempo ni por petición. Cada llamada tiene dos costes: el coste de entrada (procesar tu prompt) y el coste de salida (generar la respuesta). Entender esta diferencia es clave para estimar con precisión tu factura mensual.

# Tokens de entrada frente a tokens de salida

Tokens de entrada

Los tokens de entrada representan todo lo que se envía al modelo: tu prompt de sistema, el historial de conversación y el mensaje del usuario. Son más baratos porque el modelo los procesa en paralelo. Un prompt de sistema típico de 200 palabras genera aproximadamente 267 tokens de entrada.

Tokens de salida

Los tokens de salida se generan uno a uno de forma secuencial, lo que los hace computacionalmente más costosos. La mayoría de los proveedores cobran entre 3 y 5 veces más por los tokens de salida. Una respuesta de 300 palabras genera aproximadamente 400 tokens de salida. Mantener las respuestas concisas es una de las estrategias de ahorro más efectivas.

# Elegir el modelo adecuado para tu presupuesto

Empieza con un modelo de gama media como GPT-4o mini o Gemini 1.5 Flash y solo escala si la calidad no es suficiente. La diferencia de coste entre un modelo pequeño y uno grande puede ser de 10 a 100 veces.
No todas las tareas requieren el mismo nivel de modelo. Las tareas de clasificación, extracción y resumen suelen funcionar bien con modelos más pequeños y económicos. Reserva los modelos más grandes como claude-3-opus o o1 para razonamientos complejos donde la calidad afecta directamente al resultado.

Referencias Bibliográficas

Esc