Cargando
Cargando
Usamos cookies propias y de terceros (Google Analytics) para mejorar tu experiencia y analizar el tráfico del sitio. Leer política de privacidad.
Precio, latencia, contexto y recomendación por caso. Ningún modelo es “el mejor” en todo — OpenClaw enruta entre ellos según tarea, coste y calidad.
Precios por millón de tokens (USD). Latencia p50 medida en nuestro eval interno. Calidad en escala de 3 tiers.
| Modelo | Proveedor | Contexto | Input | Output | Latencia p50 | Calidad | Mejor para |
|---|---|---|---|---|---|---|---|
| claude-opus-4-7 | Anthropic | 1M tokens | $15 / 1M | $75 / 1M | ~2.5s | Tier 1 | Razonamiento complejo · Investigación |
| claude-sonnet-4-6 | Anthropic | 1M tokens | $3 / 1M | $15 / 1M | ~1.2s | Tier 1 | Default equilibrado · Agentes de producción |
| claude-haiku-4-5 | Anthropic | 200K tokens | $0.80 / 1M | $4 / 1M | ~0.6s | Tier 2 | Alto volumen · Atención 24/7 |
| gpt-5 | OpenAI | 400K tokens | $10 / 1M | $40 / 1M | ~1.4s | Tier 1 | Código · Agentes con function calling |
| gemini-2.5-pro | 2M tokens | $2.50 / 1M | $10 / 1M | ~1.8s | Tier 1 | Contexto ultra-largo · Docs extensos | |
| llama-3.3-70b | Meta (self-hosted) | 128K tokens | infra propia | infra propia | ~1.5s (A100) | Tier 2 | On-premise · Compliance estricto |
| qwen-2.5-72b | Alibaba (self-hosted) | 128K tokens | infra propia | infra propia | ~1.6s (A100) | Tier 2 | Multilingüe EU/ES/PT · On-premise |
| mixtral-8x22b | Mistral (self-hosted) | 64K tokens | infra propia | infra propia | ~1.2s (A100) | Tier 3 | Eficiente en CPU/GPU mixto · Tareas acotadas |
Precios cloud en USD por 1M tokens · Latencia medida con prompts <2K tokens y respuestas <500 tokens
Recomendaciones concretas, no tier lists vacías. Estos son los routing patterns que desplegamos en clientes reales.
| Caso de uso | Primario | Fallback |
|---|---|---|
| Atención al cliente 24/7 (WhatsApp, Telegram) | claude-haiku-4-5 | claude-sonnet-4-6 |
| Agente comercial (prospección + outreach) | claude-sonnet-4-6 | gpt-5 |
| Agente de research jurídico / M&A | claude-opus-4-7 | gemini-2.5-pro |
| Analítica sobre documentos muy largos | gemini-2.5-pro | claude-opus-4-7 |
| Generación y revisión de código | gpt-5 | claude-sonnet-4-6 |
| On-premise salud / defensa / banca soberana | llama-3.3-70b | qwen-2.5-72b |
| Procesamiento back-office alto volumen | claude-haiku-4-5 | mixtral-8x22b (local) |
45 minutos con un ingeniero OpenClaw: analizamos tu caso, elegimos routing óptimo y te damos estimación de coste mensual.