Core · Multi-modelo intercambiable
Modelos y routing
OpenClaw soporta los tres grandes proveedores de LLM (Anthropic, OpenAI, Google) y modelos locales via Ollama/vLLM. La elección se declara como configuración, no como código — cambiar de Claude Haiku a GPT-5 es una línea.
Modelos soportados
| Proveedor | Modelo | Uso recomendado | Tipo |
|---|---|---|---|
| Anthropic | claude-opus-4-7 | Razonamiento complejo, análisis | Cloud |
| Anthropic | claude-sonnet-4-6 | Default equilibrado | Cloud |
| Anthropic | claude-haiku-4-5 | Alto volumen, bajo coste | Cloud |
| OpenAI | gpt-5 | Código, razonamiento | Cloud |
| gemini-2.x | Contexto largo, analítica | Cloud | |
| Meta | llama-3.x-70b | On-premise, compliance | Local |
| Alibaba | qwen-2.5 | On-premise multilingüe | Local |
| Mistral | mixtral-8x22b | On-premise eficiente | Local |
La comparativa completa con precios actualizados y benchmarks propios está en /openclaw/modelos, actualizada mensualmente.
Routing por tarea
Declara modelos por rol y deja que OpenClaw los enrute según el contexto del agente.
const claw = new OpenClaw({
models: {
default: 'claude-haiku-4-5', // respuestas rápidas y baratas
reasoning: 'claude-opus-4-7', // cuando el agente pide razonar
longContext: 'gemini-2.5-pro', // ventana > 200K tokens
code: 'gpt-5', // generación de código
local: 'llama-3.3-70b', // compliance estricto
},
routing: {
// Política por agente
byAgent: {
'support': 'default',
'legal-research': 'reasoning',
'code-review': 'code',
},
// Fallback si el primario falla o excede presupuesto
fallback: ['claude-sonnet-4-6', 'gpt-5'],
},
});Fallback y degradación elegante
Si el modelo primario falla (rate limit, 500, timeout, presupuesto superado), OpenClaw intenta el siguiente de la lista de fallback con el mismo prompt. Cada salto queda trazado.
// Ejemplo de traza
{
"attempt_1": { "model": "claude-haiku-4-5", "status": "rate_limited" },
"attempt_2": { "model": "claude-sonnet-4-6", "status": "success", "latency_ms": 1240 },
"total_latency_ms": 1310,
"cost_eur": 0.0042
}Presupuestos y límites
Cada agente puede declarar un presupuesto máximo por conversación, por día o por mes. Cuando se supera, el orquestador degrada al modelo más barato o escala a humano según política.
claw.agent({
name: 'support',
budget: {
perConversation: { eur: 0.5 },
perDay: { eur: 100 },
onExceeded: 'escalate', // 'degrade' | 'block' | 'escalate'
},
});Anterior
Arquitectura
Siguiente
Canales