Core · Multi-modelo intercambiable

Modelos y routing

OpenClaw soporta los tres grandes proveedores de LLM (Anthropic, OpenAI, Google) y modelos locales via Ollama/vLLM. La elección se declara como configuración, no como código — cambiar de Claude Haiku a GPT-5 es una línea.

Modelos soportados

Proveedor	Modelo	Uso recomendado	Tipo
Anthropic	claude-opus-4-7	Razonamiento complejo, análisis	Cloud
Anthropic	claude-sonnet-4-6	Default equilibrado	Cloud
Anthropic	claude-haiku-4-5	Alto volumen, bajo coste	Cloud
OpenAI	gpt-5	Código, razonamiento	Cloud
Google	gemini-2.x	Contexto largo, analítica	Cloud
Meta	llama-3.x-70b	On-premise, compliance	Local
Alibaba	qwen-2.5	On-premise multilingüe	Local
Mistral	mixtral-8x22b	On-premise eficiente	Local

La comparativa completa con precios actualizados y benchmarks propios está en /openclaw/modelos, actualizada mensualmente.

Routing por tarea

Declara modelos por rol y deja que OpenClaw los enrute según el contexto del agente.

const claw = new OpenClaw({
  models: {
    default: 'claude-haiku-4-5',      // respuestas rápidas y baratas
    reasoning: 'claude-opus-4-7',     // cuando el agente pide razonar
    longContext: 'gemini-2.5-pro',    // ventana > 200K tokens
    code: 'gpt-5',                    // generación de código
    local: 'llama-3.3-70b',           // compliance estricto
  },
  routing: {
    // Política por agente
    byAgent: {
      'support': 'default',
      'legal-research': 'reasoning',
      'code-review': 'code',
    },
    // Fallback si el primario falla o excede presupuesto
    fallback: ['claude-sonnet-4-6', 'gpt-5'],
  },
});

Fallback y degradación elegante

Si el modelo primario falla (rate limit, 500, timeout, presupuesto superado), OpenClaw intenta el siguiente de la lista de fallback con el mismo prompt. Cada salto queda trazado.

// Ejemplo de traza
{
  "attempt_1": { "model": "claude-haiku-4-5", "status": "rate_limited" },
  "attempt_2": { "model": "claude-sonnet-4-6", "status": "success", "latency_ms": 1240 },
  "total_latency_ms": 1310,
  "cost_eur": 0.0042
}

Presupuestos y límites

Cada agente puede declarar un presupuesto máximo por conversación, por día o por mes. Cuando se supera, el orquestador degrada al modelo más barato o escala a humano según política.

claw.agent({
  name: 'support',
  budget: {
    perConversation: { eur: 0.5 },
    perDay: { eur: 100 },
    onExceeded: 'escalate',   // 'degrade' | 'block' | 'escalate'
  },
});

Modelos y routing

Modelos soportados

Proveedor	Modelo	Uso recomendado	Tipo
Anthropic	claude-opus-4-7	Razonamiento complejo, análisis	Cloud
Anthropic	claude-sonnet-4-6	Default equilibrado	Cloud
Anthropic	claude-haiku-4-5	Alto volumen, bajo coste	Cloud
OpenAI	gpt-5	Código, razonamiento	Cloud
Google	gemini-2.x	Contexto largo, analítica	Cloud
Meta	llama-3.x-70b	On-premise, compliance	Local
Alibaba	qwen-2.5	On-premise multilingüe	Local
Mistral	mixtral-8x22b	On-premise eficiente	Local

La comparativa completa con precios actualizados y benchmarks propios está en /openclaw/modelos, actualizada mensualmente.

Routing por tarea

Declara modelos por rol y deja que OpenClaw los enrute según el contexto del agente.

const claw = new OpenClaw({
  models: {
    default: 'claude-haiku-4-5',      // respuestas rápidas y baratas
    reasoning: 'claude-opus-4-7',     // cuando el agente pide razonar
    longContext: 'gemini-2.5-pro',    // ventana > 200K tokens
    code: 'gpt-5',                    // generación de código
    local: 'llama-3.3-70b',           // compliance estricto
  },
  routing: {
    // Política por agente
    byAgent: {
      'support': 'default',
      'legal-research': 'reasoning',
      'code-review': 'code',
    },
    // Fallback si el primario falla o excede presupuesto
    fallback: ['claude-sonnet-4-6', 'gpt-5'],
  },
});

Fallback y degradación elegante

Si el modelo primario falla (rate limit, 500, timeout, presupuesto superado), OpenClaw intenta el siguiente de la lista de fallback con el mismo prompt. Cada salto queda trazado.

// Ejemplo de traza
{
  "attempt_1": { "model": "claude-haiku-4-5", "status": "rate_limited" },
  "attempt_2": { "model": "claude-sonnet-4-6", "status": "success", "latency_ms": 1240 },
  "total_latency_ms": 1310,
  "cost_eur": 0.0042
}

Presupuestos y límites

Cada agente puede declarar un presupuesto máximo por conversación, por día o por mes. Cuando se supera, el orquestador degrada al modelo más barato o escala a humano según política.

claw.agent({
  name: 'support',
  budget: {
    perConversation: { eur: 0.5 },
    perDay: { eur: 100 },
    onExceeded: 'escalate',   // 'degrade' | 'block' | 'escalate'
  },
});

Modelos y routing

Modelos soportados

Routing por tarea

Fallback y degradación elegante

Presupuestos y límites

Política de Cookies

Modelos y routing

Modelos soportados

Routing por tarea

Fallback y degradación elegante

Presupuestos y límites