AI News · 2026-04-22

OpenAI añade modo WebSocket a la Responses API

Source: OpenAI ↗ 2026-04-22 Author: AIasdf Editorial

El 22 de abril de 2026, OpenAI explicó el transporte WebSocket para la Responses API: conexión persistente a /v1/responses y continuación con input incremental y previous_response_id, ante el cuello de latencia en el servicio API cuando la inferencia es más rápida. La documentación oficial detalla límites (p. ej. ~60 minutos), reglas con ZDR/store=false y reconexión.

El 22 de abril de 2026, OpenAI publicó Speeding up agentic workflows with WebSockets in the Responses API, presentando transporte WebSocket para la Responses API ya existente, orientado sobre todo a flujos agénticos con muchos ida y vuelta modelo–herramienta (el texto usa como ejemplo bucles tipo Codex).

Qué explica OpenAI

Según el artículo y la guía WebSocket mode en la documentación de la plataforma:

WebSocket persistente — el cliente mantiene la conexión a /v1/responses y, en cada turno, envía response.create con input incremental más previous_response_id.
Forma de petición familiar — la versión lanzada mantiene response.create y previous_response_id; el servidor puede cachear estado del response previo en el ámbito de la conexión para no reconstruir todo el historial en cada paso.
Motivación — el post argumenta que, al acelerarse la inferencia, la sobrecarga acumulada del servicio API en rollouts largos se vuelve más visible; WebSockets y optimizaciones relacionadas apuntan a ese cuello de botella.

Relación con los bucles de agente

OpenAI describe un patrón acción del modelo → ejecución de tools → devolución del resultado → repetición. Con HTTP cada continuación puede repetir trabajo de estado; con WebSocket, la guía vincula previous_response_id y caché en conexión a menos coste de continuación en cadenas largas.

Quién debería evaluarlo

Equipos con agents muy dependientes de tools sobre la Responses API.
Plataformas que deben respetar una respuesta en vuelo por conexión (sin multiplexión hoy).
Entornos con store=false o ZDR — la guía detalla reglas y errores cuando falta estado cacheado o persistido.

Lista de comprobación (según documentación)

Leer Connection behavior and limits: p. ej. tope de ~60 minutos, respuestas secuenciales, sin multiplexión en un socket; más conexiones si necesitas paralelismo.
Implementar Reconnect and recover ante cierre o límite; manejar previous_response_not_found y otros casos descritos.
Tratar errores documentados como websocket_connection_limit_reached sin asumir reintentos silenciosos.

Preguntas frecuentes

¿Qué es el modo WebSocket para la Responses API?

Un transporte opcional a /v1/responses donde cada turno usa response.create (payload alineado con el create HTTP salvo campos del transporte) y continúa con previous_response_id e input incremental.

¿Es otro producto?

No. OpenAI lo plantea como opción de transporte sobre la misma Responses API, manteniendo un modelo de integración reconocible.

¿Referencias oficiales?

Motivación y diseño en el artículo del 22-04-2026; detalles operativos en WebSocket mode (URL de conexión, eventos, límites, compactación y códigos de error).

Fuente primaria: OpenAI — Speeding up agentic workflows with WebSockets in the Responses API (detalle técnico: WebSocket mode).

Relacionados

Related AI Tools

3 Entradas indexadas

ChatGPT

Chat con IAFreemium

ChatGPT es un chatbot basado en modelos de lenguaje de gran escala desarrollado por OpenAI, lanzado en noviembre de 2022. Utiliza la arquitectura GPT-4 para generar respuestas de texto similares a las humanas en distintos formatos de conversación. El modelo admite entradas multimodales, incluyendo texto, imágenes e interacciones de voz. Existe un nivel gratuito con GPT-3.5, mientras que ChatGPT Plus ofrece acceso a GPT-4 con tiempos de respuesta más rápidos y capacidades de complementos. Es una herramienta versátil para redacción, análisis, asistencia en programación y tareas creativas.

OpenAI Codex

Agentes de IAPaid

OpenAI Codex es un modelo de generación de código basado en GPT-3 diseñado específicamente para tareas de programación. Es el modelo que impulsa GitHub Copilot y también está disponible a través de API. Codex puede escribir, revisar y explicar código en múltiples lenguajes de programación,理解 instrucciones en lenguaje natural y convertirlas en código funcional.

Langfuse

Herramientas para desarrolladoresOpen source + hosted plans

Langfuse es un producto open source de observabilidad para aplicaciones con LLM: ingiere trazas y spans desde tu stack, admite datasets y flujos de prompts/versiones, y ofrece Langfuse Cloud opcional o despliegue self-hosted. Se integra con SDKs Python/JS y frameworks que emiten telemetría compatible con OpenTelemetry, para depurar bucles de agentes, comparar iteraciones de prompts y vigilar métricas de calidad en producción sin construir analítica a medida desde cero.

Relacionados

Related MCP

2 Entradas indexadas

Agent Protocol MCP

Herramientas de desarrollo

Implementa el estándar Agent Protocol permitiendo a clientes MCP coordinar con frameworks de agentes externos usando esquemas compartidos de task, step y artifact. Útil al componer múltiples agentes donde uno pasa trabajo a agentes especializados. Soporta registro de agentes y seguimiento de estado.

Ollama MCP Server

Herramientas de desarrollo

Puente comunitario del Model Context Protocol que expone la API HTTP local de Ollama—listado de modelos, pulls, chat y completions compatibles con OpenAI—a clientes MCP como Claude Desktop y Cursor. Publicado en npm como `ollama-mcp-server` (fork mantenido de NightTrek/Ollama-mcp); requiere el daemon de Ollama accesible en `OLLAMA_HOST` (por defecto `http://127.0.0.1:11434`).

Relacionados

Related Skills

2 Entradas indexadas

Agentic workflow design

Planificación

Estructura tareas de agente multi-step con inputs explícitos, outputs, comportamiento de fallback y protocolos de handoff para que los agentes completen workflows complejos fiablemente en lugar de detenerse en el primer blocker. Agentic workflow design aplica disciplina de ingeniería de software a pipelines de agente de IA, tratando cada paso como una función con inputs y outputs tipados.

Designing with LLM structured outputs

Programación

Define esquemas, activa el modo de salida estructurada que documente tu proveedor, valida siempre en servidor y trata los rechazos como eventos de primera clase—fundamental cuando los regex sobre texto libre son demasiado frágiles en producción.

Continue Reading

All News →

2026-05-05 OpenAI lanza GPT-5.5 Instant como modelo predeterminado de ChatGPT para todos los usuarios OpenAI 2026-05-05 Anthropic publica diez plantillas de agentes para servicios financieros, complementos de Microsoft 365 y nuevos conectores Anthropic 2026-05-01 El Pentágono Firma Acuerdos de IA con Siete Empresas Tecnológicas para Ampliar las Capacidades de Inteligencia Clasificada The New York Times 2026-05-01 Anthropic lanza conectores de Claude orientados al trabajo creativo Anthropic