Plataforma open source de ingeniería de LLM: trazas, evals y gestión de prompts
Langfuse es un producto open source de observabilidad para aplicaciones con LLM: ingiere trazas y spans desde tu stack, admite datasets y flujos de prompts/versiones, y ofrece Langfuse Cloud opcional o despliegue self-hosted. Se integra con SDKs Python/JS y frameworks que emiten telemetría compatible con OpenTelemetry, para depurar bucles de agentes, comparar iteraciones de prompts y vigilar métricas de calidad en producción sin construir analítica a medida desde cero.
Casos de uso
- Depurar agentes con muchas herramientas cuando el fallo está profundo en la cadena
- Medir latencia y uso de tokens entre rutas y versiones de modelo
- Construir conjuntos de evaluación desde trazas de producción
- Comparar cambios de prompt con datasets consistentes
- Dar al equipo plataforma una vista compartida del comportamiento del LLM
Funciones principales
- Vistas de trazas y sesiones para flujos LLM y de agentes en varios pasos
- Gestión de prompts con versionado y comparación
- Datasets y puntuación para evaluación offline y regresiones
- Integraciones SDK en ecosistemas Python y JavaScript
- Self-hosting junto a Langfuse Cloud para requisitos de residencia de datos
Relacionados
Relacionados
3 Entradas indexadas
Postgres MCP
pg-mcp-server is a Model Context Protocol server that bridges AI agents and PostgreSQL databases. It exposes schema metadata (tables, columns, indexes, foreign keys) as MCP resources, and lets agents execute read-only SQL queries or transactional writes. Ideal for developers who want Claude, Cursor, or other LLM-powered tools to answer questions about a live database without manual SQL. Supports connection string configuration, SSL modes, and Row-level security awareness.
Google Antigravity
Google Antigravity es una plataforma de desarrollo "agent-first" presentada en el Google Developers Blog (noviembre de 2025). Une un editor asistido por IA con una Manager Surface para lanzar y supervisar agentes de forma asíncrona en editor, terminal y navegador. Los agentes generan Artefactos (planes, capturas, grabaciones) para revisión en lugar de depender solo de registros de herramientas. Hay vista previa pública gratuita para personas en macOS, Windows y Linux, con opciones de modelo incluyendo Gemini 3 Pro y otros modelos compatibles mencionados por Google.
MemGPT
MemGPT es un sistema de modelo de lenguaje que implementa gestión de memoria jerárquica para permitir conversaciones y agentes de IA que mantienen contexto a través de interacciones muy largas. Similar a cómo funciona la memoria en sistemas operativos, MemGPT mueve niveles de memoria entre procesamiento rápido y almacenamiento para superar límites de contexto.