L

AI Tool

LangSmith

Observabilidad, evaluación y prompts de LangChain para apps LLM en producción

LangSmith es la plataforma de LangChain (cloud o self-hosted) para trazar, monitorizar y mejorar aplicaciones LLM. La documentación en docs.langchain.com describe instrumentación mediante variables de entorno, integraciones de frameworks (OpenAI, Anthropic, CrewAI, Vercel AI SDK, Pydantic AI y otras listadas) o el SDK, de modo que equipos inspeccionen runs multipaso, comparen versiones de prompts, construyan datasets, ejecuten evaluaciones offline/online, automaticen flujos y recojan feedback sin analítica ad hoc para bucles de agentes.

Categoría Herramientas para desarrolladores
Precio Free developer tier plus paid Team/Enterprise plans (see LangSmith pricing docs)
Plataformas Web / API / Python / JavaScript / Self-hosted
observabilityllmopstracing

Casos de uso

  • Depurar agentes con muchas herramientas recorriendo runs anidados
  • Publicar cambios de prompt tras experimentos con datasets
  • Alimentar evaluaciones con trazas de producción
  • Visibilidad compartida entre staging y producción
  • Combinar Engine (si está habilitado) con fallos recurrentes documentados

Funciones principales

  • Vistas de trazas e hilos alineadas a conceptos de observabilidad LangSmith
  • Flujos de prompt hub con gestión programática documentada
  • Herramientas de datasets y experimentos para regresiones
  • Dashboards, alertas y automatizaciones según guías de monitoring
  • Despliegues cloud, híbridos y self-hosted descritos en platform setup

Relacionados

Relacionados

3 Entradas indexadas

Langfuse

Herramientas para desarrolladoresOpen source

Langfuse es un producto open source de observabilidad para aplicaciones con LLM: ingiere trazas y spans desde tu stack, admite datasets y flujos de prompts/versiones, y ofrece Langfuse Cloud opcional o despliegue self-hosted. Se integra con SDKs Python/JS y frameworks que emiten telemetría compatible con OpenTelemetry, para depurar bucles de agentes, comparar iteraciones de prompts y vigilar métricas de calidad en producción sin construir analítica a medida desde cero.

Braintrust

Herramientas para desarrolladoresFree + Paid

Braintrust documenta en braintrust.dev una plataforma de observabilidad donde los equipos instrumentan aplicaciones para capturar trazas (entradas, salidas, latencia, tokens, llamadas a herramientas), analizar logs, anotar con feedback humano, ejecutar experimentos y scorers, e iterar prompts antes del despliegue. La doc describe el flujo Instrument → Observe → Annotate → Evaluate → Deploy, con auto-instrumentación para proveedores principales y frameworks como LangChain, LangGraph, Vercel AI SDK y Pydantic AI. Los tipos de span documentados incluyen task, llm, function, tool y score.

Mem0

Herramientas para desarrolladoresMem0 Platform usage-b…

Mem0 documenta en docs.mem0.ai una capa de memoria auto-mejorable para apps LLM con extracción, deduplicación y recuperación semántica. Mem0 Platform (app.mem0.ai) es servicio gestionado; Mem0 Open Source (pip install mem0ai) permite self-host con stores vectoriales/grafos. Integraciones con LangChain, CrewAI, Vercel AI SDK y 20+ frameworks; SDK Python con MemoryClient (cloud) y Memory (local).