IA aplicada

RAG y memoria para IA con bases vectoriales

Datos y RAG

Dele a la IA acceso al conocimiento propio de su organización para que responda con precisión y con fuentes, en lugar de inventar. El participante domina el flujo completo de la recuperación aumentada (RAG): preparar documentos, fragmentarlos, generar embeddings, almacenarlos en una base vectorial y ejecutar búsqueda semántica, sobre una implementación real capaz de indexar miles de páginas.

Duración16 horas (4 sesiones de 4 h) ModalidadVirtual en vivo

Temario

Módulo 1: Fundamentos de RAG y memoria para IA

  • Por qué la IA necesita memoria externa: límites del contexto y alucinaciones
  • Qué es la recuperación aumentada (RAG) y cuándo conviene frente a otras opciones
  • Anatomía de un sistema RAG: ingesta, indexación, recuperación y generación
  • Embeddings y espacio vectorial: cómo se representa el significado
  • Casos de uso reales: consulta de documentación, soporte y base de conocimiento interna

Módulo 2: Ingesta y chunking de documentos

  • Preparación de fuentes: limpieza, normalización y extracción de texto
  • Estrategias de fragmentación (chunking): tamaño, solapamiento y límites semánticos
  • Metadatos por fragmento para filtrar y dar trazabilidad a la respuesta
  • Errores comunes de chunking que degradan la calidad de la recuperación
  • Práctica: fragmentar un corpus de documentos con una estrategia justificada

Módulo 3: Embeddings y base vectorial con Postgres y pgvector

  • Generación de embeddings: elección de modelo y dimensiones
  • pgvector sobre Postgres: por qué usar la base de datos que el equipo ya conoce
  • Modelado de tablas para vectores, texto y metadatos
  • Índices vectoriales y su efecto en velocidad y precisión de la búsqueda
  • Práctica: indexar el corpus fragmentado en una base vectorial funcional

Módulo 4: Búsqueda semántica y recuperación

  • Consulta por similitud: del texto de la pregunta al vector de búsqueda
  • Búsqueda semántica frente a búsqueda por palabra clave, y su combinación (híbrida)
  • Filtrado por metadatos y reordenamiento de resultados (re-ranking)
  • Cómo medir la calidad de la recuperación antes de generar respuestas
  • Práctica: recuperar los fragmentos correctos para un conjunto de preguntas reales

Módulo 5: Ensamblaje del pipeline y respuestas fundamentadas

  • Construcción del prompt con contexto recuperado y control de tamaño
  • Respuestas con citas: enlazar cada afirmación con su fuente
  • Reducción de alucinaciones y manejo del caso sin respuesta
  • Memoria de conversación frente a memoria de conocimiento
  • Práctica: ensamblar un sistema RAG que responde con fuentes citadas

Módulo 6: Operación, evaluación y escalamiento

  • Evaluación del sistema: relevancia, fidelidad a la fuente y cobertura
  • Actualización del índice: reindexado incremental y control de versiones del corpus
  • Costos y rendimiento al crecer a miles de documentos
  • Consideraciones de privacidad y control del conocimiento propio
  • Entregable final: un sistema RAG end to end sobre un corpus del participante, con evaluación de calidad

Los modelos de IA responden bien sobre lo que conocen, pero fallan cuando se les pide precisión sobre información propia de una organización: manuales, políticas, documentación interna o histórico de proyectos. La recuperación aumentada (RAG) resuelve ese problema al darle a la IA una memoria externa de conocimiento confiable, de modo que sus respuestas se fundamenten en fuentes reales y no en suposiciones.

Este curso enseña a construir ese tipo de sistema de principio a fin, sobre una implementación real que ya indexa miles de páginas. El participante trabaja con Postgres y pgvector, aprende a fragmentar documentos, generar embeddings y ejecutar búsqueda semántica, y termina con un sistema que responde con fuentes citadas. Para la organización, el resultado es tangible: una IA que consulta el conocimiento propio con exactitud y trazabilidad, un tema técnico de alta demanda abordado desde la práctica y con foco en la calidad.

Preguntas frecuentes

¿A quién está dirigido?

A desarrolladores, ingenieros de datos, arquitectos y equipos técnicos que quieren dar a sus aplicaciones de IA acceso a conocimiento propio de forma confiable y verificable.

¿Necesito conocimientos previos?

Sí, se recomienda experiencia programando y nociones básicas de bases de datos y SQL. No se requiere experiencia previa con embeddings ni con bases vectoriales; el curso construye esos conceptos desde el inicio.

¿Qué me llevo al terminar?

Un sistema RAG funcional construido por usted mismo (ingesta, chunking, embeddings, base vectorial y búsqueda semántica) sobre Postgres con pgvector, además de los criterios para evaluar y escalar su calidad.

¿Cuánto dura y cómo se imparte?

Son 16 horas repartidas en 4 sesiones de 4 horas, 100% virtuales en vivo, con práctica guiada en cada sesión que se acumula hasta el sistema RAG final sobre un corpus del participante.

Inscríbete o solicita una cotización

Curso: RAG y memoria para IA con bases vectoriales