RAG y memoria para IA con bases vectoriales

Datos y RAG

Dele a la IA acceso al conocimiento propio de su organización para que responda con precisión y con fuentes, en lugar de inventar. El participante domina el flujo completo de la recuperación aumentada (RAG): preparar documentos, fragmentarlos, generar embeddings, almacenarlos en una base vectorial y ejecutar búsqueda semántica, sobre una implementación real capaz de indexar miles de páginas.

Duración16 horas (4 sesiones de 4 h) ModalidadVirtual en vivo

Temario

Módulo 1: Fundamentos de RAG y memoria para IA

Por qué la IA necesita memoria externa: límites del contexto y alucinaciones
Qué es la recuperación aumentada (RAG) y cuándo conviene frente a otras opciones
Anatomía de un sistema RAG: ingesta, indexación, recuperación y generación
Embeddings y espacio vectorial: cómo se representa el significado
Casos de uso reales: consulta de documentación, soporte y base de conocimiento interna

Módulo 2: Ingesta y chunking de documentos

Preparación de fuentes: limpieza, normalización y extracción de texto
Estrategias de fragmentación (chunking): tamaño, solapamiento y límites semánticos
Metadatos por fragmento para filtrar y dar trazabilidad a la respuesta
Errores comunes de chunking que degradan la calidad de la recuperación
Práctica: fragmentar un corpus de documentos con una estrategia justificada

Módulo 3: Embeddings y base vectorial con Postgres y pgvector

Generación de embeddings: elección de modelo y dimensiones
pgvector sobre Postgres: por qué usar la base de datos que el equipo ya conoce
Modelado de tablas para vectores, texto y metadatos
Índices vectoriales y su efecto en velocidad y precisión de la búsqueda
Práctica: indexar el corpus fragmentado en una base vectorial funcional

Módulo 4: Búsqueda semántica y recuperación

Consulta por similitud: del texto de la pregunta al vector de búsqueda
Búsqueda semántica frente a búsqueda por palabra clave, y su combinación (híbrida)
Filtrado por metadatos y reordenamiento de resultados (re-ranking)
Cómo medir la calidad de la recuperación antes de generar respuestas
Práctica: recuperar los fragmentos correctos para un conjunto de preguntas reales

Módulo 5: Ensamblaje del pipeline y respuestas fundamentadas

Construcción del prompt con contexto recuperado y control de tamaño
Respuestas con citas: enlazar cada afirmación con su fuente
Reducción de alucinaciones y manejo del caso sin respuesta
Memoria de conversación frente a memoria de conocimiento
Práctica: ensamblar un sistema RAG que responde con fuentes citadas

Módulo 6: Operación, evaluación y escalamiento

Evaluación del sistema: relevancia, fidelidad a la fuente y cobertura
Actualización del índice: reindexado incremental y control de versiones del corpus
Costos y rendimiento al crecer a miles de documentos
Consideraciones de privacidad y control del conocimiento propio
Entregable final: un sistema RAG end to end sobre un corpus del participante, con evaluación de calidad

Los modelos de IA responden bien sobre lo que conocen, pero fallan cuando se les pide precisión sobre información propia de una organización: manuales, políticas, documentación interna o histórico de proyectos. La recuperación aumentada (RAG) resuelve ese problema al darle a la IA una memoria externa de conocimiento confiable, de modo que sus respuestas se fundamenten en fuentes reales y no en suposiciones.

Este curso enseña a construir ese tipo de sistema de principio a fin, sobre una implementación real que ya indexa miles de páginas. El participante trabaja con Postgres y pgvector, aprende a fragmentar documentos, generar embeddings y ejecutar búsqueda semántica, y termina con un sistema que responde con fuentes citadas. Para la organización, el resultado es tangible: una IA que consulta el conocimiento propio con exactitud y trazabilidad, un tema técnico de alta demanda abordado desde la práctica y con foco en la calidad.

Preguntas frecuentes

¿A quién está dirigido?

A desarrolladores, ingenieros de datos, arquitectos y equipos técnicos que quieren dar a sus aplicaciones de IA acceso a conocimiento propio de forma confiable y verificable.

¿Necesito conocimientos previos?

Sí, se recomienda experiencia programando y nociones básicas de bases de datos y SQL. No se requiere experiencia previa con embeddings ni con bases vectoriales; el curso construye esos conceptos desde el inicio.

¿Qué me llevo al terminar?

Un sistema RAG funcional construido por usted mismo (ingesta, chunking, embeddings, base vectorial y búsqueda semántica) sobre Postgres con pgvector, además de los criterios para evaluar y escalar su calidad.

¿Cuánto dura y cómo se imparte?

Son 16 horas repartidas en 4 sesiones de 4 horas, 100% virtuales en vivo, con práctica guiada en cada sesión que se acumula hasta el sistema RAG final sobre un corpus del participante.