Construcción de Sistemas RAG con Bases de Datos Vectoriales: Chroma, Pinecone y pgvector

Construcción de Sistemas RAG con Bases de Datos Vectoriales: Chroma, Pinecone y pgvector

Curso práctico para ingenieros de datos que deseen implementar sistemas RAG utilizando bases de datos vectoriales. Aprenderás a diseñar, desarrollar y optimizar pipelines completos con Chroma, Pinecone y pgvector, enfocándote en casos reales de producción.
0 Estudiantes
25 Clases
Mariana López
Mariana López

Instructora

Acerca de este curso

Curso práctico para ingenieros de datos que deseen implementar sistemas RAG utilizando bases de datos vectoriales. Aprenderás a diseñar, desarrollar y optimizar pipelines completos con Chroma, Pinecone y pgvector, enfocándote en casos reales de producción.
Mariana López
Mariana López
9 Cursos
0 Estudiantes

Mariana López es Estratega de aprendizaje digital con base en Ciudad de México, México. Su trabajo se enfoca en transformar temas complejos en rutas de aprendizaje claras, prácticas y fáciles de seguir.

Ha acompañado a estudiantes, profesionales y equipos de empresas en procesos de formación online, combinando teoría útil con ejercicios aplicables desde la primera clase.

En Cursalo diseña experiencias de aprendizaje con ejemplos reales, lenguaje directo y una estructura pensada para avanzar paso a paso sin perder contexto.

Mariana López
Resumen del temario

Este curso incluye 5 modulos, 25 lecciones y 8:40 horas de materiales.

Fundamentos de RAG y Bases de Datos Vectoriales
5 Partes | 1:40 Horas
Arquitectura de Sistemas RAG: Componentes y Flujo de Datos
Gratis

Concepto claveLa arquitectura de Retrieval Augmented Generation (RAG) combina la recuperación de información con la generación de texto, creando sistemas que pueden acceder a bases de conocimiento externas para producir respuestas precisas y contextualizadas. Imagina un bibliotecario experto que, en lugar de memorizar todos los libros, tiene acceso instantáneo a un catálogo perfectamente organizado y sabe exactamente qué páginas consultar cuando le haces una pregunta.En el corazón de esta arquit

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Embeddings y Similitud Vectorial: Teoría Aplicada
Gratis

Concepto claveLos embeddings son representaciones vectoriales de datos (texto, imágenes, audio) que capturan su significado semántico en un espacio multidimensional. Imagina que cada palabra o documento es un punto en un mapa, donde palabras similares (como "perro" y "can") están cerca, y palabras diferentes (como "perro" y "computadora") están lejos. En sistemas RAG, los embeddings convierten consultas y documentos en vectores para buscar información relevante.La similitud vectorial mide cuán c

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Configuración Inicial: Entorno de Desarrollo y Primeros Pasos
Gratis

Tipo de lección: VideoConcepto claveLa Configuración Inicial en sistemas RAG es el proceso de preparar tu entorno de desarrollo para trabajar con bases de datos vectoriales. Piensa en esto como preparar tu taller de carpintería antes de construir un mueble: necesitas las herramientas correctas, el espacio organizado y los materiales a mano. Sin esta preparación, incluso el mejor diseño fallará en la ejecución.En el contexto de RAG, esta configuración incluye tres componentes principales: el ento

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Práctica: Creación de un Pipeline Básico de Embeddings
Gratis

Concepto claveEn el corazón de cualquier sistema RAG (Retrieval Augmented Generation) se encuentra el proceso de embeddings. Imagina que tienes una biblioteca con miles de libros y necesitas encontrar rápidamente aquellos que hablan sobre "inteligencia artificial en medicina". En lugar de leer cada título, usas un sistema que convierte cada libro en una "huella digital" numérica única que captura su esencia temática. Los embeddings hacen precisamente eso: transforman texto (o imágenes, audio) en

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Evaluación de Conceptos Fundamentales
Gratis

Tipo de lección: QuizConcepto claveEl Retrieval Augmented Generation (RAG) es una arquitectura que combina recuperación de información con generación de texto. En lugar de depender únicamente de los parámetros aprendidos durante el entrenamiento (como hace un LLM tradicional), un sistema RAG primero recupera documentos relevantes de una base de conocimiento externa y luego usa esa información como contexto para generar respuestas.Imagina que eres un abogado preparando un caso. No intentas memori

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Implementación con Chroma: Bases de Datos Vectoriales Locales
5 Partes | 1:40 Horas
Instalación y Configuración de Chroma: Primeros Pasos
Gratis

Concepto claveChroma es una base de datos vectorial de código abierto diseñada específicamente para aplicaciones de Retrieval Augmented Generation (RAG). Imagina que necesitas buscar documentos en una biblioteca gigante: en lugar de revisar cada estante manualmente, Chroma organiza los documentos por su significado semántico, como si tuviera un mapa que agrupa textos similares. Esto permite recuperar información relevante rápidamente, similar a cómo un asistente de biblioteca experto te guiaría

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Operaciones CRUD con Chroma: Inserción y Consulta de Vectores
Gratis

Tipo de lección: VideoConcepto claveLas operaciones CRUD (Crear, Leer, Actualizar, Eliminar) son el núcleo de cualquier sistema de base de datos, incluyendo las bases de datos vectoriales como Chroma. En el contexto de Chroma, estas operaciones se adaptan para manejar vectores en lugar de filas tradicionales. Imagina que Chroma es como una biblioteca especializada donde cada libro (vector) tiene un resumen numérico único que permite encontrar rápidamente libros similares por tema, en lugar de bu

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Optimización de Consultas: Filtros y Métricas de Similitud
Gratis

Concepto claveEn los sistemas RAG (Retrieval Augmented Generation), la optimización de consultas es crucial para recuperar los fragmentos de texto más relevantes de tu base de datos vectorial. Chroma, como base de datos vectorial local, ofrece dos herramientas principales para esta tarea: filtros y métricas de similitud.Los filtros te permiten restringir la búsqueda a un subconjunto de documentos basado en metadatos. Imagina que tienes una biblioteca digital con miles de artículos técnicos. Sin

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Práctica: Construcción de un Sistema RAG Simple con Chroma
Gratis

Concepto claveUn sistema RAG (Retrieval Augmented Generation) combina recuperación de información con generación de texto, permitiendo que modelos de lenguaje accedan a bases de conocimiento externas. Chroma es una base de datos vectorial de código abierto diseñada específicamente para aplicaciones de IA, almacenando embeddings (representaciones vectoriales de texto) y permitiendo búsquedas por similitud semántica.Imagina que eres un investigador con una biblioteca personal gigante. En lugar de

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Evaluación de Chroma y sus Funcionalidades
Gratis

Tipo de lección: QuizConcepto claveChroma es una base de datos vectorial de código abierto diseñada específicamente para aplicaciones de Retrieval Augmented Generation (RAG). Su principal función es almacenar y recuperar eficientemente embeddings (representaciones vectoriales de texto) para encontrar documentos similares a una consulta. Imagina Chroma como una biblioteca inteligente donde cada libro (documento) tiene una huella digital única (vector) que describe su contenido; cuando buscas algo

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Escalando con Pinecone: Bases de Datos Vectoriales en la Nube
5 Partes | 1:40 Horas
Introducción a Pinecone: Cuentas, APIs y Configuración
Gratis

Concepto clavePinecone es un servicio de base de datos vectorial completamente gestionado en la nube, diseñado especificamente para aplicaciones de busqueda semantica y sistemas RAG (Retrieval Augmented Generation). A diferencia de soluciones autoalojadas como Chroma o pgvector, Pinecone elimina la sobrecarga operativa de gestionar infraestructura, escalado y mantenimiento, permitiendote enfocarte en la logica de tu aplicacion.Imagina que estas construyendo un sistema de recomendacion para una b

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Gestión de Índices en Pinecone: Creación y Mantenimiento
Gratis

Tipo de lección: VideoConcepto claveEn Pinecone, un índice es la estructura principal donde almacenas y consultas tus vectores. Piensa en él como una biblioteca especializada: cada libro (vector) tiene un ID único y contenido (embedding), y el índice organiza estos libros para que puedas encontrar rápidamente los más relevantes cuando buscas algo. A diferencia de bases de datos tradicionales, los índices de Pinecone están optimizados para búsqueda por similitud, usando algoritmos como HNSW (Hier

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Consultas Avanzadas y Monitoreo en Pinecone
Gratis

Concepto claveEn sistemas RAG (Retrieval Augmented Generation) escalados, las consultas avanzadas y el monitoreo en bases de datos vectoriales como Pinecone son esenciales para mantener la relevancia y eficiencia. Piensa en esto como un sistema de recomendación de una gran biblioteca digital: no solo buscas libros por título, sino que analizas patrones de lectura, tiempos de respuesta y ajustas las estanterías para que los libros mas populares esten mas accesibles. Las consultas avanzadas permit

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Práctica: Migración de un Sistema RAG a Pinecone
Gratis

Concepto claveMigrar un sistema RAG a Pinecone implica trasladar la capa de recuperación de información desde una base de datos vectorial local o simple a una solución escalable en la nube. Piensa en esto como mudar una biblioteca personal a una biblioteca pública con catálogo digital: tus libros (vectores) siguen siendo los mismos, pero ahora pueden ser consultados por miles de personas simultáneamente, con búsquedas más rápidas y sin preocuparte por el espacio físico.La migración no es solo ca

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Evaluación de Pinecone y Escalabilidad
Gratis

Tipo de lección: QuizConcepto claveLa escalabilidad en bases de datos vectoriales como Pinecone se refiere a la capacidad de manejar crecimientos masivos en datos y consultas sin degradar el rendimiento. A diferencia de soluciones locales como Chroma, Pinecone opera como un servicio en la nube que distribuye automáticamente los vectores en múltiples nodos, permitiendo escalar horizontalmente.Imagina una biblioteca tradicional: si solo tienes un estante, encontrar libros se vuelve lento cuando ag

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Integración con pgvector: Bases de Datos Vectoriales en PostgreSQL
5 Partes | 1:40 Horas
Instalación y Configuración de pgvector en PostgreSQL
Gratis

Concepto clavepgvector es una extensión de PostgreSQL que permite almacenar y consultar vectores de alta dimensión directamente en tu base de datos relacional. Imagina que PostgreSQL es una biblioteca tradicional donde los libros están organizados por categorías (como en tablas SQL), y pgvector agrega un sistema de "huellas digitales" para cada párrafo de esos libros. En lugar de buscar por título o autor, puedes buscar párrafos que "se parezcan" en significado, incluso si las palabras son difer

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Operaciones Vectoriales en pgvector: Extensiones y Consultas
Gratis

Tipo de lección: VideoConcepto claveLas operaciones vectoriales en pgvector son el corazón de cualquier sistema RAG que utilice PostgreSQL como base de datos vectorial. A diferencia de las bases de datos vectoriales especializadas como Chroma o Pinecone, pgvector es una extensión que transforma PostgreSQL en un motor capaz de almacenar y consultar vectores de alta dimensión. Esto permite realizar búsquedas de similitud directamente en tu base de datos relacional existente.Imagina que tienes una

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Optimización de Rendimiento: Índices y Buenas Prácticas
Gratis

Concepto claveLa optimizacion de rendimiento en bases de datos vectoriales como pgvector se centra en reducir el tiempo de busqueda de vectores similares, conocido como busqueda por similitud. Imagina una biblioteca con millones de libros: sin un sistema de organizacion, encontrar libros similares requeriria revisar cada uno. Los indices vectoriales actuan como un catalogo inteligente que agrupa libros por temas, permitiendo busquedas rapidas. En pgvector, esto se logra mediante algoritmos que p

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Práctica: Implementación de un Sistema RAG Híbrido con pgvector
Gratis

Concepto claveUn sistema RAG híbrido con pgvector combina la potencia de las búsquedas vectoriales con las capacidades relacionales tradicionales de PostgreSQL. Imagina que tienes una biblioteca donde no solo puedes buscar libros por título (búsqueda tradicional), sino también por "sentimiento" o "estilo" (búsqueda vectorial). pgvector permite almacenar y consultar embeddings de texto directamente en PostgreSQL, creando una base de datos que entiende tanto datos estructurados como semántica.La a

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz: Evaluación de pgvector y Integración
Gratis

Tipo de lección: QuizConcepto claveLa integración de pgvector en sistemas RAG transforma PostgreSQL en una base de datos vectorial nativa, permitiendo almacenar y buscar embeddings junto con datos relacionales tradicionales. A diferencia de soluciones externas como Chroma o Pinecone, pgvector opera dentro del mismo motor de base de datos, eliminando la necesidad de sincronización entre sistemas y manteniendo la consistencia ACID.Imagina que tienes una biblioteca donde cada libro tiene una ficha

Tiempo de estudio 10 Minutos
Archivos adjuntos 0
Proyecto Integrador: Sistema RAG Completo con Evaluación y Despliegue
5 Partes | 2:00 Horas
Diseño del Proyecto: Arquitectura y Planificación
Gratis

Concepto claveEl diseño de un sistema RAG (Retrieval Augmented Generation) con bases de datos vectoriales es como planificar una biblioteca inteligente. En lugar de estantes con libros, tienes vectores que representan el significado de documentos. La arquitectura define cómo organizas esos vectores, cómo los buscas y cómo integras los resultados con un modelo generativo.Imagina que eres un arquitecto construyendo un edificio: primero defines los cimientos (la base de datos vectorial), luego las

Tiempo de estudio 20 Minutos
Archivos adjuntos 0
Implementación del Pipeline: Integración de Múltiples Bases de Datos
Gratis

Tipo de lección: VideoConcepto claveLa integración de múltiples bases de datos vectoriales en un sistema RAG (Retrieval Augmented Generation) es como construir una biblioteca con diferentes secciones especializadas. Imagina que tienes una biblioteca donde algunos libros están organizados por autor (Chroma), otros por tema (Pinecone), y otros por fecha de publicación (pgvector). Cada sistema tiene sus fortalezas: Chroma es ligero y fácil de usar localmente, Pinecone ofrece escalabilidad en la nub

Tiempo de estudio 25 Minutos
Archivos adjuntos 0
Evaluación de Rendimiento: Métricas y Pruebas
Gratis

Concepto claveLa evaluacion de rendimiento en sistemas RAG es como calibrar un sistema de navegacion GPS para un conductor de camiones de larga distancia. No basta con que el GPS encuentre una ruta; debe ser la mas eficiente, precisa y segura para entregar la carga a tiempo. En RAG, esto significa medir que tan bien tu sistema recupera informacion relevante de la base de datos vectorial y la usa para generar respuestas utiles.Imagina que eres un ingeniero de datos en una empresa de e-commerce. T

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Práctica: Despliegue y Monitoreo del Sistema RAG
Gratis

Concepto claveEl despliegue y monitoreo de un sistema RAG (Retrieval Augmented Generation) es el proceso de llevar tu aplicación desde un entorno de desarrollo a producción, asegurando que funcione de manera confiable, escalable y observable. Piensa en esto como lanzar un nuevo restaurante: no basta con tener una gran cocina (desarrollo), necesitas un local abierto al público (despliegue), personal capacitado (infraestructura) y sistemas para medir la satisfacción de los clientes (monitoreo).En

Tiempo de estudio 30 Minutos
Archivos adjuntos 0
Quiz Final: Evaluación Integral del Proyecto
Gratis

Tipo de lección: QuizConcepto claveEl Retrieval Augmented Generation (RAG) es una arquitectura que combina sistemas de recuperación de información con modelos generativos de lenguaje. En esencia, funciona como un asistente de investigación que primero busca documentos relevantes en una base de datos y luego usa esa información para generar respuestas precisas y contextualizadas.Imagina que eres un abogado preparando un caso. Primero buscas en tu biblioteca de leyes y precedentes (la base de dato

Tiempo de estudio 15 Minutos
Archivos adjuntos 0
Responder al comentario
Comentarios Aprobacion

Tu comentario sera visible despues de la aprobacion del administrador.

0
0 Reseñas
Calidad del contenido (0)
Habilidades del instructor (0)
Valor de compra (0)
Calidad de soporte (0)
Responder a la resena
Enviar respuesta

Tu respuesta a esta reseña será visible para todos los usuarios.

Construcción de Sistemas RAG con Bases de Datos Vectoriales: Chroma, Pinecone y pgvector
Gratis

Este curso incluye

Soporte del formador
Favorito
Compartir

Curso specifications

Secciones
5
Lecciones
25
Capacidad
Ilimitado
Duración
8:40 Horas
Estudiantes
0
Fecha de Created
3 abr. 2026
Fecha de Updated
21 jun. 2026
Mariana López

Estratega de aprendizaje digital · México

Ricardo dave

Data Analyst at Microsoft

El instructor no esta disponible actualmente.
I am not available for 2 days due to a business trip
Construcción de Sistemas RAG con Bases de Datos Vectoriales: Chroma, Pinecone y pgvector
Estas viendo
Construcción de Sistemas RAG con Bases de Datos Vectoriales: Chroma, Pinecone y pgvector
Hablar por WhatsAppContactar por WhatsApp