Data Science: Ruta Completa de Aprendizaje Desde Cero
Data Science sigue siendo una de las fields mejor pagadas y más demandas. Pero la información sobre cómo aprenderla está fragmentada y muchas veces obsoleta.
Esta es la ruta actualizada para 2026.
Qué Es Data Science Realmente
Data Science no es solo machine learning. Es el proceso completo de extraer conocimiento de datos para tomar decisiones.
El workflow típico:
- Definir la pregunta de negocio
- Recolectar datos
- Limpiar y explorar datos
- Modelar (estadística, ML, deep learning)
- Comunicar resultados
Machine learning es una parte del proceso, no todo.
Etapa 1: Fundamentos (2-3 meses)
Python para Análisis de Datos
No necesitás ser developer. Solo necesitás saber:
- Variables, tipos de datos, operadores
- Listas, diccionarios, loops básicos
- Funciones y librerías
- Jupyter Notebooks
Recursos:
- Kaggle Python Course (gratis, 7 horas)
- DataCamp Intro to Python (gratis primer capítulo)
- "Python for Data Analysis" de Wes McKinney (libro, referencia)
Estadísticas Básicas
- Media, mediana, desviación estándar
- Distribuciones de probabilidad
- Pruebas de hipótesis
- Correlación vs causalidad
Recursos:
- Statistics Fundamentals en Khan Academy (gratis)
- "Think Stats" (gratuito, programación + estadística)
SQL
El 80% del trabajo real de data science es queryar bases de datos.
Qué aprender:
- SELECT, WHERE, GROUP BY, ORDER BY
- JOINs (LEFT, RIGHT, INNER)
- Subqueries y CTEs
- Window functions
Recursos:
- Mode SQL Tutorial (gratuito, muy práctico)
- LeetCode Database problems (ejercicios)
Timeline: 2-3 meses, 1-2 horas/día
Etapa 2: Análisis y Visualización (2-3 meses)
Pandas y NumPy
Librerías de Python para manipulación de datos.
Qué aprender:
- DataFrames (el core de Pandas)
- Limpieza de datos (valores faltantes, duplicados, tipos)
- Aggregations y groupby
- Merge/join de datasets
- Basic visualization con Matplotlib y Seaborn
Proyectos para portfolio:
- Análisis exploratorio de un dataset público (Kaggle tiene miles)
- Visualización de tendencias de COVID, películas, jugadores de fútbol
- Dashboard de ventas con datos de ejemplo
Visualización
- Principios de storytelling con datos
- Gráficos efectivos vs. gráficos misleading
- Herramientas: Matplotlib, Seaborn, Plotly
Timeline: 2-3 meses
Etapa 3: Machine Learning (3-4 meses)
ML Conceptos Fundamentales
- Regresión lineal y logística
- Árboles de decisión y Random Forests
- Overfitting vs underfitting
- Train/test/validation split
- Métricas: accuracy, precision, recall, F1, RMSE
Scikit-Learn
Librería estándar de ML en Python.
Qué hacer:
- Proyectos de clasificación (spam detection, churn prediction)
- Proyectos de regresión (predicción de precios, demanda)
- Cada proyecto:1. Define problema, 2. Explora datos, 3. Entrena modelo, 4. Evalúa, 5. Communica resultados
Deep Learning Intro
Solo si te interesa专门 (especialización) en NLP o Computer Vision:
- Neural networks basics
- TensorFlow o PyTorch básico
- Transfer learning con modelos pre-entrenados
Etapa 4: Especialización y Portfolio (2-3 meses)
Elegí 1-2 áreas de especialización:
Opciones Populares
- NLP: Procesamiento de lenguaje natural (chatbots, sentiment analysis)
- Computer Vision: Imágenes y video (detección de objetos, reconocimiento facial)
- Recommender Systems: Sistemas de recomendación (Netflix, Spotify)
- Time Series: Series temporales (forecasting de ventas, demanda)
- Causal Inference: Análisis de causalidad (más avanzado)
Tu Portfolio Debe Tener:
3-4 proyectos completos que demuestren:
- Capacidad de limpiar y explorar datos 2.能力 de entrenar y evaluar modelos
- Habilidad de comunicar resultados a personas no técnicas
- Conocimiento del dominio/industria
Cada proyecto idealmente incluye:
- Notebook de Jupyter con el proceso completo
- Readme explicando el problema y solución
- Deploy de un modelo o dashboard interactivo
Timeline total realista: 10-14 meses, 10-15 horas/semana
Errores Comunes
Empezar por deep learning. Sin fundamentos de estadística y ML clásico, deep learning no tiene sentido.
Ver cursos sin practicar. Hacé proyectos. Muchos. La teoría sin práctica no se retiene.
Ignorar SQL. Gran error. El 80% del tiempo en el trabajo real es SQL.
No explicar los proyectos. Si tu proyecto no tiene un README o blog post explicando qué hiciste y por qué, no existe para el reclutador.
Copy-paste de tutoriales. Adaptá los tutoriales a tu situación. El código de tutorial no es tu portfolio.
Descuidar soft skills. Data science es tanto comunicación como técnica.
Recursos Actualizados 2026
- Kaggle: Dataset público + competitions + cursos cortos
- Fast.ai: Curso práctico de deep learning (gratuito)
- Andrew Ng (Coursera): Machine Learning (el clásico, sigue vigente)
- StatQuest (YouTube): Explicaciones visuales de estadística y ML
- Santiago (@s_vigliens?): Data Science para hispanohablantes
Explora el roadmap de Data Science completo y personalizado en Cursalo. Con proyectos, recursos y timeline según tu situación.