Data Science desde cero: ruta 2026
Data Science sigue siendo una de las rutas tech con mejor techo laboral, pero no conviene empezar por modelos complejos. En 2026, la forma más realista de aprender Data Science desde cero en LATAM es dominar SQL, Python, estadística aplicada, visualización, comunicación y portfolio antes de perseguir deep learning.
Esta guía ordena la ruta por etapas, proyectos y señales de empleabilidad. Si querés un camino más corto para primer empleo, mirá también Data Analytics en LATAM, Python para primer empleo, rutas de empleo y cursos prácticos de Python para Data Science.
Respuesta rápida: cómo aprender Data Science desde cero
| Etapa | Qué aprender | Evidencia para portfolio |
|---|---|---|
| 1 | SQL, Excel/Sheets y pensamiento analítico | Consultas, limpieza de datos y mini reporte |
| 2 | Python, pandas y notebooks | Análisis exploratorio con README |
| 3 | Estadística aplicada y visualización | Dashboard con decisión de negocio |
| 4 | Machine learning clásico | Modelo simple con métricas y explicación |
| 5 | Especialización | Proyecto final conectado con una industria |
La ruta completa puede tomar 8 a 14 meses si empezás desde cero. Para conseguir entrevistas antes, no esperes a "saber todo": publicá proyectos pequeños, explicá decisiones y conectá cada práctica con un rol real como data analyst, BI analyst, analytics engineer o data scientist junior.
Ruta recomendada para LATAM
| Objetivo | Ruta más realista | Próximo paso en Cursalo |
|---|---|---|
| Primer empleo rápido | Data analytics antes que ML avanzado | Data Analytics LATAM |
| Perfil técnico con Python | Python, pandas, SQL y notebooks | Python primer empleo |
| Portfolio para entrevistas | 3 proyectos con problema, datos y conclusión | Portfolio junior |
| Carrera completa | Datos, ML, comunicación y especialización | Carreras digitales |
| Búsqueda laboral | CV, LinkedIn, proyectos y entrevistas | Rutas de empleo |
Qué Es Data Science Realmente
Data Science no es solo machine learning. Es el proceso completo de extraer conocimiento de datos para tomar decisiones.
El workflow típico:
- Definir la pregunta de negocio
- Recolectar datos
- Limpiar y explorar datos
- Modelar (estadística, ML, deep learning)
- Comunicar resultados
Machine learning es una parte del proceso, no todo.
Etapa 1: Fundamentos (2-3 meses)
Python para Análisis de Datos
No necesitás ser developer. Solo necesitás saber:
- Variables, tipos de datos, operadores
- Listas, diccionarios, loops básicos
- Funciones y librerías
- Jupyter Notebooks
Recursos:
- Kaggle Python Course (gratis, 7 horas)
- DataCamp Intro to Python (gratis primer capítulo)
- "Python for Data Analysis" de Wes McKinney (libro, referencia)
Estadísticas Básicas
- Media, mediana, desviación estándar
- Distribuciones de probabilidad
- Pruebas de hipótesis
- Correlación vs causalidad
Recursos:
- Statistics Fundamentals en Khan Academy (gratis)
- "Think Stats" (gratuito, programación + estadística)
SQL
Gran parte del trabajo real de data science empieza consultando bases de datos.
Qué aprender:
- SELECT, WHERE, GROUP BY, ORDER BY
- JOINs (LEFT, RIGHT, INNER)
- Subqueries y CTEs
- Window functions
Recursos:
- Mode SQL Tutorial (gratuito, muy práctico)
- LeetCode Database problems (ejercicios)
Timeline: 2-3 meses, 1-2 horas/día
Etapa 2: Análisis y Visualización (2-3 meses)
Pandas y NumPy
Librerías de Python para manipulación de datos.
Qué aprender:
- DataFrames (el core de Pandas)
- Limpieza de datos (valores faltantes, duplicados, tipos)
- Aggregations y groupby
- Merge/join de datasets
- Visualización básica con Matplotlib y Seaborn
Proyectos para portfolio:
- Análisis exploratorio de un dataset público (Kaggle tiene miles)
- Visualización de tendencias de COVID, películas, jugadores de fútbol
- Dashboard de ventas con datos de ejemplo
Visualización
- Principios de storytelling con datos
- Gráficos efectivos vs. gráficos engañosos
- Herramientas: Matplotlib, Seaborn, Plotly
Timeline: 2-3 meses
Etapa 3: Machine Learning (3-4 meses)
ML Conceptos Fundamentales
- Regresión lineal y logística
- Árboles de decisión y Random Forests
- Overfitting vs underfitting
- Train/test/validation split
- Métricas: accuracy, precision, recall, F1, RMSE
Scikit-Learn
Librería estándar de ML en Python.
Qué hacer:
- Proyectos de clasificación (spam detection, churn prediction)
- Proyectos de regresión (predicción de precios, demanda)
- Cada proyecto: 1. definí el problema, 2. explorá datos, 3. entrená modelo, 4. evaluá, 5. comunicá resultados
Deep Learning Intro
Solo si te interesa especializarte en NLP o Computer Vision:
- Neural networks basics
- TensorFlow o PyTorch básico
- Transfer learning con modelos pre-entrenados
Etapa 4: Especialización y Portfolio (2-3 meses)
Elegí 1-2 áreas de especialización:
Opciones Populares
- NLP: Procesamiento de lenguaje natural (chatbots, sentiment analysis)
- Computer Vision: Imágenes y video (detección de objetos, reconocimiento facial)
- Recommender Systems: Sistemas de recomendación (Netflix, Spotify)
- Time Series: Series temporales (forecasting de ventas, demanda)
- Causal Inference: Análisis de causalidad (más avanzado)
Tu Portfolio Debe Tener:
3-4 proyectos completos que demuestren:
- Capacidad de limpiar y explorar datos
- Capacidad de entrenar y evaluar modelos
- Habilidad de comunicar resultados a personas no técnicas
- Conocimiento del dominio/industria
Cada proyecto idealmente incluye:
- Notebook de Jupyter con el proceso completo
- README explicando el problema y solución
- Deploy de un modelo o dashboard interactivo
Proyectos de portfolio que sí ayudan a conseguir entrevistas
| Proyecto | Qué demuestra | Link interno útil |
|---|---|---|
| Dashboard de ventas ecommerce | Limpieza, métricas, visualización y decisión de negocio | Comercio electrónico LATAM |
| Análisis de ofertas laborales tech | SQL, tendencias y comunicación | Futuro empleo LATAM |
| Predicción de churn | ML clásico, métricas y explicación de negocio | Machine Learning desde cero |
| Segmentación de clientes | Clustering, interpretación y recomendaciones | Cursos de programación |
| Portfolio de notebooks | GitHub, README, storytelling y reproducibilidad | CV tech |
Timeline total realista: 10-14 meses, 10-15 horas/semana
Errores Comunes
Empezar por deep learning. Sin fundamentos de estadística y ML clásico, deep learning no tiene sentido.
Ver cursos sin practicar. Hacé proyectos. Muchos. La teoría sin práctica no se retiene.
Ignorar SQL. Gran error. El 80% del tiempo en el trabajo real es SQL.
No explicar los proyectos. Si tu proyecto no tiene un README o blog post explicando qué hiciste y por qué, no existe para el reclutador.
Copy-paste de tutoriales. Adaptá los tutoriales a tu situación. El código de tutorial no es tu portfolio.
Descuidar soft skills. Data science es tanto comunicación como técnica.
Recursos Actualizados 2026
- Kaggle: datasets públicos, competencias y cursos cortos
- Fast.ai: Curso práctico de deep learning (gratuito)
- Andrew Ng (Coursera): Machine Learning (el clásico, sigue vigente)
- StatQuest (YouTube): Explicaciones visuales de estadística y ML
- Santiago (@s_vigliens?): Data Science para hispanohablantes
Siguiente paso en Cursalo
No conviertas la ruta en una lista infinita de cursos. Elegí un proyecto y trabajá hacia una pieza visible. Para avanzar dentro de Cursalo, empezá por Data Analytics LATAM, Python para primer empleo, Python para Data Science, Data Science con Python y Pandas y rutas de empleo.