Instalacion del Entorno: Anaconda y Jupyter Notebooks
Tu Primer Paso en Data ScienceBienvenido al mundo del analisis de datos con Python. Antes de escribir una sola linea de codigo, necesitas tener un entorno de trabajo profesional. En esta leccion vamos a instalar Anaconda, la distribucion de Python mas usada en data science, y aprender a usar Jupyter Notebooks, la herramienta donde los cientificos de datos de todo el mundo hacen su trabajo diario.
Si trabajas en una empresa como analista de datos, cientifico de datos o ingeniero de machine learning, vas a usar estas herramientas todos los dias. Es el estandar de la industria.
Que es Anaconda y por que usarlo?
Anaconda es una distribucion gratuita de Python que viene con mas de 250 paquetes pre-instalados para ciencia de datos. En lugar de instalar Python basico y despues ir agregando librerias una por una (lo cual puede generar problemas de compatibilidad), Anaconda te da todo listo.
Ventajas de Anaconda
- Gestion de entornos: Podes tener diferentes versiones de Python y librerias para diferentes proyectos
- Conda package manager: Resuelve dependencias automaticamente (esto te va a ahorrar HORAS de frustracion)
- Pre-instalado: Pandas, NumPy, Matplotlib, Scikit-learn y mas ya vienen incluidos
- Multiplataforma: Funciona en Windows, macOS y Linux
Instalacion Paso a Paso
1. Descarga Anaconda
Anda a https://www.anaconda.com/download y descarga la version para tu sistema operativo. Elegi la version con Python 3.11 o superior.
2. Ejecuta el instalador
- Windows: Ejecuta el
.exe, acepta los terminos, selecciona "Install for: Just Me" y marca la opcion "Add Anaconda to my PATH environment variable" - macOS: Abri el
.pkgy segui las instrucciones. Despues abri la Terminal y verifica. - Linux: En la terminal:
bash Anaconda3-2025.10-Linux-x86_64.sh
Segui las instrucciones y responde "yes" cuando pregunte si queres inicializar conda.
3. Verifica la instalacion
Abri una terminal (o Anaconda Prompt en Windows) y ejecuta:
conda --version
# Deberia mostrar algo como: conda 24.9.2
python --version
# Deberia mostrar algo como: Python 3.11.x
Si ves las versiones, felicitaciones. Ya tenes Python y Anaconda instalados.
Entornos Virtuales con Conda
Uno de los conceptos mas importantes en desarrollo profesional es el uso de entornos virtuales. Imaginate que tenes dos proyectos: uno usa Pandas 1.5 y otro usa Pandas 2.0. Sin entornos virtuales, tendrias un conflicto. Con conda, cada proyecto tiene su propio mundo aislado.
Crear un entorno para este curso
# Crear entorno llamado 'datascience' con Python 3.11
conda create -n datascience python=3.11
# Activar el entorno
conda activate datascience
# Instalar las librerias que vamos a usar en el curso
conda install pandas numpy matplotlib seaborn scikit-learn jupyter plotly scipy
Cada vez que trabajes en este curso, primero activa el entorno:
conda activate datascience
Para ver tus entornos:
conda env list
Para desactivar:
conda deactivate
Jupyter Notebooks: Tu Laboratorio de Datos
Que es un Jupyter Notebook?
Jupyter Notebook es una aplicacion web que te permite crear documentos que combinan:
- Codigo ejecutable (Python, R, Julia)
- Texto formateado (Markdown)
- Visualizaciones (graficos, tablas)
- Ecuaciones matematicas (LaTeX)
Es como un cuaderno interactivo donde podes escribir codigo, ejecutarlo y ver los resultados inmediatamente. Los notebooks son el estandar en data science porque permiten documentar el analisis paso a paso.
Iniciar Jupyter Notebook
# Asegurate de tener el entorno activado
conda activate datascience
# Iniciar Jupyter
jupyter notebook
Esto va a abrir tu navegador web con la interfaz de Jupyter. Desde ahi podes crear notebooks nuevos, abrir existentes y navegar tus archivos.
Anatomia de un Notebook
Un notebook esta compuesto de celdas. Hay dos tipos principales:
- Celdas de codigo: Donde escribis y ejecutas Python
- Celdas de Markdown: Donde escribis texto, titulos, listas, etc.
Atajos de teclado esenciales
| Atajo | Accion |
|---|---|
Shift + Enter |
Ejecutar celda y pasar a la siguiente |
Ctrl + Enter |
Ejecutar celda sin moverse |
Esc + A |
Insertar celda arriba |
Esc + B |
Insertar celda abajo |
Esc + M |
Cambiar celda a Markdown |
Esc + Y |
Cambiar celda a Codigo |
Esc + DD |
Eliminar celda |
Tab |
Autocompletar codigo |
Shift + Tab |
Ver documentacion |
Tu primer notebook
Crea un notebook nuevo (New > Python 3) y escribi en la primera celda:
# Mi primer notebook de Data Science
print("Hola, Data Science!")
import sys
print(f"Python version: {sys.version}")
Presiona Shift + Enter para ejecutar. Deberias ver la salida debajo de la celda.
Ahora en la siguiente celda:
# Verificar que las librerias estan instaladas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
print(f"Pandas: {pd.__version__}")
print(f"NumPy: {np.__version__}")
print("Todo listo para empezar!")

JupyterLab es la version moderna de Jupyter Notebook. Tiene una interfaz mas completa con:
- Editor de archivos integrado
- Terminal
- Multiples notebooks en pestanas
- Explorador de archivos lateral
Para usarlo:
jupyter lab
Ambas herramientas funcionan con los mismos archivos .ipynb. Podes usar la que prefieras, pero JupyterLab es mas recomendado para trabajo profesional.
Google Colab: Alternativa en la Nube
Si no queres instalar nada localmente, Google Colab te da notebooks gratuitos en la nube con GPU incluida. Es ideal para:
- Practicar desde cualquier computadora
- Proyectos de machine learning que necesitan GPU
- Compartir notebooks con colegas
La desventaja es que dependes de internet y los archivos se guardan en Google Drive.
Video Recomendado
Para complementar esta leccion, mira este video tutorial completo:
Instalar Anaconda y Jupyter Notebook - Tutorial Completo en Espanol
JupyterLab Tutorial en Espanol
Ejercicio Practico
- Instala Anaconda en tu computadora
- Crea un entorno virtual llamado
datascience - Instala las librerias del curso
- Abri Jupyter Notebook y crea un notebook llamado
01_setup.ipynb - Ejecuta el codigo de verificacion que vimos arriba
- Crea una celda Markdown con tu nombre y la fecha de inicio del curso
- Guarda el notebook (Ctrl + S)
Revisemos los puntos más importantes de esta lección antes de continuar.
Resumen
En esta leccion configuramos tu entorno profesional de data science:
- Anaconda: Distribucion de Python con todo incluido para ciencia de datos
- Conda: Gestor de paquetes y entornos virtuales
- Jupyter Notebook/Lab: Tu herramienta de trabajo principal
- Google Colab: Alternativa en la nube
Con el entorno listo, en la proxima leccion vamos a repasar los fundamentos de Python que necesitas para manipular datos.
- Comprendo el concepto principal y puedo explicarlo con mis palabras
- Entiendo cómo aplicarlo en mi situación específica
- Necesito repasar algunas partes antes de continuar
- Quiero ver más ejemplos prácticos del tema