Volver al curso

Data Science con Python: Análisis de Datos para Tu Carrera

leccion
1 / 23
intermediate
8 horas
Fundamentos de Python para Datos

Instalacion del Entorno: Anaconda y Jupyter Notebooks

Lectura
45 min~6 min lectura

Instalacion del Entorno: Anaconda y Jupyter Notebooks

Tu Primer Paso en Data Science

Bienvenido al mundo del analisis de datos con Python. Antes de escribir una sola linea de codigo, necesitas tener un entorno de trabajo profesional. En esta leccion vamos a instalar Anaconda, la distribucion de Python mas usada en data science, y aprender a usar Jupyter Notebooks, la herramienta donde los cientificos de datos de todo el mundo hacen su trabajo diario.

Si trabajas en una empresa como analista de datos, cientifico de datos o ingeniero de machine learning, vas a usar estas herramientas todos los dias. Es el estandar de la industria.


Que es Anaconda y por que usarlo?

Anaconda es una distribucion gratuita de Python que viene con mas de 250 paquetes pre-instalados para ciencia de datos. En lugar de instalar Python basico y despues ir agregando librerias una por una (lo cual puede generar problemas de compatibilidad), Anaconda te da todo listo.

Ventajas de Anaconda

  • Gestion de entornos: Podes tener diferentes versiones de Python y librerias para diferentes proyectos
  • Conda package manager: Resuelve dependencias automaticamente (esto te va a ahorrar HORAS de frustracion)
  • Pre-instalado: Pandas, NumPy, Matplotlib, Scikit-learn y mas ya vienen incluidos
  • Multiplataforma: Funciona en Windows, macOS y Linux

Instalacion Paso a Paso

1. Descarga Anaconda

Anda a https://www.anaconda.com/download y descarga la version para tu sistema operativo. Elegi la version con Python 3.11 o superior.

2. Ejecuta el instalador

  • Windows: Ejecuta el .exe, acepta los terminos, selecciona "Install for: Just Me" y marca la opcion "Add Anaconda to my PATH environment variable"
  • macOS: Abri el .pkg y segui las instrucciones. Despues abri la Terminal y verifica.
  • Linux: En la terminal:
bash Anaconda3-2025.10-Linux-x86_64.sh

Segui las instrucciones y responde "yes" cuando pregunte si queres inicializar conda.

3. Verifica la instalacion

Abri una terminal (o Anaconda Prompt en Windows) y ejecuta:

conda --version
# Deberia mostrar algo como: conda 24.9.2

python --version
# Deberia mostrar algo como: Python 3.11.x

Si ves las versiones, felicitaciones. Ya tenes Python y Anaconda instalados.


Entornos Virtuales con Conda

Uno de los conceptos mas importantes en desarrollo profesional es el uso de entornos virtuales. Imaginate que tenes dos proyectos: uno usa Pandas 1.5 y otro usa Pandas 2.0. Sin entornos virtuales, tendrias un conflicto. Con conda, cada proyecto tiene su propio mundo aislado.

Crear un entorno para este curso

# Crear entorno llamado 'datascience' con Python 3.11
conda create -n datascience python=3.11

# Activar el entorno
conda activate datascience

# Instalar las librerias que vamos a usar en el curso
conda install pandas numpy matplotlib seaborn scikit-learn jupyter plotly scipy

Cada vez que trabajes en este curso, primero activa el entorno:

conda activate datascience

Para ver tus entornos:

conda env list

Para desactivar:

conda deactivate

Jupyter Notebooks: Tu Laboratorio de Datos

Que es un Jupyter Notebook?

Jupyter Notebook es una aplicacion web que te permite crear documentos que combinan:

  • Codigo ejecutable (Python, R, Julia)
  • Texto formateado (Markdown)
  • Visualizaciones (graficos, tablas)
  • Ecuaciones matematicas (LaTeX)

Es como un cuaderno interactivo donde podes escribir codigo, ejecutarlo y ver los resultados inmediatamente. Los notebooks son el estandar en data science porque permiten documentar el analisis paso a paso.

Iniciar Jupyter Notebook

# Asegurate de tener el entorno activado
conda activate datascience

# Iniciar Jupyter
jupyter notebook

Esto va a abrir tu navegador web con la interfaz de Jupyter. Desde ahi podes crear notebooks nuevos, abrir existentes y navegar tus archivos.

Anatomia de un Notebook

Un notebook esta compuesto de celdas. Hay dos tipos principales:

  1. Celdas de codigo: Donde escribis y ejecutas Python
  2. Celdas de Markdown: Donde escribis texto, titulos, listas, etc.

Atajos de teclado esenciales

Atajo Accion
Shift + Enter Ejecutar celda y pasar a la siguiente
Ctrl + Enter Ejecutar celda sin moverse
Esc + A Insertar celda arriba
Esc + B Insertar celda abajo
Esc + M Cambiar celda a Markdown
Esc + Y Cambiar celda a Codigo
Esc + DD Eliminar celda
Tab Autocompletar codigo
Shift + Tab Ver documentacion

Tu primer notebook

Crea un notebook nuevo (New > Python 3) y escribi en la primera celda:

# Mi primer notebook de Data Science
print("Hola, Data Science!")
import sys
print(f"Python version: {sys.version}")

Presiona Shift + Enter para ejecutar. Deberias ver la salida debajo de la celda.

Ahora en la siguiente celda:

# Verificar que las librerias estan instaladas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

print(f"Pandas: {pd.__version__}")
print(f"NumPy: {np.__version__}")
print("Todo listo para empezar!")

Infografia
Infografia generada con IA
JupyterLab: La Evolucion

JupyterLab es la version moderna de Jupyter Notebook. Tiene una interfaz mas completa con:

  • Editor de archivos integrado
  • Terminal
  • Multiples notebooks en pestanas
  • Explorador de archivos lateral

Para usarlo:

jupyter lab

Ambas herramientas funcionan con los mismos archivos .ipynb. Podes usar la que prefieras, pero JupyterLab es mas recomendado para trabajo profesional.


Google Colab: Alternativa en la Nube

Si no queres instalar nada localmente, Google Colab te da notebooks gratuitos en la nube con GPU incluida. Es ideal para:

  • Practicar desde cualquier computadora
  • Proyectos de machine learning que necesitan GPU
  • Compartir notebooks con colegas

La desventaja es que dependes de internet y los archivos se guardan en Google Drive.


Video Recomendado

Para complementar esta leccion, mira este video tutorial completo:

Instalar Anaconda y Jupyter Notebook - Tutorial Completo en Espanol

JupyterLab Tutorial en Espanol


Ejercicio Practico
  1. Instala Anaconda en tu computadora
  2. Crea un entorno virtual llamado datascience
  3. Instala las librerias del curso
  4. Abri Jupyter Notebook y crea un notebook llamado 01_setup.ipynb
  5. Ejecuta el codigo de verificacion que vimos arriba
  6. Crea una celda Markdown con tu nombre y la fecha de inicio del curso
  7. Guarda el notebook (Ctrl + S)

💡 Concepto Clave

Revisemos los puntos más importantes de esta lección antes de continuar.

Resumen

En esta leccion configuramos tu entorno profesional de data science:

  • Anaconda: Distribucion de Python con todo incluido para ciencia de datos
  • Conda: Gestor de paquetes y entornos virtuales
  • Jupyter Notebook/Lab: Tu herramienta de trabajo principal
  • Google Colab: Alternativa en la nube

Con el entorno listo, en la proxima leccion vamos a repasar los fundamentos de Python que necesitas para manipular datos.

🧠 Pon a prueba tu conocimiento
¿Cuál es el aspecto más importante que aprendiste en esta lección?
  • Comprendo el concepto principal y puedo explicarlo con mis palabras
  • Entiendo cómo aplicarlo en mi situación específica
  • Necesito repasar algunas partes antes de continuar
  • Quiero ver más ejemplos prácticos del tema
✅ ¡Excelente! Continúa con la siguiente lección para profundizar más.