Python para Data Science
Texto Leccion
Limpieza de datos
Preparando datos para analisis Los datos reales raramente estan limpios. Pandas tiene herramientas poderosas para limpiarlos. Valores nulos import pandas as pd import numpy as np # Detectar nulos df.isnull() # DataFrame de True/False df.isnull().sum() # Cuenta nulos por columna # Eliminar filas con nulos df.dropna() # cualquier nulo df.dropna(subset=['columna']) # nulo en columna especifica # Rellenar nulos df.fillna(0) # con valor fijo df.fillna(df.mean()) # con media df['col'].fillna(df['col']
Tiempo de estudio
15 Min
Preparando datos para analisis
Los datos reales raramente estan limpios. Pandas tiene herramientas poderosas para limpiarlos.
Valores nulos
import pandas as pd
import numpy as np
# Detectar nulos
df.isnull() # DataFrame de True/False
df.isnull().sum() # Cuenta nulos por columna
# Eliminar filas con nulos
df.dropna() # cualquier nulo
df.dropna(subset=['columna']) # nulo en columna especifica
# Rellenar nulos
df.fillna(0) # con valor fijo
df.fillna(df.mean()) # con media
df['col'].fillna(df['col'].median()) # con mediana
df.fillna(method='ffill') # con valor anterior
df.fillna(method='bfill') # con valor siguienteDuplicados
# Detectar duplicados
df.duplicated() # True/False por fila
df.duplicated().sum() # contar duplicados
# Eliminar duplicados
df.drop_duplicates()
df.drop_duplicates(subset=['columna']) # solo considera columna
df.drop_duplicates(keep='last') # mantener ultimoTipos de datos
# Convertir tipos
df['edad'] = df['edad'].astype(int)
df['precio'] = df['precio'].astype(float)
df['fecha'] = pd.to_datetime(df['fecha'])
# Categorias (ahorra memoria)
df['ciudad'] = df['ciudad'].astype('category')Strings
# Metodos de string con .str
df['nombre'] = df['nombre'].str.lower() # minusculas
df['nombre'] = df['nombre'].str.upper() # mayusculas
df['nombre'] = df['nombre'].str.strip() # quitar espacios
df['nombre'] = df['nombre'].str.replace('a', 'x')
# Extraer con regex
df['codigo'] = df['texto'].str.extract(r'(d+)')
# Contiene
df[df['nombre'].str.contains('Mar')]Renombrar columnas
# Renombrar especificas
df.rename(columns={'old_name': 'new_name'})
# Todas a minusculas
df.columns = df.columns.str.lower()
# Reemplazar espacios
df.columns = df.columns.str.replace(' ', '_')Practica de portfolio
Convierte esta leccion en evidencia real: arma una entrega pequena que puedas mostrar en una entrevista, en LinkedIn o en tu portfolio. Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.
- Entregable: una captura, documento, repositorio o tablero con el resultado final.
- Checklist: objetivo, pasos seguidos, criterio de calidad y mejora pendiente.
- Mini-rubrica: si otra persona lo revisa, debe entender que hiciste, por que y como repetirlo.
Texto Lessons
#1
Por que Python para Data Science?
#2
Introduccion a NumPy
#3
Introduccion a Pandas
#4
Matplotlib: Fundamentos
#5
Estructuras de datos en Python
#6
Operaciones con NumPy
#7
Limpieza de datos
#8
Seaborn: Graficos estadisticos
#9
Funciones y Lambda
#10
NumPy en la practica
#11
Transformacion y agregacion
#12
Visualizacion con Pandas
#13
Combinando DataFrames
#14
Quiz: Fundamentos de Python
Ver full lessons
Revisar curso learning pagina