Python para Data Science
Texto Leccion
Transformacion y agregacion
Transformando datos Filtrado import pandas as pd # Condicion simple df[df['edad'] > 25] # Condiciones multiples df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')] df[(df['edad'] < 20) | (df['edad'] > 30)] # isin: multiples valores df[df['ciudad'].isin(['Madrid', 'Barcelona'])] # query: sintaxis SQL-like df.query('edad > 25 and ciudad == "Madrid"') Ordenamiento # Por una columna df.sort_values('edad') df.sort_values('edad', ascending=False) # Por multiples columnas df.sort_values(['ciudad', 'edad
Tiempo de estudio
15 Min
Transformando datos
Filtrado
import pandas as pd
# Condicion simple
df[df['edad'] > 25]
# Condiciones multiples
df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')]
df[(df['edad'] < 20) | (df['edad'] > 30)]
# isin: multiples valores
df[df['ciudad'].isin(['Madrid', 'Barcelona'])]
# query: sintaxis SQL-like
df.query('edad > 25 and ciudad == "Madrid"')Ordenamiento
# Por una columna
df.sort_values('edad')
df.sort_values('edad', ascending=False)
# Por multiples columnas
df.sort_values(['ciudad', 'edad'], ascending=[True, False])
# Por indice
df.sort_index()Agregar y modificar columnas
# Nueva columna
df['edad_en_meses'] = df['edad'] * 12
# Con funcion
df['categoria'] = df['edad'].apply(lambda x: 'joven' if x < 30 else 'adulto')
# Con condiciones
df['nivel'] = np.where(df['puntos'] > 100, 'alto', 'bajo')
# Multiples condiciones
condiciones = [
df['edad'] < 18,
df['edad'] < 30,
df['edad'] >= 30
]
valores = ['menor', 'joven', 'adulto']
df['grupo'] = np.select(condiciones, valores)GroupBy: Agregaciones
# Agrupar y agregar
df.groupby('ciudad')['edad'].mean()
df.groupby('ciudad')['edad'].agg(['mean', 'min', 'max', 'count'])
# Multiples columnas
df.groupby(['ciudad', 'genero'])['salario'].mean()
# Multiples agregaciones
df.groupby('ciudad').agg({
'edad': 'mean',
'salario': ['min', 'max', 'sum'],
'nombre': 'count'
})Pivot Tables
# Tabla pivot (como Excel)
pd.pivot_table(
df,
values='ventas',
index='producto',
columns='mes',
aggfunc='sum'
)
# Cross tabulation
pd.crosstab(df['genero'], df['ciudad'])Practica de portfolio
Convierte esta leccion en evidencia real: arma una entrega pequena que puedas mostrar en una entrevista, en LinkedIn o en tu portfolio. Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.
- Entregable: una captura, documento, repositorio o tablero con el resultado final.
- Checklist: objetivo, pasos seguidos, criterio de calidad y mejora pendiente.
- Mini-rubrica: si otra persona lo revisa, debe entender que hiciste, por que y como repetirlo.
Texto Lessons
#1
Por que Python para Data Science?
#2
Introduccion a NumPy
#3
Introduccion a Pandas
#4
Matplotlib: Fundamentos
#5
Estructuras de datos en Python
#6
Operaciones con NumPy
#7
Limpieza de datos
#8
Seaborn: Graficos estadisticos
#9
Funciones y Lambda
#10
NumPy en la practica
#11
Transformacion y agregacion
#12
Visualizacion con Pandas
#13
Combinando DataFrames
#14
Quiz: Fundamentos de Python
Ver full lessons
Revisar curso learning pagina