Python para Data Science
Python para Data Science Texto Leccion

Transformacion y agregacion

Transformando datos Filtrado import pandas as pd # Condicion simple df[df['edad'] > 25] # Condiciones multiples df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')] df[(df['edad'] < 20) | (df['edad'] > 30)] # isin: multiples valores df[df['ciudad'].isin(['Madrid', 'Barcelona'])] # query: sintaxis SQL-like df.query('edad > 25 and ciudad == "Madrid"') Ordenamiento # Por una columna df.sort_values('edad') df.sort_values('edad', ascending=False) # Por multiples columnas df.sort_values(['ciudad', 'edad
Tiempo de estudio
15 Min

Transformando datos



Filtrado



import pandas as pd

# Condicion simple
df[df['edad'] > 25]

# Condiciones multiples
df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')]
df[(df['edad'] < 20) | (df['edad'] > 30)]

# isin: multiples valores
df[df['ciudad'].isin(['Madrid', 'Barcelona'])]

# query: sintaxis SQL-like
df.query('edad > 25 and ciudad == "Madrid"')


Ordenamiento



# Por una columna
df.sort_values('edad')
df.sort_values('edad', ascending=False)

# Por multiples columnas
df.sort_values(['ciudad', 'edad'], ascending=[True, False])

# Por indice
df.sort_index()


Agregar y modificar columnas



# Nueva columna
df['edad_en_meses'] = df['edad'] * 12

# Con funcion
df['categoria'] = df['edad'].apply(lambda x: 'joven' if x < 30 else 'adulto')

# Con condiciones
df['nivel'] = np.where(df['puntos'] > 100, 'alto', 'bajo')

# Multiples condiciones
condiciones = [
df['edad'] < 18,
df['edad'] < 30,
df['edad'] >= 30
]
valores = ['menor', 'joven', 'adulto']
df['grupo'] = np.select(condiciones, valores)


GroupBy: Agregaciones



# Agrupar y agregar
df.groupby('ciudad')['edad'].mean()
df.groupby('ciudad')['edad'].agg(['mean', 'min', 'max', 'count'])

# Multiples columnas
df.groupby(['ciudad', 'genero'])['salario'].mean()

# Multiples agregaciones
df.groupby('ciudad').agg({
'edad': 'mean',
'salario': ['min', 'max', 'sum'],
'nombre': 'count'
})


Pivot Tables



# Tabla pivot (como Excel)
pd.pivot_table(
df,
values='ventas',
index='producto',
columns='mes',
aggfunc='sum'
)

# Cross tabulation
pd.crosstab(df['genero'], df['ciudad'])



Practica de portfolio


Convierte esta leccion en evidencia real: arma una entrega pequena que puedas mostrar en una entrevista, en LinkedIn o en tu portfolio. Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.



  • Entregable: una captura, documento, repositorio o tablero con el resultado final.

  • Checklist: objetivo, pasos seguidos, criterio de calidad y mejora pendiente.

  • Mini-rubrica: si otra persona lo revisa, debe entender que hiciste, por que y como repetirlo.

Texto Leccion 3/14
Estas viendo
Transformacion y agregacion
Hablar por WhatsAppContactar por WhatsApp