Transformacion y agregacion

Lectura
15 min~2 min lectura
Objetivo de la lección

Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.

Puntos de control
  • Transformando datos
  • Ordenamiento
  • Agregar y modificar columnas
  • GroupBy: Agregaciones

Transformando datos

Filtrado

import pandas as pd

# Condicion simple
df[df['edad'] > 25]

# Condiciones multiples
df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')]
df[(df['edad'] < 20) | (df['edad'] > 30)]

# isin: multiples valores
df[df['ciudad'].isin(['Madrid', 'Barcelona'])]

# query: sintaxis SQL-like
df.query('edad > 25 and ciudad == "Madrid"')

Ordenamiento

# Por una columna
df.sort_values('edad')
df.sort_values('edad', ascending=False)

# Por multiples columnas
df.sort_values(['ciudad', 'edad'], ascending=[True, False])

# Por indice
df.sort_index()

Agregar y modificar columnas

# Nueva columna
df['edad_en_meses'] = df['edad'] * 12

# Con funcion
df['categoria'] = df['edad'].apply(lambda x: 'joven' if x < 30 else 'adulto')

# Con condiciones
df['nivel'] = np.where(df['puntos'] > 100, 'alto', 'bajo')

# Multiples condiciones
condiciones = [
    df['edad'] < 18,
    df['edad'] < 30,
    df['edad'] >= 30
]
valores = ['menor', 'joven', 'adulto']
df['grupo'] = np.select(condiciones, valores)

GroupBy: Agregaciones

# Agrupar y agregar
df.groupby('ciudad')['edad'].mean()
df.groupby('ciudad')['edad'].agg(['mean', 'min', 'max', 'count'])

# Multiples columnas
df.groupby(['ciudad', 'genero'])['salario'].mean()

# Multiples agregaciones
df.groupby('ciudad').agg({
    'edad': 'mean',
    'salario': ['min', 'max', 'sum'],
    'nombre': 'count'
})

Pivot Tables

# Tabla pivot (como Excel)
pd.pivot_table(
    df,
    values='ventas',
    index='producto',
    columns='mes',
    aggfunc='sum'
)

# Cross tabulation
pd.crosstab(df['genero'], df['ciudad'])

Practica de portfolio

Convierte esta leccion en evidencia real: arma una entrega pequena que puedas mostrar en una entrevista, en LinkedIn o en tu portfolio. Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.

  • Entregable: una captura, documento, repositorio o tablero con el resultado final.
  • Checklist: objetivo, pasos seguidos, criterio de calidad y mejora pendiente.
  • Mini-rubrica: si otra persona lo revisa, debe entender que hiciste, por que y como repetirlo.
Laboratorio de práctica

Antes de marcar esta lección como completa, escribí una evidencia breve para Python para Data Science: un ejemplo, una decisión, una captura, una mini demo o una nota que puedas reutilizar en portfolio.

Reflexión rápida

¿Qué cambiarías en tu forma de trabajar después de aplicar transformacion y agregacion?

De lección a portfolio

Convertí esta lección en evidencia para Data Analyst.

Sumá un mini caso con datos, una conclusión de negocio y una captura del resultado. Eso pesa más que decir que viste la herramienta.

Paso 1

Publicá una consulta, dashboard o notebook con una conclusión clara.

Paso 2

Agregá contexto: problema, dato usado, decisión recomendada y limitación.

Paso 3

Guardá el enlace en tu CV, LinkedIn o portfolio antes de postular.

Newsletter Cursalo

Recibí rutas y cursos nuevos

Sumate para recibir recursos orientados a empleo y portfolio.

  • Rutas de empleo
  • Cursos prácticos
  • Portfolio y entrevistas

Sin spam. También podés entrar con tu cuenta para guardar progreso. Iniciá sesión