Python para Data Science Texto Leccion

Transformacion y agregacion

Transformando datos Filtrado import pandas as pd # Condicion simple df[df['edad'] > 25] # Condiciones multiples df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')] df[(df['edad'] < 20) | (df['edad'] > 30)] # isin: multiples valores df[df['ciudad'].isin(['Madrid', 'Barcelona'])] # query: sintaxis SQL-like df.query('edad > 25 and ciudad == "Madrid"') Ordenamiento # Por una columna df.sort_values('edad') df.sort_values('edad', ascending=False) # Por multiples columnas df.sort_values(['ciudad', 'edad

Tiempo de estudio

15 Min

Transformando datos

Filtrado

import pandas as pd



# Condicion simple

df[df['edad'] > 25]



# Condiciones multiples

df[(df['edad'] > 25) & (df['ciudad'] == 'Madrid')]

df[(df['edad'] < 20) | (df['edad'] > 30)]



# isin: multiples valores

df[df['ciudad'].isin(['Madrid', 'Barcelona'])]



# query: sintaxis SQL-like

df.query('edad > 25 and ciudad == "Madrid"')

Ordenamiento

# Por una columna

df.sort_values('edad')

df.sort_values('edad', ascending=False)



# Por multiples columnas

df.sort_values(['ciudad', 'edad'], ascending=[True, False])



# Por indice

df.sort_index()

Agregar y modificar columnas

# Nueva columna

df['edad_en_meses'] = df['edad'] * 12



# Con funcion

df['categoria'] = df['edad'].apply(lambda x: 'joven' if x < 30 else 'adulto')



# Con condiciones

df['nivel'] = np.where(df['puntos'] > 100, 'alto', 'bajo')



# Multiples condiciones

condiciones = [

    df['edad'] < 18,

    df['edad'] < 30,

    df['edad'] >= 30

]

valores = ['menor', 'joven', 'adulto']

df['grupo'] = np.select(condiciones, valores)

GroupBy: Agregaciones

# Agrupar y agregar

df.groupby('ciudad')['edad'].mean()

df.groupby('ciudad')['edad'].agg(['mean', 'min', 'max', 'count'])



# Multiples columnas

df.groupby(['ciudad', 'genero'])['salario'].mean()



# Multiples agregaciones

df.groupby('ciudad').agg({

    'edad': 'mean',

    'salario': ['min', 'max', 'sum'],

    'nombre': 'count'

})

Pivot Tables

# Tabla pivot (como Excel)

pd.pivot_table(

    df,

    values='ventas',

    index='producto',

    columns='mes',

    aggfunc='sum'

)



# Cross tabulation

pd.crosstab(df['genero'], df['ciudad'])

Practica de portfolio

Convierte esta leccion en evidencia real: arma una entrega pequena que puedas mostrar en una entrevista, en LinkedIn o en tu portfolio. Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.

Entregable: una captura, documento, repositorio o tablero con el resultado final.

Checklist: objetivo, pasos seguidos, criterio de calidad y mejora pendiente.

Mini-rubrica: si otra persona lo revisa, debe entender que hiciste, por que y como repetirlo.

Transformacion y agregacion

Transformando datos

Filtrado

Ordenamiento

Agregar y modificar columnas

GroupBy: Agregaciones

Pivot Tables

Practica de portfolio

Texto Lessons

Por que Python para Data Science?

Introduccion a NumPy

Introduccion a Pandas

Matplotlib: Fundamentos

Estructuras de datos en Python

Operaciones con NumPy

Limpieza de datos

Seaborn: Graficos estadisticos

Funciones y Lambda

NumPy en la practica