Python para Data Science
Texto Leccion
Combinando DataFrames
Uniendo datos Concat: Apilar DataFrames import pandas as pd df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]}) df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]}) # Apilar verticalmente (filas) pd.concat([df1, df2]) # A B # 0 1 3 # 1 2 4 # 0 5 7 # 1 6 8 # Resetear indice pd.concat([df1, df2], ignore_index=True) # Apilar horizontalmente (columnas) pd.concat([df1, df2], axis=1) Merge: JOIN como SQL # DataFrames de ejemplo clientes = pd.DataFrame({ 'id': [1, 2, 3], 'nombre': ['Ana', 'Luis', 'Maria'] }) pedi
Tiempo de estudio
12 Min
Uniendo datos
Concat: Apilar DataFrames
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
# Apilar verticalmente (filas)
pd.concat([df1, df2])
# A B
# 0 1 3
# 1 2 4
# 0 5 7
# 1 6 8
# Resetear indice
pd.concat([df1, df2], ignore_index=True)
# Apilar horizontalmente (columnas)
pd.concat([df1, df2], axis=1)Merge: JOIN como SQL
# DataFrames de ejemplo
clientes = pd.DataFrame({
'id': [1, 2, 3],
'nombre': ['Ana', 'Luis', 'Maria']
})
pedidos = pd.DataFrame({
'cliente_id': [1, 1, 2, 4],
'producto': ['A', 'B', 'C', 'D']
})
# Inner join (solo coincidencias)
pd.merge(clientes, pedidos, left_on='id', right_on='cliente_id')
# Left join (todos los de la izquierda)
pd.merge(clientes, pedidos, left_on='id', right_on='cliente_id', how='left')
# Right join
pd.merge(clientes, pedidos, left_on='id', right_on='cliente_id', how='right')
# Outer join (todos)
pd.merge(clientes, pedidos, left_on='id', right_on='cliente_id', how='outer')
# Mismo nombre de columna
pd.merge(df1, df2, on='id')Join: Por indice
df1 = pd.DataFrame({'A': [1, 2]}, index=['a', 'b'])
df2 = pd.DataFrame({'B': [3, 4]}, index=['a', 'b'])
df1.join(df2)
# A B
# a 1 3
# b 2 4Guardando datos
# CSV
df.to_csv('resultado.csv', index=False)
# Excel
df.to_excel('resultado.xlsx', index=False)
# JSON
df.to_json('resultado.json', orient='records')
# Parquet (eficiente)
df.to_parquet('resultado.parquet')Practica de portfolio
Convierte esta leccion en evidencia real: arma una entrega pequena que puedas mostrar en una entrevista, en LinkedIn o en tu portfolio. Trabaja con un caso propio o con una empresa ficticia, pero deja claro el problema, la decision y el resultado.
- Entregable: una captura, documento, repositorio o tablero con el resultado final.
- Checklist: objetivo, pasos seguidos, criterio de calidad y mejora pendiente.
- Mini-rubrica: si otra persona lo revisa, debe entender que hiciste, por que y como repetirlo.
Texto Lessons
#1
Por que Python para Data Science?
#2
Introduccion a NumPy
#3
Introduccion a Pandas
#4
Matplotlib: Fundamentos
#5
Estructuras de datos en Python
#6
Operaciones con NumPy
#7
Limpieza de datos
#8
Seaborn: Graficos estadisticos
#9
Funciones y Lambda
#10
NumPy en la practica
#11
Transformacion y agregacion
#12
Visualizacion con Pandas
#13
Combinando DataFrames
#14
Quiz: Fundamentos de Python
Ver full lessons
Revisar curso learning pagina