Python para Data Science
Texto Leccion
Introduccion a NumPy
NumPy: cálculo numérico en Python NumPy (Numerical Python) es la base de casi todo el ecosistema de datos. Aporta el array n-dimensional (ndarray), una estructura compacta y rápida sobre la que se construyen Pandas, scikit-learn y muchas otras librerías. Entender NumPy te da intuición sobre cómo se almacenan y procesan los datos por debajo. ¿Por qué un array y no una lista? import numpy as np lista = [1, 2, 3, 4, 5] array = np.array([1, 2, 3, 4, 5]) # Un array guarda un solo tipo de dato y vive
Tiempo de estudio
15 Min
NumPy: cálculo numérico en Python
NumPy (Numerical Python) es la base de casi todo el ecosistema de datos. Aporta el array n-dimensional (ndarray), una estructura compacta y rápida sobre la que se construyen Pandas, scikit-learn y muchas otras librerías. Entender NumPy te da intuición sobre cómo se almacenan y procesan los datos por debajo.
¿Por qué un array y no una lista?
import numpy as np
lista = [1, 2, 3, 4, 5]
array = np.array([1, 2, 3, 4, 5])
# Un array guarda un solo tipo de dato y vive en memoria contigua,
# por eso las operaciones numéricas son mucho más rápidas que con listas.Nota
Las operaciones de NumPy están escritas en C y se aplican a todo el array de golpe (vectorización). Eso evita los bucles lentos de Python y es la razón de su velocidad.
Crear arrays
# Desde una lista
arr = np.array([1, 2, 3, 4, 5])
# Matriz 2D
matriz = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
# Arrays especiales
ceros = np.zeros(5) # [0. 0. 0. 0. 0.]
unos = np.ones((3, 3)) # matriz 3x3 de unos
rango = np.arange(0, 10, 2) # [0 2 4 6 8]
lineal = np.linspace(0, 1, 5) # [0. 0.25 0.5 0.75 1.]Propiedades clave de un array
arr = np.array([[1, 2, 3], [4, 5, 6]])
arr.shape # (2, 3) -> 2 filas, 3 columnas
arr.ndim # 2 -> número de dimensiones
arr.size # 6 -> total de elementos
arr.dtype # int64 -> tipo de datoIndexado y slicing
arr = np.array([10, 20, 30, 40, 50])
arr[0] # 10
arr[-1] # 50
arr[1:4] # [20 30 40]
arr[::2] # [10 30 50]
matriz = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
matriz[1, :] # [4 5 6] -> fila 1 completa
matriz[:, 2] # [3 6 9] -> columna 2 completa
matriz[0:2, 1:] # [[2 3] [5 6]]Para un array con shape = (4, 3), ¿cuántas filas y columnas tiene?
El primer número de
shape es el número de filas (4) y el segundo el de columnas (3).Ejercicio práctico
Objetivo: familiarizarte con la creación e inspección de arrays.
- Crea un array 1D con
np.arangeque contenga los números del 0 al 11. - Conviértelo en una matriz 3x4 (lo verás a fondo en la siguiente lección, prueba
reshape(3, 4)). - Imprime
shape,ndim,sizeydtypede la matriz. - Extrae la segunda fila completa y la última columna usando slicing.
Entregable: notebook con la matriz, sus propiedades y los dos cortes impresos.
Para recordar
- El
ndarrayes la estructura central; guarda un solo tipo de dato en memoria contigua. shape,ndim,sizeydtypedescriben cualquier array.- El slicing
matriz[fila, columna]selecciona filas, columnas o subbloques.
Texto Lessons
#1
Por que Python para Data Science?
#2
Introduccion a NumPy
#3
Introduccion a Pandas
#4
Matplotlib: Fundamentos
#5
Estructuras de datos en Python
#6
Operaciones con NumPy
#7
Limpieza de datos
#8
Seaborn: Graficos estadisticos
#9
Funciones y Lambda
#10
NumPy en la practica
#11
Transformacion y agregacion
#12
Visualizacion con Pandas
#13
Combinando DataFrames
#14
Quiz: Fundamentos de Python
Ver full lessons
Revisar curso learning pagina