Intermedio14 min
Intro a Pandas
Usa la libreria Python più popolare per caricare, esplorare e trasformare dataset in modo efficiente.
Intro a Pandas
Pandas è la libreria Python standard per la data analysis. Un DataFrame Pandas è come un foglio Excel programmabile, con potenza quasi illimitata.
Caricare e esplorare
python
import pandas as pd
df = pd.read_csv("vendite.csv")
df.head() # prime 5 righe
df.info() # tipi di dato e valori nulli
df.describe() # statistiche descrittiveFiltrare e selezionare
python
# Vendite superiori a 1000 euro nella regione Lombardia
grandi_vendite = df[(df["importo"] > 1000) & (df["regione"] == "Lombardia")]Aggregare con groupby
python
# Fatturato totale per regione
fatturato = df.groupby("regione")["importo"].sum().sort_values(ascending=False)Gestire valori mancanti
python
df["email"].isna().sum() # conta i mancanti
df["citta"].fillna("Sconosciuta", inplace=True) # riempi i vuoti
df.dropna(subset=["importo"]) # elimina righe senza importoCreare nuove colonne
python
df["anno"] = pd.to_datetime(df["data"]).dt.year
df["margine"] = df["ricavo"] - df["costo"]Perché Pandas e non Excel
- ●Gestisce milioni di righe senza rallentare
- ●Operazioni riproducibili e versionabili
- ●Si integra con visualizzazione, ML e automazione
Pandas trasforma ore di lavoro manuale in poche righe di codice.