Parliamo

project-cherry.dev

Intermedio14 min

Intro a Pandas

Usa la libreria Python più popolare per caricare, esplorare e trasformare dataset in modo efficiente.

Intro a Pandas

Pandas è la libreria Python standard per la data analysis. Un DataFrame Pandas è come un foglio Excel programmabile, con potenza quasi illimitata.

Caricare e esplorare

python
import pandas as pd

df = pd.read_csv("vendite.csv")
df.head()          # prime 5 righe
df.info()          # tipi di dato e valori nulli
df.describe()      # statistiche descrittive

Filtrare e selezionare

python
# Vendite superiori a 1000 euro nella regione Lombardia
grandi_vendite = df[(df["importo"] > 1000) & (df["regione"] == "Lombardia")]

Aggregare con groupby

python
# Fatturato totale per regione
fatturato = df.groupby("regione")["importo"].sum().sort_values(ascending=False)

Gestire valori mancanti

python
df["email"].isna().sum()        # conta i mancanti
df["citta"].fillna("Sconosciuta", inplace=True)  # riempi i vuoti
df.dropna(subset=["importo"])   # elimina righe senza importo

Creare nuove colonne

python
df["anno"] = pd.to_datetime(df["data"]).dt.year
df["margine"] = df["ricavo"] - df["costo"]

Perché Pandas e non Excel

  • Gestisce milioni di righe senza rallentare
  • Operazioni riproducibili e versionabili
  • Si integra con visualizzazione, ML e automazione

Pandas trasforma ore di lavoro manuale in poche righe di codice.