Parliamo

project-cherry.dev

Avanzato17 min

Machine Learning Intro

Comprendi i fondamenti del machine learning e costruisci il tuo primo modello predittivo con scikit-learn.

Machine Learning Intro

Il machine learning è la naturale evoluzione della data analysis: invece di descrivere cosa è successo, prevedi cosa succederà.

I tre tipi di ML

  • Supervisionato — Impara da esempi etichettati (previsione vendite, classificazione email)
  • Non supervisionato — Trova pattern nascosti (segmentazione clienti, anomalie)
  • Reinforcement — Impara per tentativi (robotica, giochi — meno comune nell'analisi dati)

Il tuo primo modello

python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error

X = df[["superficie", "stanze", "piano"]]
y = df["prezzo"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

modello = LinearRegression()
modello.fit(X_train, y_train)

previsioni = modello.predict(X_test)
errore = mean_absolute_error(y_test, previsioni)
print(f"Errore medio: €{errore:,.0f}")

Workflow del ML

  • Prepara i dati — Pulizia, feature engineering, split train/test
  • Scegli il modello — Inizia sempre dal più semplice
  • Addestra — Il modello impara dai dati di training
  • Valuta — Testa su dati mai visti
  • Itera — Migliora feature e parametri

Errori da evitare

  • Overfitting — Il modello memorizza invece di generalizzare
  • Data leakage — Informazioni dal futuro che inquinano il training
  • Ignorare il baseline — Confronta sempre con una previsione naive

Il ML non è magia. È statistica applicata con metodo e disciplina.