Avanzato17 min
Machine Learning Intro
Comprendi i fondamenti del machine learning e costruisci il tuo primo modello predittivo con scikit-learn.
Machine Learning Intro
Il machine learning è la naturale evoluzione della data analysis: invece di descrivere cosa è successo, prevedi cosa succederà.
I tre tipi di ML
- ●Supervisionato — Impara da esempi etichettati (previsione vendite, classificazione email)
- ●Non supervisionato — Trova pattern nascosti (segmentazione clienti, anomalie)
- ●Reinforcement — Impara per tentativi (robotica, giochi — meno comune nell'analisi dati)
Il tuo primo modello
python
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error
X = df[["superficie", "stanze", "piano"]]
y = df["prezzo"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
modello = LinearRegression()
modello.fit(X_train, y_train)
previsioni = modello.predict(X_test)
errore = mean_absolute_error(y_test, previsioni)
print(f"Errore medio: €{errore:,.0f}")Workflow del ML
- ●Prepara i dati — Pulizia, feature engineering, split train/test
- ●Scegli il modello — Inizia sempre dal più semplice
- ●Addestra — Il modello impara dai dati di training
- ●Valuta — Testa su dati mai visti
- ●Itera — Migliora feature e parametri
Errori da evitare
- ●Overfitting — Il modello memorizza invece di generalizzare
- ●Data leakage — Informazioni dal futuro che inquinano il training
- ●Ignorare il baseline — Confronta sempre con una previsione naive
Il ML non è magia. È statistica applicata con metodo e disciplina.