Tutorial su Sklearn Modulo 3

Tutorial sul modulo Sklearn 3

Ho seguito il tutorial MOOC ufficiale di sklearn. Ecco le mie considerazioni.

Questo è il terzo articolo della mia serie di tutorial su scikit-learn. Se non l’hai già letto, ti consiglio vivamente i miei primi due articoli – sarà molto più semplice seguirmi:

Tutorial sklearn: Modulo 1

Ho seguito il tutorial MOOC ufficiale di sklearn. Ecco le mie considerazioni.

towardsdatascience.com

Tutorial sklearn: Modulo 2

Ho seguito il tutorial MOOC ufficiale di sklearn. Ecco le mie considerazioni.

towardsdatascience.com

In questo terzo modulo, vedremo cos’è un iperparametro e perché e come dovremmo ottimizzarli.

Foto di Glenn Carstens-Peters su Unsplash

Cosa è un iperparametro

Fino ad ora, quando abbiamo impostato il nostro modello, abbiamo cambiato solo la fase di preprocessing, il tipo di modello o entrambi, ma non abbiamo realmente giocato con gli iperparametri del modello.

Gli iperparametri di un modello sono i parametri che noi, come data scientist, impostiamo durante la creazione del modello/pipeline. Sono parametri che definiscono il modello prima che esso veda i dati. Potresti dire che ci permettono di definire diverse “varianti” della stessa pipeline.

Gli iperparametri influenzano tipicamente la complessità del modello e, di conseguenza, il processo di apprendimento e le prestazioni complessive del modello. Dato un dataset e il problema che vuoi risolvere, il tuo compito come data scientist è trovare il miglior “modello iperparametrizzato” nell’infinito spazio dei “modelli iperparametrizzati”.

Gli iperparametri non devono essere confusi con i parametri interni che il modello apprende durante il processo di apprendimento – questi parametri interni che vengono appresi sono anche chiamati “coefficienti”. Ad esempio, nella regressione polinomiale, l’iperparametro (impostato prima dell’apprendimento) è il grado della regressione, mentre i parametri interni appresi utilizzando il set di addestramento sono i coefficienti polinomiali (il a/b/c in aX² + bX + c). In altre parole, prima imposti il grado (iperparametro), e poi leffettui l’adattamento della regressione con i dati (interno…