Piano di formazione per l’apprendimento automatico Raccomandazioni della comunità 2023

2023 Community Recommendations for Machine Learning Training Plan

Roadmap per Machine Learning. Immagine generata dall'Autore.

Mappa stradale

Nell’ultimo articolo, Parte 1 di questa roadmap, abbiamo discusso brevemente gli strumenti di avvio e le direzioni per l’apprendimento automatico. Abbiamo discusso di un piano semplice che avrebbe aiutato i principianti a stabilire una base solida. Dopo aver parlato di questo, alla fine dell’articolo, ho detto che stavo conducendo alcuni sondaggi su LinkedIn per scoprire quali suggerimenti la comunità avesse per i nuovi arrivati.

Diagramma di flusso di base per principianti. Immagine creata dall'Autore.

Ad esempio, ho chiesto ai gruppi di apprendimento automatico su LinkedIn domande su dove dovrebbe iniziare un appassionato, la migliore risorsa per la teoria dell’apprendimento automatico, l’algebra lineare, la statistica, ecc., e il miglior punto di partenza per un appassionato. Dopo aver dedicato del tempo per consolidare tutti questi risultati, li presento finalmente attraverso questo articolo. Quindi, immergiamoci nell’articolo senza perdere ulteriore tempo.

Come iniziare il viaggio?

Nella roadmap precedente, ho suggerito alle persone di iniziare con la programmazione in Python e di imparare la matematica man mano (se già conoscevano la matematica di base). Ma volevo anche sapere quale sarebbe stato un buon punto di partenza secondo loro. Ho chiesto loro dei corsi di apprendimento automatico invece della programmazione di base in Python perché pensavo che sarebbe stato meglio.

Ho chiesto ai gruppi da dove è iniziato il loro viaggio come prima domanda. Quale risorsa hanno seguito? Su quale area si sono concentrati? Hanno iniziato con le basi come la matematica o sono passati direttamente all’apprendimento automatico o all’apprendimento profondo? Ora, dopo aver acquisito un po’ di esperienza e intuizioni, cosa raccomandano per le persone che vogliono iniziare da zero?

Prima di parlare ancora, guarda come sono andati i sondaggi.

Diagramma di flusso di base per principianti. Immagine creata dall'Autore.

Quando guardi i risultati del sondaggio, puoi vedere che la maggior parte delle persone ha iniziato facendo corsi online o di persona. Pensavo che fosse normale e che il secondo sondaggio fosse lo stesso. Ma quando ho chiesto alle persone i loro suggerimenti, hanno suggerito di iniziare facendo progetti.

Inoltre, circa lo stesso numero di persone ha detto che le persone dovrebbero iniziare con la matematica. Dopo aver guardato questo, ho fatto una serie di riflessioni e ho ascoltato le opinioni della comunità. Ecco alcune ragioni per cui potrebbe non essere consigliato iniziare con i corsi di apprendimento automatico ma piuttosto con i progetti.

  • I progetti danno ai principianti una formazione pratica e li aiutano a imparare dai propri errori, rendendo più facile lavorare insieme, specialmente su siti come Kaggle.
  • Anche se i corsi offrono ancora un punto di partenza chiaro, la maggior parte dei corsi è considerata troppo vaga o accademica e ha bisogno di essere aggiornata alle richieste attuali.
  • Gli studenti che non hanno una formazione in matematica hanno bisogno di una matematica ben organizzata e di statistiche di base per capire cosa sta accadendo dietro le quinte.
  • Gli assessment dovrebbero includere domande a risposta multipla e progetti pratici.

Oltre a queste, ci possono essere molteplici altre ragioni. Tuttavia, questi punti contribuiscono alla maggior parte delle ragioni.

Dove iniziare ad imparare Python?

Ora torniamo alla roadmap che abbiamo disegnato. In quella roadmap, puoi vedere l’importanza orizzontale di Python, Matematica e SQL. Iniziando con Python, analizzeremo da vicino ogni aspetto prima di passare al livello successivo di concetti.

Python è uno dei punti di partenza più consigliati per ogni appassionato di apprendimento automatico, in quanto offre una grande flessibilità per sperimentare. Con Python, puoi estrarre i dati, pulirli e pre-preprocessarli, addestrare un modello sui dati puliti, distribuirlo su un’app web e monitorare lo stato dell’app distribuita utilizzando cruscotti personalizzati. Puoi lavorare su un progetto dall’inizio alla fine solo con Python e nient’altro.

Oltre alla sua flessibilità, Python è uno dei linguaggi più semplici da capire. Tutto ciò che devi ricordare è i due punti (:) e le indentazioni, e poi sei pronto a partire.

Ora che abbiamo discusso perché Python è una buona raccomandazione, consideriamo ciò che è consigliato come punto di partenza.

Raccomandazioni della comunità per i corsi di Python. Immagine generata dall'autore.

La Specializzazione Python for Everybody dell’Università del Michigan è il punto di partenza più raccomandato per i principianti. Si tratta di una specializzazione di 5 corsi su Coursera che può essere acquistata o auditata. Personalmente ho seguito il corso su Django del Prof. Charles Severence, e non devi pensarci due volte riguardo al suo stile di insegnamento. Puoi trovare maggiori dettagli sul corso qui.

Specializzazione Python for Everybody, Coursera. Immagine presa da Coursera.org

Oltre a questi, le persone hanno raccomandato le loro playlist preferite su YouTube di diversi canali, come CodeWithHarry, CodeBasics, Codanics, Corey Schafer, Telusko, ecc. Le persone hanno anche raccomandato le loro fonti come DataCamp, CS50 dell’Università di Harvard e libri su Python pubblicati da Packt e altri editori.

Dove imparare la matematica?

La matematica è una delle aree più ampie da discutere. Ci concentriamo su tre aspetti: Algebra Lineare, Calcolo e Statistica. Ho chiesto di più riguardo all’Algebra Lineare e alla Statistica per il livello principiante, poiché il calcolo di livello scolastico (in particolare la regola della catena) è sufficiente per la maggior parte delle parti iniziali del tuo percorso.

Algebra Lineare

La maggior parte del nostro machine learning è una combinazione di Algebra Lineare e Statistica. La maggior parte di ciò che facciamo in ML è convertire dati ad alta dimensionalità in dimensioni inferiori interpretabili. Utilizziamo l’Algebra Lineare per visualizzare e manipolare questi dati ad alta dimensionalità.

Ecco le raccomandazioni degli appassionati di ML,

Risultati del sondaggio sull'Algebra Lineare. Immagine generata dall'autore.

Una delle principali raccomandazioni per imparare in modo approfondito l’Algebra Lineare è il corso MIT OCW, 18.06 Linear Algebra, tenuto dal Prof. Gilbert Strang. Tuttavia, la profondità del corso è al di fuori dello scopo delle persone che stanno iniziando il loro viaggio nel ML. I risultati del sondaggio possono riflettere che i corsi di Khan Academy o DeepLearning.ai sono un punto di partenza migliore per i principianti.

Oltre a questi, una delle raccomandazioni più comuni per l’Algebra Lineare è la playlist del canale 3Blue1Brown. Naturalmente, se hai poco tempo, ti consiglio di seguire la playlist di 3Blue1Brown. È una delle risorse più raccomandate per l’Algebra Lineare.

Probabilità e Statistica

La Probabilità e la Statistica sono fondamentali per il machine learning e la carriera di qualsiasi professionista del ML nel lungo termine. Anche se le fasi iniziali non richiedono una conoscenza approfondita, nel lungo periodo le persone inizieranno a confrontarsi con il muro delle statistiche (assumendo che lavorerai nel campo tecnico del ML anziché intraprendere ruoli manageriali). Pertanto, acquisire una base di conoscenze di base e comprendere la visione statistica di ciascun modello è una delle cose chiave da tenere a mente durante il tuo percorso.

Quindi, diamo un’occhiata a cosa raccomanda la comunità,

Raccomandazioni della comunità per il punto di partenza della Statistica. Immagine creata dall'autore.

In base alle raccomandazioni della comunità, un numero uguale di persone ha votato per StatQuest e il corso di Probabilità e Statistica di DeepLearning.AI. Dato che abbiamo già discusso della specializzazione su Coursera, diamo un’occhiata alla playlist di StatQuest.

Il punto forte più importante di questa playlist è la semplicità con cui Josh Starmer insegna le cose. Scompone gli argomenti in pezzi piccoli e li spiega in uno stile semplificato. Questo rende il tuo percorso più modulare e anche conveniente.

Per saperne di più su perché le persone raccomandano Statquest, puoi dare un’occhiata alla seguente discussione su Reddit. Ecco solo un piccolo estratto dalla conversazione:

Un estratto di alcune opinioni su StatQuest, una schermata presa da Reddit.com

Structured Query Language (SQL)

SQL è uno degli argomenti controversi per un data scientist. A seconda del luogo e del settore in cui lavori, potresti utilizzare completamente SQL o talvolta non toccarlo per mesi. Per entrare nel dettaglio, se ti trovi in un team focalizzato su campioni di tipo immagine, video o speech, raramente utilizzi SQL; tuttavia, in alcune aree dei sistemi di raccomandazione e altre applicazioni, potresti dover lavorare con SQL. Quindi, dipende dall’applicazione. (Ricorda che questa è una roadmap più incentrata sull’apprendimento automatico piuttosto che sulla scienza dei dati o sull’ingegneria dei dati. Pertanto, questa discussione sarà breve).

Tuttavia, per quanto riguarda i colloqui, sicuramente discuterai di SQL. Pertanto, è meglio avere un’idea di base. Ecco le raccomandazioni date dalla comunità:

Raccomandazioni SQL per principianti. Immagine creata dall'autore.

Le raccomandazioni sono piuttosto semplici, con la maggior parte delle persone che raccomandano il corso SQL for Data Science su Coursera e una minoranza che consiglia alle persone di iniziare con DataCamp nei commenti. Non ho provato il corso poiché ho lavorato con DataCamp per il mio SQL, quindi non posso dare un’opinione accurata sul corso o sulle raccomandazioni. Se vuoi saperne di più sulle mie raccomandazioni, puoi trovarle nella parte 1 di questa roadmap.

Infine… Apprendimento automatico.

Non penso che tu abbia bisogno di un’introduzione a questa sezione, poiché probabilmente hai cliccato su questo articolo per la roadmap sull’apprendimento automatico. Pertanto, vediamo le raccomandazioni per iniziare il percorso di apprendimento automatico.

Raccomandazioni sull'apprendimento automatico per principianti della comunità di LinkedIn. Immagine generata dall'autore.

Qui non c’è bisogno di confusione. Chiunque voglia iniziare con l’apprendimento automatico e non voglia seguire un percorso altamente teorico con tutte le complesse nozioni di matematica e statistica può iniziare direttamente con la specializzazione in apprendimento automatico su Coursera tenuta dal Prof. Andrew Ng. Questo è uno dei migliori punti di partenza; chiunque può spiegare perché questo è il migliore.

In seguito nel percorso, se desideri un’introduzione più teorica, il Prof. Andrew Ng ha pensato anche a questo con la sua playlist CS229 su YouTube. Pertanto, non c’è bisogno di cercare altrove. Per ulteriori informazioni, puoi consultare le numerose risorse disponibili o, ancora una volta, controllare la parte 1 di questa serie.

Bonus: Lavoro vs Studi superiori in ML?

Come studente appena laureato, ho avuto difficoltà a prendere questa decisione. Ero completamente confuso su cosa scegliere, una laurea magistrale in ML o Scienza dei dati o ottenere un lavoro e imparare le cose praticamente. E, in realtà, questa è la confusione di molti studenti che scelgono di lavorare in ML. Pertanto, ho pensato che questa sarebbe stata anche una delle domande che richiedono più di un suggerimento da parte di più persone. (E la risposta a questo sondaggio è stata enorme. Alla fine dell’applicazione del sondaggio, quasi 500 professionisti hanno votato). Quindi, cosa hanno finalmente raccomandato i professionisti?

Raccomandazione laurea magistrale vs lavoro per gli appassionati di ML. Immagine generata dall'autore.

Da questo, si può vedere che alle persone viene consigliato di lavorare di più che perseguire studi superiori. Tuttavia, c’è anche un lato negativo. Trovare un lavoro dopo una laurea triennale è molto difficile, specialmente perché le persone con una laurea magistrale si candidano anche per la stessa posizione. (Sono stato respinto per lo stesso motivo in alcuni dei miei colloqui dello scorso anno). Al contrario, una persona che entra nello spazio professionale dopo una laurea magistrale ha bisogno di più tempo per adattarsi all’ambiente produttivo, in quanto sarà abituata a un ambiente più accademico. Quindi, la decisione deve essere presa dopo molta considerazione e valutazione di ciò che è meglio per te.

Con questo, ho coperto tutte le aree per la roadmap. Mi sono servite tre settimane per condurre questi sondaggi e consolidare i risultati da vari sondaggi. Se trovi questo articolo utile, iscriviti per essere avvisato quando compaiono altri articoli interessanti sul web.

Nel frattempo, ho iniziato a seguire la specializzazione in NLP e a lavorare su progetti interessanti. Sulla base di ciò che ho imparato, ho intenzione di creare una serie di articoli su NLP (Già fatto!). Non dimenticare di iscriverti al sito per riceverli direttamente nella tua casella di posta!

Per essere sempre aggiornato sul mio percorso di ML e data science, non dimenticare di iscriverti e seguirmi su LinkedIn e Instagram! Grazie per aver letto fino alla fine. Sei fantastico! ✌️