Intervista del 30º anniversario di VoAGI con il fondatore Gregory Piatetsky-Shapiro

30th anniversary interview with VoAGI founder Gregory Piatetsky-Shapiro

 

Buon anniversario VoAGI!

Questo sito web, proprio quello che stai leggendo in questo momento, è nato 30 anni fa come una modesta newsletter e si è trasformato nel corso del tempo in una delle risorse più antiche e durature nel campo della scienza dei dati. Stiamo festeggiando questo traguardo per tutto il mese, iniziando nel modo più appropriato con la condivisione della nostra recente intervista con il fondatore di VoAGI, Gregory Piatetsky-Shapiro.

Gregory è il genio dietro VoAGI e ha gestito il sito per oltre 28 anni, fino a tempi molto recenti. Conosciuto per aver coniato il termine “scoperta di conoscenza nei database” e per aver fondato la serie di conferenze KDD, Gregory ha creato la newsletter Knowledge Discovery Nuggets (VoAGI) nel 1993 per connettere i ricercatori nel campo del data mining e della scoperta della conoscenza. Fino al suo ritiro nel 2022, VoAGI è diventata una pubblicazione influente nel campo della scienza dei dati, dell’apprendimento automatico, dell’intelligenza artificiale e dell’analisi dei dati sotto la guida di Gregory.

Anche se sta godendo del meritato riposo della pensione, siamo riusciti a convincerlo a tornare in campo per una discussione approfondita sulla storia di VoAGI, il suo stato attuale, il futuro e persino qualche momento di nostalgia.

Le domande per questa intervista sono state poste dagli editor di VoAGI Matthew Mayo, Abid Ali Awan e Nisha Arya. L’editore che pone ciascuna domanda è indicato lungo il percorso.

  VoAGI: Buon 30° anniversario, Gregory! Per le poche persone là fuori che potrebbero non sapere chi sei, puoi darci una versione abbreviata di 30.000 piedi? (chiesto da Matthew)

Gregory: Matt, grazie e è un piacere lavorare di nuovo con te e scrivere per VoAGI!

Sono probabilmente più conosciuto come il fondatore di VoAGI, questa pubblicazione, e come co-fondatore delle conferenze KDD, una delle conferenze più importanti nel campo della scienza dei dati e del data mining. Ho iniziato la mia carriera scientifica come ricercatore nell’intelligenza artificiale e nei database; la mia tesi di dottorato nel 1984 riguardava i sistemi di database auto-organizzanti. Ho poi lavorato per una dozzina di anni presso i laboratori GTE nella zona di Boston, facendo ricerca e costruendo sistemi applicati all’intersezione tra intelligenza artificiale e database. Nel 1989 ho avviato il primo progetto al mondo chiamato “Scoperta della Conoscenza nei Database”. Il nostro progetto ha prodotto interessanti applicazioni nel settore sanitario (sistema KEFIR), nella rilevazione delle frodi, nella previsione dell’abbandono dei clienti e in altri settori.

Nel 1997 la bolla delle dot-com era ancora agli inizi e ho lasciato GTE per unirmi a una startup che applicava il data mining nell’ambito finanziario. Abbiamo collaborato con alcune delle più grandi banche e compagnie di assicurazione del mondo, sviluppando modelli per la segmentazione dei clienti, l’abbandono dei clienti, le vendite incrociate e così via. Nel 2000 la prima startup è stata acquistata da una startup più grande per 50 milioni di dollari, ma prima che qualcuno di noi potesse incassare le opzioni azionarie, la bolla delle dot-com è scoppiata e la seconda startup è fallita. Il valore di tutte le opzioni azionarie guadagnate a fatica era zero.

 

Gregory Piatetsky-Shapiro ha coniato il termine “scoperta di conoscenza nei database” per il primo workshop sullo stesso argomento (KDD-1989) e questo termine è diventato più popolare nelle comunità di intelligenza artificiale e di apprendimento automatico. Tuttavia, il termine data mining è diventato più popolare nelle comunità aziendali e della stampa. Attualmente, i termini data mining e scoperta della conoscenza vengono utilizzati in modo interscambiabile. – “Data mining” voce di Wikipedia

 

Quindi, nel 2001 ho deciso di fare tutto da solo, pubblicando VoAGI e facendo consulenza.

Ho svolto una grande varietà di interessanti progetti di consulenza, dalla ricerca di biomarcatori per l’Alzheimer alla rilevazione di gioielli contraffatti su eBay all’analisi dell’utilizzo del software. Ma mano a mano che VoAGI diventava sempre più popolare, richiedeva sempre più tempo, quindi ho smesso di fare consulenza e mi sono concentrato a tempo pieno su VoAGI.

Con la scienza dei dati e l’apprendimento automatico che divenivano campi di grande interesse intorno al 2012 (come dimostra l’articolo, tra molti altri, intitolato “Data Scientist – il lavoro più sexy del XXI secolo”), VoAGI è cresciuta notevolmente e ha ottenuto un’ampia riconoscenza nell’industria. VoAGI è stata spesso citata tra le migliori pubblicazioni nell’ambito dell’intelligenza artificiale, dei big data, della scienza dei dati e dell’apprendimento automatico (vedi qui per maggiori dettagli).

Sono stato molto onorato di essere nominato la voce principale di LinkedIn nella scienza dei dati e nell’analisi dei dati nel 2018.

Certo, qualsiasi successo che ho raggiunto con VoAGI è condiviso con molte altre persone che mi hanno aiutato e lavorato con me lungo il percorso. Non posso nominarle tutte, ma voglio menzionare in particolare Chris Matheus e Michael Beddows, che hanno lavorato con me presso GTE sul primo sito web di VoAGI; Usama Fayyad, Sam Uthurusamy e Won Kim, con cui ho collaborato per le conferenze e l’organizzazione KDD; e Anmol Rajpurohit per aver aiutato con VoAGI nel 2013-15.

Infine, e più importantemente, Matthew Mayo che si è unito al team di VoAGI nel 2016 e ha aiutato VoAGI a raggiungere il suo attuale successo, e ha preso il mio posto quando mi sono ritirato nel 2022.

Puoi dirci quale è stata l’ispirazione dietro l’avvio della tua pubblicazione? (Nisha)

Nel 1989 ho organizzato il primo workshop su Knowledge Discovery in Databases presso IJCAI-89. Quel workshop è stato ripetuto nel 1991 e nel 1993 e, nel luglio del 1993, per mettere in contatto i ricercatori che lavoravano in questo settore, ho avviato un bollettino informativo che all’epoca chiamavo Knowledge Discovery Nuggets. Ho usato il termine “knowledge discovery” perché il termine “data mining” usato all’epoca sembrava impreciso – non era chiaro cosa stavamo cercando di estrarre. “Nuggets” perché pubblicavamo principalmente articoli brevi ma rilevanti e interessanti. Pensate a “nuggets d’oro” trovati nel minerale dei dati.

Il workshop è diventato una conferenza KDD-95 nel 1995 (abilmente organizzata da Usama Fayyad e Sam Ramaswamy) e le conferenze KDD sono state un grande successo come la conferenza di data science più importante al mondo. Sono stato presidente dell’organizzazione ACM KDD dal 2005 al 2009 e membro del comitato esecutivo KDD fino al 2013.

Il primo numero di VoAGI è stato inviato a circa 50 ricercatori che hanno partecipato al workshop KDD-93. La quantità di informazioni in questo settore stava crescendo e, come organizzatore del workshop, ero ben posizionato per raccoglierle e organizzarle. Nel 1994, poco dopo l’apparizione del World Wide Web, abbiamo avviato quello che all’epoca era il secondo sito al mondo su data mining e knowledge discovery. Si chiamava “Knowledge Discovery Mine”, ma era ospitato nel dominio di GTE Labs e non è più disponibile.

Quando ho lasciato GTE Labs nel 1997, ho copiato le informazioni su un nuovo sito chiamato VoAGI, un’abbreviazione di Knowledge Discovery Nuggets. Questo sito web esiste ancora oggi… e tu lo stai leggendo!!!

Ritiene di aver raggiunto il suo obiettivo con VoAGI? (Nisha)

L’obiettivo è il viaggio!

Ma il successo e la longevità di VoAGI hanno superato di gran lunga le mie aspettative.

Il mio obiettivo iniziale nel creare il bollettino VoAGI era mettere in contatto i ricercatori che lavoravano in questo settore più frequentemente rispetto a un workshop annuale. Il mio obiettivo per il primo sito web collegato a VoAGI, creato nel 1994 presso GTE Labs e chiamato “Knowledge Discovery Mine”, era principalmente organizzare le informazioni allora disponibili su data mining, principalmente software e dataset, e renderle disponibili a tutti. Queste due sezioni – Software e Datasets – sono state le sezioni più popolari per molti anni.

Negli anni ’90, VoAGI aveva una directory molto completa di software, dataset, incontri e altre informazioni rilevanti allora disponibili, quindi era una risorsa molto utile.

Con l’aumentare del campo, è diventato impossibile mantenere una directory curata a mano delle cose relative al data mining e alla data science, e VoAGI si è concentrato su contenuti pratici ed educativi, e più su ciò che era utile per i praticanti. Siamo stati anche fortunati con il tempismo, poiché l’interesse per il data mining e la data science è cresciuto in modo significativo negli anni 2010 e 2020. Di conseguenza, il numero di abbonati e visitatori del sito web è cresciuto in modo significativo.

Ritiene che VoAGI abbia avuto un impatto positivo nel campo dei dati lungo il percorso? (Abid)

Certo che spero di sì! Nei primi giorni, il bollettino e il sito web di VoAGI erano risorse utili per mettere in contatto la comunità di ricerca, e in seguito sono state risorse educative utili per i praticanti e gli scienziati dei dati all’inizio della loro carriera.

Alcuni dei nostri lettori hanno apprezzato molto VoAGI, come dimostrato in questa vignetta:

Cosa ritiene essere il più grande avanzamento nella data science avvenuto durante la sua carriera di pubblicazione? (Matt)

Chiaramente, il deep learning. Sebbene la ricerca sulle reti neurali fosse in corso dagli anni ’60, la grande svolta è stata l’approccio del deep learning, sviluppato principalmente da Geoff Hinton, Yann LeCun e Yoshua Bengio agli inizi degli anni 2000. Il primo successo significativo del deep learning è generalmente datato a ottobre del 2012, quando AlexNet, creato da Geoff Hinton e dai suoi studenti, ha vinto la competizione ImageNet con un margine senza precedenti.

Poco dopo, molti ricercatori e professionisti hanno iniziato a utilizzare il deep learning e VoAGI ha iniziato a occuparsene. Il deep learning era già la notizia principale di VoAGI nel dicembre 2012.

Il deep learning e tutte le tecnologie derivate da esso, come ChatGPT, rimangono tra gli argomenti più popolari adesso.

 Cosa era importante per te mentre lavoravi a VoAGI (ad esempio: soldi, esperienza o diffusione della conoscenza)? (Abid)

Certo, i soldi erano importanti, dal momento che ero lavoratore autonomo dal 2001 e dovevo sostenere la mia famiglia e pagare il mutuo, ma non erano la cosa più importante. Probabilmente la principale motivazione per me quando ho iniziato VoAGI era costruire una comunità e interagire con persone intelligenti. Dal 1993 al 2000, ho gestito la newsletter e il sito web di VoAGI senza alcun guadagno o pubblicità, come un servizio completamente volontario per la comunità. Gestire VoAGI era un complemento naturale nell’organizzare workshop e conferenze KDD, un’attività volontaria non retribuita ma molto gratificante.

Credo che VoAGI abbia svolto un ruolo positivo nella diffusione della conoscenza del data mining e delle scienze dei dati, come testimoniato da un gran numero di visitatori e abbonati.

 Come hai fatto in modo che VoAGI si distinguesse nel competitivo panorama dei media? (Nisha)

Non c’è una formula magica. Ciò richiedeva, innanzitutto, molto lavoro duro. Ma se dovessi individuare alcuni “nugget” del successo duraturo di VoAGI, sarebbero il contenuto di qualità, la sinergia e l’attenzione.

Innanzitutto, ci sforzavamo di trovare o scrivere contenuti di buona qualità. In secondo luogo, ci affidavamo alla sinergia positiva tra diversi canali: le email aiutavano a portare visitatori al sito e il sito aiutava ad avere più abbonati alle email. La presenza di successo di VoAGI su Twitter (ora X), LinkedIn e Facebook si rafforzava reciprocamente.

Infine, l’attenzione. Prestavo molta attenzione sia al comportamento interno del sito, modificandolo periodicamente per migliorare importanti metriche, sia alle tendenze esterne, adattando i nostri contenuti a ciò che era interessante e attuale nel campo.

 Puoi condividere una storia particolarmente significativa o memorabile che VoAGI ha trattato all’inizio e l’effetto che ha avuto? (Nisha)

Una storia precoce degli anni ’90 riguardava i bambini in affido. Una delle cose utili che VoAGI faceva era pubblicare richieste da parte dei ricercatori e una persona intorno al 1995 ha inviato una richiesta riguardante il suo problema nel lavorare su un database di pagamenti per bambini in affido. C’erano molti nomi che erano leggermente diversi nella scrittura e per effettuare i pagamenti alla persona giusta era necessario unificarne la scrittura differente. Un altro ricercatore ha visto quella richiesta su VoAGI ed è stato in grado di applicare il suo algoritmo per il matching dei nomi per risolvere il problema dei bambini in affido. Ciò ha contribuito a far arrivare i pagamenti a più bambini e a migliorare le loro vite.

 Anche se ti sei allontanato, dove ti piacerebbe vedere VoAGI nei prossimi 10 anni? (Nisha)

Spero che avrà ancora alcuni contenuti scritti da esseri umani e lettori umani!

 Come ti senti riguardo all’AI che alla fine prenderà il controllo della creazione dei contenuti? (Abid)

Da una parte, mi sento molto emozionato nel vedere che le storie di fantascienza sull’IA e i robot che leggevo da bambino si stanno avvicinando alla realtà e in alcuni casi la realtà supera già la fantascienza. Dall’altra parte, mi dispiace per i creatori di contenuti umani.

I social network hanno già mostrato i pericoli dell’ottimizzazione dell’attenzione e l’IA è estremamente brava nell’ottimizzare. Posso immaginare che tra pochi anni (o anche mesi) l’IA eccellerà nella creazione di contenuti ad alto potenziale di dipendenza che molti umani vorrebbero guardare senza sosta.

Forse l’IA sta già generando molti contenuti su TikTok.

Ma è buono per la società che così tante persone siano dipendenti da una droga digitale?

La promessa e la minaccia dell’IA sono ovviamente molto più ampie della creazione di contenuti: l’IA può potenzialmente prendere il controllo della maggior parte dei lavori.

A breve termine, penso che ci sarà un periodo di collaborazione, in cui umani + IA possono fare meglio in molti compiti rispetto a umani o IA da sole. Prendendo gli scacchi come esempio, dopo che Deep Blue ha sconfitto il campione del mondo Garry Kasparov nel 1997, ci sono stati tornei in cui squadre composte da umani + computer hanno fatto meglio di computer o umani. Tuttavia, quel periodo è stato breve e ora i migliori programmi di scacchi sono molto, molto migliori persino del campione del mondo.

A lungo termine, sono molto preoccupato per le perdite di lavoro causate dall’IA e per l’aumento delle disuguaglianze di reddito, che possono destabilizzare le società e distruggere le democrazie. Questo non accadrà quest’anno, ma le attuali tendenze tecnologiche stanno puntando verso scenari del genere. Una possibile soluzione a lungo termine per la disoccupazione causata dall’IA potrebbe essere una forma di reddito di base universale e il focus sullo sviluppo della creatività umana.

Una soluzione del genere sarà difficile da adottare e richiederà attivismo politico e impegno civico, quindi se tu, lettore, sei preoccupato per i rischi dell’IA, allora informati, impegnati e vota!

Grazie, Gregory! Il tuo coinvolgimento è apprezzato e celebrare un traguardo del genere per VoAGI non sarebbe lo stesso senza di te.

Matthew Mayo (@mattmayo13) ha una laurea magistrale in informatica e un diploma di specializzazione in data mining. Come Editor-in-Chief di VoAGI, Matthew si impegna a rendere accessibili concetti complessi della scienza dei dati. I suoi interessi professionali includono l’elaborazione del linguaggio naturale, gli algoritmi di apprendimento automatico ed esplorare l’IA emergente. È mosso da una missione di democratizzare la conoscenza nella comunità della scienza dei dati. Matthew programma sin da quando aveva 6 anni.