Il “Gemini” di Google colma il divario dell’intelligenza artificiale, ma l’intelligenza artificiale generale rimane sfuggente
Nell’ultimo anno, l’intelligenza artificiale generativa ha preso d’assalto il mondo.
Il ritmo del progresso è stato poco meno che sorprendente, con OpenAI – e la sua partnership con Microsoft – che hanno attirato gran parte dell’attenzione dopo il lancio di ChatGPT alla fine dello scorso anno.
La scorsa settimana Google ha alzato la posta in gioco presentando il suo ultimo modello di intelligenza artificiale generativa, Gemini, uno sforzo congiunto di Google Brain e DeepMind e un concorrente diretto di GPT-4 di OpenAI.
Google sta promuovendo Gemini come piattaforma nativamente multimodale.
Ciò significa che i suoi componenti non vengono uniti insieme a posteriori da tipi separati di contenuti e dati.
Invece, è stato costruito da zero attraverso diverse modalità, combinando miliardi di parametri che rappresentano testo, immagini, video, audio e codice di programmazione.
Con il rilascio di Gemini, alcune persone si chiedono se forse abbiamo finalmente creato l'intelligenza artificiale generale, o AGI, arrivando al punto in cui la nostra tecnologia diventa più intelligente di noi stessi.
"È impossibile giudicare se [Google] abbia raggiunto l'AGI o meno sulla base di video PR pesantemente modificati senza accesso API pubblico", ha affermato Yejin Choi, professore di Wissner-Slivka e MacArthur Fellow presso la Paul G.
Allen School of Computer Science & Engineering presso l'Università di Washington e direttore senior dell'Allen Institute for AI (AI2).
AI2, un istituto di ricerca senza scopo di lucro con sede a Seattle, è in prima linea nell'esplorazione e nel progresso dell'intelligenza artificiale sin dalla sua fondazione nel 2014.
La sua missione è contribuire all'umanità attraverso la ricerca e l'ingegneria sull'intelligenza artificiale ad alto impatto.
“Il progresso tecnologico nel GPT e nei suoi simili è stato a dir poco mozzafiato, ma non siamo ancora vicini al livello di intelligenza umana”, ha affermato Oren Etzioni, professore emerito della UW ed ex CEO di AI2.
“Ad esempio, stiamo ancora lottando per mettere in campo auto a guida autonoma”.
I modelli linguistici di grandi dimensioni (LLM) e altre forme di intelligenza artificiale generativa hanno consentito all’intelligenza artificiale di eseguire un numero crescente di compiti con capacità che sembrano parallele e talvolta addirittura superiori a quelle della cognizione umana.
Dalla preparazione istantanea di modelli aziendali alla composizione di poesie fino all'esplorazione rapida di nuovi approcci alla risoluzione dei problemi, questi recenti progressi ci stanno portando in un rapporto davvero diverso con la nostra tecnologia.
Con Gemini, Google non solo sembra aver raggiunto il ChatGPT basato su GPT-4 di OpenAI, ma lo ha addirittura superato.
I risultati dei test pubblicati da Google mostrano che Gemini supera ChatGPT e supera persino molti punteggi umani nella sua conoscenza del mondo e nella risoluzione dei problemi.
Secondo Google, con un punteggio del 90%, Gemini Ultra è il primo modello a superare gli esperti umani nel MMLU (Massive Multitask Language Understanding).
Testando sia la conoscenza del mondo che le capacità di risoluzione dei problemi, MMLU copre la conoscenza di 57 argomenti.
Se i risultati dei test saranno confermati, Gemini potrà far avanzare e accelerare la conoscenza umana come nessuna intelligenza artificiale ha mai fatto prima.
Ma nonostante ciò, non dovremmo commettere l’errore di pensare che questa nuova intelligenza artificiale sia in realtà intelligente quanto una persona.
In verità, Gemini e altri grandi modelli sembrano avere ancora molte sfide davanti a sé.
Nell'annunciare il rilascio di Gemini, Google ha prodotto una serie di video per commercializzare la nuova intelligenza artificiale, incluso un video dimostrativo che mostra Gemini rispondere rapidamente e senza sforzo alle domande di un utente umano fuori dallo schermo.
Ma mentre nella descrizione di YouTube si affermava che il video era stato modificato per motivi di latenza, queste modifiche si sono presto rivelate molto più estese di quanto suggerisse la loro dichiarazione.
Dietro le quinte, i suggerimenti sembrano essere stati molto più estesi e dettagliati di quelli rappresentati nel video.
La successiva risposta dei media è stata tutt’altro che generosa.
Anche se dobbiamo ancora vedere esattamente quanto sia capace Gemini in natura, questo non è il tipo di lancio che qualcuno desidera per il proprio prodotto.
Col senno di poi, Google probabilmente sarebbe stato meglio con una rappresentazione più realistica delle attuali capacità dei Gemelli.
Quindi, per quanto entusiasmanti siano tutti questi progressi, l’AGI probabilmente rimane un’aspirazione lontana.
Questa sarà senza dubbio una domanda che verrà posta di routine per ogni importante progresso dell’intelligenza artificiale nei decenni a venire.
Nel frattempo ciò non diminuisce le preoccupazioni sulla sicurezza dell’IA.
Anche se questa intelligenza artificiale non è all’altezza dell’AGI, come possiamo garantire che questi nuovi potenti sistemi siano adatti all’uso aziendale e pubblico? Formazione e tutele sull'intelligenza artificiale Nell'addestramento e nei test di Gemini, Google avrebbe utilizzato i Real Toxicity Prompts di AI2 per garantire che i suoi risultati fossero appropriati per questi scopi.
All'inizio del 2021, il team di Choi presso AI2 ha sviluppato e rilasciato questo set di 100.000 suggerimenti, come ho riportato su GeekWire quasi tre anni fa.
Poiché la tossicità del linguaggio è complessa ed estesa, in particolare se tratta da contenuti sul Web, non è possibile filtrare semplicemente le parole volgari o che incitano all'odio.
Real Toxicity Prompts fornisce un modo per addestrare i sistemi a identificare e filtrare forme più sfumate di linguaggio e significato tossici.
Ciò è estremamente importante perché, poiché questi grandi modelli sono diventati sempre più complessi, sono stati necessari maggiori sforzi per creare tutele attorno ai loro risultati.
Ciò sarà probabilmente ancora più cruciale poiché gli sviluppatori faranno affidamento su approcci multimodali.
Gemini “è stato costruito da zero per essere multimodale, il che significa che può generalizzare e comprendere perfettamente, operare attraverso e combinare diversi tipi di informazioni tra cui testo, codice, audio, immagini e video”, Demis Hassabis, CEO e co-fondatore di DeepMind, ha scritto in un recente blog di Google.
Sfruttando la potenza dell’approccio del modello multimodale di grandi dimensioni, Gemini offre funzionalità che sarebbero state impossibili solo pochi anni fa.
Negli ultimi anni, gli approcci multimodali sono stati visti come un modo per apportare nuove importanti funzionalità all’intelligenza artificiale generativa grazie al contesto aggiuntivo che questi ulteriori livelli di informazioni possono fornire.
A differenza dei grandi modelli linguistici originali che costruivano il loro output esclusivamente da vaste raccolte di testi, i modelli multimodali traggono più significato dalle molte diverse forme dei loro dati sottostanti.
In un certo senso, questo è parallelo al modo in cui noi stessi costruiamo una comprensione molto più profonda delle situazioni attingendo ai nostri molteplici sensi: vista, udito, ecc.
Questo approccio multimodale consente a questi sistemi di generare risultati molto più capaci, sfumati e utili.
Gemini verrà rilasciato in tre livelli.
Gemini Pro è già stato incorporato in Google Bard.
Gemini Ultra è attualmente in fase di perfezionamento e test di sicurezza con piani per distribuirlo a sviluppatori e clienti aziendali all'inizio del 2024.
Gemini Nano, una versione più compatta che può essere utilizzata nei dispositivi mobili, fa ora parte di Pixel 8 Pro e verrà aggiunta a un numero crescente di prodotti nei prossimi mesi.
Ostacoli rimanenti per l'intelligenza artificiale Dopo il rilascio fulmineo di ChatGPT da parte di OpenAI, a molte persone sembrava che Google stesse cercando di recuperare terreno.
Ma la società sembra aver scelto un approccio più lento per costruire e rilasciare il suo nuovo modello in quanto affronta seriamente le preoccupazioni sulla sicurezza dell’intelligenza artificiale, sforzandosi di creare importanti garanzie in Gemini, come ridurre il suo potenziale di linguaggio tossico.
Ci sono molte altre considerazioni quando si parla di sicurezza ed etica dell’IA.
Come abbiamo visto con ChatGPT, si sono verificati molti casi d'uso imprevisti, molti dei quali illegali o comunque dannosi.
Anche se è rassicurante che Google si sia presa il suo tempo e abbia fatto molti sforzi per creare protezioni attorno alla sua nuova tecnologia, resta da vedere se questo sarà sufficiente.
Data la complessità del sistema e l’opacità dei dati sottostanti, è probabile che ora dovremo affrontare una serie di sfide completamente nuove.
Oltre a tutto ciò, è probabilmente giusto dire che ci aspetta un altro giro di entusiastici blitz di pubbliche relazioni e di clamore senza fiato all'interno dei media mentre tutti noi avvolgiamo la testa attorno a questi ultimi progressi e facciamo i conti con ciò che questi nuovi sistemi effettivamente può e non può fare.
Distruggeranno posti di lavoro o semplicemente trasformeranno il modo in cui lavoriamo? Questi modelli ci aiuteranno a gestire meglio le grandi quantità di informazioni che il nostro mondo sta creando? Oppure porteranno a un’esplosione di disinformazione e alla conseguente sfiducia che ne consegue? Nonostante tutti i problemi che la nuova tecnologia comporta, vale la pena ricordare che costruiamo queste IA affinché diventino i nostri strumenti.
Sono ancora molto lontani dall'essere autoconsapevoli o coscienti o dall'avere qualcosa di simile alle motivazioni umane che guidano le nostre scelte e azioni.
I mezzi statistici con cui l’intelligenza artificiale generativa ragiona e genera output è completamente diverso dal funzionamento della cognizione umana e probabilmente rimarrà tale per molto tempo a venire.
Probabilmente è una fortuna.
Per molti aspetti, è questa differenza che rende l'intelligenza artificiale così utile per noi come strumenti di cui avremo bisogno per le prossime fasi del progresso.
Quale ruolo giocheranno i Gemelli in tutto questo, solo il tempo lo dirà.