I modelli mondiali: verso un’AI che comprende il mondo fisico

Punti salienti:

  • I “Modelli Mondiali” sono la prossima frontiera dell’AI, sviluppati da pionieri come Fei-Fei Li e Yann LeCun, per superare i limiti dei modelli linguistici (LLM) e mimare la comprensione umana del mondo fisico tramite “modelli mentali”.
  • L’obiettivo è dotare l’AI di intelligenza spaziale (comprensione 3D), buon senso e capacità di ragionamento e pianificazione, permettendole di interagire con il mondo reale.
  • La principale sfida è la carenza di dati spaziali e 3D, che richiede metodi avanzati di acquisizione ed elaborazione per costruire questi modelli complessi.

Mentre il mondo della tecnologia continua ad investire miliardi nello sviluppo di Large Language Models (LLM) all’avanguardia, una piccola ma influente schiera di ricercatori di punta sta già guardando oltre, lavorando a quella che potrebbe essere la prossima grande rivoluzione nell’intelligenza artificiale: i “modelli mondiali”.

Oltre le parole: perché il linguaggio non basta

Ricercatori di spicco come Fei-Fei Li, professoressa di Stanford e creatrice di ImageNet, e Yann LeCun, capo scienziato dell’AI di Meta, sono in prima linea in questa nuova direzione. La loro convinzione fondamentale è che il linguaggio, pur essendo potente, sia limitante per l’intelligenza artificiale. Come ha affermato Li, “Il linguaggio non esiste in natura” e gli esseri umani costruiscono la civiltà “oltre il linguaggio”.

A differenza dei modelli linguistici, che generano output basandosi su relazioni statistiche tra parole e frasi nei loro dati di addestramento, i modelli mondiali mirano a predire gli eventi basandosi sui “costrutti mentali” che gli esseri umani creano per comprendere il mondo che li circonda. Questo concetto si rifà alle teorie del computer scientist Jay Wright Forrester, che già nel 1971 sottolineava come gli esseri umani utilizzino costantemente modelli mentali per il processo decisionale, poiché la nostra mente non contiene la realtà fisica, ma piuttosto “concetti e relazioni selezionati per rappresentare sistemi reali.

Imitare l’intelligenza umana

Se l’AI deve raggiungere o superare l’intelligenza umana, allora, secondo questi ricercatori, deve essere capace di creare anch’essa modelli mentali. La visione è chiara: abbiamo bisogno di sistemi AI che possano “imparare nuovi compiti molto rapidamente” e che “capiscano il mondo fisico – non solo testo e linguaggio, ma il mondo reale – abbiano un certo livello di buon senso, e capacità di ragionamento e pianificazione, abbiano una memoria persistente – tutte le cose che ci aspettiamo da entità intelligenti.

Chi sta costruendo il futuro?

Fei-Fei Li e World Labs: Li sta portando avanti questa visione attraverso World Labs, una compagnia che ha co-fondato nel 2024 con un finanziamento iniziale di 230 milioni di dollari. L’obiettivo di World Labs è “sollevare i modelli AI dal piano 2D dei pixel a mondi 3D completi – sia virtuali che reali – dotandoli di un’intelligenza spaziale ricca quanto la nostra”. L’intelligenza spaziale è definita come “la capacità di comprendere, ragionare, interagire e generare mondi 3D”. Le applicazioni per i modelli mondiali, secondo Li, sono infinite: dai campi creativi alla robotica, e potrebbero includere anche avanzamenti nelle applicazioni militari, aiutando il personale sul campo a percepire meglio l’ambiente e anticipare le mosse nemiche.

Yann LeCun a Meta: Anche Yann LeCun ha un team dedicato a un progetto simile presso Meta. Il suo approccio prevede l’uso di dati video per addestrare i modelli e l’esecuzione di simulazioni che astraggono i video a diversi livelli. L’idea fondamentale è non predire a livello di pixel, ma addestrare un sistema a creare una “rappresentazione astratta del video” per fare previsioni, eliminando così i dettagli imprevedibili e creando un insieme più semplice di “blocchi di costruzione” per mappare le traiettorie di come il mondo cambierà.

Le sfide: la scarsità di dati 3D

Nonostante il potenziale, la costruzione di modelli mondiali presenta sfide significative. La principale è la carenza di dati sufficienti. A differenza del linguaggio, che gli umani hanno raffinato e documentato per secoli, l’intelligenza spaziale è meno sviluppata in termini di dati strutturati. Li spiega che “se ti chiedo di chiudere gli occhi in questo momento e disegnare o costruire un modello 3D dell’ambiente intorno a te, non è così facile”. Per superare questa lacuna, è necessario un “data engineering, acquisizione dati, elaborazione dati e sintesi dati sempre più sofisticati”.

In sintesi, i modelli mondiali rappresentano un audace passo avanti per l’intelligenza artificiale, promettendo sistemi che non si limitano a comprendere il testo, ma possono percepire, ragionare e interagire con il mondo fisico proprio come facciamo noi. È una sfida complessa, ma i pionieri dell’AI credono che sia l’unica strada per creare un’intelligenza veramente umana nell’era digitale5.

“Support Responsible AI” contro l’uso non autorizzato dei contenuti da parte dell’IA

Centinaia di testate giornalistiche statunitensi hanno lanciato la campagna "Support Responsible AI" per chiedere al governo di regolamentare l'uso dei loro contenuti da parte delle aziende di intelligenza artificiale.​

DeepSeek: Intervista al CEO di una delle startup AI emergenti in Cina

DeepSeek, una startup AI cinese, sta sviluppando tecnologie avanzate per la ricerca di informazioni in ambienti complessi.

L’Intelligenza Artificiale di Google, CC: un’alternativa innovativa alla tua lettura mattutina

CC, il nuovo agente di intelligenza artificiale di Google, svolge il compito di filtrare il vostro ambiente digitale - le email, il calendario, i documenti - e di elaborare un briefing quotidiano per voi.

Presenta