Come DeepSeek ha riconfigurato la corsa all’intelligenza artificiale
di Antonio Dini
“È una delle innovazioni più sorprendenti e impressionanti che abbia mai visto”: le parole del venture capitalist Marc Andreessen sintetizzano alla perfezione lo stupore con cui la Silicon Valley ha assistito all’avvento di V3 e R1, i modelli di intelligenza artificiale creati da DeepSeek, la startup cinese derivata dall’hedge fund di Lian Wenfeng.
DeepSeek è riuscita a creare sistemi di AI potenti almeno quanto i principali realizzati negli Stati Uniti a una frazione del costo di training – 5,6 milioni di dollari per il suo modello V3, un LLM (modello linguistico di grandi dimensioni), contro gli oltre 100 milioni stimati per ChatGPT-4 – e utilizzando chip molto meno potenti e probabilmente in quantità inferiore (il numero di schede Nvidia utilizzate è ancora dibattuto), anche a causa dei blocchi commerciali imposti dagli Stati Uniti. DeepSeek è riuscita nell’impresa usando delle tecniche di programmazione e di funzionamento innovative e procedendo a ottimizzazioni sistematiche e su larga scala nel funzionamento dei sistemi di creazione e gestione dei modelli.
In questo ha giocato un ruolo significativo anche il fatto che DeepSeek abbia scelto un modello di sviluppo di tipo open source (pur con le differenze che questo ha nel settore dell’intelligenza artificiale rispetto all’ingegneria del software tradizionale, tanto che la definizione di open per questi modelli è contestata), da un lato potendo sfruttare l’aiuto di sviluppatori indipendenti di tutto il mondo, dall’altro aumentando la pervasività dei suoi modelli, perché possono essere scaricati da chiunque, nel repository presente su GitHub, e utilizzati in altro modo. I modelli possono quindi essere utilizzati in locale anche con computer relativamente poco potenti, mentre altre aziende possono riutilizzarli dopo averli portati nel proprio cloud. Microsoft stessa ha dichiarato di voler aggiungere i modelli di DeepSeek nell’offerta del suo cloud Azure (nonostante la partnership con OpenAI), mentre Perplexity offre R1 come opzione per il suo motore di ricerca.
La scossa al modello americano
La stampa e i mercati finanziari hanno rapidamente registrato il cambiamento nel settore dell’intelligenza artificiale, comparando il lavoro e i costi affrontati da DeepSeek con quanto invece sostenuto dalle aziende statunitensi del settore, cioè che siano necessari investimenti di capitale e tecnologia crescenti per sviluppare nuovi modelli e mantenere la supremazia statunitense. Nel biennio 2023-2024 le cifre, mai rivelate ufficialmente, sono state nell’ordine di grandezza dei 100 milioni di dollari per l’addestramento dei modelli di nuova generazione, e questo contando solo il costo d’uso dei processori, mentre per il 2025, come aveva dichiarato l’anno scorso il Ceo di Anthropic Dario Amodei, la cifra necessaria per l’addestramento della “next gen” di AI potrebbe arrivare anche al miliardo di dollari.
La comparazione più facile per la stampa internazionale e per i mercati finanziari è stata comunque quella con lo “Stargate Project”, pianificato durante la presidenza di Joe Biden da OpenAI, SoftBank, Oracle e il fondo emiratino Mgx, e presentato alla Casa Bianca da Donald Trump il 21 gennaio. Il progetto prevede che, per continuare lo sviluppo dei modelli realizzati da OpenAI, sia necessario creare una gigantesca infrastruttura di centri di calcolo dedicata esclusivamente all’azienda di Sam Altman al costo iniziale di 100 miliardi di dollari nel 2025, che potrebbero diventare 500 miliardi in quattro anni, generando tra le altre cose più di 100mila posti di lavoro negli Usa. L’obiettivo, secondo Altman, è lo sviluppo dell’intelligenza artificiale generale (AGI), mentre per il presidente Trump è più esplicitamente il mantenimento della supremazia statunitense nel settore.
Durante un evento pubblico tenuto solo un giorno prima, il 20 gennaio, Liang Wenfeng ha presentato al premier cinese Li Qiang il modello di DeepSeek capace di “ragionamento”, R1, che secondo varie metriche è pari o superiore a o1 di OpenAI, il modello giudicato finora il più avanzato tra quelli dotati di ragionamento. Riferendosi alla presentazione di questo particolare modello, Marc Andreessen ha parlato del “momento Sputnik” dell’intelligenza artificiale, con un suggestivo riferimento alla messa in orbita nel 1954 da parte dei sovietici del primo satellite artificiale, che abbatté il primato americano nel settore aerospaziale e scatenò la corsa allo spazio, con la nascita della Nasa, l’espansione del programma militare e, indirettamente, la nascita di Internet.
L’impatto del “momento Sputnik” di DeepSeek per adesso si è tradotto invece in una reazione di shock e nel timore di un “AI Gap” evidenziato da tutte le più autorevoli testate internazionali, a partire da quelle statunitensi. I giornali hanno sostanzialmente ufficializzato lo stupore per questa “new entry” cinese, sconosciuta ai più, nel settore dell’intelligenza artificiale, che non solo è riuscita a raggiungere e superare il campione del settore (OpenAI), ma lo ha fatto mettendone in discussione gli assunti tecnologici ed economici.
Al di là dei dettagli tecnici (numero di parametri dei modelli di DeepSeek, modalità di addestramento e funzionamento, velocità e modalità di gestione dei token) ed economici (costo dell’addestramento e del funzionamento, costi di inferenza e costo delle GPU utilizzate), l’impatto del nuovo attore cinese ha prodotto un primo risultato immediato, cioè il crollo dei titoli delle aziende centrali per lo sviluppo dell’intelligenza artificiale, che dal 2022 stavano godendo di una crescita significativa. In particolare, Nvidia ha perso circa 600 miliardi di dollari in poche ore (-17%), ma il calo ha coinvolto, su cifre più contenute, anche gli altri protagonisti del settore: Alphabet/Google, Amazon, Meta e Microsoft (OpenAI non è quotata in Borsa).
DeepSeek è riuscita a rompere la narrazione, portata avanti da alcune aziende degli Stati Uniti, secondo la quale lo sviluppo dell’intelligenza artificiale richiede investimenti miliardari crescenti e l’aumento esponenziale di centri di calcolo per sviluppare nuovi sistemi di intelligenza artificiale. Ed è riuscita a rompere questa narrazione senza minarne la base, che sia cioè comunque opportuno, e anzi necessario, sviluppare l’intelligenza artificiale perché utile alle imprese e all’umanità in generale, rispetto invece alle resistenze (soprattutto occidentali) di chi vede nello sviluppo dell’intelligenza artificiale un pericolo per l’umanità diretto (una sorta di “rischio Terminator”) o indiretto (soprattutto per l’impatto ambientale dei centri di calcolo, ma anche dal punto di vista occupazionale e non solo).
L’AI come strumento di supremazia strategica
Inoltre, DeepSeek è (involontariamente) riuscita a far mettere a fuoco ai media, e a una parte dell’opinione pubblica occidentale, le dimensioni dello scontro in corso tra gli Stati Uniti e la Cina. La supremazia nell’ambito dell’intelligenza artificiale è un fattore non solo puramente tecnologico ed economico, ma anche strategico e geopolitico.
L’intelligenza artificiale (intesa in senso lato, non solo come AI generativa) è facilmente convertibile a fini bellici, sia in contesti di scontri convenzionali, sia non convenzionali e asimmetrici. Può infatti essere utilizzata sia per campagne di disinformazione, spam, hacking, furto di informazioni o più in generale di sabotaggio tecnologico, ma anche come strumento di intelligence per analisi di dati sia di natura riservata sia pubblica, oltre che come strumento militare diretto: dai droni a guida autonoma alle armi e bombe intelligenti, dai software per sistemi d’arma innovativi (compresi i robot) agli altri meccanismi automatici o semiautomatici da usare sul campo nei conflitti.
L’intelligenza artificiale è inoltre uno strumento in grado di aumentare l’innovazione in altri settori: dalla ricerca biochimica all’ambito finanziario.
La supremazia tecnologica degli Stati Uniti, nel campo dell’intelligenza artificiale come in altri settori, è un elemento della dottrina della deterrenza militare americana, che si stava già riorganizzando attorno al settore privato. Per esempio, Eric Schmidt, uno dei cofondatori di Sun Microsystems e poi Ceo di Google, da tre anni porta avanti un’attività di lobbying incentrata sull’idea che le forze armate statunitensi debbano modernizzarsi velocemente, sfruttando a questo scopo sistemi di intelligenza artificiale a qualsiasi livello (il cosiddetto “AI Warfare”), mentre Palantir Technologies, creata tra gli altri da Peter Thiel, uno degli ex soci di Elon Musk e personaggio strumentale per il successo elettorale di Donald Trump, ha numerosi appalti militari per la fornitura di sistemi di intelligence basati su AI.
Assieme all’impatto tecnologico, economico, finanziario e ambientale, l’intelligenza artificiale cinese realizzata da DeepSeek sta avendo un ruolo più sotterraneo, ma altrettanto dirompente, nei rapporti di forza geopolitici in generale.
Mostrando come, al di là dei blocchi e delle sanzioni americane, possa raggiungere e superare la tecnologia realizzata dagli Usa, con costi più accessibili e un impatto ambientale inferiore di vari ordini di grandezza, la storia di DeepSeek rimette in discussione uno dei vettori di crescita economica diretta apparentemente più consolidati, ovvero gli enormi e crescenti investimenti pianificati nel settore dello sviluppo e funzionamento dell’AI.
Inoltre, crea uno strumento che non solo solleva potenziali problemi di privacy (tanto che il Garante italiano ha subito chiesto chiarimenti e poi è intervenuto con una istruttoria), ma, in Occidente, può anche essere considerato un rischio per la sicurezza nazionale assimilabile a quello che gli Usa sostengono sia causato dal social media TikTok. Il riferimento è, da un lato, alla censura e manipolazione dei contenuti e delle risposte fornite dai modelli di DeepSeek (anche se limitazioni sulle risposte sono presenti nei modelli di tutte le aziende), dall’altro, all’estrazione di informazioni personali, prompt, chat e alla loro conservazione a tempo indeterminato su server cinesi, con possibili utilizzi anche a fini di intelligence (almeno nella versione che non prevede un utilizzo in locale, che limiterebbe molti di questi rischi).
È per queste ragioni che possiamo considerare l’intelligenza artificiale come un moltiplicatore di potenza strategico, che opera su tre livelli principali. Innanzitutto, su una dimensione economica, perché rappresenta una tecnologia abilitante fondamentale, paragonabile all’elettricità o al motore a combustione interna. Chi oggi domina lo sviluppo dell’AI avrà vantaggi competitivi enormi in molteplici settori.
Dal punto di vista militare – dove, come abbiamo visto, sta trasformando profondamente la natura dei conflitti moderni permettendo lo sviluppo di sistemi d’arma autonomi – l’intelligenza artificiale potenzia drasticamente le capacità di intelligence e sorveglianza, automatizzando in parte il processo decisionale sul campo di battaglia.
Dal punto di vista geopolitico, l’intelligenza artificiale rappresenta invece il fulcro di quella che è ormai diventata una specie di nuova “corsa agli armamenti tecnologici” tra gli Stati Uniti e la Cina. Controllare l’AI non determina solo la supremazia militare ed economica, ma anche la capacità di influenzare gli standard globali e le norme etiche del suo utilizzo.
La corsa all’intelligenza artificiale è quindi una competizione caratterizzata, da un lato, da una forte interdipendenza nelle catene di approvvigionamento tra i due paesi e, dall’altro, dalla mancanza quasi completa di una governance globale condivisa. Governance condivisa che, peraltro, esiste in quasi tutti gli altri settori di attrito tra stati o blocchi di stati. È proprio questo doppio vincolo, l’interdipendenza e la mancanza di governance globale condivisa, che dovrebbe far nascere le preoccupazioni maggiori.







































Comments
Molto interessante, ma ni.
La forte interdipendenza temo sia quella che gli Usa non vogliono e a cui i cinesi vorrebbero non dover rinunciare. Purtroppo, i neuroni a senso unico atlantici hanno messo pali, paletti e autentiche frontiere. Non so come se la caveranno in Usa con l'autarchica, lo vedremo. Intanto la Cina sembra se la stia cavando non male, tanto da restituire un colpo poco simpatico alle enclosures dell'Ai che i colossi Usa cercavano di fare con costosissimi sistemi, costosissimi investimenti, costosissimi consumi. Come ho scritto in altri commenti non e' uno sputnik moment e' solo il primo di tanti sputnik moment.
Ed e' proprio questa open source risposta cinese che spariglia qualsiasi governance. Che governance potra' esserci tra i pali, paletti-sbarre-al-confine e modelli proprietari coperti da diritti con la scelta cinese sull'open source. Si tratta di una scelta precisa e che gli autori di deepseek considerano non necessaria, ma inevitabile anche per i modelli Usa (questo quello che ho capito, correggetemi se sbaglio).
Sarei curioso di sentire come potrebbe essere articolata una governance tra modelli proprietari (quotati in borsa) e modelli open source.
Confesso l'ignoranza, non so se deepseek sia quotato in borsa e che profitti si attendono salvo, al momento, quelli di immagine e di sviluppo da parte di altri smanettoni. Mi sembra pero' che si tratti di due governance diverse e poco conciliabili e mi sembra pure che la Cina abbia scelto una strada che senza dichiarazioni bellicose a quei signori che siedono alla destra e sinistra del donald crea e creera' non solo collassi borsistici, ma parecchi problemi di rincorsa e di innovazioni.
A proposito delle interconnessioni, la Cina ha in casa materie prime, ingegneri (altri li comprera' a Taiwan), finanziamenti illimitati e progressione sia nelle stampanti dei chip (ancora lontani come nanometri, ma se anche in quell'ambito trovassero soluzioni alternative e migliori?) che strutture di produzione e personale preparato a tutti i livelli. Mi sfugge la situazione Usa, cosa hanno cosa manca perche' possano non essere interdipendenti? La domanda e' retorica e ne vedremo delle brutte perche' quello che non hanno, semplicemente, lo ruberanno ... la loro sicurezza prima di tutto. Fossi il produttore di stampanti olandese ... qualche pensierino lo avrei, magari mandano le corazzate a caricare intere fabbriche per portarle in salvo sul suolo americano. Lo escludete? Io no
E la governance?
La governance puo' attendere, donal no.