DeepSeek-R1, il nuovo modello AI cinese, sfida OpenAI con innovazione, efficienza hardware e impatto geopolitico. Scopri i dettagli
La pubblicazione di un nuovo software di intelligenza artificiale prodotto in Cina ha suscitato un mix di reazioni tra ammirazione, preoccupazione e scompiglio nel settore tecnologico. Questo software, denominato DeepSeek-R1, è stato lanciato il 20 gennaio da DeepSeek, un laboratorio di ricerca cinese relativamente sconosciuto fino a quel momento. Si tratta di un modello linguistico di grandi dimensioni (LLM), lo stesso tipo di tecnologia che alimenta sistemi avanzati come ChatGPT, Claude e Google Gemini.
Secondo DeepSeek, il loro modello sarebbe in grado di competere con o1, il modello più avanzato di OpenAI. Questo tipo di tecnologia, nota come “reasoning model“, è progettata per simulare il ragionamento umano e risolvere problemi complessi con un approccio più ponderato rispetto ai modelli tradizionali.
Negli ultimi giorni, il lancio di DeepSeek-R1 è diventato un argomento centrale nel dibattito tecnologico globale. Lunedì, alla riapertura della borsa statunitense, il Nasdaq Composite, che include molte società tecnologiche, ha subito una perdita di oltre il 3%. Le azioni di Nvidia, uno dei principali fornitori di chip per l’intelligenza artificiale, hanno registrato un calo significativo, arrivando a perdere fino al 17% del loro valore. Questo è stato attribuito non solo alle capacità del modello DeepSeek-R1, ma anche al fatto che questa tecnologia rappresenta un nuovo punto di svolta per il settore dell’IA generativa, sviluppata da una realtà cinese in grado di sfidare aziende leader come OpenAI.
L’annuncio di DeepSeek-R1 si inserisce in un contesto politico particolarmente delicato. Il suo lancio è avvenuto durante la prima settimana della presidenza di Donald Trump, un periodo segnato dalla presentazione del progetto Stargate, un piano da 500 miliardi di dollari per investimenti privati nel settore dell’intelligenza artificiale, e dalla discussione di un possibile “ban” di TikTok per via della sua proprietà cinese.
DeepSeek-R1 ha attirato particolare attenzione anche per i suoi costi di sviluppo. La fase di addestramento del modello, secondo il Wall Street Journal, è costata circa 5,6 milioni di dollari, una cifra significativamente inferiore rispetto agli standard occidentali. Ad esempio, Dario Amodei, CEO di Anthropic, aveva stimato che i modelli linguistici più avanzati potrebbero richiedere tra i 100 milioni e il miliardo di dollari per lo sviluppo. L’efficienza economica dimostrata da DeepSeek ha quindi sorpreso molti osservatori.
Un altro aspetto che ha destato scalpore è stato il ridotto utilizzo di hardware durante lo sviluppo del modello. Per un precedente progetto, denominato V3, DeepSeek ha dichiarato di aver utilizzato solo 2.000 chip Nvidia, a fronte delle 16.000 GPU normalmente necessarie per modelli simili. Questo dettaglio ha avuto un impatto immediato sulle azioni Nvidia e di altre aziende legate alla produzione di chip, mettendo in dubbio la sostenibilità dei loro attuali modelli di business.
Nelle stesse ore, l’applicazione di DeepSeek ha raggiunto la vetta dell’App Store di Apple, superando ChatGPT, che dominava da mesi i download gratuiti su iOS. Su X, l’investitore Marc Andreessen ha definito DeepSeek-R1 «uno dei progressi più impressionanti mai visti», sottolineando il valore innovativo del progetto.
DeepSeek è stata fondata nel 2023 da Liang Wenfeng, imprenditore e co-fondatore di High-Flyer, un’azienda attiva nell’analisi di dati finanziari. Liang ha puntato fin dall’inizio su un team giovane, assumendo per la maggior parte posizioni tecniche occupate da neolaureati. Inoltre, DeepSeek ha adottato un approccio aperto, sviluppando progetti open source e collaborativi, una strategia che aiuta a colmare il divario tecnologico tra aziende cinesi e occidentali, attirando utenti e collaboratori.
Come progetto open source, DeepSeek-R1 può essere scaricato ed eseguito localmente dagli utenti su computer dotati di elevate capacità di calcolo. Questo approccio consente di utilizzare il modello senza la necessità di trasferire dati ai server aziendali, una caratteristica che lo rende unico e potenzialmente competitivo rispetto ai modelli di Meta, come Llama.
Le restrizioni imposte dagli Stati Uniti durante l’amministrazione Biden hanno limitato l’accesso della Cina ai chip avanzati necessari per lo sviluppo dell’intelligenza artificiale. Tuttavia, come osservato dalla MIT Technology Review, queste sanzioni sembrano aver spinto startup come DeepSeek a trovare soluzioni innovative. Secondo Marina Zhang, docente presso la University of Technology di Sydney, l’azienda ha compensato la carenza di hardware puntando sull’ottimizzazione delle risorse software.
Non tutti concordano su questa interpretazione. Alcuni ritengono che DeepSeek abbia accumulato una significativa scorta di chip Nvidia A100 prima dell’imposizione delle sanzioni, utilizzandoli poi in combinazione con hardware meno avanzato. Secondo alcune stime, l’azienda possiede tra 10.000 e 50.000 di questi chip, una quantità che, se confermata, dimostrerebbe la lungimiranza di Liang nel prevedere le restrizioni.
Il successo di DeepSeek-R1 evidenzia il crescente ruolo della Cina nel panorama dell’intelligenza artificiale, ma anche le sfide che il paese deve affrontare per mantenere la competitività. Liang stesso ha riconosciuto l’esistenza di un divario tra Cina e Stati Uniti in termini di efficienza nell’addestramento dei modelli, sottolineando come sia necessario colmare questa distanza per ottenere risultati comparabili con un utilizzo inferiore di risorse.
Parallelamente, DeepSeek è oggetto di preoccupazioni simili a quelle che circondano TikTok. Gli Stati Uniti temono che il governo cinese possa influenzare il funzionamento del modello, con potenziali rischi per la sicurezza nazionale. Alcuni utenti hanno testato il modello su temi sensibili, come Taiwan e piazza Tienanmen, ottenendo risposte vaghe o interrotte, alimentando i sospetti su una possibile censura integrata.
DeepSeek-R1 rappresenta un significativo passo avanti nel settore dell’intelligenza artificiale, combinando innovazione tecnica, efficienza economica e un approccio collaborativo. Tuttavia, il suo successo solleva questioni cruciali che vanno oltre l’aspetto tecnologico, toccando temi geopolitici, economici e di sicurezza nazionale.
Il futuro dell’intelligenza artificiale sarà inevitabilmente segnato da sfide legate a competizione globale, efficienza delle risorse e regolamentazioni. DeepSeek ha dimostrato che la Cina è pronta a competere su scala globale, ma rimane da vedere come questo modello influenzerà il mercato e gli equilibri politici nei prossimi anni.
Molti utenti hanno raccontato esperienze simili su piattaforme come Reddit, mettendo in luce un possibile…
Il lancio di Qwen 2.5-Max da parte di Alibaba, che si presenta come il miglioramento…
Liang Wenfeng incarna una nuova generazione di imprenditori cinesi che non si limitano a imitare…
Il nuovo presidente degli Stati Uniti ha confermato l’interesse del colosso dell’informatica nei confronti del…
Con una base di 300 milioni di utenti attivi mensilmente, 140.000 brand e una valutazione…
Mercato crypto in calo: Bitcoin scende verso 100.000$, Ethereum sotto pressione. Focus su supporti chiave…