DeepSeek
DeepSeek | |
---|---|
![]() | |
Stato | ![]() |
Fondazione | 2023 |
Fondata da | Liang Wenfeng |
Sede principale | Hangzhou |
Gruppo | High-Flyer |
Persone chiave | Liang Wenfeng (amministratore delegato) |
Sito web | www.deepseek.com |
DeepSeek (in cinese: 深度求索S, shēn dù qiú suǒP) è una società cinese di intelligenza artificiale che sviluppa modelli linguistici di grandi dimensioni (LLM) open source. Con sede a Hangzhou, Zhejiang, è di proprietà e finanziata esclusivamente dal fondo speculativo cinese High-Flyer, il cui co-fondatore, Liang Wenfeng, ha fondato la società nel 2023 e ne è l'amministratore delegato. L'azienda recluta giovani ricercatori di intelligenza artificiale dalle migliori università cinesi,[1] e assume al di fuori del campo dell'informatica per diversificare le conoscenze e le capacità dei suoi modelli.[2]
Il modello DeepSeek-R1 esegue attività allo stesso livello di ChatGPT,[3] nonostante sia stato sviluppato a un costo significativamente inferiore (dichiarato in 6 milioni di dollari, rispetto ai 100 milioni di dollari per GPT-4 di OpenAI nel 2023[4]) e richieda un decimo della potenza di calcolo di un LLM comparabile.[4][5][6] Il modello di intelligenza artificiale è stato sviluppato da DeepSeek nel mezzo delle sanzioni degli Stati Uniti alla Cina (per i chip Nvidia), che avevano lo scopo di limitare la capacità del paese di sviluppare sistemi di intelligenza artificiale avanzati.[7][8]
Storia
[modifica | modifica wikitesto]
Nel febbraio 2016, High-Flyer è stata co-fondata dall'appassionato di intelligenza artificiale Liang Wenfeng, che si era immerso nel mondo del trading durante la crisi finanziaria del 2007-2008, mentre frequentava l'Università dello Zhejiang.[9] Nel 2019, ha trasformato High-Flyer come hedge fund focalizzato sullo sviluppo e l'utilizzo di algoritmi di trading basati sull'intelligenza artificiale. Nel 2021 High-Flyer ha utilizzato esclusivamente l'intelligenza artificiale nel trading.[10] Prima che il governo federale degli Stati Uniti d'America imponesse restrizioni alla Cina sui chip dedicati all'AI, Liang aveva accumulato un magazzino di 10.000 GPU A100 di Nvidia.[10] Alcune notizie stimano tale quantità fino a 50.000.[9]
Nell'aprile 2023 High-Flyer ha avviato un laboratorio di intelligenza artificiale generale dedicato alla ricerca sullo sviluppo di strumenti di intelligenza artificiale separati dall'attività finanziaria di High-Flyer.[11] Nel maggio 2023 con High-Flyer come uno degli investitori, il laboratorio è diventato una società a sé stante, DeepSeek.[10][12] Le società di capitale di rischio erano riluttanti all'inizio a fornire finanziamenti poiché era altamente improbabile che la società sarebbe stata in grado di generare una release di un prodotto convincente, in un breve periodo di tempo.[10]
Il 10 gennaio 2025 la società ha rilasciato la sua prima app chatbot gratuita per Apple IOS e Android; entro il 27 gennaio, DeepSeek-R1 ha superato ChatGPT come app gratuita più scaricata sull'App Store iOS negli Stati Uniti,[1] e ha causato un calo del 18% del prezzo delle azioni Nvidia.[13][14][15] Il successo di DeepSeek contro rivali più grandi e affermati è stato descritto come "un capovolgimento dell'intelligenza artificiale",[1] che costituisce "il primo tentativo di quella che sta emergendo come una corsa allo spazio globale dell'intelligenza artificiale"[16] e inaugura "una nuova era di rischio di intelligenza artificiale"[17] citata anche come una nuova guerra fredda[18]
DeepSeek ha reso open source i suoi algoritmi, modelli e dettagli di allenamento dell'intelligenza artificiale generativa, rendendo il suo codice liberamente disponibile per l'uso, la modifica e la visualizzazione; ciò include il permesso di accedere e utilizzare il codice sorgente e i documenti di progettazione per scopi di costruzione.[19] Ciononostante, numerosi rapporti indicano che applica restrizioni sui contenuti in conformità con le normative locali, limitando le risposte su argomenti come il massacro di Piazza Tienanmen, il genocidio degli uiguri[20][21][22] e lo status di Taiwan.[23][24]
Prodotti
[modifica | modifica wikitesto]DeepSeek LLM
[modifica | modifica wikitesto]Il 2 novembre 2023, DeepSeek ha rilasciato la sua prima serie di modelli, DeepSeek-Coder
, disponibile gratuitamente sia per i ricercatori che per gli utenti commerciali. Il codice per il modello è stato reso open source con la licenza MIT, con un accordo di licenza aggiuntivo ("licenza DeepSeek") riguardante "l'utilizzo downstream aperto e responsabile" per il modello stesso.[25]
V2
[modifica | modifica wikitesto]A maggio 2024 hanno rilasciato la serie di modelli DeepSeek-V2
. La serie include 4 modelli, 2 modelli base (DeepSeek-V2
, DeepSeek-V2-Lite
) e 2 chatbot (-Chat
). Il Financial Times ha riferito che la soluzione era più economica dei suoi pari, con un prezzo di 2 RMB per ogni milione di token di output. La classifica del Tiger Lab dell'Università di Waterloo ha classificato DeepSeek-V2 al settimo posto nella sua classifica LLM.[12]
V3
[modifica | modifica wikitesto]Nel dicembre 2024 hanno rilasciato un modello base DeepSeek-V3-Base
e un modello di chat DeepSeek-V3
. L'architettura del modello è essenzialmente la stessa della V2.
DeepSeek-V2.5
è stato rilasciato a settembre e aggiornato a dicembre. È stato realizzato combinando DeepSeek-V2-Chat
e DeepSeek-Coder-V2-Instruct
.[26]
I test di benchmark mostrano che DeepSeek-V3 ha superato le prestazioni Llama 3.1 e Qwen 2.5 mentre si avvicina a GPT-4o e Claude 3.5 Sonnet.[27][28][29]
Il modello R1
[modifica | modifica wikitesto]Il 20 novembre 2024 DeepSeek-R1-Lite-Preview è diventato accessibile tramite le API di DeepSeek e chat.deepseek.com.[30] È stato addestrato per inferenza logica, ragionamento matematico e risoluzione di problemi in tempo reale. DeepSeek ha affermato di aver superato le prestazioni di OpenAI o1 su benchmark come American Invitational Mathematics Examination (AIME) e MATH.[31] Tuttavia, il Wall Street Journal ha affermato che quando ha utilizzato 15 problemi dall'edizione 2024 di AIME, il modello o1 ha raggiunto una soluzione più velocemente di DeepSeek-R1-Lite-Preview.[32]
Il 20 gennaio 2025, DeepSeek-R1 e DeepSeek-R1-Zero sono stati rilasciati.[33] Entrambi sono stati inizializzati da DeepSeek-V3-Base e hanno la stessa architettura. La società ha anche rilasciato alcuni modelli "DeepSeek-R1-Distill", che non sono inizializzati su V3-Base, ma sono invece inizializzati da altri modelli open-weight pre-addestrati, tra cui LLaMA e Qwen, quindi perfezionati su dati sintetici generati da R1.
DeepSeek ha rilasciato il suo Assistente A.I., che utilizza il modello V3/R1, anche come app chatbot per Apple IOS e Android[34]. Entro il 27 gennaio 2025 l'app aveva superato ChatGPT come app gratuita con la valutazione più alta sull'App Store iOS negli Stati Uniti; il suo chatbot risponderebbe a domande, risolverebbe problemi logici e scriverebbe programmi per computer alla pari di altri chatbot sul mercato, secondo i test di benchmark utilizzati dalle aziende di intelligenza artificiale americane.[6]
DeepSeek-V3 utilizza risorse significativamente inferiori rispetto ai suoi pari; ad esempio, mentre le principali aziende di intelligenza artificiale al mondo addestrano i loro chatbot con supercomputer che utilizzano fino a 16.000 circuiti integrati (o più), DeepSeek afferma di aver avuto bisogno solo di circa 2.000 chip per computer specializzati, vale a dire la serie H800 della multinazionale americana Nvidia. È stato addestrato in circa 55 giorni ad un costo di 5,58 milioni di dollari, che è circa 10 volte inferiore a quanto il gigante tecnologico statunitense Meta ha speso per costruire la sua ultima tecnologia di intelligenza artificiale.[6]
Sicurezza e protezione dei dati personali
[modifica | modifica wikitesto]L'ascesa di questo servizio ha già sollevato numerose perplessità, tanto che in Italia si è deciso di bloccare l'app con effetto immediato. A gennaio 2025, infatti, Altroconsumo ha presentato un reclamo presso il Garante per la protezione dei dati personali contro DeepSeek.[35] Di conseguenza, l'app è stata rimossa dai negozi digitali di Google e Apple sul territorio nazionale. Il blocco, tuttavia, non ha riguardato la versione online, che risulta ancora accessibile via browser.[36]
Molti esperti temono che il governo cinese possa utilizzare il sistema di intelligenza artificiale per operazioni di influenza estera, diffusione di disinformazione, sorveglianza e sviluppo di armi informatiche.[37][38][39]
Gli enti per la protezione dei dati personali dei Paesi Bassi e della Corea del Sud, ed il Consiglio per la sicurezza nazionale degli Stati Uniti d'America hanno aperto indagini sull'uso dei dati da parte di DeepSeek.[40][41][42]
Il 31 gennaio 2025, il ministero del digitale di Taiwan ha sconsigliato ai suoi dipartimenti governativi di utilizzare il servizio DeepSeek per "evitare rischi per la sicurezza delle informazioni".[41] Lo stesso giorno, il governatore del Texas Greg Abbott ha emesso un divieto statale sui dispositivi forniti dal governo per DeepSeek, insieme a REDnote e Lemon8.[43] L'accesso a DeepSeek è stato vietato sui dispositivi del New South Wales Department of Customer Service.[44] Anche l'Australia ha vietato DeepSeek per i dispositivi governativi.[45]
Note
[modifica | modifica wikitesto]- ^ Salta a: a b c (EN) Cade Metz, What is DeepSeek? And How Is It Upending A.I.?, in The New York Times, 27 gennaio 2025. URL consultato il 28 gennaio 2025.
- ^ (EN) Cade Metz e Meaghan Tobin, How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants, su The New York Times, 23 gennaio 2025. URL consultato il 27 gennaio 2025.
- ^ (EN) Elizabeth Gibney, China's cheap, open AI model DeepSeek thrills scientists, in Nature, 23 gennaio 2025.
- ^ Salta a: a b James Vincent, The DeepSeek panic reveals an AI world ready to blow, in The Guardian, 28 gennaio 2025.
- ^ (EN) Peter Hoskins, DeepSeek Chinese AI chatbot sparks market turmoil for rivals, su BBC, 27 gennaio2025. URL consultato il 27 gennaio 2025.
- ^ Salta a: a b c Emma Cosgrove, DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending, su Business Insider, 27 gennaio 2025.
- ^ Cliff Saran, Nvidia investigation signals widening of US and China chip war, su Computer Weekly, 10 dicembre 2024. URL consultato il 27 gennaio 2025.
- ^ Natalie Sherman, Nvidia targeted by China in new chip war probe, su BBC, 9 dicembre 2024. URL consultato il 27 gennaio 2025.
- ^ Salta a: a b (EN) Caiwei Chen, How a top Chinese AI model overcame US sanctions, su MIT Technology Review, 24 gennaio 2025.
- ^ Salta a: a b c d (EN) Lily Ottinger, Deepseek: From Hedge Fund to Frontier Model Maker, su ChinaTalk, 9 dicembre 2024. URL consultato il 28 dicembre 2024.
- ^ (EN) Xu Yu, Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says, su Yicai Global, 17 aprile 2023. URL consultato il 28 dicembre 2024.
- ^ Salta a: a b Ryan McMorrow, The Chinese quant fund-turned-AI pioneer, su Financial Times, 9 giugno 2024. URL consultato il 28 dicembre 2024.
- ^ Hayden Field, China's DeepSeek AI dethrones ChatGPT on App Store: Here's what you should know, su CNBC, 27 gennaio 2025.
- ^ What is DeepSeek, and why is it causing Nvidia and other stocks to slump?, su CBS News, 27 gennaio 2025.
- ^ Thomas Barrabi, Nvidia stock suffers record wipeout on DeepSeek fears - as CEO Jensen Huang's net worth tanks, su nypost.com, 27 gennaio 2025.
- ^ (EN) Max Zahn, Nvidia, Microsoft shares tumble as China-based AI app DeepSeek hammers tech giants, su ABC News. URL consultato il 27 gennaio 2025.
- ^ (EN) Kevin Roose, Why DeepSeek Could Change What Silicon Valley Believe About A.I., su The New York Times, 28 gennaio 2025. URL consultato il 28 gennaio 2025.
- ^ U.S.-China AI Cold War Is Heating Up—Can OpenAI’s Stargate End It?, su forbes.com.
- ^ Luis E. Romero, ChatGPT, DeepSeek, Or Llama? Meta's LeCun Says Open-Source Is The Key, su Forbes.
- ^ MSN, su www.msn.com. URL consultato il 5 febbraio 2025.
- ^ (EN) ‘Let’s talk about something else’: Why DeepSeek refuses to answer questions on Xi Jinping, China’s Covid lockdown, su Firstpost, 28 gennaio 2025. URL consultato il 5 febbraio 2025.
- ^ (EN) What questions will China's DeepSeek not answer? – DW – 01/31/2025, su dw.com. URL consultato il 5 febbraio 2025.
- ^ (EN) Matthew Field e James Titcomb, What is DeepSeek? The Chinese AI that has sparked a $1 trillion panic, in The Telegraph, 27 gennaio 2025. URL consultato il 5 febbraio 2025.
- ^ (EN) Donna Lu, We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan, in The Guardian, 28 gennaio 2025. URL consultato il 5 febbraio 2025.
- ^ (EN) DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder, su GitHub, 22 gennaio 2025. URL consultato il 24 gennaio 2025.
- ^ deepseek-ai/DeepSeek-V2.5 · Hugging Face, su huggingface.co, 3 gennaio 2025. URL consultato il 28 gennaio 2025.
- ^ (EN) Ben Jiang, Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products, su South China Morning Post, 27 dicembre 2024. URL consultato il 28 dicembre 2024.
- ^ (EN) Shubham Sharma, DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch, su VentureBeat, 26 dicembre 2024. URL consultato il 28 dicembre 2024.
- ^ Kyle Wiggers, DeepSeek's new AI model appears to be one of the best 'open' challengers yet, su TechCrunch, 26 dicembre 2024. URL consultato il 31 dicembre 2024.
- ^ (EN) DeepSeek-R1-Lite - DeepSeek-R1-Lite-Preview is now live: unleashing supercharged reasoning power!, su DeepSeek API Docs. URL consultato il 28 gennaio 2025.
- ^ (EN) Carl Franzen, DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance, su VentureBeat, 20 novembre 2024. URL consultato il 28 dicembre 2024.
- ^ (EN) Raffaele Huang, Don't Look Now, but China's AI Is Catching Up Fast, su The Wall Street Journal, 24 dicembre 2024. URL consultato il 28 dicembre 2024 (archiviato dall'url originale il 27 dicembre 2024).
- ^ (EN) Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce, su GitHub. URL consultato il 21 gennaio 2025.
- ^ DeepSeek, Come funziona l'AI della startup cinese, su wired.it, 28 gennaio 2025.
- ^ Deepseek, il Garante Privacy dispone blocco e apre istruttoria, su ilsole24ore.com. URL consultato il 2025/01/31.
- ^ DeepSeek, che cos’è e come funziona, su kuriuland.it. URL consultato il 3 febbraio 2025.
- ^ (EN) China’s DeepSeek AI poses formidable cyber, data privacy threats | Biometric Update, su www.biometricupdate.com, 26 gennaio 2025. URL consultato il 5 febbraio 2025.
- ^ (EN) Robert Booth e Dan Milmo, Experts urge caution over use of Chinese AI DeepSeek, in The Guardian, 28 gennaio 2025. URL consultato il 5 febbraio 2025.
- ^ (EN) Rael Hornby published, DeepSeek's success has painted a huge TikTok-shaped target on its back, su LaptopMag, 28 gennaio 2025. URL consultato il 5 febbraio 2025.
- ^ White House evaluates effect of China AI app DeepSeek on national security, official says, su reuters.com.
- ^ Salta a: a b Taiwan says government departments should not use DeepSeek, citing security concerns, su reuters.com.
- ^ Dutch privacy watchdog to launch investigation into China's DeepSeek AI, su reuters.com.
- ^ Texas governor orders ban on DeepSeek, RedNote for government devices, su apnews.com.
- ^ NSW Govt blocks access to DeepSeek AI, su Information Age. URL consultato il 5 febbraio 2025.
- ^ (EN) Australia bans DeepSeek on government devices over security risk, su www.bbc.com, 4 febbraio 2025. URL consultato il 5 febbraio 2025.
Altri progetti
[modifica | modifica wikitesto]Wikimedia Commons contiene immagini o altri file su DeepSeek
Collegamenti esterni
[modifica | modifica wikitesto]- (ZH, EN) Sito ufficiale, su deepseek.com.
- (EN) DeepSeek, su GitHub.
Controllo di autorità | GND (DE) 1355055415 |
---|