DeepSeek
![]() | |
Tip | Özel |
---|---|
Endüstri | Bilgi teknolojisi |
Kuruluş | Mayıs 2023 | )
Kurucu | |
Genel merkezi | Hangzhou, Zhejiang, Çin |
Önemli kişiler | Liang Wenfeng (CEO) |
Sahibi | High-Flyer |
Çalışan sayısı | 200'den az |
Web sitesi | deepseek.com |
DeepSeek, açık kaynaklı geniş dil modelleri geliştiren Çinli bir yapay zekâ şirketidir. DeepSeek, her ikisi de Liang Wenfeng tarafından kurulan ve merkezi Hangzhou, Zhejiang'da bulunan Çinli hedge fonu High-Flyer tarafından finanse edilmektedir.
DeepSeek-R1, ChatGPT ile aynı seviyede görevleri yerine getirebilmektedir.[1] OpenAI'in GPT-4'ü 2023'te 100 milyon dolar maliyetle üretmesine karşın DeepSeek-R1 için bu maliyet 6 milyon dolar olarak belirtilmiştir.[2] DeepSeek-R1, eşdeğer başka bir geniş dil modeliyle kıyaslandığında, onda biri kadar hesaplama gücü gerektirmektedir.[2][3][4][5] DeepSeek-R1 yapay zeka modeli, ABD'nin Nvidia çipleri konusunda Çin'e uyguladığı ve ülkenin gelişmiş yapay zeka sistemleri geliştirme kabiliyetini kısıtlamayı amaçlayan yaptırımların ortasında, DeepSeek tarafından geliştirildi.[6][7] 10 Ocak 2025'te şirket Apple IOS ve Android için ilk ücretsiz sohbet botu uygulamasını yayınladı. 27 Ocak itibariyle DeepSeek-R1, ABD'deki iOS App Store'da en çok indirilen ücretsiz uygulama olarak ChatGPT'yi geçti[8] ve Nvidia'nın hisse fiyatının %18 düşmesine neden oldu.[9][10][11]
DeepSeek, üretken yapay zeka algoritmalarını, modellerini ve eğitim verilerini açık kaynak olarak sunarak, kodunu kullanım, değişiklik yapma ve görüntüleme için erişilebilir kılmıştır. Ayrıca, kaynak kodu ve tasarım belgelerine inşa amacıyla erişim ve bunlardan yararlanma izni de sağlamaktadır.[12] Şirket, modellerinin bilgi ve becerilerini çeşitlendirmek amacıyla Çin'in en iyi üniversitelerinden genç yapay zeka araştırmacılarının[8] yanı sıra bilgisayar bilimleri dışındaki alanlardan kişileri işe alıyor.[4]
DeepSeek, sunucularını hedef alarak hizmetlerinde yavaşlamaya neden olan kaynağı bilinmeyen kötü niyetli saldırılara karşı büyük bir saldırı başlatıldığını bildirdi. Şirket, bu sorunları çözmek için çalışmalarını sürdürüyor.[13]
Arkaplanı
[değiştir | kaynağı değiştir]High-Flyer, Şubat 2016'da Liang Wenfeng tarafından kurulmuştur. Liang Wenfeng, 2007-2008 mali krizi sırasında Zhejiang Üniversitesi'ne devam ederken ticarete başladı.[14] 2019 yılına gelindiğinde, yapay zeka ticaret algoritmaları geliştirmeye ve kullanmaya odaklanan bir hedge fonu olarak High-Flyer'ı kurdu.[15] 2021 yılına gelindiğinde High-Flyer, ticaret için yalnızca yapay zekayı kullanıyordu. Bu durum, Amerikan hedge fonu Renaissance Technologies ile yapılan kıyaslamaları da beraberinde getirdi.[16]
Nisan 2023'te High-Flyer, yapay genel zekayı araştırmak için yeni bir bağımsız kuruluş oluşturacağını duyurdu. Bu kuruluş hisse senedi alım satımı için kullanılmayacak ve High-Flyer'ın finansal işlerinden ayrı olacaktı.[17][18] Mayıs 2023'te bu şirket DeepSeek olarak faaliyete geçti.[15][18] DeepSeek'in gelişimi High-Flyer tarafından finanse edilmektedir.[16][18] Girişim sermayesi şirketleri, kısa sürede bir çıkış elde etme olasılığı düşük olduğu için finansman sağlama konusunda isteksizdi.[15]
Düşük fiyata güçlü performans sunan DeepSeek-V2'yi Mayıs 2024'te piyasaya sürdükten sonra DeepSeek, Çin'in yapay zeka modeli savaşının katalizörü olarak tanındı. Kısa sürede “Yapay Zekanın Pinduoduo'su” olarak adlandırıldı ve ByteDance, Tencent, Baidu ve Alibaba gibi diğer büyük teknoloji devleri de şirketle rekabet edebilmek için kendi yapay zeka modellerinin fiyatlarını düşürmeye başladı. DeepSeek düşük fiyat uygulamasına rağmen, para kaybeden rakiplerine kıyasla kârlı çıktı.[19] DeepSeek şu ana kadar yalnızca araştırmaya odaklanmış durumda ve ticarileştirme için ayrıntılı planları bulunmuyor.[19]
DeepSeek'in işe alım tercihleri, yeni çalışanları işe alırken iş deneyiminden ziyade teknik yetenekleri hedeflemektedir. Bu nedenle yeni işe alınanların çoğu ya yeni mezun olmuş üniversite öğrencilerinden ya da yapay zeka kariyerleri henüz oturmamış geliştiricilerden oluşmaktadır.[18]
Piyasaya sürülme geçmişi
[değiştir | kaynağı değiştir]2 Kasım 2023 tarihinde DeepSeek, hem araştırmacılar hem de ticari kullanıcılar için ücretsiz olarak sunulan ilk modeli DeepSeek Coder'ı tanıttı.[20] Modelin kodu, modelin kendisi için “açık ve sorumlu downstream kullanımı” ile ilgili ek bir lisans sözleşmesi ile MIT lisansı altında açık kaynaklı hale getirilmiştir.[21]
29 Kasım 2023'te DeepSeek, 67B parametreye kadar ölçeklendirilen DeepSeek LLM'yi piyasaya sürdü. GPT-4'ün performansına yaklaşan bir performansla o sırada mevcut olan diğer LLM'lerle rekabet etmek için geliştirildi. Bununla birlikte, hesaplama verimliliği ve ölçeklenebilirlik konusunda zorluklarla karşılaştı.[20] Modelin DeepSeek Chat adlı bir sohbet botu sürümü de yayınlandı.[22]
Mayıs 2024'te DeepSeek-V2 piyasaya sürüldü. Financial Times, her bir milyon çıkış tokenı için 2 RMB'lik bir fiyatla emsallerinden daha ucuz olduğunu bildirdi. Waterloo Üniversitesi Tiger Lab'ın sıralama tablosunda DeepSeek-V2, LLM sıralamasında yedinci sırada yer aldı.[16]
Kasım 2024'te DeepSeek R1-Lite-Preview piyasaya sürüldü ve mantıksal çıkarım, matematiksel muhakeme ve gerçek zamanlı problem çözme gerektiren görevlerde başarılı olmak üzere tasarlandı. DeepSeek, American Invitational Mathematics Examination (AIME) ve MATH gibi ölçütlerde OpenAI o1'in performansını aştığını iddia etmiştir.[23] Ancak The Wall Street Journal, AIME'nin 2024 baskısından 15 problem kullandığında, o1 modelinin DeepSeek R1-Lite-Preview'den daha hızlı çözüme ulaştığını belirtmiştir.[24]
Aralık 2024'te DeepSeek-V3 piyasaya sürüldü. 671 milyar parametre ile geldi ve benzerlerine kıyasla önemli ölçüde daha az kaynak kullanarak 5,58 milyon ABD doları maliyetle yaklaşık 55 günde eğitildi.[18] Bu sistem 14,8 trilyon jetondan oluşan bir veri kümesi üzerinde eğitilmiştir. Benchmark testleri, GPT-4o ve Claude 3.5 Sonnet ile başa baş performans gösterirken Llama 3.1 ve Qwen 2.5'ten daha iyi performans gösterdiğini ortaya koymuştur.[18][25][26][27] DeepSeek'in sınırlı kaynaklarla yaptığı optimizasyon, ABD tarafından uygulanan yaptırımların Çin'in yapay zeka gelişimindeki muhtemel sınırlarını ortaya çıkarmıştır.[18][28]
Aşama | Maliyet (bin GPU saati cinsinden) | Maliyet (milyon ABD Doları cinsinden) |
---|---|---|
Eğitim öncesi | 2,664 | 5.328 |
Bağlam genişletme | 119 | 0.24 |
İnce ayar | 5 | 0.01 |
Toplam | 2,788 | 5.576 |
20 Ocak 2025 tarihinde DeepSeek-R1 ve DeepSeek-R1-Zero piyasaya sürüldü.[30] Bunlar V3-Base'i temel alıyordu. V3 gibi, her biri 671B toplam parametre ve 37B aktif parametreye sahip bir uzman karışımıdır. Ayrıca R1'e dayanmayan bazı “DeepSeek-R1-Distill” modelleri de yayınladılar. Bunun yerine, LLaMA ve Qwen gibi diğer açık ağırlıklı modellere benzeyen bu modeller, R1 tarafından üretilen sentetik veriler kullanılarak ince ayar yapılmıştır.
R1, mantıksal çıkarım, matematiksel akıl yürütme anlamına gelen ingilizce "reasoning" kelimesinden gelmektedir.[31]
R1-Zero, herhangi bir gözetimli ince ayar (SFT) olmaksızın tamamen pekiştirmeli öğrenme (RL) kullanılarak eğitilmiştir.[32] Eleştirel bir model kullanmak yerine grup puanlarından temel çizgiyi tahmin eden grup göreli politika optimizasyonu (GRPO) kullanılarak eğitilir.[33] Kullanılan ödül sistemi kural tabanlıdır ve temel olarak iki tür ödülden oluşur; doğruluk ödülleri ve biçim ödülleri.
R1-Zero çıktıları çok okunaklı olmadığından ve çıktılarda İngilizce ve Çince arasında değişiklik olduğundan, bu sorunları gidermek ve muhakemeyi daha da geliştirmek için R1'i eğitilmiştir.[32]
Ocak 2025'te piyasaya sürülen DeepSeek-R1 akıl yürütme, kodlama ve matematik gibi karmaşık görevlerdeki yetenekleriyle ChatGPT'nin son modellerinden biri olan o1'e yarışacak seviyeye gelmiştir. DeepSeek'in son kullanıcılar için ücretsiz olması popülerliliğini arttırmıştır. Kullanıcılara ücretsiz olarak sunulan bu denli gelişmiş ilk yapay zeka sistemi olarak değerlendirilmektedir. OpenAI o1 ve Claude Sonnet gibi diğer güçlü sistemler ücretli abonelik gerektirmesi ve bazı aboneliklerde bile kullanıcılara kota koyması DeepSeek'i bu alanda öne çıkartmaktadır.[34] Son dönemde iOS ve Android sistemler için DeepSiq mobil uygulaması App Store ve Google Play mağazalarında yayınlanarak kullanıcıların bu gelişmiş teknolojiye daha kolay ulaşmaları sağlandı.[35]
Değerlendirme ve tepkiler
[değiştir | kaynağı değiştir]DeepSeek, V3 modelini kullanan Yapay Zeka Asistanını Apple IOS ve Android için bir sohbet botu uygulaması olarak piyasaya sürdü. 27 Ocak 2025 itibariyle uygulama, Amerika Birleşik Devletleri'ndeki iOS App Store'da en yüksek puan alan ücretsiz uygulama olarak ChatGPT'yi geride bıraktı. Amerikan yapay zeka şirketleri tarafından kullanılan kıyaslama testlerine göre, sohbet botunun soruları yanıtladığı, mantık problemlerini çözdüğü ve piyasadaki diğer sohbet botlarıyla eşit düzeyde bilgisayar programları yazdığı bildirildi.[4]
DeepSeek-V3, benzerlerine kıyasla çok daha az kaynak kullanmaktadır. Örneğin, dünyanın önde gelen yapay zeka şirketleri sohbet botlarını 16.000 kadar grafik işlem birimi(GPU) kullanan süper bilgisayarlarla eğitirken, DeepSeek sadece 2.000 GPU'ya, yani Nvidia'nın H800 serisi çipine ihtiyaç duyduğunu belirtmektedir.[29] Yaklaşık 55 günde 5,58 milyon ABD doları maliyetle eğitildi ki bu rakam ABD'li teknoloji devi Meta'nın en son yapay zeka teknolojisini oluşturmak için harcadığı paranın yaklaşık onda birine denk gelmektedir.[4][36]
DeepSeek'in nispeten düşük maliyetli rekabetçi performansı, Amerikan yapay zeka modellerinin küresel hakimiyetine meydan okuma potansiyeline sahip olarak kabul edildi.[37] The Hill ve Guardian tarafından yayınlanan bir görüş yazısında, bu açıklamanın Amerikan yapay zekasının tıpkı SSCB ile ABD arasındaki Sputnik krizine benzer bir şekilde Çin ile ABD arası bir yarışa dönüşmesi olarak nitelendirildi.[38][39] R1 modelinin performansının matematik, kodlama ve doğal dil muhakemesi gibi görevler için kullanıldığında OpenAI'nin en son modellerinden biriyle “eşit” olduğu bildirildi.[40] Diğer yorumcuları yansıtan Amerikalı Silikon Vadisi girişim sermayedarı Marc Andreessen de benzer şekilde R1'i “yapay zekanın Sputnik anı” olarak tanımladı.[40]
DeepSeek'in kurucusu Liang Wenfeng, Open AI CEO'su Sam Altman ile kıyaslandı ve CNN onu Çin'in Sam Altman'ı ve yapay zeka için bir öncüsü olarak nitelendirdi.[41] Çin devlet medyası DeepSeek'i ulusal bir değer olarak övgüyle bahsetti.[42][43] 20 Ocak 2025 tarihinde Çin Başbakanı Li Çiang, Liang Wenfeng'i uzmanlarla yaptığı sempozyuma davet etti ve 2024 yıllık hükümet çalışma raporunun yorumlanması için bir taslak üzerinde görüş ve önerilerini sunmasını istedi.[44]
DeepSeek'in sınırlı kaynaklarla yaptığı optimizasyon, ABD'nin Çin'in yapay zeka gelişimine uyguladığı ve Çin'e gelişmiş yapay zeka çiplerinin ihracatına getirilen kısıtlamaları da içeren yaptırımların potansiyel sonuçlarını ortaya koydu.[18][45] Şirketin yapay zeka modellerinin başarısı sonuç olarak “ piyasada kargaşaya neden oldu”.[46] Büyük küresel teknoloji şirketlerinin hisselerinin 27 Ocak 2025 tarihinde düşmesine neden oldu. Nvidia'nın hisseleri %17-18'e varan oranlarda düşerken, rakibi Broadcom'un hisseleri de aynı oranda düştü. Microsoft (%2,5 düştü), Google'ın sahibi Alphabet (%4'ün üzerinde düştü) ve Hollandalı çip ekipmanı üreticisi ASML (%7'nin üzerinde düştü) dahil olmak üzere diğer teknoloji firmaları da düştü.[40] R1 modelinin piyasaya sürülmesiyle Nasdaq'taki teknoloji hisselerinde yaşanan küresel düşüş, yapay zeka ve bilgisayar donanımı şirketlerinin piyasa değerlerinde yaklaşık 593 milyar dolarlık rekor kayıplara yol açtı.[47] 28 Ocak 2025 itibariyle Amerikan hisse senetlerinden toplam 1 trilyon dolarlık değer kaybı yaşandı.[39]

Amerikan yapay zeka sektörünün önde gelen isimleri DeepSeek'in başarısına ve performansına karışık tepkiler verdi.[48] ABD'nin yapay zeka altyapısını geliştirmek üzere ABD hükümeti destekli “ Stargate Projesi” kapsamında şirketleri bulunan Microsoft CEO'su Satya Nadella ve OpenAI CEO'su Sam Altman DeepSeek'i “süper etkileyici” olarak nitelendirdi.[49][50] Stargate Project'i duyuran ABD Başkanı Donald Trump, DeepSeek'i bir uyanış çağrısı ve olumlu bir gelişme olarak nitelendirdi.[51][52][39][40][53] Aralarında Scale AI CEO'su Alexandr Wang, Anthropic kurucu ortağı ve CEO'su Dario Amodei ve Elon Musk'ın da bulunduğu alanın diğer önde gelenleri, uygulamanın performansına veya başarısının sürdürülebilirliğine ilişkin şüphe duyduklarını dile getirdiler.[48][54][55] Aralarında Amazon Web Services, Toyota ve Stripe'ın da bulunduğu çeşitli şirketler bu modeli kendi programlarında kullanmak için arayış içindedir.[56]
27 Ocak 2025 tarihinde DeepSeek, sunucularının düzgün işleyişini bozan “büyük ölçekli” bir siber saldırı sonrasında yeni kullanıcı kaydını Çin anakarasındaki telefon numaraları, e-posta adresleri veya Google hesabı girişleriyle sınırlandırmıştır.[57][58]
Ayrıca bakınız
[değiştir | kaynağı değiştir]Kaynakça
[değiştir | kaynağı değiştir]- ^ Gibney, Elizabeth (23 Ocak 2025). "China's cheap, open AI model DeepSeek thrills scientists". Nature (İngilizce). doi:10.1038/d41586-025-00229-6. ISSN 1476-4687. PMID 39849139.
- ^ a b Vincent, James (28 Ocak 2025). "The DeepSeek panic reveals an AI world ready to blow". The Guardian.
- ^ Hoskins, Peter; Rahman-Jones, Imran (27 Ocak 2025). "Nvidia shares sink as Chinese AI app spooks markets". BBC (İngilizce). Erişim tarihi: 28 Ocak 2025.
- ^ a b c d Metz, Cade; Tobin, Meaghan (23 Ocak 2025). "How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants". The New York Times (İngilizce). ISSN 0362-4331. Erişim tarihi: 27 Ocak 2025.
- ^ Cosgrove, Emma (27 Ocak 2025). "DeepSeek's cheaper models and weaker chips call into question trillions in AI infrastructure spending". Business Insider.
- ^ Saran, Cliff (10 Aralık 2024). "Nvidia investigation signals widening of US and China chip war | Computer Weekly". Computer Weekly. Erişim tarihi: 27 Ocak 2025.
- ^ Sherman, Natalie (9 Aralık 2024). "Nvidia targeted by China in new chip war probe". BBC. Erişim tarihi: 27 Ocak 2025.
- ^ a b Metz, Cade (27 Ocak 2025). "What is DeepSeek? And How Is It Upending A.I.?". The New York Times (İngilizce). ISSN 0362-4331. Erişim tarihi: 27 Ocak 2025.
- ^ Field, Hayden (27 Ocak 2025). "China's DeepSeek AI dethrones ChatGPT on App Store: Here's what you should know". CNBC.
- ^ "What is DeepSeek, and why is it causing Nvidia and other stocks to slump?". www.cbsnews.com. 27 Ocak 2025.
- ^ Barrabi, Thomas (27 Ocak 2025). "Nvidia stock suffers record wipeout on DeepSeek fears – as CEO Jensen Huang's net worth tanks".
- ^ Romero, Luis E. "ChatGPT, DeepSeek, Or Llama? Meta's LeCun Says Open-Source Is The Key". Forbes.
- ^ Kerr, Dara (27 Ocak 2025). "DeepSeek hit with 'large-scale' cyber-attack after AI chatbot tops app stores". The Guardian. Erişim tarihi: 28 Ocak 2025.
- ^ "How a top Chinese AI model overcame US sanctions". MIT Technology Review (İngilizce). 24 Ocak 2025. 25 Ocak 2025 tarihinde kaynağından arşivlendi.
- ^ a b c Ottinger, Lily (9 Aralık 2024). "Deepseek: From Hedge Fund to Frontier Model Maker". ChinaTalk (İngilizce). 28 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ a b c McMorrow, Ryan; Olcott, Eleanor (9 Haziran 2024). "The Chinese quant fund-turned-AI pioneer". Financial Times. 17 Temmuz 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ Yu, Xu (17 Nisan 2023). "[Exclusive] Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says". Yicai Global (İngilizce). 31 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ a b c d e f g h Jiang, Ben; Perezi, Bien (1 Ocak 2025). "Meet DeepSeek: the Chinese start-up that is changing how AI models are trained". South China Morning Post (İngilizce). 22 Ocak 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 1 Ocak 2025.
- ^ a b Schneider, Jordan (27 Kasım 2024). "Deepseek: The Quiet Giant Leading China's AI Race". ChinaTalk (İngilizce). Erişim tarihi: 28 Aralık 2024.
- ^ a b Se, Ksenia (28 Ağustos 2024). "Inside DeepSeek Models". Turing Post (İngilizce). 18 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ "DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder". GitHub (İngilizce). 22 Ocak 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Ocak 2025.
- ^ Sharma, Shubham (1 Aralık 2023). "Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model". VentureBeat (İngilizce). 23 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ Franzen, Carl (20 Kasım 2024). "DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance". VentureBeat (İngilizce). 22 Kasım 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ Huang, Raffaele (24 Aralık 2024). "Don't Look Now, but China's AI Is Catching Up Fast". The Wall Street Journal (İngilizce). 27 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ Jiang, Ben (27 Aralık 2024). "Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products". South China Morning Post (İngilizce). 27 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ Sharma, Shubham (26 Aralık 2024). "DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch". VentureBeat (İngilizce). 27 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ Wiggers, Kyle (26 Aralık 2024). "DeepSeek's new AI model appears to be one of the best 'open' challengers yet". TechCrunch. 2 Ocak 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 31 Aralık 2024.
- ^ Shilov, Anton (27 Aralık 2024). "Chinese AI company's AI model breakthrough highlights limits of US sanctions". Tom's Hardware (İngilizce). 28 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 Aralık 2024.
- ^ a b DeepSeek-AI; Liu, Aixin; Feng, Bei; Xue, Bing; Wang, Bingxuan; Wu, Bochao; Lu, Chengda; Zhao, Chenggang; Deng, Chengqi (27 Aralık 2024), DeepSeek-V3 Technical Report, arXiv:2412.19437 $2
- ^ "Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce". GitHub (İngilizce). 21 Ocak 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Ocak 2025.
- ^ deepseek-ai/DeepSeek-R1, 28 Ocak 2025, erişim tarihi: 28 Ocak 2025
- ^ a b Sharma, Shubham (20 Ocak 2025). "Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost". VentureBeat (İngilizce). 25 Ocak 2025 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Ocak 2025.
- ^ Shao, Zhihong; Wang, Peiyi; Zhu, Qihao; Xu, Runxin; Song, Junxiao; Bi, Xiao; Zhang, Haowei; Zhang, Mingchuan; Li, Y. K. (27 Nisan 2024), DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models, arXiv:2402.03300 $2
- ^ "Sekiz soruda dünyayı sarsan yapay zeka aracı DeepSeek". euronews. 27 Ocak 2025. Erişim tarihi: 27 Ocak 2025.
- ^ "آموزش ثبتنام در دیپسیک و دسترسی رایگان به مدل DeepSeek V3". شهر بورس.
- ^ "config.json · deepseek-ai/DeepSeek-V3 at main". Hugging Face. 26 December 2024. Erişim tarihi: 28 January 2025.
- ^ "Chinese AI startup DeepSeek overtakes ChatGPT on Apple App Store". Reuters. 27 January 2025. Erişim tarihi: 27 January 2025.
- ^ Wade, David (6 Aralık 2024). "American AI has reached its Sputnik moment". The Hill (İngilizce). 8 Aralık 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Ocak 2025.
- ^ a b c Milmo, Dan; Hawkins, Amy; Booth, Robert; Kollewe, Julia (28 January 2025). "'Sputnik moment': $1tn wiped off US stocks after Chinese firm unveils AI chatbot". The Guardian.
- ^ a b c d Hoskins, Peter; Rahman-Jones, Imran (27 January 2025). "Nvidia shares sink as Chinese AI app spooks markets" (İngilizce). BBC. Erişim tarihi: 28 January 2025.
- ^ Goldman, David (27 January 2025). "What is DeepSeek, the Chinese AI startup that shook the tech world? | CNN Business" (İngilizce). CNN. Erişim tarihi: 2025-01-29.
- ^ "DeepSeek poses a challenge to Beijing as much as to Silicon Valley". The Economist. 29 January 2025. ISSN 0013-0613. Erişim tarihi: 2025-01-31.
- ^ Paul, Katie; Nellis, Stephen (30 January 2025). "Chinese state-linked accounts hyped DeepSeek AI launch ahead of US stock rout, Graphika says". Reuters. Erişim tarihi: 30 January 2025.
- ^ 澎湃新闻 (22 January 2025). "量化巨头幻方创始人梁文锋参加总理座谈会并发言,他还创办了"AI界拼多多"". Sina Corp. Erişim tarihi: 2025-01-31.
- ^ Shilov, Anton (27 December 2024). "Chinese AI company's AI model breakthrough highlights limits of US sanctions". Tom's Hardware (İngilizce). 28 December 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 28 December 2024.
- ^ "DeepSeek updates – Chinese AI chatbot sparks US market turmoil, wiping $500bn off Nvidia". BBC News (İngilizce). Erişim tarihi: 27 January 2025.
- ^ Carew, Sinéad; Cooper, Amanda; Banerjee, Ankur (27 January 2025). "DeepSeek sparks global AI selloff, Nvidia losses about $593 billion of value". Reuters.
- ^ a b Sherry, Ben (28 January 2025). "DeepSeek, Calling It 'Impressive' but Staying Skeptical". Inc. Erişim tarihi: 29 January 2025.
- ^ Okemwa, Kevin (28 January 2025). "Microsoft CEO Satya Nadella touts DeepSeek's open-source AI as "super impressive": "We should take the developments out of China very, very seriously"". Windows Central (İngilizce). Erişim tarihi: 2025-01-28.
- ^ Nazzaro, Miranda (28 January 2025). "OpenAI's Sam Altman calls DeepSeek model 'impressive'". The Hill. Erişim tarihi: 28 January 2025.
- ^ Dou, Eva; Gregg, Aaron; Zakrzewski, Cat; Tiku, Nitasha; Najmabadi, Shannon (28 January 2025). "Trump calls China's DeepSeek AI app a 'wake-up call' after tech stocks slide". The Washington Post. Erişim tarihi: 28 January 2025.
- ^ Habeshian, Sareen (28 January 2025). "Johnson bashes China on AI, Trump calls DeepSeek development "positive"". Axios.
- ^ Karaian, Jason; Rennison, Joe (27 January 2025). "China's A.I. Advances Spook Big Tech Investors on Wall Street". The New York Times.
- ^ Sharma, Manoj (6 January 2025). "Musk dismisses, Altman applauds: What leaders say on DeepSeek's disruption". Fortune India (İngilizce). Erişim tarihi: 2025-01-28.
- ^ "Elon Musk 'questions' DeepSeek's claims, suggests massive Nvidia GPU infrastructure". The Financial Express (İngilizce). 28 January 2025. Erişim tarihi: 2025-01-28.
- ^ Kim, Eugene. "Big AWS customers, including Stripe and Toyota, are hounding the cloud giant for access to DeepSeek AI models". Business Insider.
- ^ Kerr, Dara (27 January 2025). "DeepSeek hit with 'large-scale' cyber-attack after AI chatbot tops app stores". The Guardian. Erişim tarihi: 28 January 2025.
- ^ Tweedie, Steven; Altchek, Ana. "DeepSeek temporarily limited new sign-ups, citing 'large-scale malicious attacks'". Business Insider.