Deepseek
Deepseek Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd | |
![]() | |
Typ | Icke börsnoterat aktiebolag |
---|---|
Säte | ![]() |
Huvudkontor | Hangzhou |
Nyckelpersoner | Liang Wenfeng, vd |
Bransch | AI-teknik |
Produkter | stora språkmodeller, textrobot |
Historik | |
Grundat | Maj 2023 |
Grundare | Liang Wenfeng |
Struktur | |
Moderbolag | High-Flyer |
Deepseek (kinesiska: 深度求索) är ett kinesiskt AI-företag, vilket grundades 2023 och ägs av det kinesiska hedgefond- och AI-företaget High-Flyer. Deepseek lanserade i januari 2025 textroboten ”Deepseek” som en gratis nedladdningsbar app på webbutikerna Apple Store och Google Play på mobiltelefoner och surfplattor.
Deepseek, som är baserat i Hangzhou i provinsen Zhejiang, arbetar med generativ artificiell intelligens och utvecklar stora språkmodeller (LLM:er), vilka baseras på öppen källkod.
Bakom Deepseek står den kinesiske datoringenjören och entreprenören Liang Wenfeng, som är medgrundare till High-Flyer och grundare av och ledare för Deepseek, som han började arbeta med som ett privat projekt vid sidan av sitt engagemang som chef för High-Flyer.
Deepseeks textrobot är en liknande AI-tjänst som de tidigare lanserade Chat GPT, Microsoft Copilot, Gemini och Le Chat, vilka alla bygger på stora språkmodeller. Deepseeks stora språkmodell kallas Deepseek-R1, vilken offentliggjordes i en första upplaga i november 2024 och lanserades den 20 januari 2025.
Historik
[redigera | redigera wikitext]Deepseek har sitt ursprung i utveckling av algoritmstyrd aktieförvaltning av Liang Wenfeng och studiekamrater till honom, framför allt från 2016 inom hedgefonden High-Flyer. Efterhand använde sig fonden mer och mer av artificiell intelligens i sitt arbete, och 2021 tog dess chef Liang Wenfeng detta vidare genom att vid sidan om experimentera med djupinlärning och att utveckla stora språkmodeller. För detta ändamål inköptes 10 000 GPU-mikroprocessorer av typ Nvidia A100 för en superdator innan USA införde restriktioner för export av avancerade mikroprocessorer till Kina.[1] Detta möjliggjorde för Deepseek att utveckla stora språkmodeller. Företaget Deepseek grundades 2023 med kapital från High-Flyer.
Under 2024 lanserades den stora språkmodellen Deepseek-V2. I januari 2025 lanserades Deepseek-R1, vilken fick stor uppmärksamhet och åstadkom ett betydande ras på börsen för framför allt chip-tillverkaren Nvidia,[2][3] Skälet till detta var att Deepseek kunnat visa att stora språkmodeller kunde tränas med användning av mindre datorresurser än vad som till dess ansetts möjligt, vilket innebär avsevärt lägre kostnader för att ta fram dessa språkmodeller.[4]
Se också
[redigera | redigera wikitext]Källor
[redigera | redigera wikitext]Noter
[redigera | redigera wikitext]- ^ Cosmia_Nebula (2024-11-29) (på engelska). Two interviews with the founder of DeepSeek. https://www.lesswrong.com/posts/kANyEjDDFWkhSKbcK/two-interviews-with-the-founder-of-deepseek. Läst 31 januari 2025.
- ^ Jeffery, Björn (30 januari 2025). ”Tagna på sängen – nu ska USA slå tillbaka | Björn Jeffery”. Svenska Dagbladet. ISSN 1101-2412. https://www.svd.se/a/OoXpPb/silicon-valley-blir-tagna-pa-sangen-av-kinesiska-deepseek. Läst 31 januari 2025.
- ^ ”Chinese AI DeepSeek's Assistant Tops ChatGPT on US Apple App Store” (på engelska). The Express Tribune. 27 January 2025. https://tribune.com.pk/story/2524765/chinese-start-up-deepseek-stuns-silicon-valley-with-cutting-edge-ai-model.
- ^ ”DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1”. GitHub. https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf.
Externa länkar
[redigera | redigera wikitext]
|