DeepSeek
![]() | この記事は英語版の対応するページを翻訳することにより充実させることができます。(2025年1月) 翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。
|
![]() | |
現地語社名 | 杭州深度求索人工智能基础技术研究有限公司 |
---|---|
ラテン文字名 | Hangzhou DeepSeek Artificial Intelligence Co., Ltd.[1] |
業種 |
情報技術 ![]() |
設立 | 2023年5月 |
創業者 | 梁文鋒 |
本社 | |
ウェブサイト |
www |
提供元 | DeepSeek |
---|---|
種別 | チャットボット |
ウェブサイト |
chat |
開発元 | DeepSeek |
---|---|
対応OS | Android, iOS |
ライセンス | プロプライエタリ |
公式サイト |
DeepSeek(ディープシーク、簡体字: 深度求索; 拼音: Shēndù Qiúsuǒ)は、中国の人工知能研究所であり、オープンソースの大規模言語モデルを開発している。DeepSeekは、中国のヘッジファンド「幻方量化」による資金提供を主に受けており、両者とも浙江省杭州市を拠点とする梁文鋒によって設立・運営されている。
沿革
[編集]2016年2月、AI愛好家である梁文鋒が「幻方量化」を共同設立した。彼は2007~2008年の金融危機の際に浙江大学に在学しながら取引を開始していた[2]。2019年までに、彼は「幻方量化」をAI取引アルゴリズムの開発と使用に特化したヘッジファンドとして確立した。2021年までには、幻方量化は取引においてAIのみを使用するようになった[3]。
2023年4月、幻方量化は金融事業とは独立したAIツールの研究開発に専念する汎用人工知能ラボを立ち上げた[4][5]。2023年5月、幻方量化を投資家の一つとして、そのラボは「DeepSeek」という独立企業となった[3][6][5]。しかし、短期間での収益化が難しいと予想されたため、ベンチャーキャピタルは資金提供に慎重だった[3]。
2024年5月、DeepSeekは高性能かつ低価格の「DeepSeek-V2」をリリースし、中国におけるAIモデルの価格競争の引き金となった。すぐに「AI業界の拼多多」と呼ばれるようになり、ByteDance、テンセント、百度、アリババグループといった大手テクノロジー企業も同社と競うためにAIモデルの価格を引き下げ始めた。DeepSeekは低価格で提供しながらも、赤字を出している競合他社と比べて収益を上げていた[7]。
リリース履歴
[編集]DeekSeek LLM
[編集]2023年11月2日、DeepSeekは初のモデル「DeepSeek Coder」を発表した。このモデルは研究者と商業利用者の双方に無料で提供されている[8]。モデルのコードはMITライセンスのもとでオープンソース化されており、モデルそのものについては「オープンかつ責任ある下流利用」に関する追加のライセンス契約が付随している[9]。
2023年11月29日、DeepSeekはパラメータ数を67Bに拡張した「DeepSeek LLM」をリリースした[10]。このモデルは、当時の他の大規模言語モデル(LLM)と競合するために開発され、GPT-4に近い性能を目指していた[8]。しかし、計算効率やスケーラビリティにおいて課題に直面した。さらに、このモデルを基盤とするチャットボット版「DeepSeek Chat」も公開された[11]。
DeepSeek-V2
[編集]2024年5月、DeepSeek-V2がリリースされた[12]。Financial Timesによれば、同モデルの価格は100万トークンの出力あたり2人民元と、競合モデルよりも安価であると報じられた。ウォータールー大学のTiger Labが提供するリーダーボードでは、DeepSeek-V2はLLMランキングで7位にランクインした[6]。
DeepSeek-V3
[編集]2024年12月、DeepSeek-V3がリリースされた。このモデルは6710億のパラメータを持ち、約55日間の学習期間と558万米ドルの費用でトレーニングされた[5]。これは競合モデルと比較して大幅に少ないリソースで実現されている。学習データセットは14.8兆トークンに及ぶものだった。ベンチマークテストでは、Llama 3.1やQwen 2.5を上回る性能を示し、GPT-4oやClaude 3.5 Sonnetに匹敵する結果を出した[5][13][14][15]。DeepSeekが限られたリソースで最適化を実現したことは、中国のAI開発に対する米国制裁の限界を浮き彫りにした[5][16]。「The Hill」の意見記事では、このリリースを「アメリカのAIがスプートニク・モーメントに達した」と評した[17]。
このモデルは、256のルーティングエキスパートと1つの共有エキスパートを含む「Multi-head Latent Attention Transformer」によるエキスパートの混合モデルである。各トークンが370億以上のパラメータを活性化する仕組みとなっている[18]。
DeepSeek-R1
[編集]2024年11月、DeepSeek R1-Lite-Previewがリリースされた。このモデルは、論理的推論、数学的推論、およびリアルタイムの問題解決のためにトレーニングされたものである。DeepSeekは、このモデルがAmerican Invitational Mathematics Examination(AIME)やMATHといったベンチマークにおいてOpenAI o1モデルを上回る性能を示したと主張した[19]。しかし、「The Wall Street Journal」によれば、2024年版のAIMEから15問を使用したテストでは、o1モデルの方がDeepSeek R1-Lite-Previewよりも迅速に解を導き出したという[20]。
2025年1月20日[21]、DeepSeek-R1およびDeepSeek-R1-Zeroがリリースされた[22]。これらはV3-Baseを基盤としており、V4と同様に6710億の総パラメータと370億のアクティブパラメータを持つエキスパートの混合モデルである。また、「DeepSeek-R1-Distill」と呼ばれる一部のモデルもリリースされたが、これらはR1を基盤としておらず、LLaMAやQwenのような他のオープンウェイトモデルに類似しており、R1が生成した合成データでファインチューニングされている。このDeep-Seek-R1は、中国における人工知能技術の発展がすでに米国と大差ないこと、そしてLLMトークンのコストは下げ、人工知能の進歩の道はモデル規模を拡大することだけではないことを象徴している[23]。
R1-Zeroは完全に強化学習(RL)のみでトレーニングされており、教師ありファインチューニング(Supervised Fine-Tuning、SFT)は一切行われていない[24]。このモデルはGroup Relative Policy Optimization(GRPO)を使用しており、批評モデルを用いず、グループスコアから基準を推定する仕組みである[25]。報酬システムはルールベースで構成され、主に精度報酬と形式報酬の2種類から成る。
R1-Zeroの出力は可読性が低く、英語と中国語が混在する傾向があったため、R1のトレーニングを通じてこれらの問題を解決し、さらに推論能力を向上させた[24]。
評価と反応
[編集]2025年1月20日にリリースされたスマートフォン向けAIチャットアプリは、iOS版がアメリカ合衆国や日本のApp Storeの無料アプリランキングで1位を取るなど、大きな注目を集めた[26]。同月27日、DeepSeekは「大規模なサイバー攻撃」を理由に、新規利用登録の一時制限を発表した[27]。
米中貿易戦争の影響で強化された最先端AIチップなどの対中輸出規制下において、ハードウェアへのアクセスに制限がある中国企業が開発したモデルを、AIの開発競争における「マイルストーン」と評価する専門家がいる一方で[28]、DeepSeekが公表している開発情報の信憑性などに対しては、米国のAI関係者からは懐疑的な意見も聞かれた[29]。
上記のような成功を受け、DeepSeekの創業者・梁文鋒は、OpenAIのCEOに照らし合わされ、中国のサム・アルトマンと称されるようになった[30][31]。中国製AIモデルへの世界的な注目は中国国内でも話題を呼び、李強首相は梁を会談に招き「中国国民としてとても誇りに思う」と称賛している[32]。
株式市場への影響
[編集]競合のモデルに比べて低コストで開発されたというR1の公開を受けて、米国の金融市場ではAI関連株の価格が急落し[33][34]、特にNVIDIAが時価総額で失った5890億ドルは1日当たりの減少額では米国企業史上最大の暴落であり[35]、日経平均株価も大幅に下落し[36]、「DeepSeekショック」と呼ばれ[36][37][38]、米国のドナルド・トランプ大統領も米国のAI企業への「警鐘」として言及する事態となった[39]。
問題
[編集]検閲
[編集]
中国にあるサーバーで動作するR1の公式APIは、中国政府にとって政治的にセンシティブとみなされるトピックに対して検閲を行っていることが確認されている。例としては、1989年の天安門事件、ウイグル人への迫害、習近平とクマのプーさんの比較、中国の人権問題などに関する質問には答えないようになっている[40][41][42]。上記のような質問に、AIは答えを生成する場合もあるが、回答はすぐに削除され、「Sorry, that's beyond my current scope. Let's talk about something else.(申し訳ありません、それは現在私の範囲外です。別の話をしましょう。)」といったメッセージに置き換わる[41]。統合された検閲メカニズムと制限は、R1モデルのオープンソース版では限られた範囲でしか解除できない。中国のインターネット規制当局が定めた「社会主義核心価値観」に触れる場合や、台湾問題が取り上げられた場合、会話はそこで打ち切られる[43]。NBCニュースによるテストでは、DeepSeek-R1は台湾を「中国の領土の不可分の一部」であるとし、「我々はいかなる形の台湾独立分離主義活動にも断固反対し、平和的手段によって祖国の完全な統一を実現することを誓う」と述べた[44]。しかし、西側の研究者たちは、文字の置き換えなどのトリックを使うことで、いくつかの話題で正確な回答を引き出すことに成功している[42]。また、尖閣諸島が日本の領土か尋ねたところ、「中国固有の領土」とする中国側の見解による答えが返ってきたという[45]。
セキュリティとプライバシー
[編集]一部の専門家は、中国政府がAIシステムを外国への影響力行使、偽情報の拡散、監視、サイバー兵器の開発に利用する可能性があることを懸念している[46][47][48]。DeepSeekのプライバシー規約は、収集した情報を「中華人民共和国にある安全なサーバーに保存する」とし、収集対象は「テキストや音声の入力、プロンプト、アップロードされたファイル、フィードバック、チャット履歴、またはその他のコンテンツ」としている。この規約はChatGPTのそれと同等であるが[49]、WIREDはこれをセキュリティ面での懸念とした[50]。イタリアやアイルランドの当局はプライバシーへの懸念を表明しており[51]、アメリカ国家安全保障会議も安全保障上の影響を精査していると報じられた[52]。
実コストと輸出規制
[編集]機械学習研究者のネイサン・ランバートは、DeepSeekが報告したトレーニング費用500万ドルに、研究要員、インフラ、電気代などの費用が含まれておらず、過少に報告されている可能性があるとし、実際の運営コストは年間5億ドルから10億ドルに近いと試算した[53]。スケールAIのアレキサンダー・ワンCEOは、DeepSeekは米国の輸出規制への違反を隠すため、GPUの数を過少に申告していると主張した[54][55]。
脚注
[編集]- ^ “DeepSeek Terms of Use”. deepseek.com (2025年1月20日). 2025年2月11日閲覧。
- ^ “How a top Chinese AI model overcame US sanctions” (英語). MIT Technology Review (2025年1月24日). 2025年1月25日時点のオリジナルよりアーカイブ。2025年1月24日閲覧。
- ^ a b c Ottinger, Lily (2024年12月9日). “Deepseek: From Hedge Fund to Frontier Model Maker” (英語). ChinaTalk. 28 December 2024時点のオリジナルよりアーカイブ。2024年12月28日閲覧。
- ^ Yu, Xu (17 April 2023). “[Exclusive Chinese Quant Hedge Fund High-Flyer Won't Use AGI to Trade Stocks, MD Says]” (英語). Yicai Global. 31 December 2023時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ a b c d e “Meet DeepSeek: the Chinese start-up that is changing how AI models are trained” (英語). South China Morning Post (1 January 2025). 22 January 2025時点のオリジナルよりアーカイブ。1 January 2025閲覧。
- ^ a b McMorrow, Ryan; Olcott, Eleanor (9 June 2024). “The Chinese quant fund-turned-AI pioneer”. Financial Times. オリジナルの17 July 2024時点におけるアーカイブ。 28 December 2024閲覧。
- ^ Schneider, Jordan (27 November 2024). “Deepseek: The Quiet Giant Leading China's AI Race” (英語). ChinaTalk. 28 December 2024閲覧。
- ^ a b Se, Ksenia (28 August 2024). “Inside DeepSeek Models” (英語). Turing Post. 18 September 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ “DeepSeek-Coder/LICENSE-MODEL at main · deepseek-ai/DeepSeek-Coder” (英語). GitHub. 22 January 2025時点のオリジナルよりアーカイブ。2025年1月24日閲覧。
- ^ DeepSeek-AI; Bi, Xiao; Chen, Deli; Chen, Guanting; Chen, Shanhuang; Dai, Damai; Deng, Chengqi; Ding, Honghui et al. (2024-01-05), DeepSeek LLM: Scaling Open-Source Language Models with Longtermism, arXiv, doi:10.48550/arXiv.2401.02954, arXiv:2401.02954
- ^ Sharma, Shubham (1 December 2023). “Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model” (英語). VentureBeat. 23 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ DeepSeek-AI; Liu, Aixin; Feng, Bei; Wang, Bin; Wang, Bingxuan; Liu, Bo; Zhao, Chenggang; Dengr, Chengqi et al. (2024-06-19), DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model, arXiv, doi:10.48550/arXiv.2405.04434, arXiv:2405.04434
- ^ Jiang, Ben (27 December 2024). “Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products” (英語). South China Morning Post. 27 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Sharma, Shubham (26 December 2024). “DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch” (英語). VentureBeat. 27 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ “DeepSeek's new AI model appears to be one of the best 'open' challengers yet”. TechCrunch (26 December 2024). 2 January 2025時点のオリジナルよりアーカイブ。31 December 2024閲覧。
- ^ Shilov, Anton (27 December 2024). “Chinese AI company's AI model breakthrough highlights limits of US sanctions” (英語). Tom's Hardware. 28 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Wade, David (2024年12月6日). “American AI has reached its Sputnik moment” (英語). The Hill. オリジナルの8 December 2024時点におけるアーカイブ。 2025年1月25日閲覧。
- ^ DeepSeek-AI; Liu, Aixin; Feng, Bei; Xue, Bing; Wang, Bingxuan; Wu, Bochao; Lu, Chengda; Zhao, Chenggang et al. (2024-12-27), DeepSeek-V3 Technical Report, arXiv:2412.19437
- ^ Franzen, Carl (20 November 2024). “DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance” (英語). VentureBeat. 22 November 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ Huang, Raffaele (24 December 2024). “Don't Look Now, but China's AI Is Catching Up Fast” (英語). The Wall Street Journal. 27 December 2024時点のオリジナルよりアーカイブ。28 December 2024閲覧。
- ^ “Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce” (英語). GitHub. 21 January 2025時点のオリジナルよりアーカイブ。2025年1月21日閲覧。
- ^ DeepSeek-AI; Guo, Daya; Yang, Dejian; Zhang, Haowei; Song, Junxiao; Zhang, Ruoyu; Xu, Runxin; Zhu, Qihao et al. (2025-01-22), DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning, arXiv, doi:10.48550/arXiv.2501.12948, arXiv:2501.12948
- ^ “Three Takeaways from DeepSeek’s Big Week” (英語). Three Takeaways from DeepSeek’s Big Week (2025年1月29日). 2025年1月31日閲覧。
- ^ a b Sharma, Shubham (2025年1月20日). “Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost” (英語). VentureBeat. 25 January 2025時点のオリジナルよりアーカイブ。2025年1月25日閲覧。
- ^ Shao, Zhihong; Wang, Peiyi; Zhu, Qihao; Xu, Runxin; Song, Junxiao; Bi, Xiao; Zhang, Haowei; Zhang, Mingchuan et al. (2024-04-27), DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models, arXiv:2402.03300
- ^ “中華AI「DeepSeek」、日本のApp Store無料アプリランキングでも1位に ChatGPT抑える”. ITmedia AI+. 2025年2月2日閲覧。
- ^ “DeepSeek、生成AIに「サイバー攻撃」 アプリ登録制限”. 日本経済新聞 (2025年1月28日). 2025年2月2日閲覧。
- ^ “中国「ディープシーク」AIアプリが人気、米ハイテク企業の株価急落 どんなアプリなのか”. BBCニュース (2025年1月28日). 2025年2月2日閲覧。
- ^ Sherry, Ben (2025年1月28日). “AI Leaders in the U.S. React to DeepSeek, Calling It ‘Impressive’ but Staying Skeptical” (英語). Inc 2025年2月2日閲覧。
- ^ Goldman, David (2025年1月27日). “What is DeepSeek, the Chinese AI startup that shook the tech world? | CNN Business” (英語). CNN. 2025年2月2日閲覧。
- ^ “「ディープシーク」を創業した梁文鋒CEOはどんな人物なのか”. クーリエ・ジャポン. 2025年2月3日閲覧。
- ^ “「中国国民の誇り」 一躍脚光のディープシーク、創業者は李首相と会談(ロイター)”. Yahoo!ニュース. 2025年2月2日閲覧。
- ^ “DeepSeekショック、アメリカのAI株価が急落 NVIDIA17%下落”. 日本経済新聞 (2025年1月28日). 2025年1月30日閲覧。
- ^ Knight, Will (2025年1月29日). “低コストで開発、「DeepSeek」の新AIモデルを米競合各社が注視している”. WIRED.jp. 2025年1月30日閲覧。
- ^ “エヌビディア時価総額、米史上最大の5890億ドル減-DeepSeekショック”. ブルームバーグ (2025年1月27日). 2025年2月2日閲覧。
- ^ a b “日経平均が下落、DeepSeekショックで電機株が安い-銀行や内需は高い”. ブルームバーグ (2025年1月27日). 2025年2月2日閲覧。
- ^ “トランプ関税、DeepSeekショックからの回復に冷や水”. 日本経済新聞 (2025年2月1日). 2025年2月2日閲覧。
- ^ “「ディープシーク・ショック」、アジア欧州で続く 米中AI競争が焦点に”. Reuters (2025年1月28日). 2025年2月2日閲覧。
- ^ “トランプ氏、DeepSeekを評価 中国AI企業の台頭で「米企業への警鐘となるべき」”. ITmedia (2025年1月28日). 2025年2月2日閲覧。
- ^ Field, Matthew; Titcomb, James (27 January 2025). “Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech” (英語). The Daily Telegraph. ISSN 0307-1235 27 January 2025閲覧。
- ^ a b Steinschaden, Jakob (27 January 2025). “DeepSeek: This is what live censorship looks like in the Chinese AI chatbot” (英語). Trending Topics. 27 January 2025閲覧。
- ^ a b Lu, Donna (28 January 2025). “We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan” (英語). The Guardian. 30 January 2025閲覧。
- ^ “The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos” (英語). The Guardian. (26 January 2025). ISSN 0261-3077 27 January 2025閲覧。
- ^ “Chinese AI DeepSeek jolts Silicon Valley, giving the AI race its 'Sputnik moment'” (英語). NBC News (27 January 2025). 27 January 2025閲覧。
- ^ “中国AIディープシークが「尖閣は中国固有の領土」自民・小野寺氏、衆院予算委で懸念表明”. 産経新聞. (2025年1月31日) 2025年1月31日閲覧。
- ^ Kimery, Anthony (26 January 2025). “China's DeepSeek AI poses formidable cyber, data privacy threats” (英語). Biometric Update. 27 January 2025閲覧。
- ^ Booth, Robert; Milmo, Dan (2025年1月28日). “Experts urge caution over use of Chinese AI DeepSeek” (英語). The Guardian. ISSN 0261-3077 2025年1月28日閲覧。
- ^ Hornby, Rael (2025年1月28日). “DeepSeek's success has painted a huge TikTok-shaped target on its back” (英語). LaptopMag. 2025年1月28日閲覧。
- ^ “Privacy policy” (英語). Open AI. 2025年1月28日閲覧。
- ^ Burgess, Matt. “DeepSeek's Popular AI App Is Explicitly Sending US Data to China” (英語). Wired. ISSN 1059-1028 28 January 2025閲覧。.
- ^ “アイルランド当局、DeepSeekに情報提供要請-データ処理巡り懸念表明”. Bloomberg.com (2025年1月30日). 2025年1月30日閲覧。
- ^ Shalal, Andrea、Shepardson, David、Singh, Kanishka、Singh, Kanishka「ディープシーク、米が安全保障への影響精査 知財窃盗との見方も」『Reuters』2025年1月29日。2025年1月30日閲覧。
- ^ Morales, Jowi (29 January 2025). “AI research team claims to reproduce DeepSeek core technologies for $30 — relatively small R1-Zero model has remarkable problem-solving abilities”. Tom's Hardware. Yahoo!tech 30 January 2025閲覧。
- ^ Chalk, Andy (27 January 2025). “Nvidia share price plummets as it loses more than $600B in valuation, the biggest single-day loss in history”. PC Gamer 30 January 2025閲覧。
- ^ “中国製AI「DeepSeek」は検閲される? 回答できなかった5つの質問 | Forbes JAPAN 公式サイト(フォーブス ジャパン)”. forbesjapan.com. 2025年1月30日閲覧。