DeepSeek
杭州深度求索人工智能基础技术研究有限公司 | |
---|---|
Tipo | Privada |
Fundação | maio de 2023 |
Sede | Hangzhou, China |
Fundador(a) | Liang Wenfeng |
Empregados | Menos de 200 |
Área de influência | Tecnologia de informação Inteligência artificial |
Sítio oficial | deepseek |
Hangzhou DeepSeek Artificial Intelligence Co., Ltd.[1], comumente chamada de DeepSeek, (chinês:深度求索; pinyin: Shēndù Qiúsuǒ) é uma empresa chinesa de inteligência artificial especializada no desenvolvimento de modelos de linguagem de grande porte (LLMs) de código aberto. Sediada em Hangzhou, a companhia é propriedade e recebe financiamento do fundo de hedge chinês High-Flyer, cujo cofundador, Liang Wenfeng, fundou a empresa em 2023 e atualmente ocupa o cargo de CEO.[2]
O modelo DeepSeek-R1 apresentou desempenho superior em testes com modelos otimizados para processamento de imagens e análise de dados complexos, quando comparado a outros modelos de linguagem de grande porte contemporâneos, como o GPT-4 da OpenAI.[3][4] Ele foi treinado a um custo significativamente mais baixo, US$ 6 milhões, em comparação com US$ 100 milhões para o GPT-4 da OpenAI em 2023, e requer apenas um décimo da potência computacional de um LLM equivalente. Os modelos de IA da DeepSeek foram desenvolvidos em meio a sanções dos Estados Unidos contra a Índia e a China relacionadas aos chips da Nvidia, que visavam restringir a capacidade desses dois países de desenvolver sistemas avançados de IA.[5][6][7]
A DeepSeek disponibiliza seus algoritmos de inteligência artificial generativa, modelos e detalhes de treinamento como código aberto, permitindo que seu código seja livremente acessado, utilizado, modificado e adaptado para a criação de novos projetos. A empresa recruta ativamente jovens pesquisadores de IA das principais universidades chinesas e também contrata profissionais de áreas fora da ciência da computação, com o objetivo de diversificar o conhecimento e as capacidades de seus modelos.[8][9]
Histórico de lançamento
[editar | editar código-fonte]Em 2 de novembro de 2023, a DeepSeek revelou seu primeiro modelo DeepSeek Coder, que era gratuito para uso comercial e totalmente de código aberto.[10]
Em 29 de novembro de 2023, a DeepSeek lançou o DeepSeek LLM (modelo de linguagem grande), que foi dimensionado para até 67 bilhões de parâmetros. Ele foi desenvolvido para competir com outros LLMs disponíveis na época, com um desempenho próximo ao do GPT-4. No entanto, enfrentou desafios em termos de eficiência computacional e escalabilidade.[10] Uma versão de chat do modelo chamada DeepSeek Chat também foi lançada.[11]
Em maio de 2024, o DeepSeek-V2 foi lançado. O Financial Times informou que era mais barato que seus pares, com um preço de 2 RMB para cada milhão de tokens produzidos. A tabela de classificação do Tiger Lab da Universidade de Waterloo classificou o DeepSeek-V2 em sétimo lugar em sua classificação LLM.[12]
Em novembro de 2024, foi lançado o DeepSeek R1-Lite-Preview, projetado para se destacar em tarefas que exigem inferência lógica, raciocínio matemático e resolução de problemas em tempo real. A DeepSeek afirmou que superou o desempenho do OpenAI o1 em tarefas como o American Invitational Mathematics Examination (AIME) e o MATH.[13] No entanto, o The Wall Street Journal afirmou que, ao usar 15 problemas da edição de 2024 do AIME, o OpenAI o1 chegou às soluções mais rápido do que o DeepSeek R1-Lite-Preview.[14]
Em dezembro de 2024, o DeepSeek-V3 foi lançado. Veio com 671 bilhões de parâmetros e treinados em cerca de 55 dias a um custo de US$ 5,58milhões, usando significativamente menos recursos em comparação aos seus pares. Foi treinado em um conjunto de dados de 14,8 trilhões de tokens. Os testes de benchmark mostraram que ele superou o Llama 3.1 e o Qwen 2.5, ao mesmo tempo em que igualou o GPT-4o e o Claude 3.5 Sonnet.[15][16][17][18] A otimização do DeepSeek em recursos limitados destacou os potenciais limites das sanções dos EUA ao desenvolvimento da IA da China.[19][15] O custo total para treinar o modelo foi de US$ 5,58 milhões e levou cerca de dois meses para ser concluído.[15]
Em 10 de janeiro de 2025, a DeepSeek lançou seu primeiro aplicativo de chatbot, baseado no modelo DeepSeek-R1 para iOS e Android.[20] Seu lançamento acarretou em uma queda trilionária no mercado de ações,[21] em especial de empresas de tecnologia americanas e europeias, entre elas a Nvidia, que caiu em 600 bilhões de dólares em um único dia, a maior queda no mercado de ações na história.[22]
Controvérsias
[editar | editar código-fonte]Censura
Algumas fontes observaram que a versão oficial da API do R1 usa mecanismos de censura para tópicos considerados politicamente sensíveis para o governo da China. Por exemplo, o modelo se recusa a responder perguntas sobre os protestos e massacres da Praça da Paz Celestial de 1989, perseguição de uigures, comparações entre Xi Jinping e Ursinho Pooh ou direitos humanos na China.[23][24][25] A IA pode inicialmente gerar uma resposta, mas depois a exclui logo depois e a substitui por uma mensagem como: "Desculpe, isso está além do meu escopo atual. Vamos falar sobre outra coisa."[24]
Os mecanismos de censura e restrições integrados só podem ser removidos até certo ponto na versão de código aberto do modelo R1. Se os "valores socialistas essenciais" definidos pelas autoridades reguladoras da Internet chinesas forem tocados ou o status político de Taiwan for levantado, as discussões serão encerradas.[26]
Quando testado pela NBC News, o R1 do DeepSeek descreveu Taiwan como "uma parte inalienável do território da China" e declarou: "Nós nos opomos firmemente a qualquer forma de atividade separatista de 'independência de Taiwan' e estamos comprometidos em alcançar a reunificação completa da pátria por meios pacíficos."[27] Em janeiro de 2025, pesquisadores ocidentais conseguiram enganar o DeepSeek para dar respostas precisas a alguns desses tópicos, solicitando em sua resposta a troca de certas letras por números de aparência semelhante.[25]
Referências
- ↑ «DeepSeek Terms of Use». deepseek.com. 20 de janeiro de 2025. Consultado em 10 de fevereiro de 2025
- ↑ «DeepSeek: chip mais barato, autocensura, 'ameaça' aos EUA... veja perguntas e respostas sobre a IA chinesa». G1. 29 de janeiro de 2025. Consultado em 1 de fevereiro de 2025
- ↑ Vincent, James (28 de janeiro de 2025). «The DeepSeek panic reveals an AI world ready to blow». The Guardian (em inglês). ISSN 0261-3077. Consultado em 1 de fevereiro de 2025
- ↑ «آموزش ثبتنام در دیپسیک و دسترسی رایگان به مدل DeepSeek V3». شهر بورس
- ↑ «Após caso DeepSeek, EUA devem fiscalizar exportações da Nvidia com mais rigor». Valor Econômico. 30 de janeiro de 2025. Consultado em 1 de fevereiro de 2025
- ↑ Mallick, Subhrojit; Lohchab, Himanshi (16 de janeiro de 2025). «Biden admin's cap on GPU exports may hit India's AI ambitions». The Economic Times. ISSN 0013-0389. Consultado em 1 de fevereiro de 2025
- ↑ «Nvidia investigation signals widening of US and China chip war | Computer Weekly». ComputerWeekly.com (em inglês). Consultado em 1 de fevereiro de 2025
- ↑ Metz, Cade (27 de janeiro de 2025). «What to Know About DeepSeek and How It Is Upending A.I.». The New York Times (em inglês). ISSN 0362-4331. Consultado em 1 de fevereiro de 2025
- ↑ Metz, Cade; Tobin, Meaghan (23 de janeiro de 2025). «How Chinese A.I. Start-Up DeepSeek Is Competing With Silicon Valley Giants». The New York Times (em inglês). ISSN 0362-4331. Consultado em 1 de fevereiro de 2025
- ↑ a b Se, Ksenia (28 de agosto de 2024). «Inside DeepSeek Models». Turing Post (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 18 de setembro de 2024
- ↑ Sharma, Shubham (1 de dezembro de 2023). «Meet DeepSeek Chat, China's latest ChatGPT rival with a 67B model». VentureBeat (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 23 de dezembro de 2024
- ↑ McMorrow, Ryan; Olcott, Eleanor (9 de junho de 2024). «The Chinese quant fund-turned-AI pioneer». Financial Times. Consultado em 28 de dezembro de 2024. Arquivado do original em 17 de julho de 2024
- ↑ Franzen, Carl (20 de novembro de 2024). «DeepSeek's first reasoning model R1-Lite-Preview turns heads, beating OpenAI o1 performance». VentureBeat (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 22 de novembro de 2024
- ↑ Huang, Raffaele (24 de dezembro de 2024). «Don't Look Now, but China's AI Is Catching Up Fast». The Wall Street Journal (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 27 de dezembro de 2024
- ↑ a b c Jiang, Ben; Perezi, Bien (1 de janeiro de 2025). «Meet DeepSeek: the Chinese start-up that is changing how AI models are trained». South China Morning Post (em inglês)
- ↑ Jiang, Ben (27 de dezembro de 2024). «Chinese start-up DeepSeek's new AI model outperforms Meta, OpenAI products». South China Morning Post (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 27 de dezembro de 2024
- ↑ Sharma, Shubham (26 de dezembro de 2024). «DeepSeek-V3, ultra-large open-source AI, outperforms Llama and Qwen on launch». VentureBeat (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 27 de dezembro de 2024
- ↑ Wiggers, Kyle (26 de dezembro de 2024). «DeepSeek's new AI model appears to be one of the best 'open' challengers yet». TechCrunch
- ↑ Shilov, Anton (27 de dezembro de 2024). «Chinese AI company's AI model breakthrough highlights limits of US sanctions». Tom's Hardware (em inglês). Consultado em 28 de dezembro de 2024. Arquivado do original em 28 de dezembro de 2024
- ↑ «Release DeepSeek-R1 · deepseek-ai/DeepSeek-R1@23807ce». GitHub (em inglês). Consultado em 28 de janeiro de 2025
- ↑ «Empresas de tecnologia perdem US$ 1 trilhão em valor de mercado com 'ameaça' de IA chinesa». G1. 27 de janeiro de 2025. Consultado em 28 de janeiro de 2025
- ↑ Saul, Derek. «Biggest Market Loss In History: Nvidia Stock Sheds Nearly $600 Billion As DeepSeek Shakes AI Darling». Forbes (em inglês). Consultado em 28 de janeiro de 2025
- ↑ Field, Matthew; Titcomb, James (27 de janeiro de 2025). «Chinese AI has sparked a $1 trillion panic – and it doesn't care about free speech». The Daily Telegraph (em inglês). ISSN 0307-1235. Consultado em 27 de janeiro de 2025
- ↑ a b Steinschaden, Jakob (27 de janeiro de 2025). «DeepSeek: This is what live censorship looks like in the Chinese AI chatbot». Trending Topics (em inglês). Consultado em 27 de janeiro de 2025
- ↑ a b Lu, Donna (28 de janeiro de 2025). «We tried out DeepSeek. It worked well, until we asked it about Tiananmen Square and Taiwan». The Guardian (em inglês). ISSN 0261-3077. Consultado em 30 de janeiro de 2025
- ↑ «The Guardian view on a global AI race: geopolitics, innovation and the rise of chaos». The Guardian (em inglês). 26 de janeiro de 2025. ISSN 0261-3077. Consultado em 27 de janeiro de 2025
- ↑ Yang, Angela; Cui, Jasmine (27 de janeiro de 2025). «Chinese AI DeepSeek jolts Silicon Valley, giving the AI race its 'Sputnik moment'». NBC News (em inglês). Consultado em 27 de janeiro de 2025