DeepSeek IA

Ascensão Disruptiva da DeepSeek na Arena da IA

DeepSeek, um laboratório chinês de IA, ganhou recentemente atenção significativa, liderando as paradas da loja de aplicativos e gerando discussões sobre a corrida global de IA. Apoiados pela High-Flyer Capital Management, os modelos de IA da DeepSeek, desenvolvidos com técnicas de computação eficientes, estão levando os analistas a questionar o domínio dos EUA na IA e a sustentabilidade da demanda por chips de IA.

De Hedge Fund a Inovadora em IA

Fundada pelo entusiasta de IA Liang Wenfeng, a High-Flyer Capital Management inicialmente se concentrou em algoritmos de negociação orientados por IA. Em 2023, a DeepSeek surgiu como um laboratório separado dedicado à pesquisa de IA, eventualmente se tornando sua própria empresa. Apesar de enfrentar desafios como proibições de exportação de hardware dos EUA, a DeepSeek construiu seus próprios data centers para treinamento de modelos, utilizando chips Nvidia H800.

A equipe da DeepSeek é conhecida por ser jovem e recrutar agressivamente os melhores pesquisadores de IA de universidades chinesas. Eles também contratam indivíduos de diversas origens para ampliar a compreensão de sua IA em vários assuntos.

Avanços do Modelo DeepSeek

A empresa revelou seus modelos iniciais em novembro de 2023, mas foi a família DeepSeek-V2 que realmente chamou a atenção da indústria de IA. O DeepSeek-V2 se destacou em benchmarks de IA e foi notavelmente econômico, pressionando concorrentes como ByteDance e Alibaba a baixar seus preços de modelo.

O DeepSeek-V3, lançado em dezembro de 2024, solidificou ainda mais a reputação da DeepSeek. Testes internos sugerem que o DeepSeek V3 supera modelos de código aberto como o Llama do Meta e modelos fechados como o GPT-4o do OpenAI. Além disso, o modelo de "raciocínio" R1 do DeepSeek demonstra desempenho comparável ao modelo o1 do OpenAI, destacando-se na verificação de fatos e confiabilidade.

Preocupações e Implicações

No entanto, como uma IA desenvolvida na China, a DeepSeek está sujeita à regulamentação de conteúdo, garantindo que suas respostas estejam alinhadas com os "valores socialistas essenciais". Isso levanta preocupações sobre potencial censura e viés. Embora o modelo de negócios da DeepSeek permaneça um tanto obscuro, sua competitividade de custos e licenciamento permissivo atraíram uma grande base de desenvolvedores, com modelos derivados ganhando milhões de downloads.

A rápida ascensão da DeepSeek interrompeu o cenário da IA, impactando o preço das ações da Nvidia e provocando respostas do CEO da OpenAI, Sam Altman. Embora algumas entidades estejam banindo a DeepSeek devido a preocupações de segurança e controle estatal percebido, outras, como a Microsoft, estão integrando sua tecnologia. O governo dos EUA também está considerando banir a DeepSeek em dispositivos governamentais. O futuro da DeepSeek permanece incerto, mas seus modelos inovadores e impacto na indústria de IA são inegáveis.

Source: TechCrunch