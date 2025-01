Participe de nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saiba mais

Se você ainda não ouviu, há uma nova estrela da IA ​​na cidade: DeepSeeksubsidiária da empresa de análise quantitativa (quant) de Hong Kong High-Flyer Capital Management, enviou ondas de choque por todo o Vale do Silício e pelo mundo em geral com o lançamento no início desta semana de um novo modelo de raciocínio de código aberto em grande escala, DeepSeek R1, que corresponde ao mais modelo poderoso disponível o1 — e por uma fração do preço para usuários e para a própria empresa (durante o treinamento).

Embora o surgimento do DeepSeek R1 já tenha remodelado o mercado consistentemente confuso, em rápida evolução e intensamente competitivo para novos modelos de IA – nos meses anteriores, a OpenAI lutou com a Anthropica e o Google pelos modelos proprietários mais poderosos disponíveis, enquanto as Meta Platforms frequentemente surgiu com concorrentes de código aberto “suficientemente próximos” – a diferença desta vez é que a empresa por trás do modelo quente está sediada na China, geopoliticamente “inimigo”dos EUA, cujo setor tecnológico até então era amplamente considerado inferior ao do Vale do Silício.

Como tal, causou não falta de angústia e existencialismo por parte dos técnicos americanos e ocidentais, que de repente suspeitaram da OpenAI e da estratégia geral da grande tecnologia de gastar mais dinheiro e mais computadores (unidades de processamento gráfico, GPUs, chips de jogos poderosos geralmente usados para treinar modelos de IA) para o problema de inventar modelos cada vez mais poderosos.

Ainda assim, alguns líderes tecnológicos ocidentais tiveram uma resposta pública amplamente positiva à rápida ascensão do DeepSeek.

Marc Andreessen, co-inventor do pioneiro navegador Mosaic, cofundador da empresa de navegadores Netscape e atual sócio geral da famosa Andreessen Horowitz (a16z) empresa de capital de risco, publicado no X hoje: “Deepseek R1 é uma das descobertas mais incríveis e impressionantes que já vi – e como código aberto, um grande presente para o mundo (emoji de robô, emoji de olá).”

Yann LeCun, Cientista Chefe de Inteligência Artificial da divisão Fundamental AI Research (FAIR) da Meta, postou em seu Conta do LinkedIn:

“Para as pessoas que veem o desempenho do DeepSeek e pensam:

‘A China supera os EUA em IA.’

Você está lendo isso errado.

A leitura correta é:

‘Os modelos de código aberto superam os proprietários.’

DeepSeek se beneficiou de pesquisa aberta e código aberto (por exemplo, PyTorch e Llama da Meta)

Eles tiveram novas ideias e as construíram com base no trabalho de outras pessoas.

Como seu trabalho é publicado e de código aberto, qualquer pessoa pode lucrar com isso.

Esse é o poder da pesquisa aberta e do código aberto.”

Até mesmo Mark “Zuck” Zuckerberg, fundador e CEO da Meta AI, parece ter tentado conter a ascensão do DeepSeek com seu própria postagem no Facebook prometendo que a nova versão da família Llama de modelos de IA de código aberto do Facebook será um “modelo de última geração” quando for lançada este ano. Como ele colocou:

“Este será um ano decisivo para a IA. Espero que em 2025, Meta AI seja o principal assistente atendendo a mais de 1 bilhão de pessoas, o Llama 4 se torne o principal modelo de ponta e construiremos um engenheiro de IA que começará a contribuir cada vez mais com código para nossa pesquisa e esforços de desenvolvimento. Para impulsionar isso, a Meta está construindo um data center de 2 GW+ grande o suficiente para cobrir uma parte significativa de Manhattan. Colocaremos cerca de 1 GW de computação online em 25 e terminaremos o ano com mais de 1,3 milhão de GPUs. Planejamos investir US$ 60-65 bilhões em investimentos de capital este ano, ao mesmo tempo em que aumentamos significativamente nossas equipes de IA, e temos o capital para continuar investindo nos próximos anos. Este é um esforço enorme e, nos próximos anos, impulsionará os nossos principais produtos e negócios, desbloqueará inovações históricas e ampliará a liderança tecnológica da América. Vamos construir!“

Ele até compartilhou um gráfico mostrando o data center de 2 gigawatts mencionado em sua postagem em Manhattan:

É claro que, embora esteja comprometido com a IA de código aberto, Zuck não está convencido de que a abordagem do DeepSeek de otimizar a eficiência usando muito menos GPUs do que os grandes laboratórios seja adequada para o Meta ou para o futuro da IA.

Mas com as empresas dos EUA a levantar e/ou a gastar somas recordes em novas infra-estruturas de IA que muitos especialistas notaram que estão a perder rapidamente valor (devido aos avanços de hardware/chip e software), permanece a questão de saber qual a visão do futuro que acabará por vencer e se tornar a fornecedor dominante de IA – e para o mundo. Ou talvez sejam sempre mais modelos com menos participação de mercado? Fique ligado enquanto esta competição fica mais próxima e mais forte do que nunca.