Há alguns dias, ele só ouvia nerds nervosos (digo isso como um) Busca profundao ramo chinês da IA ​​​​também evocativamente chamada Gestão de capital de números elevadosuma empresa de análise quantitativa (ou quant) que foi inicialmente lançada em 2015.

Porém, nos últimos dias, provavelmente se discutiu sobre a empresa no Vale do Silício. Isso se deve em grande parte ao lançamento do Deepseek R1, um novo modelo de linguagem grande que executa “raciocínio” de maneira muito semelhante ao modelo atual da OpenAi, o melhor disponível O1 – levando mais segundos ou minutos para responder a perguntas difíceis e resolver problemas complexos à medida que reflete sobre seus próprios passos. análise passo a passo ou “cadeia de pensamento”.

Não apenas isso, mas o DeepSeek R1 obteve pontuação tão alta ou superior ao O1 da OpenAi em vários benchmarks de terceiros (testes para medir o desempenho da IA ​​ao responder perguntas sobre uma variedade de tópicos) e foi supostamente Construído por uma fração do custo (supostamente cerca de US$ 5 milhões) com muito menos unidades de processamento gráfico (GPUs) sob o estrito embargo imposto pelos EUA, território da OpenAi.

Mas, ao contrário do O1, que está disponível apenas para assinantes pagantes do chatgpt plus tier (US$ 20 por mês) e níveis mais caros (como Pro por US$ 200 por mês), o DeepSeek R1 lançou Ele rapidamente subiu nas classificações da comunidade de código de IA, abraçando os rostos dos modelos mais espalhados e ativos.

Além disso, graças ao fato de ser totalmente de código aberto, as pessoas já refinaram e treinaram muitas variações múltiplas do modelo para diferentes finalidades específicas de tarefas, como torná-lo pequeno o suficiente para ser executado em um dispositivo móvel ou combiná-lo com outros aplicativos abertos. modelos de origem. Mesmo se você quiser usá-lo para fins de desenvolvimento, os custos da API do DeepSeek são mais de 90% mais baratos que o modelo O1 equivalente da OpenAi.

O mais impressionante de tudo é que você nem precisa ser um engenheiro de software para usá-lo: DeepSeek Site grátis e Aplicativo móvel mesmo para nós, usuários com uma interface de chatbot no R1 muito semelhante ao chatgpt do OpenAi. Exceto, mais uma vez, DeepSeek Undercut ou “Mogged” OpenAi conectando este poderoso modelo de raciocínio à pesquisa na web – algo que o OpenAi ainda não fez (a pesquisa na web está atualmente disponível apenas na família de modelos GPT menos poderosa).

Ironia aberta e fechada

Há uma ironia bastante deliciosa, ou talvez perturbadora, nisso, dados os objetivos fundadores da OpenAi de democratizar a IA para as massas. Como O gerente sênior de pesquisa da NVIDIA, Jim Fan, colocou isso em x: “Vivemos em uma linha do tempo em que uma empresa fora dos EUA mantém a missão original da OpenAi – pesquisa de fronteira verdadeiramente aberta que permite tudo. Não faz sentido. O resultado mais popular é o mais provável. “

Ou como Usuário X @suspedEdRoBotreferenciando relatórios que DeepSeek parece estar treinado Sobre o resultado da resposta e outros dados gerados pelo chatgpt: “OpenAi roubou de toda a Internet para ficar mais rico, Deepseek os roubou e os devolveu às massas de graça, acho que há um certo povo britânico sobre isso”

Mas Fan não foi o único que sentou e percebeu o sucesso do DeepSeek. A disponibilidade do DeepSeek R1 de código aberto, seu alto desempenho e o fato de que aparentemente “surgiu do nada” para desafiar o ex-líder da IA ​​generativa enviou ondas de choque por todo o Vale do Silício e muito além, com base em minhas conversas e leituras de vários engenheiros, pensadores e líderes. Caso contrário, “todos” são pagos por causa do que meu título hiperbólico sugere, é certamente o assunto da cidade nos círculos de tecnologia e negócios.

E Uma mensagem publicada para cegosO aplicativo anônimo de compartilhamento de fofocas do Vale do Silício circulou sugerindo que o Meta está em crise devido ao sucesso do Deepseek, pois rapidamente eclipsou os próprios esforços do Meta para ser o rei da IA ​​de código aberto com seus modelos Llama.

‘Isso muda todo o jogo’

Usuário X @tphuang escreveu de forma persuasiva: “Deepseek tornou a IA comoditizada além do mais sofisticado. Momento leve para mim na primeira foto. R1 é tão mais barato que os custos trabalhistas dos EUA que muitos empregos serão automatizados nos próximos 5 anos “,” mais tarde percebendo Por que o R1 da Deepseek está recebendo mais usuários do que o O1 da OpenAi:

“3 grandes questões sem o1:

1) muito lento

2) Muito caro

3) Falta de controle/confiança do usuário final no OpenAi

R1 resolve todos eles. A empresa pode comprar suas próprias GPUs NVIDIA e rodar esses modelos. Você não precisa se preocupar com custos extras ou servidores abertos lentos/que não respondem”

@tphaung também fez uma pose analogia persuasiva como uma pergunta: “O Deepseek será o LLM que o Android se tornou o OS World?”

O empresário da web Arnaud Bertrand não mediu palavras sobre as implicações surpreendentes do sucesso do Deepseek, Escrevendo para x: “Não há como exagerar o quão profundamente isso muda todo o jogo. E não apenas sobre a IA, é também uma enorme acusação à tentativa equivocada dos EUA de travar o desenvolvimento tecnológico da China, sem a qual o DeepSeek poderia não ter sido possível (como diz o ditado, a necessidade é a mãe da invenção). “

A questão da censura

No entanto, outros pareceram cautelosos sobre a rápida ascensão da DeepSeek, argumentando que, como uma startup que operava fora da China, estava necessariamente sujeita a leis e exigências de censura de conteúdo.

Na verdade, meu próprio uso do Deepseek no aplicativo iOS aqui nos EUA revelou Não responda perguntas sobre a Praça Tiananmenlocal de protestos e revoltas estudantis pró-democracia em 1989, e da subsequente repressão violenta por parte do exército chinês, resultando em pelo menos 200, possivelmente milhares de mortesganhando o apelido “Massacre da Praça Tiananmen“Na mídia ocidental.

Ben Hylak, ex-designer de interface humana da Apple e cofundador da plataforma AI Analytics da Dawn, postou no X How Uma pergunta sobre este tópico fez com que o DeepSeek R1 entrasse em loop.

Como membro da imprensa, é claro que levo muito a sério a liberdade de expressão e de expressão e esta é provavelmente uma das causas mais fundamentais e inquestionáveis ​​do I Champion.

No entanto, eu seria negligente se não observasse que os modelos e produtos OpenAi, incluindo chatgpt, também se recusam a responder a uma série de perguntas até mesmo sobre conteúdo inócuo – especialmente aqueles relacionados à sexualidade humana e assuntos eróticos/adultos, NSFW .

Não é uma comparação igual, é claro. E haverá alguns para quem a resistência em confiar em tecnologia estrangeira os torna céticos quanto ao valor e utilidade finais do Deepseek. Mas seu desempenho e baixo custo não podem ser negados.

E na hora em que China importa 16,5% de todos os produtos americanosé difícil para mim alertar contra o uso do DeepSeek R1 com base em preocupações de censura ou riscos de segurança – especialmente quando o código do modelo está disponível gratuitamente para download, download offline, uso do dispositivo em ambientes seguros e ajuste à vontade.

Estou definitivamente detectando alguma crise existencial sobre a “Queda do Ocidente” e a “Ascensão da China”, motivando algumas discussões animadas em torno do Deepseek, e outros já a vincularam aNossos usuários aderiram ao aplicativo Xiaohongshu (também conhecido como “Pequeno Livro Vermelho”) Quando o Tiktok foi brevemente banido neste país, só para nos maravilharmos com a qualidade de vida na China mostrada nos vídeos de lá. A chegada do Deepseek R1 ocorre neste contexto narrativo – aquele em que a China aparece (e por muitas métricas é claramente) Ascendente, enquanto os EUA aparecem (e por muitas métricas) em declínio.

O primeiro, mas dificilmente o último, modelo chinês de IA que abalou o mundo

Nem será o último modelo chinês de IA a ameaçar o domínio dos gigantes do Vale do Silício – mesmo que eles, como a OpenAi, angariem mais dinheiro do que nunca para as suas ambições de desenvolver inteligência artificial geral (AGI), programas que superam os humanos na maioria dos casos. trabalho economicamente valioso.

Ainda ontem, outro modelo chinês da empresa controladora de Tiktok, ByTottance – chamado Doubao-1.5-pro -Foi publicado com desempenho correspondente ao modelo GPT-4O da OpenAi em benchmarks de terceiros, mas Novamente, a 1/50 do custo.

Os modelos chineses ficaram tão bons e tão rápido que até mesmo quem está fora da indústria de tecnologia está prestando atenção: Economista A revista acaba de publicar um artigo sobre o sucesso do Deepseek e aquele outro esforço chinês de IA e comentarista político Matt Bruenig postou no X sim: “Tenho usado Gemini, chatgpt e Claude extensivamente para resumo de documentos NLRB há quase um ano. Deepseek é melhor que todos eles. A versão CHATBOT é gratuita. O preço de utilização da API é 99,5% inferior ao preço da API OpenAi. (aceno Emoji) ”

Como o OpenAi reage?

Não é de admirar que o cofundador e CEO da OpenAi, Sam Altman Hoje ela disse que a empresa trouxe sua família Model Model, O3, ainda lançada, para o chatgpt, mesmo para usuários gratuitos. A OpenAi ainda parece estar trilhando seu próprio caminho com modelos mais proprietários e avançados – estabelecendo o padrão da indústria.

Mas a questão é: com Deepseek, Bytendan e outras empresas chinesas de IA em seu encalço, por quanto tempo a OpenAi poderá permanecer na liderança na construção e lançamento de novos modelos de IA de ponta? E se e quando ele cair, quão difícil será e quanto tempo durará sua queda?

OpenAi, entretanto, tem outro precedente histórico. Se o DeepSeek e os modelos de IA da China realmente se tornarem LLMS como o Android de código aberto do Google fez em dispositivos móveis – por um tempo ocupando a maior parte do mercado – você só precisa ver como o Apple iPhone com seu Home Access bloqueado, proprietário e completo conseguiu conquistar o mercado definitivo e a partir daí ele se espalha continuamente para baixoespecialmente nos EUA, na medida em que já detém quase 60% do mercado nacional de smartphones.

No entanto, para que todos eles gastem muito dinheiro para usar modelos de IA dos principais laboratórios, o DeepSeek mostra que os mesmos recursos poderiam estar disponíveis por um preço muito mais barato e com muito mais controle. E em um ambiente empresarial, isso pode ser suficiente para ganhar a bola.