A indústria técnica está cheia de metáforas relacionadas à corrida espacial original. Dele favorito É um tiro na luaum termo relacionado a Qualquer obrigação de ambição atípica. Mas o lançamento chinês da edição Deepseeka dos modelos de IA explica Este pode ser um par GPT-O1 aberto—Pit foi criado em barato, sem acesso às melhores fichas da Nvidia – ele tem todos Voltar ao original de 1957 Um momento de Sputnik Como um ponto de comparação.

De alguma forma, levou a maioria das pessoas por semana para prestar atenção ao R1 da Deepseek, que a empresa publicou em 20 de janeiro. Uma vez que ela fez, ela lançou eNSTA-FRAN cujas ondas impressionantes variaram de tecnológicas a geopolíticas. Inclua um Espancamento de ações Para a Nvidia e outras rendas, novas perguntas sobre se são enormes recursos realmente dê uma vantagem Finalmente, na IA, e chocante que um governo Biden proibiria as fichas mais poderosas dos Estados Unidos no cinema não impediram que os pesquisadores desse país fizessem talvez um avanço de época com as coisas que tinham em mãos.

A repentina influência de Deepseek tem uma semelhança indiscutível com o pânico há mais de 67 anos, quando a URSS colocou um satélite com sucesso na órbita antes de fazê -lo. Mas como ex -diretor de Reddita Yishan Wong apontou No post desta semana, há paralelos superficiais. Primeiro de tudo, os soviéticos trabalharam em profundo sigilo. O oposto, Deepseek é Código de publicação e pesquisa Refere -se a suas técnicas para criar IA, o que ganha mais com menos. Dá ao mundo inteiro a oportunidade Atualize rapidamente para o que a empresa criouA aceleração potencial de IA -use em todos os lugares, em vez de preservar uma vantagem competitiva assustadora para uma empresa ou país.

Certamente, o súbito conforto da IA ​​poderia ter profundas consequências em um punhado de poderosas empresas americanas que lançaram a tecnologia até agora. Mas, embora os detalhes e o tempo de tal ponto da dobra fossem imprevisíveis, sua inevitabilidade não era. Por exemplo, um documento interno do Google vazou no início de 2023 Intitulado “Não temos uma vala, nem está aberto”. Ou, como disse o diretor executivo da Microsoft Satya Nadella, quando conversei com ele no final daquele ano, “no que me diz respeito, os primeiros guias de tecnologia não são importantes”.

O R1 de Deepseek – e outras tecnologias de IA modeladas em sua abordagem – posso forçar bem os gigantes atuais da IA ​​a reconsiderar tudo sobre o futuro deles. Ainda assim, dificilmente é o jogo final para a indústria da maneira que sabíamos. A inteligência artificial não está nem perto de uma parede perpetuadora que impeça o progresso adicional, e é difícil imaginar que empresas com enormes recursos não serão capazes de desbloquear alguns dos precursores que não podem fazer isso com maiores limitações.

Mais importante ainda, as melhorias vertiginosas que vimos nos LLMs nos últimos anos ainda precisam reconciliar a IA no mundo real nas aplicações que usamos. Como a novidade generativa da IA ​​-OH se desgastou, ferramentas como o co -pilot da Microsoft se parecem rascunhos rudes e brutos de algo que precisa de mais ingenuidade para cumprir seu potencial. O trabalho de conectar a IA a todos os processos que usamos para fazer as coisas mal começou, e muito dinheiro precisa fazer com que as empresas consigam isso.

É um fato que está por trás da obsessão da indústria do chamado agente AI-O-AI-AID desagradável que cobre as formas de tecnologia que podem executar tarefas complexas sem controle humano constante. Existem algumas facadas decentes na idéia do lado de fora, como os “companheiros de equipe da AI” da Asan, que já mudaram alguns dos grunhidos da interrupção das tarefas no aplicativo de gerenciamento de projetos. Mas esses exemplos são superados com casos de agente AI que provam principalmente que a tecnologia não está pronta para fazer muito por conta própria.

Na semana passada, por exemplo, openii postou Operador“Revisão da pesquisa” disponível para usuários de seus 200 USD por mês Chatgpt Pro -Tier. O operador pode se inscrever no navegador da web e controlar o cursor do mouse, o primeiro passo teórico para permitir lidar com todas as tarefas que as pessoas realizam na web. Em PlataformaCasey Newton relatou sua experiência prática com um serviço, que incluía e solicitando tarefas como escrever um plano de lição no ensino médio para Grande Gatsby. Demorou alguns minutos para alcançar resultados que não eram melhores do que o ChatGPT não indiferente criou quase imediatamente. E quando Newton tentou usar o operador para encomendar mantimentos – algo que o Chatbot compartilha não poderia fazer -, a versão atual do operador era bastante sem esperança no trabalho.

Em dezembro, recebi uma demonstração do agente experimental do Google, a AI, “Project Mariner”, que também incluía encomendar produtos alimentícios e era uma disputa glacial demais para parecer progresso. Esse operador e marinheiro ainda não estão prontos para lidar com uma tarefa modesta, como comprar um litro de leite, não é uma prova de que os exercícios estejam em futilidade – apenas que o objetivo é usar um agente útil, permanece em grande parte aspiração, mesmo no Openi e Google.

Deepseek e outros envios da otimização do LLM que ainda não virão não interferirão no desenvolvimento adicional do agente AI. De fato, eles certamente ajudarão sendo a infraestrutura básica mais acessível a pessoas maiores com boas idéias. Mesmo assim, os chefões da AI americanos manterão algumas vantagens diferentes, de talentos de dinheiro e engenharia que podem realizar os desafios de amanhã à sua capacidade de comercializar novos produtos em base de clientes grandes e estabelecidos. Talvez a chegada do Deepseek-R1 indique um ponto de virada para essas empresas. Mas apenas o fracasso da imaginação pereceria irrelevante.

