A IA acabou de ter seu momento de Sputnik.

O empresário Marc Andreessen fez Reivindicação ousada em xA plataforma de redes sociais anteriormente conhecida como Twitter, no domingo passado. O Vale do Silício, juntamente com o mercado de ações e as previsões on -line, está se recuperando do que a atividade de nível sísmico parece estar no espaço da IA.

A Deepseek AI, um novo modelo da IA ​​da China que subiu para o topo da Apple App Store, está enviando reverberações no Vale do Silício. Deepseek afirma que sua IA compete e, em alguns casos excedeModelo de raciocínio OpenAI O1 para uma fração de custo. Além disso, o modelo R1 da Deepseek é completamente de código aberto, o que significa que o código é acessível abertamente e qualquer pessoa pode usá -lo gratuitamente.

Um diferencial importante entre o depseek-r1 e o Openi’s O1 é que o R1 permite que você veja sua cadeia de pensamento. É uma ideia incrível de como a IA “pensa”. Você pode realmente ver isso Tentando responder a perguntas sobre a Praça Tiananmen Antes de cancelar sua resposta, no meio do caminho. Nvidia, a empresa que faz os chips que dirigem a revolução da IA, viu seu Limitação de ações 18% e perder um Registre US $ 600 bilhões Após o aumento do fim de semana Deepseek. Faz sentido. Se o que o Deepseek diz é verdadeiro, está alcançando quase o nível de O1 em lascas aparentemente mais antigas da NVIDIA, enquanto gasta uma pequena porcentagem do custo.

Os comentaristas on -line ainda estão tentando entender o surgimento repentino da Deepseek no mercado de IA. É realmente uma apresentação com um O1 a um custo menor? Até que ponto certas declarações da Deepseek e da China em relação à eficiência? Os custos vêm de importantes desbloqueios técnicos ou de outras áreas da cadeia de suprimentos da China tornam mais barato usar?

De qualquer forma, R1 é impressionante.

“Essa acessibilidade abre as portas para empresas e novas empresas menores para aproveitar a tecnologia avançada de IA que era inacessível”, disse Mel Morris, CEO da Corpus você temUm mecanismo de investigação de IA, em comunicado à CNET. Morris acrescentou que o Depseek eleva a competição aos jogadores estabelecidos da IA ​​e é provável que sua presença estimule mais rápidos avanços na tecnologia de IA, o que leva a soluções mais eficientes e acessíveis para atender à crescente demanda.

Pode ser por isso que opeai CEO cortar preços para suas mini -consultas da O3 da O3 perto de sábado.

À medida que a Big Tech joga continuamente bilhões de dólares, processamento de energia e energia na IA, o desbloqueio de eficiência da Deepseek pode ser semelhante ao tipo de salto que vimos quando os carros passavam de carburadores para sistemas de injeção de combustível. Ao contrário do OpenAI, o modelo R1 da Depseek é de código aberto, o que significa que qualquer pessoa pode usar a tecnologia. É uma ótima interrupção para o mercado, atualmente dominada pelo Openai ChatGPT e pelo Google Gemini, que estão fechadas e exigem que os usuários paguem pelo acesso total ao seu conjunto de recursos.

Na corrida entre os Estados Unidos e a China, os Estados Unidos permaneceram à frente do investimento em massa do Vale do Silício e do bloqueio do governo na Nvidia, que vende as últimas fichas da IA ​​para a China. No entanto, esse bloco poderia ter sozinho Ele incentivou a China a fazer suas próprias fichas mais rápido. O dinheiro, além do protecionismo, era visto como uma maneira de manter a China em segundo lugar, fazendo com que o mundo dependa da tecnologia americana. Essa dinâmica pode ter mudado. Agora, consumidores e empresas em todo o mundo têm acesso a um modelo de “raciocínio” de alto desempenho por uma fração de custo. Além disso, a empresa controladora da Tiktok Bytedance publicou um Modelo ainda mais barato para R1.

À medida que mercados e redes sociais reagem a novos desenvolvimentos fora da China, pode ser muito cedo para dizer que os Estados Unidos foram derrotados. Mas pelo menos, a China está atualizada.

“A China já produziu modelos de qualidade GPT-4, mas houve um atraso mais longo no tempo, pois levou um ano, um ano e meio, algo assim. Mas agora existe um modelo chinês, que pode levar apenas seis meses atrás, e acho que é uma diferença “, disse Lucas Hansen, co -fundador de CivaiUma organização sem fins lucrativos que usa software para demonstrar o que a IA é capaz. “Então, os Estados Unidos ainda têm uma vantagem, mas não é tão grande quanto anteriormente”.

Uma coisa que, sem dúvida, ajudará as empresas a acompanhar o OpenAI é a capacidade do R1 para os usuários lerem sua cadeia de pensamento. Mesmo que o R1 não obtenha todas as respostas corretas, possa ver como os motivos podem ajudar a desenvolvê -lo melhor. Como Hansen, pessoas de “choque e espanto” vêm da capacidade de ler sua cadeia de pensamentos, segundo Hansen. É o Insight OpenAI não ter acesso ao seu modelo O1, já que ocultar o molho secreto mantém as pessoas desembolsando um custo mensal de assinatura para acesso.

Mesmo assim, há um nível de ceticismo que deve ser tomado com a taxa de custo / desempenho de R1. Ele Livro branco que Deepseek publicou teve mais de 100 co -autores. Essa é uma grande quantidade de capacidade intelectual de treinar uma IA pelo baixo custo de US $ 5,5 milhões. Esse custo de US $ 5,5 milhões pode ser os custos de energia para treinar o modelo, exceto salários individuais de todos os pesquisadores, mas a China não foi completamente transparente sobre como calculou esses custos de energia. O custo de configurar um data center na China provavelmente difere de uma configuração nos Estados Unidos. E é incerto se os custos foram subsidiados por um fornecedor de nuvem ou pelo próprio governo chinês, segundo Hansen.

Também há ceticismo nos chips depseek usados ​​para treinar seu modelo. A empresa é realmente Uso de chips NVIDIA A100 e H800 ou é China acessar as últimas fichas H100 através de outras mídiasComo disse Alexandr Wang, CEO da Scale AI.

Mesmo se tomarmos esse valor de US $ 5,5 milhões como uma estimativa altamente conservadora, ela permanece significativamente menor que o Custo de US $ 100 milhões para treinar GPT-4O modelo de negócios anterior. Operai não publicou números sobre o que custa para construir O1, mas, dado seu custo de token muito mais alto para os clientes, provavelmente era mais caro.

“Com o carregamento do data center nos Estados Unidos que deve ser dobrado ou triplicado até 2030, qualquer economia de eficiência pode ter um impacto significativo”, disse Mark James, diretor interino do Instituto Energético e da Lei do Meio Ambiente de Vermont e graduação Escola em comunicado. Já, Os lucros estão sendo enfatizados por altas demandas de energia da IA. Se as declarações de Deepseek estiverem corretas, a possível carga de eletricidade poderá ser iluminada em grande parte, aliviando o estresse nos consumidores e no meio ambiente. “Por outro lado”, disse James, “modelos mais eficientes poderiam desbloquear ainda mais crescimento no setor, o que mitigaria a economia de eficiência e exacerbaria o estresse em nossa rede”.

Afirma que os Estados Unidos têm perdeu a guerra da IA Pode ser prematuro. Pelo menos, a paisagem tornou -se instantaneamente mais competitiva e há espaço para inovação contínua. Deepseek não significa que o mundo esteja no precipício de alcançar a inteligência geral artificial, ou a IA super avançada que é mais inteligente que os seres humanos e pode se ensinar.

“Não acho que o Depseek feche um milímetro mais próximo da inteligência geral artificial (AGI), mas acho que isso nos aproxima do modelo de linguagem comercialmente viável (LLM) que é fantástico”, disse ele “, disse ele”, disse ele. “Ele disse”, disse ele “, disse ele Ben Goertzel CEO da Aliança de Superintelligência Artificial (ASI) e o fundador de Singularidade. O Deepseek ainda tem as mesmas limitações cognitivas que outros modelos de IA. Apesar disso, as eficiências de Deepseek poderiam democratizar ainda mais a IA.