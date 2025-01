Participe de nossos boletins diários e semanais para obter as atualizações mais recentes e o conteúdo exclusivo sobre a principal cobertura da IA. Descubra mais

Sistemas cerebrais Anunciado hoje para sediar o avanço de Deepseek R1 Modelo de Inteligência Artificial nos servidores dos EUAVelocidade promissora até 57 vezes mais rápida que a solução baseada em GPU, mantendo dados sensíveis dentro das fronteiras dos EUA. Esse movimento ocorre devido à crescente preocupação devido à rápida progressão e privacidade dos dados na China.

Startup AI Chip instalará uma versão de parâmetro de 70 bilhões de bilhões Deepseek-r1 Executando o hardware do VAFLA do proprietário, entregando 1.600 tokens por segundo que é uma melhoria dramática em comparação com a implementação tradicional da GPU que lutou com os recentes modelos de IA de “ressonância”.

O tempo da resistência para várias plataformas de IA, medido em segundos até a geração do primeiro token. O Cerebras lidera com o menor atraso em 0,18 segundos, enquanto a plataforma Amazon leva quase um segundo completo para responder. (Crédito: análise artificial)

Por que os modelos Deepseek rezonizando estão remodelando a IA da empresa

“Esses modelos de explicação afetam a economia”, disse James Wang, CEO sênior do Cerebras, em uma entrevista exclusiva ao VentureBeat. “Qualquer trabalhador do conhecimento basicamente deve executar alguns tipos de tarefas cognitivas em várias etapas. E esses modelos de explicações serão ferramentas que entram em seu trabalho em seu trabalho. “

O anúncio segue uma semana tumultuada em que a aparência de Deepseek foi lançada pela NVIDIA A maior perda de valor de mercado, quase US $ 600 bilhõesFazendo perguntas sobre o chip gigante sobre -humano da IA. A solução do Cerebras resolve diretamente dois problemas principais que surgiram: os requisitos do computador de modelos de IA avançados e soberania de dados.

“Se você usar API de DeepseekO que é muito popular no momento, que os dados são enviados diretamente ao cinema “, explicou Wang”.

À medida que a tecnologia Waffle da Cerebras ganha a GPU tradicional na velocidade da Ai Speed

O Cerebras alcança sua vantagem de velocidade da nova arquitetura de chips que mantém todos os modelos de IA em um processador de tamanho de wafer, eliminando abraços estreitos da memória que experimentam os sistemas baseados em GPU. A empresa afirma que seu aplicativo Deepseek-R1 coincide ou excede o desempenho dos modelos de propriedade do Openi, enquanto executa completamente em solo americano.

O desenvolvimento representa uma mudança significativa na paisagem da IA. DeepseekFundada pelo ex -executivo de hedge de Hedge Wenfeng, chocou a indústria ao alcançar a IA sofisticada supostamente apenas 1% dos custos dos concorrentes dos EUA. A solução da Hosting de Cerebras agora oferece às empresas americanas uma maneira de usar esse progresso, mantendo o controle de dados.

“Na verdade, é uma boa história que os laboratórios de pesquisa dos EUA deram esse presente ao mundo. Os chineses o levaram e melhoraram, mas há restrições porque funciona na China, existem alguns problemas de censura e agora o trazemos de volta e o executamos em dados de data centers, sem censura, sem manter dados “, disse Wang.

Os valores de referência do desempenho que mostram o DeepSeek-R1 em execução nos cerebros excedem o GPT-4O e o Openi-IS O1-Dom através da questão das respostas ao raciocínio matemático e às tarefas de codificação. Os resultados sugerem que o desenvolvimento chinês de IA pode abordar ou superar as capacidades americanas em algumas áreas. (Crédito: Cerebri)

A liderança tecnológica americana enfrenta novas perguntas porque a inovação da IA ​​vai globalmente

O serviço estará disponível através Revisão do programador a partir de hoje. Embora seja gratuito no início, o plano de Cerebri é implementar Controles de acesso à API Devido à forte demanda ferida.

A medida ocorre enquanto os legisladores dos EUA estão lutando com implicações da ascensão de Deepseek, que expuseram as limitações potenciais em Limitações comerciais americanas Projetado para manter as vantagens tecnológicas sobre a China. A capacidade das empresas chinesas de alcançar recursos de colapso, apesar de Chips Controle de exportação incentivou chamadas para novas abordagens regulatórias.

Analistas industriais sugerem que esse desenvolvimento pode acelerar o desvio da infraestrutura de IA dependente da GPU. “A NVIDIA não é mais um líder de conclusão”, observou Wang, apontando para os valores de referência que mostram o desempenho superior de diferentes chips de IA especializados. “Essas outras empresas de chips de IA são realmente mais rápidas que a GPU para executar esses modelos mais recentes”.

O impacto se estende além dos dados de medição técnica. À medida que os modelos de IA estão cada vez mais envolvendo opções sofisticadas de raciocínio, seus requisitos de computador saltaram abruptamente. Cerebras afirma que sua arquitetura é mais apropriada para essas novas cargas emergentes, o que potencialmente transforma paisagens competitivas na implementação da IA ​​corporativa.