Participe de nossos boletins diários e semanais para obter as atualizações mais recentes e o conteúdo exclusivo sobre a principal cobertura da IA. Descubra mais

Antropicamente Acabei de disparar um tiro de aviso para Abrir,,, Deepseek e toda a indústria de IA com lançamento Claud 3.7 SonetoUm modelo que oferece aos usuários controle sem precedentes de quanto tempo a IA gasta “pensando” antes de gerar uma resposta. Edição, com estréia Claud CodificadoCodificação da IA ​​da linha de comando, sinaliza o empurrão agressivo de antropia para o mercado AI Enterprise AI-Granje, que pode remodelar a maneira como as empresas criam software e automatizam operações.

Os papéis não poderiam ser maiores. No mês passado, Deepseek ficou assustado com o mundo tecnológico do modelo de IA que correspondia às capacidades dos sistemas americanos em um parte do custoEnviando nvidia estoque de acordo com 17% e aproveitar um alarme sobre a liderança da IA ​​americana. Agora, a Anthropy está apostando que o controle preciso sobre a IA será ressoado – não apenas a uma velocidade bruta ou economia de custos – para dar preferência.

O Sonnet Claude 3.7 apresenta a troca de “mentalidade”, permitindo que os usuários otimizem o tempo de renovação da IA ​​com base na complexidade das tarefas. (Crédito: antropicamente)

“Acreditamos que a explicação é a parte básica e o componente fundamental da IA, não uma coisa separada que você deve pagar separadamente pelo acesso”, disse Dianne Penn, que lidera o gerenciamento de produtos de pesquisa em antropia, em entrevista à VentureBeat. “Assim como as pessoas, você deve lidar com respostas rápidas e pensamentos complexos. Para uma pergunta simples como” Quantas horas? “, Ele deve responder imediatamente. Mas para tarefas complexas-depois de planejar uma viagem de duas semanas à Itália enquanto se adapta ao As necessidades nutricionais sem glúten-é muito tempo.

“Não vemos a explicação, o planejamento e as auto-expectativas como capacidades separadas”, acrescentou. “Então, essa é basicamente a nossa maneira de expressar essa diferença filosófica … no ideal, o próprio modelo deve reconhecer quando o problema requer pensamento e ajuste mais intensos, não exigindo dos usuários para escolher explicitamente diferentes maneiras de explicação”.

A comparação do modelo de IA mostra o desempenho dos sonetos Claud 3,7 em tarefas diferentes, com ganhos significativos nas opções de pensamentos expandidos em comparação com seu antecessor. (Crédito: antropicamente)

Os dados de referência suportam uma visão ambiciosa do Anthrop. No modo de pensamento expandido, Claude 3,7 sonetos alcança 78,2% de precisão Sobre as tarefas de um nível de pós-graduação, causando os modelos mais recentes do OpenAI e superando o Deepseek-R1.

Mas métricas mais reveladoras vêm de aplicações reais. O modelo avalia 81,2% no uso de ferramentas destinadas ao varejo e mostra melhorias significativas em Aterrissagem à direita (93,2%) – Áreas onde os concorrentes lutaram ou não anunciaram os resultados.

Enquanto Deepseek e Abertura de Água em Medida matemática tradicionalO Acesso Unido ao Claude 3.7 mostra que um modelo pode alternar efetivamente entre respostas rápidas e análise profunda, potencialmente eliminando a necessidade de as empresas manterão sistemas separados de IA para diferentes tipos de tarefas.

Para que os híbridos sejam aphrópicos para remodelar empresas de computação

O tempo de liberação é crucial. A gênese da Deepseek enviou no mês passado ondas impressionantes Através do Vale do Silício, mostrando que uma explicação sofisticada de IA poderia ser alcançada Muito menos energia do computador do que ele pensou antes. Isso desafiou as suposições básicas sobre o custo do desenvolvimento da IA ​​e os requisitos de infraestrutura. Quando Deepseek publicou seus resultados, as ações da NVIDIA caiu 17% Em um dia, os investidores examinam de repente se os chips caros são realmente importantes para a IA avançada.

Para as empresas, as funções não poderiam ser maiores. As empresas são gastando milhões Integração da IA ​​em suas operações, apostando na qual o acesso a dominar. O modelo híbrido da Anthrópica oferece um caminho intermediário convincente: a capacidade de ajustar com precisão o desempenho da IA ​​com base na tarefa, desde as respostas atuais dos serviços do usuário a uma análise financeira complexa. O sistema mantém antropia Preços anteriores Dos 3 tokens de entrada por três dólares e US $ 15 por milhão de tokens de produção, mesmo com recursos de explicação adicionais.

O Sonnet Claude 3.7 apresenta a troca de “mentalidade”, permitindo que os usuários otimizem o tempo de renovação da IA ​​com base na complexidade das tarefas. (Crédito: antropicamente)

“Nossos clientes estão tentando alcançar resultados para seus clientes”, explicou Michael Gerstenhaber, chefe da plataforma da Anthropic. “Usar o mesmo modelo e incentivou o mesmo modelo de maneiras diferentes permite alguém como Thompson Reuters Para pesquisa jurídica permite nossos parceiros de gabinete como Cursor ou Girlub ser capaz de desenvolver aplicativos e preencher esses objetivos. “

A abordagem híbrida de antropina é a evolução técnica e a gambit estratégico. Enquanto o Openii mantém modelos separados para diferentes opções e Deepseek custo -efetividadeA antropia lida com sistemas exclusivos que podem lidar com tarefas rotineiras e explicações complexas. É uma filosofia que pode remodelar à medida que as empresas implantam IA e eliminam a necessidade de correr modelos mais especializados.

Conheça o Código Claude: AI -ov New Assistant Programmer

Antropicamente descoberto hoje Claud CodificadoUma ferramenta de linha de comando que permite aos desenvolvedores delegar tarefas complexas de engenharia diretamente à IA. O sistema requer aprovação humana antes que as alterações do código sejam feitas, refletindo o foco crescente da indústria no desenvolvimento responsável da IA.

A interface terminal do código Claude, parte da nova ferramenta antropal para desenvolvedores, enfatiza a simplicidade e a interação direta. (Crédito: antropicamente)

“Na verdade, você ainda precisa aceitar as mudanças que Claude faz. Você é um revisor com as mãos na () roda”, disse Penn. “Basicamente, existe um tipo de lista de controle que você deve basicamente aceitar para o modelo tomar determinadas ações”.

Os anúncios vêm no meio da intensa competição no desenvolvimento da IA. Pesquisadores de Stanford criado recentemente Um modelo de raciocínio de código aberto por menos de US $ 50, enquanto a Microsoft integrou apenas Modelo O3-Modelo do OpenAI no Azure. O sucesso da Deepseek também incentivou novas abordagens para o desenvolvimento da IA, e algumas empresas estão explorando as técnicas da destilação de modelos que podem reduzir ainda mais os custos.

O código da linha de comando Claude permite que os desenvolvedores delegem tarefas complexas de engenharia, mantendo o controle humano. (Crédito: antropicamente)

De Pokémon à Enterprise: testando a nova inteligência ai

Penn Ilustrated Dramatic Progress nos recursos de IA com um exemplo inesperado: “Pedimos versões diferentes de Claude para tocar Pokémon … Esta versão foi bem -sucedida A cidade de VermilionEle capturou mais Pokémon e até moer no nivelamento. Ele tem um verdadeiro Pokémon para combater rivais. “

“Acho que você nos verá continuar e empurrar a qualidade da explicação, empurrando -nos para coisas como ressonância dinâmica”, explicou Penn. “Sempre consideramos isso uma parte fundamental da inteligência, não algo separado”.

Uma verdadeira abordagem antrópica de teste virá da adoção da empresa. Embora jogar Pokémon possa parecer trivial, ele mostra um tipo de empresa de inteligência adaptável necessária: IA que pode lidar com operações de rotina e decisões estratégicas complexas sem alternar entre modelos especializados. As versões anteriores de Claude não poderiam sair da cidade inicial do jogo. A versão mais recente da construção de estratégias, gerenciamento de recursos e toma decisões táticas-a desportação que reflete a complexidade dos desafios de negócios no mundo real.

Para os clientes da empresa, isso pode significar a diferença entre manter vários sistemas de IA para tarefas diferentes e organizar uma solução única e mais capaz. Nos meses seguintes, eles descobrirão se as apostas antrópicas em recursos combinadas de IA remodelarão o mercado da empresa ou se tornarão apenas mais um experimento em evolução rápida no setor.