A narrativa da IA ​​atingiu um ponto crítico de Bend. Deepseek, avanço do desempenho de ponta, sem depender dos mais avançados que muitos já declararam em dezembro: o futuro da IA ​​não está mais calculando os problemas-essa é uma remigação de Como esses sistemas funcionam com as pessoas e nosso ambiente.

Como um cientista da computação que foi educado em Stanford, que foi testemunha e promessa e perigo do desenvolvimento da IA, vejo esse momento ainda mais transformador do que a estréia do ChatGPT. Entramos no que alguns chamam de “o renascimento da explicação”. O O1 Open, o R1 de Deepseek e outros estão passando por forças difíceis para um pouco mais inteligente e o fazem com eficiência sem precedentes.

Essa mudança não poderia ser oportuna. Durante sua palavra principal, o ex -cientista do Openi -e Ilya Sutskever declarado Isso “girará” porque, ao calcular a energia crescer, somos limitados pelos dados finais da Internet. O avanço da Deepseek confirma essa perspectiva – pesquisadores de empresas chinesas alcançaram desempenho comparável com o Openi O1 em um pouco de custos, mostrando que a inovação, não apenas a energia bruta do computador, é um caminho a seguir.

AI avançada sem um pré-termo enorme

Os modelos mundiais são amplificados para preencher essa lacuna. Recentemente, Laboratórios Mundiais Um aumento de US $ 230 milhões Construa sistemas de IA que entendam a realidade como as pessoas paralelos a abordagem de Deepseek, onde o modelo R1 mostra “Aha!” Os momentos que se aproximam da reconsideração do problema, assim como as pessoas. Esses sistemas, inspirados nos processos cognitivos humanos, prometem que transformarão tudo, desde o modelo ambiental até a interação humana.

Vemos as primeiras vitórias: uma atualização recente do alvo em seus Óculos inteligentes de Ray-Ban Ele permite conversas contínuas e contextuais com os ajudantes de IA sem uma palavra, juntamente com a tradução real de tempo. Esta não é apenas uma atualização dos recursos-esta é uma revisão de como a IA pode melhorar as capacidades humanas sem a necessidade de modelos pré-vestidos maciços.

No entanto, essa evolução vem com desafios matizados. Embora o DeepSeek tenha reduzido drasticamente o custo de técnicas de treinamento inovadoras, esse avanço de eficiência poderia levar paradoxicamente ao aumento do consumo total de recursos – fenômeno conhecido como Jevons Paradoxonde as melhorias de eficiência tecnológica geralmente resultam em aumento do que o uso reduzido de recursos.

No caso da IA, o treinamento mais barato pode significar mais modelos que treinaram várias organizações, o que potencialmente aumenta o consumo de energia líquida. Mas a inovação da Deepseek é diferente: mostrando que o desempenho mais moderno é possível sem o hardware superior, eles não apenas tornam a IA mais eficaz-eles basicamente mudam a maneira como abordamos o desenvolvimento do modelo.

Essa mudança em direção à arquitetura inteligente sobre a energia bruta do computador pode nos ajudar a evitar a armadilha do Jevons Paradox, porque o foco passa de “quanto contamos?” “Quão inteligentemente podemos projetar nossos sistemas?” O impacto desses sistemas ambientais permanece significativo, empurrando a indústria de acordo com soluções mais eficazes – é o tipo de inovação de Deepsek.

Prioridade para arquiteturas eficazes

Essa mudança requer novas abordagens. O sucesso de Deepseek confirma o fato de que o futuro não está na construção de modelos maiores – mas sobre a construção de os mais inteligentes e eficazes que atuam de acordo com a inteligência humana e as limitações ambientais.

Meta principal cientista da IA ​​Yann Lecun prevê sistemas futuros Passar dias ou semanas pensando em problemas complexos, assim como as pessoas. O modelo Deepseek-R1, com sua capacidade de pausar e reconsiderar abordagens, é um passo em direção a essa visão. Embora intensamente para os recursos, essa abordagem pode trazer um avanço nas soluções para as mudanças climáticas, Health Inn e além. Mas como Carnegie Mellon’s AMET Ele alerta com sabedoria, temos que questionar qualquer pessoa que reivindique a segurança de onde essas tecnologias nos guiarão.

Para os líderes empresariais, essa mudança representa um caminho claro a seguir. Precisamos priorizar a arquitetura eficaz. Aquele que pode:

Modo as cadeias de agentes de IA especializados, não modelos enormes individuais.

Invista em sistemas que otimizem o efeito e o impacto ambiental.

Construa uma infraestrutura que apóie o desenvolvimento iterativo das pessoas em um loop.

Aqui está o que me excita: o avanço de Deepseek prova que estamos nos movendo ao lado da época “Maior é melhor” e algo muito mais interessante. Como ele atingiu seus limites e empresas inovadoras que encontram novas maneiras de conseguir mais com menos, também há um espaço incrível para soluções criativas.

As cadeias inteligentes de agentes menores e especializados não são apenas mais eficazes – eles nos ajudarão a resolver problemas de maneiras que nunca imaginamos. Para startups e empresas que estão prontas para pensar de maneira diferente, este é o nosso momento de se divertir novamente com a IA, para construir algo que faça sentido das pessoas e do planeta.

