DeepSeek-R1, um modelo de inteligência artificial (IA) da empresa chinesa DeepSeek, foi lançado na segunda-feira. Esta é a versão completa do modelo de IA de código aberto, que chegou dois meses após o lançamento da versão prévia. O modelo de IA de código aberto está disponível para download e também pode ser usado como plug-in e interface de programação de aplicativos (API). A empresa chinesa de IA afirmou que o modelo DeepSeek-R1 foi capaz de operar com base nos benchmarks OpenAI o1 em diversas tarefas matemáticas, de codificação e de computação.

O modelo DeepSeek-R1 AI custa até 200% menos que o OpenAI é o1

Existem duas variantes na série mais recente – DeepSeek-R1 e DeepSeek-R1-Zero. Ambos são derivados de outro modelo de linguagem grande (LLM) desenvolvido pela empresa de IA DeepSeek V3. Os novos modelos de IA baseiam-se numa arquitetura mista especializada (MoE), onde vários modelos mais pequenos são combinados para melhorar a eficiência e a capacidade de um modelo maior.

Modelos do DeepSeek-R1 AI estão atualmente disponíveis para download através do Hugging Face seja qual for o sexo. O modelo vem com licença do MIT que permite uso acadêmico e comercial. Para quem não pretende rodar o LLM localmente, o modelo API. eles podem escolher em vez de. A empresa anunciou uma estimativa do custo do modelo, afirmando que esses custos são 90-95 por cento menores que o o1 da OpenAI.

Atualmente, a API DeepSeek-R1 vem com um preço de entrada de US$ 0,14 (cerca de Rs. 12,10) milhões de tokens e um preço de US$ 2,19 (cerca de Rs. 189,50) milhões de tokens. Em comparação, a API o1 da OpenAI custa US$ 7,5 (cerca de Rs. 649) por milhão de tokens de entrada e US$ 60 (cerca de Rs. 5.190) por milhão de tokens de saída.

O DeepSeek-R1 não só custa menos, mas a empresa também afirma que oferece melhor desempenho do que seus equivalentes OpenAI. Com base em testes internos, a empresa de IA afirmou que DeepSeek-R1 passou no Mathematics Invitational Exam (AIME), Math-500, e foi certificado como benchmark SWE. Mas a diferença entre os modelos é marginal.

Chegando ao pós-processamento, a empresa disse que utilizou aprendizado por reforço (RL) para o modelo base sem nenhum ajuste fino dos supervisores (SFT). Este método, também conhecido como RL puro, permite uma modelagem mais livre na resolução de problemas complexos usando um mecanismo de pensamento de máquina (CoT). DeepSeek afirmou que este é o primeiro projeto de IA de código aberto a usar RL puro para melhorar as capacidades de computação.