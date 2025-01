Os pesquisadores do Google revelaram na semana passada uma nova arquitetura de inteligência artificial (IA) que pode usar grandes modelos de linguagem (LLMs) para lembrar objetos de longo prazo e contexto local. Um artigo publicado pela gigante da tecnologia baseada em Mount View sobre o assunto, e os pesquisadores afirmam que os modelos de IA treinados usando esta arquitetura mostraram maior capacidade de retenção da memória “humana”. Notavelmente, o Google abandonou a arquitetura tradicional de Transformer e Rede Neural Recorrente (RNN) para desenvolver um novo método para ensinar modelos de IA como lembrar informações contextuais.

Titãs podem escalar a instância de IA de ‘Janelas de Contexto’ em mais de 2 milhões de sinais

O pesquisador principal do projeto, Ali Behrouz; enviado sobre a nova arquitetura do dia 10 (anteriormente conhecida como Twitter). Ele afirmou que a nova arquitetura de memória fornece uma abordagem focada no contexto que ensina modelos de IA como lembrar informações durante um teste de computação.

De acordo com o Google Paper, isso foi publicado na pré-impressão da revista arXiv, a arquitetura do contexto da janela Titan dos modelos de IA pode ser dimensionada para mais de dois milhões de símbolos. A memória tem sido um problema difícil de resolver para os desenvolvedores de IA.

As pessoas se lembram de informações e eventos com contexto. Se alguém perguntasse a uma pessoa quem ela usou no último autor, ela poderia se lembrar de informações contextuais adicionais, como comparecer ao aniversário de uma pessoa que conhece há 12 anos. Dessa forma, quando é alcançado, é buscado. pergunta sobre por que usaram camisas amarelas e jeans no fim de semana passado, a pessoa seria capaz de contextualizar com todas essas informações de curto e longo prazo.

Os modelos de IA, por outro lado, normalmente usam sistemas de aumento de recuperação (RAG) em vez da arquitetura Transformer e RNN. Ele usa informações para nós neurais. Portanto, quando um modelo de IA é pesquisado, ele acessa um nó específico que contém informações importantes e nós vizinhos que podem conter informações informativas ou relacionadas. Mas quando a solicitação é resolvida, as informações são retiradas do sistema para economizar poder de processamento.

Mas há duas desvantagens nisso. Primeiro, o modelo de IA não consegue lembrar as informações que descobre. Se alguém quisesse acompanhar uma pergunta após o término da sessão, teria que fornecer todo o contexto novamente (ao contrário de como os humanos realizam uma tarefa). Em segundo lugar, os modelos de IA fazem um mau trabalho na recuperação de informações relacionadas ao contexto de longo prazo.

Com a Titans AI, Behrouz e outros pesquisadores do Google têm tentado construir uma arquitetura que permita à IA desenvolver modelos de memória de longo prazo que executem dados continuamente e não lembrados para se tornarem computacionalmente eficientes.

Para tanto, os pesquisadores desenvolveram uma arquitetura que codificava a história no circuito de uma rede neural. Três variantes são usadas – Memória como Contexto (MAC), Memória como Gating (MAG), Memória como Camada (MAL). Cada uma destas variantes é adequada para tarefas específicas.

Além disso, Titans usa um novo sistema baseado em maravilhas que diz aos modelos de IA para lembrar informações inesperadas ou importantes sobre um assunto. Essas duas mudanças permitem que a arquitetura Titan forneça uma melhor função de memória em LLMs.

No Benchmark BABILong, Titans (MAC) apresenta excelente desempenho, onde é dimensionado com eficiência para janelas de contexto maiores que 2M, formando modelos grandes como GPT-4, Llama3 + RAG e Llama3-70B. pic.twitter.com/ZdngmtGIoW -Ali Behrouz (@behrouz_ali) 13 de janeiro de 2025

Em uma postagem separada, Behrouz afirmou que em testes internos no BABILong Benchmark (uma abordagem de agulha em um palheiro), os modelos Titan (MAC) foram capazes de executar grandes modelos de IA, como GPT-4, LLama 3 + RAG; e Lhama III 70B.