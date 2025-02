O ChatGPT da Openai foi publicado para uso público mal foi publicado, convidando qualquer pessoa na Internet para colaborar com um espírito artificial em tudo, de poesia às tarefas da escola ao seu proprietário.





Hoje, o famoso Ótimo modelo de idioma (LLM) é apenas um dos muitos programas líderes que parecem ser convincentemente humanos em suas respostas a solicitações básicas.





Essa estranha semelhança pode se estender além do esperado, os pesquisadores de Israel agora descobriam que o LLM sofre de uma forma de declínio cognitivo que aumenta com a idade como nós.





A equipe aplicou uma bateria de avaliações cognitivas a “chatbots” acessíveis ao público: 4 e 4o das versões ChatGPT, duas versões do Alfabet de Gemini e a versão 3.5 do Claude d’Antrópica.





Se os LLMs fossem realmente inteligentes, os resultados seriam preocupantes.





Em seu artigo publicado, os neurologistas Roy Dayan e Benjamin Uliel, do Hadassah Medical Center, e Gal Koplewitz, cientista de dados da Universidade de Tel Aviv, descrever Um nível de “declínio cognitivo que parece comparável aos processos neurodegenerativos no cérebro humano”.





Por toda a sua personalidade, o LLM tem mais comum Com o texto preditivo em seu telefone, os princípios que geram conhecimento usando a substância cinzenta esponjosa em nossas cabeças.





Qual essa abordagem estatística para a geração de texto e imagens ganha velocidade e seu pessoal, perde em credulidade, a construção do código de acordo com algoritmos que lutam para classificar extratos significativos de texto da ficção e do não sentido.





Para ser justo, o cérebro humano não é impecável quando se trata de tomar um atalho mental ocasional. No entanto, com as crescentes expectativas da IA ​​que oferecem palavras de confiança – até mesmo médico e aviso legal – vem das hipóteses segundo as quais cada nova geração de LLMs encontrará de maneiras melhores de “pensar” sobre o que realmente diz.





Para ver até onde temos que ir, Dayan, Uliel e Koplewitz aplicaram uma série de testes que incluem o Avaliação cognitiva de Montreal (MOCA), uma ferramenta que os neurologistas geralmente usam para medir as capacidades mentais, como memória, habilidades espaciais e função executiva.





O ChaptGPT 4O marcou o mais alto na avaliação, com apenas 26 dos 30 pontos possíveis, indicando um leve comprometimento cognitivo. Isto foi seguido por 25 pontos para o ChatGPT 4 e Claude, e apenas 16 para Gêmeos – uma pontuação que sugere um grave comprometimento em humanos.

Ao cavar os resultados, todos os modelos entenderam mal as medidas de função visuoespacial / executiva.





Isso incluiu uma tarefa para fazer trilhas, a cópia de um design simples de cubo ou desenhos de um relógio, os LLMs falhando completamente ou exigindo instruções explícitas.

Certas respostas a perguntas na localização do site no espaço ecoaram as usadas por pacientes com demência, como Resposta de Claude “O local específico e a cidade dependeriam de onde você, o usuário, está localizado por um momento”.





Da mesma forma, a falta de empatia demonstrada por todos os modelos em uma característica do exame de afasia diagnóstica de Boston pode ser interpretada como um sinal de demência frontotemporal.





Como seria de esperar, as versões anteriores do LLMS obtiveram uma pontuação abaixo dos testes de que os modelos mais recentes, indicando que cada nova geração de IA encontrou maneiras de superar as deficiências cognitivas de seus antecessores.





Os autores reconhecem que os LLMs não são cérebros humanos, o que torna impossível “diagnosticar” os modelos testados com qualquer forma de demência. No entanto, os testes também questionam as hipóteses segundo as quais estamos à beira da revolução da IA ​​na medicina clínica, uma área que geralmente se baseia na interpretação de cenas visuais complexas.





Embora o ritmo da inovação na inteligência artificial continue acelerando, é possível, mesmo provavelmente, veremos as primeiras notas do LLM sobre tarefas de avaliação cognitiva nas futuras décadas.





Até então, o próprio conselho dos chatbots mais avançados deve ser tratado com uma boa dose de ceticismo.

Esta pesquisa foi publicada em BMJ.