Início Mundo Musk sugere que os dados do mundo real estão “esgotados” para o...

Musk sugere que os dados do mundo real estão “esgotados” para o treinamento de IA

206

Postado em 11 de janeiro de 2025


Inscrever-se

Elon Musk juntou-se a outros inteligência artificial especialistas afirmando que restavam poucos dados do mundo real para treinar modelos de IA e que o “pico de dados” seria alcançado em breve.

Durante uma recente transmissão ao vivo na quinta-feira, ele explicou que quase todo o conhecimento disponível da humanidade foi processado em IA treinamento.

“Basicamente esgotamos a soma cumulativa do conhecimento humano… em IA treinamento“Musk disse durante a transmissão ao vivo no X.” Isso aconteceu basicamente no ano passado.

Musk, que lançou sua própria IA negóciosxAI, em 2023, sugeriu que as empresas de tecnologia não teriam escolha senão recorrer a dados “sintéticos”, ou seja, dados gerados pela IA que levam à autoaprendizagem.

“A única maneira de complementar isso é com dados sintéticos onde… você escreve uma redação ou elabora uma tese e depois recebe uma nota e… passa por esse processo de auto-estudo”, ele adicionado.

Musk alertou, no entanto, que a tendência dos modelos de IA de produzir “alucinações,” resultados imprecisos ou sem sentido representam um risco para o processo de síntese de dados.

Ele disse que as alucinações tornam o uso de material artificial “desafiador” porque “como saber se… a resposta é uma alucinação ou se é uma resposta real?”

André Duncann, diretor de IA fundamental do Instituto Alan Turing do Reino Unido, observou que a declaração de Musk está alinhada com um artigo acadêmico recente que sugere que os dados disponíveis publicamente para modelos de IA podem acabar até 2026, como relatou o The Guardian.

Ele alertou que uma dependência excessiva de dados sintéticos poderia levar ao “colapso do modelo”, onde a qualidade dos resultados do modelo se degradaria.

“Quando você começa a alimentar um modelo com material sintético, começa a obter retornos decrescentes”, disse ele, destacando o risco de resultados tendenciosos e pouco criativos.

Duncan também observou que o aumento do conteúdo online gerado por IA poderia resultar na incorporação do material em dados de treinamento de IA.

Fonte