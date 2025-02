A revolução generativa da IA ​​se transformou em uma corrida global, com misturas de modelos de empresas privadas e uma iniciativa de código aberto que compete para se tornar o mais popular e mais poderoso. Muitos decidem promover sua habilidade, mostrando seu desempenho nos testes e níveis usuais dentro da escada regular.

Mas a legitimidade desses gráficos foi questionada Nova pesquisa Postado no servidor de reavivamento para a Universidade de Cornell Arxiv mostra que é possível resolver os resultados do modelo com apenas algumas centenas de votos.

“Quando se trata de grandes modelos de idiomas, seu efeito nos valores de referência é muito importante”, diz o autor do estudo Tianyu Pang, pesquisador do Sea AI Lab, grupo de pesquisa com sede em Cingapura. Ajuda a promover startups que buscam apontar as habilidades de seus modelos “, e é por isso que algumas startups motivam para obter ou manipular uma escala”, diz ele.

Para testar se é possível a manipulação do ranking, Pang e seus colegas analisaram a Arena Chatbot, uma plataforma para fazer IA, desenvolvida por pesquisadores da Universidade da Califórnia Berkeley e Lmaren. Na arena do chatbot, os usuários podem listar sua tendência para uma saída de chatbot sobre a outra quando gasta através de uma bateria de teste. Os resultados desses votos estão entrando na escala em geral que a plataforma se divide publicamente, que geralmente são considerados finais.

Mas Pang e seus colegas descobriram que é possível classificar a posição do modelo com apenas algumas centenas de votos. “Só precisamos levar centenas de novos votos para melhorar uma posição de classificação”, diz ele. “A técnica é muito simples.”

Enquanto a arena do chatbot mantém a identidade de seus modelos em segredo quando eles lutaram, Pang e seus colegas treinaram a classificação para identificar qual modelo usado com base em seus resultados, com um alto nível de precisão. “Podemos então usar o sistema de avaliação para melhorar com mais eficácia a classificação dos modelos com o menor número de novos votos”, explica ele.

O experimento de votação não foi testado na versão ao vivo da arena do chatbot, para que não enveneje os resultados do site real, mas em vez de dados históricos da plataforma de classificação. No entanto, Pang diz que seria possível na vida real com a versão apropriada da arena do chatbot.

A equipe por trás da plataforma de classificação não respondeu Uma empresa rápidaSolicitação de comentário. Pang diz que seu último contato com a Chatbot Arena chegou em setembro de 2024 (antes de passar o experimento), quando marcou uma técnica potencial para manipular os resultados. De acordo com Pang, a Tim Chatbot Arena respondeu com a recomendação dos princípios de teste de Sandbox em dados históricos. Pang diz que a Chatbot Arena tem mais mecanismos de separação para evitar inundações de votação, mas não para aliviar sua técnica de equipe.

“Do lado do usuário, por enquanto não podemos ter certeza de que a escada é confiável”, diz Pang. “A responsabilidade da equipe da Chatbot Arena é implementar algum mecanismo para a luta contra a fraude para garantir que o valor de referência do nível certo seja”.

Fonte