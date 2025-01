A síntese de novas proteínas – os elementos constituintes da vida orgânica – é um campo científico de imenso potencial, e um modelo de IA recém -desenvolvido promete criar instruções para novas proteínas muito além das encontradas na natureza.





Nos Estados Unidos, os cientistas usaram o Modelo 3 (ESM3) da Escala de Evolução TAGRFP.





É o equivalente a 500 milhões de anos de evolução tratados pela IA, a equipe de pesquisa estima, e abre caminho para a criação de proteínas feitas sob medida que podem ser projetadas para usos específicos ou desbloquear mais funções de proteínas existentes.

“Mais de três bilhões de anos de evolução produziram uma imagem de biologia codificada no espaço das proteínas naturais”. para escrever Os pesquisadores, liderados por Thomas Hayes, fundador da EvolutionaryScale em Nova York, em seu artigo publicado.





“Aqui mostramos que modelos de idiomas treinados em grande escala em dados evolutivos podem gerar proteínas funcionais que estão longe de ser proteínas conhecidas”.

O ESM3 foi formado em uma impressionante sequência de proteínas de 3,15 bilhões (a ordem de Aminoácidos Em uma proteína), 236 milhões de estruturas proteicas (suas formas 3D) e 539 milhões de anotações de proteínas (etiquetas descritivas).





Ao identificar os modelos nesses vastos dados de dados, o modelo de IA pode entender o que funciona e o que não funciona na construção e na função das proteínas – da mesma maneira que o ChatGPT pode compor um novo poema que rima depois de ler milhões de poemas escritos pelo homem.





O que torna o ESMGFP mais especial é que ele funciona: é fluorescente como seu TAGRFP relativo. Proteínas fluorescentes Dê a certas organizações do oceano sua luzE seu uso como marcadores é de grande importância na medicina e na biotecnologia.





“Escolhemos a funcionalidade da fluorescência porque é difícil de alcançar, fácil de medir e um dos mecanismos mais bonitos da natureza”, a equipe escrita.

A IA remove muitos ensaios e erros da síntese de proteínas, adicionando a capacidade de explorar longe das proteínas que conhecemos atualmente.





“As proteínas podem ser consideradas existentes em um espaço organizado, onde cada proteína está próxima de todos os outros, o que é um evento mutacional”, ” para escrever pesquisadores. “A estrutura da evolução aparece como uma rede nesse espaço, conectando todas as proteínas pelos caminhos que a evolução pode seguir entre eles”.





Para que a evolução ocorra, a equipe afirma que cada proteína deve se transformar no próximo sem o sistema do qual faz parte de sua funcionalidade geral. Um modelo de linguagem reconhece proteínas neste espaço.





As proteínas projetadas pelo ESM3 ainda devem ser validadas, sintetizadas e testadas, o que leva tempo, mas a equipe está confiante para progredir aqui. No futuro não muito distante, poderíamos produzir proteínas para tudo, medicamentos biomateriais apenas com incentivo inteligente.





“Models of protein language do not work explicitly in the physical constraints of evolution, but can rather implicitly build a model of the multitude of potential paths that the evolution could have followed”, the researchers, the researchers, the researchers, the researchers, the pesquisadores explicar.

A pesquisa foi publicada em Ciência.