Google lança AlphaGenome: IA que decifra 98% do DNA não codificante para revolucionar a genética

Google revoluciona a genética com AlphaGenome: IA que desvenda os segredos do DNA não codificante

O Google deu um salto monumental na compreensão do genoma humano ao lançar oficialmente o AlphaGenome, uma ferramenta de Inteligência Artificial anunciada na quarta-feira, 28 de janeiro, na prestigiada revista Nature. Esta inovação tecnológica representa uma mudança de paradigma, pois se concentra especificamente em analisar como partes específicas do DNA regulam a atividade dos genes dentro das células, oferecendo uma chave para decifrar a complexa "gramática da vida" que há décadas desafia os cientistas.

Do livro da vida à compreensão de sua gramática

Pushmeet Kohli, vice-presidente de pesquisas da Google DeepMind, destacou durante a apresentação que, embora a decodificação completa do genoma humano em 2003 tenha nos entregado "o livro da vida", a verdadeira dificuldade sempre residiu em interpretá-lo corretamente. "Temos o texto" — referindo-se à sequência de 3 bilhões de pares de nucleotídeos A, T, C e G que compõem o DNA —, mas "compreender a gramática e a forma como ela governa a vida constitui a próxima grande fronteira da pesquisa", enfatizou Kohli. O AlphaGenome surge justamente para enfrentar esse desafio colossal, focando sua análise nas sequências não codificantes do DNA, que representam impressionantes 98% do genoma humano.

Enquanto apenas 2% das sequências codificam diretamente proteínas essenciais para o funcionamento dos organismos vivos, os 98% restantes atuam como um "maestro" genético: coordenam, protegem e regulam meticulosamente a expressão da informação genética em cada uma de nossas células. É precisamente nessas sequências não codificantes que se encontram inúmeras variantes associadas a doenças, tornando sua compreensão detalhada absolutamente fundamental para o avanço da medicina personalizada e de tratamentos mais eficazes.

Precisão multibiologica e capacidade analítica sem precedentes

O AlphaGenome não chega sozinho; ele se integra a uma família de modelos de IA desenvolvidos pelo laboratório do Google, complementando ferramentas como o AlphaMissense (que analisa sequências codificantes), o AlphaProteo (voltado ao design de proteínas) e o celebrado AlphaFold (que prediz estruturas proteicas e foi laureado com o Prêmio Nobel de Química em 2024). Este novo modelo de aprendizagem profunda, onde uma rede neural aprende automaticamente a reconhecer padrões complexos, foi treinado com dados provenientes de grandes consórcios públicos que mediram experimentalmente propriedades genéticas em centenas de tipos de células e tecidos humanos e de ratos.

Um dos diferenciais mais marcantes do AlphaGenome em relação a modelos anteriores é sua capacidade de superar o tradicional compromisso entre comprimento da sequência e precisão da resolução. Conforme explicou Žiga Avsec, um dos coautores do projeto, é necessária uma sequência longa — de até um milhão de pares de nucleotídeos — para compreender o ambiente regulatório completo de um único gene. A precisão da resolução, por sua vez, permite aos pesquisadores estudar o efeito de variantes genéticas comparando previsões de sequências mutadas com as não mutadas.

Além disso, o AlphaGenome modela simultaneamente a influência da sequência de DNA em 11 processos biológicos distintos, enquanto até então os cientistas precisavam utilizar múltiplos modelos diferentes para realizar análises semelhantes. Natasha Latysheva, também coautora, estima que esta ferramenta "pode acelerar a nossa compreensão do genoma ao ajudar a cartografar a localização dos elementos funcionais e a determinar seus papéis em nível molecular". Kohli complementou expressando a esperança de que pesquisadores ao redor do mundo enriqueçam o modelo com mais dados e modalidades ao longo do tempo.

Disponibilidade em código aberto e recepção cautelosa da comunidade científica

O AlphaGenome já passou por testes rigorosos conduzidos por aproximadamente 3.000 cientistas de 160 países e agora está disponível em código aberto para pesquisas não comerciais, democratizando o acesso a essa tecnologia de ponta. No entanto, a comunidade científica recebeu o anúncio com um misto de entusiasmo e prudência.

Ben Lehner, responsável pela genômica generativa e sintética no Wellcome Sanger Institute em Cambridge, observou que "identificar com precisão as diferenças em nossos genomas que nos tornam mais ou menos suscetíveis a desenvolver milhares de doenças é um passo crucial rumo a melhores tratamentos". O pesquisador, que não participou do projeto, mas testou o modelo, considerou-o "muito eficaz", embora ainda "longe de ser perfeito". Lehner alertou ao Science Media Center britânico que "os modelos de IA são tão bons quanto os dados usados para treiná-los", e a maioria dos conjuntos de dados existentes "são muito pequenos e não estão suficientemente padronizados".

Robert Goldstone, responsável pela genômica no Francis Crick Institute, concordou que o AlphaGenome não é uma "solução milagrosa para todas as questões biológicas", uma vez que a expressão dos genes é influenciada por fatores ambientais complexos que vão além do código genético. Apesar disso, ele considera a ferramenta fundamental e acredita que ela permitirá aos cientistas "estudar e simular de maneira programática as bases genéticas das doenças complexas", representando um avanço significativo na busca por tratamentos mais eficazes para condições médicas que há muito desafiam a comunidade científica global.

Com seu foco inédito no DNA não codificante e sua arquitetura analítica sofisticada, o AlphaGenome do Google promete não apenas acelerar descobertas na genética, mas também pavimentar o caminho para uma nova era na medicina, onde a compreensão profunda da regulação genética poderá transformar radicalmente a prevenção, diagnóstico e tratamento de inúmeras doenças.