O livro das proteínas humanas tem a sua edição mais completa

Mais de 30 mil proteínas foram identificadas por uma das duas equipas que apresentam agora este catálogo. Surpresas: 193 proteínas eram mesmo desconhecidas e cerca de 2000, que teoricamente existiriam, não se encontram.

Foto
Estruturas de várias proteínas Marc A. Elsliger

O maravilhosamente complexo livro da vida humana continua a ser submetido a novas leituras, cada vez mais refinadas. Primeiro, em 2003, o genoma humano foi descodificado letra a letra, tendo-se determinado, ao longo da molécula de ADN, a sequência de todas as quatro “letras” com que está escrito. Depois, passou-se para a leitura das proteínas fabricadas no corpo humano, seguindo as instruções dos genes. É este catálogo das proteínas humanas — o proteoma humano — que duas equipas de cientistas apresentam esta quinta-feira na revista Nature, dizendo que é o mais completo até ao momento e que pode impulsionar a investigação biomédica.

A molécula de ADN é composta por quatro pequenas moléculas — ou “letras”, conhecidas pelas iniciais A, T, C, G — e é com elas que o livro da vida humana (e de toda a vida) é escrito. No caso dos seres humanos, o ADN tem cerca de 3000 milhões de pares de moléculas (diz-se “pares”, porque, na molécula de ADN em forma de dupla hélice, o A emparelha sempre com o T e o C com o G). Se fosse imprensa em papel, a sequência das quatro “letras” do ADN humano encheria 750 milhões de folhas A4.

Ora determinadas sequências das letras do genoma compõem os genes, que por sua vez são instruções de fabrico das proteínas que constituem as células, os tecidos, os órgãos ou, resumindo, o nosso corpo. Muitíssimas outras sequências de letras não contêm o código de fabrico de proteínas — mas já se sabe que têm, por exemplo, um papel importante na regulação dos próprios genes, ligando-os e desligando-os conforme o tipo de células. Estas sequências genéticas são designadas pelos cientistas por “ADN não codificante”.

Aprofundando agora o olhar sobre o genoma humano, mais concretamente sobre os seus produtos, as duas equipas procuraram exaustivamente proteínas do corpo humano, aplicando a técnica da espectrometria de massa a amostras de diversos tecidos saudáveis (do coração, pâncreas, fígado, pulmões, cérebro, próstata, testículos, ovários, rins, vesícula ou do cólon e recto).

Resultado, a equipa de Akhilesh Pandey, da Universidade Johns Hopkins (EUA) e do Instituto de Bioinformática em Bangalore (Índia), identificou 30.057 proteínas. E, no caso 17.294 genes, conseguiu estabelecer uma relação com proteínas codificadas por esses genes — o que representa cerca de 84% do genoma humano que se pensa conter as instruções de produção de proteínas. Já a equipa de Bernhard Küster, da Universidade Técnica de Munique, na Alemanha, identificou proteínas originadas por 18.097 genes.

Surpresas entusiasmantes
Uma das surpresas é relatada pela Akhilesh Pandey, que analisou 30 tipos de tecidos e células, tanto de adultos como de fetos e de células precursoras do sangue: 193 proteínas eram totalmente desconhecidas até agora e, além disso, têm origem em regiões do genoma supostamente não codificantes.

“Este é o resultado mais entusiasmante do estudo, ao permitir a descoberta de mais complexidades no genoma”, frisa Akhilesh Pandey, em comunicado da Universidade Johns Hopkins. “O facto de 193 proteínas virem de sequências de ADN que se pensava serem não codificantes significa que não compreendemos completamente como é que as células lêem o ADN, porque é claro que essas sequências codificam proteínas.”

Também a equipa de Bernhard Küster diz, em comunicado da sua universidade alemã, ter ficado “surpreendida ao descobrir centenas de fragmentos de proteínas codificados por ADN fora dos genes actualmente conhecidos”. “Estas novas proteínas poderão ter novas propriedades e funções biológicas, cuja relevância está por compreender”, lê-se ainda no comunicado.

Mas a equipa alemã, que analisou proteínas de 27 tecidos e fluidos corporais, teve ainda outra surpresa: não conseguiu localizar cerca de 2000 proteínas que, segundo os dados da sequenciação do genoma humano, em particular das regiões ditas codificantes, deveriam teoricamente existir. Talvez algumas destas proteínas “desaparecidas” existam apenas durante o desenvolvimento embrionário, uma hipótese que é colocada. Pode também dar-se o caso de muitos genes identificados que deveriam estar envolvidos na produção dessas proteínas terem deixado de ser funcionais — por exemplo, genes ligados ao olfacto, um sentido que se tornou menos crucial para a sobrevivência da nossa espécie à medida que fomos evoluindo. “Podemos estar aqui ver a evolução em acção. O organismo humano desactiva genes supérfluos e, ao mesmo tempo, testa protótipos de novos genes”, diz Bernhard Küster, acrescentando que por essa razão poderemos nunca saber o número exacto de proteínas que temos no corpo.

Seja como for, ambas as equipas contribuíram para o catálogo mais completo do proteoma humano, disponibilizando os seus resultados em bases de dados de acesso livre, indicando que proteínas se encontram em que tecidos e células e em que quantidades. Como somos feitos de proteínas, espera-se que este inventário acelere a investigação biomédica nos mais variados aspectos, desde as doenças, a eficácia dos medicamentos até ao desenvolvimento de novos fármacos e testes de diagnósticos.

“Podemos olhar para o corpo humano como uma biblioteca gigantesca”, diz Akhilesh Pandey. “Não tínhamos um catálogo abrangente com os títulos dos livros disponíveis e onde encontrá-los. Agora pensamos ter um bom primeiro rascunho desse catálogo.”

Sugerir correcção
Comentar