UNIPROT: base de dados de proteínas

Data:

uniprot

Conheça o UNIPROT, uma base de dados integrada para quem trabalha com proteínas

Autor | Pedro Medeiros

 

Você já ouviu falar do UNIPROT - Universal Protein Resource?

 

Para quem trabalha com proteínas ele já se mostrou um recurso indispensável, mas muitas pessoas que atuam na área de gênomica e dev ou desconhecem ou ainda não o conhecem por completo.

 

O Uniprot é um colaboração entre o EMBL, PIR  e o SIB que reúne dados e ferramentas acerca de proteínas, formando hoje , se não a mais completa, uma das melhores bases de dados e ferramentas para trabalhar com proteínas.

 

Os dados do uniprot provém inicialmente do e!Ensembl, INSDC e do PDB.

 

Ao realizarem a integração dessas 3 bases a equipe do UNIPROT realiza basicamente 3 processos:

 

[1] Trata ambiguidades e duplicações, garantindo a integridade dos dados

[2] Estuda e adiciona MANUALMENTE informações úteis acerca de dadas proteínas, verificando na literatura resultados e papers que vão trazer conteúdo informacional àquela entrada: Localização, experimentos, interações com outras proteínas e etc… um trabalho de curadoria que você pode ver pela indicação de “Reviewed (Swiss-Prot) - Manually annotated” nas sequências. 

[3] Expande automaticamente para proteínas semelhantes às que sofreram um processo de revisão anotações que possam ser pertinentes.

 

Esse processo é o que faz com que o UNIPROT seja um recurso de extrema qualidade, mas o que poucas pessoas conhecem é que qualquer pessoa pode submeter através da página de cada proteína nos campos “add a publication” e “feedback” novas publicações e correções às informações, de maneira que o UNIPROT é também um recurso que aceita entradas diretamente da comunidade, ainda que não de maneira tão aberta e automática quanto a Wikipédia.

 

O UNIPROT pode ser acessado de maneira gráfica, com diversas ferramentas de visualização acerca de diferentes aspectos das proteínas, mas também por suas APIs, sendo não apenas um bom portal para consultas pequenas, mas também para executar queries acerca de quase qualquer informação específica no seu banco.

 

Adaptado de www.uniprot.org

 

Por fim, o sistema como um todo está passando por uma atualização prometida para ao final de outubro a fim de adequar o sistema ao volume massivo de dados que hoje é submetido a ele e, também, aumentar sua capacidade de processamento (hoje, pra se ter uma idéia, o UNIPROT funciona em uma única máquina de menos de 100 GB de memória ram).

 

Nesta grande mudança devem ser adicionadas funcionalidades novas, como um Dashboard que facilitará a utilização das ferramentas e uma unificação das APIs. Dessa maneira, espera-se aumentar a usabilidade tanto por linha de comando quando por interface gráfica.

 

Conhecia o UNIPROT? Já utilizou em seus trabalhos academicos? Comenta com a gente o quê achou do conteúdo.

 

Saiba mais:

 

APIs do UNIPROT

 

#ciencia #bioinformatica #divulgaçãocientífica #edutaugc #uniprot

 

Última atualização: Sept. 3, 2021, 8:51 p.m.

Posts Relacionados