Bioinformática: Por onde começar?

Data:

first_steps

Biologia e Informática, por onde começar na carreira de Bioinformática?

Autor | Paulo Marcelo Rayner Oliveira

 

A bioinformática é uma grande área da ciência que possui diversas ramificações que levam a diferentes lugares. Entretanto, uma coisa é fato, qualquer problema a ser resolvido vai envolver eventos biológicos e um computador, e na maioria das vezes, um terminal com linhas de comando. 

 

Dessa forma, um bom começo seria ter conhecimento tanto na área das ciências da vida, quanto na área das ciências da computação. Isso permite um diálogo mais próximo entre profissionais provenientes de áreas distintas. 

 

Um primeiro ponto bastante importante é respeitar o caminho do aprendizado. Você não nasceu sabendo correr, isso veio com o tempo e com a prática. Procure sempre alguém com mais experiência na área, a reciprocidade na  troca de conhecimentos vai alavancar ambos. 

 

Ensinar é um excelente jeito de aprender.  

 

Qual poderia ser um bom caminho para alguém que vem das Ciências da vida e quer ingressar no mundo da Bioinformática? O primeiro passo é entender o que é a programação. Comece pelo básico, quando você começou a ter aulas de ciências na escola você não começou aprendendo sobre transcrição gênica. 

 

Primeiro você aprendeu sobre os seres vivos em geral, depois sobre o corpo humano, aprendeu sobre órgãos, tecidos que formam os órgãos, células e por fim o que é o DNA e RNA. 

 

 

Na graduação esses mesmos tópicos ganharam complexidade e só então começaram a surgir coisas como proteínas, genes, mutações, expressão gênica, íntrons, éxons e por aí vai.

 

Assim, comece a aprender lógica de programação e vá inserindo complexidade aos poucos como comandos básicos linux. Hoje existem algumas ferramentas com interface gráfica, porém são pouco flexíveis e permitem apenas algumas abordagens. 

 

A grande maioria das ferramentas utilizadas na bioinformática são executadas via linha de comando em um terminal. Não tenha medo, o terminal é escuro, mas não tem bicho papão. Interfaces gráficas oneram muito os recursos computacionais de uma máquina. 

 

Além disso, análises em si consomem bastante recurso, por isso é importante que os processos envolvidos na execução das ferramentas tenham recursos suficientes. Um outro ponto importante seria começar a aprender linguagens de programação de alto nível como Python e R

 

Hoje existe uma grande quantidade de pacotes desenvolvidos para análise de dados biológicos. Lembre-se, o funcionamento de um organismo é basicamente um conjunto códigos de diferentes linguagens de programação que colocam a máquina para funcionar. 

 

Qualquer semelhança não é mera coincidência. O código genético é um conjunto de substâncias que são representadas por letras (Isso na computação é chamado de linguagem de alto nível, pois se aproxima mais da linguagem humana do que da linguagem interpretada pela máquina/organismo). 

 

O início de qualquer análise em bioinfo inevitavelmente vai envolver arquivos com o código genético, vulgo “ATCG”. Essas informações são salvas em arquivos específicos, que são arquivos FASTA e FASTQ. Por isso, entenda o que são esses arquivos, eles serão personagens recorrentes na vida de um bioinformata.

 

Se pensarmos nos profissionais da Ciência da Computação. Podemos aplicar a mesma  lógica do processo de aprendizagem sobre as Ciências. Imagine o DNA como o mais baixo nível dentro de qualquer ser vivo e que as informações codificadas no DNA precisam de “interpretadores” para colocar o sistema em funcionamento. 

 

É muito pouco provável que um profissional com experiência na computação, recomende a um iniciante começar a programar em assembly. Por isso,  seria pouco produtivo um profissional da computação começar estudar eventos biológicos com um certo grau de complexidade, como chamada de variantes. 

 

 

Primeiro é preciso entender a lógica “programação” de um organismo. Tente responder, o que é um DNA e o RNA?  Qual a relação entre DNA e RNA? O que são as letras ATCG para o DNA e AUCG para o RNA? Se você encontrar as respostas para essas perguntas, já vai ser um começo digno de um merge da branch de desenvolvimento com o main (Biólogos e afins, procurem por Git e Github).

 

Não existe fórmula mágica para aprender biologia, o caminho é o mesmo para aprender programação. Comece por termos básicos e vá aumentando a complexidade. A complexidade da análise pode ser um bom referencial para a complexidade daquilo que está sendo aprendido. Por exemplo, se você entendeu o que é DNA e RNA, você vai conseguir entender o que é um arquivo FASTA e FASTQ.

 

Com essas informações você já consegue executar uma análise simples de controle de qualidade de arquivos de sequenciamento com a ferramenta FastQC. Assim, seu próximo objetivo de aprendizado pode ser um passo com um nível de complexidade um pouco mais elevado com uma ferramenta um pouco mais elaborada.

 

Dessa forma, você consegue utilizar os conceitos da biologia e ferramentas computacionais para resolver determinado problema. E sim, amigos das ciências da vida, essa dica também serve para vocês.   

 

Como disse anteriormente, não existe fórmula mágica e o objetivo aqui não é trazer um manual. Essas são algumas dicas que podem tornar a entrada na bioinformática mais tranquila.

 

O importante é estudar,  praticar e se comunicar. Abaixo temos algumas referências que podem ajudar no processo de aprendizagem com alguns termos e conceitos bastante utilizados na Bioinformática, em especial na genômica. 

 

Gostou do conteúdo? Não esqueça de deixar seu comentário, like ou compartilhar!!

 

Saiba mais: 

 

Gene expression

NCI Dictionary of Genetics Terms

10 dicas para biólogos aprenderem a programar

 

#ciencia #bioinformatica  #edutaugc 

Última atualização: May 27, 2022, 3:50 p.m.

Posts Relacionados