popsicleR: QC de dados de single cell RNA-Seq

Data:

pop

O pacote popsicleR permite realizar pré-processamento e QC em dados de scRNA-Seq

Autor | César H. Yokomizo

 

A disponibilização de dados de sequenciamento de célula única - single cell sequencing - têm crescido de maneira acelerada e com isso trazendo oportunidades até pouco tempo inimagináveis. 

 

Através da análise desses dados, é possível compreender a complexidade de tecidos, bem como determinar as funções dos mais diversos tipos celulares.

 

Porém, essa análise não é uma tarefa trivial, uma vez que gera inúmeros desafios nas suas diversas etapas, no que concerne à demandas de grande poder computacional em conjunto com a necessidade de profundos conhecimentos biológicos. 

 

Como exemplo prático, podemos imaginar o seguinte cenário: dados de RNA-Seq de célula única - scRNA-Seq - contém diversos ruídos e vieses biológicos, além de artefatos técnicos. Esses dados necessitam passar por intensos (e custosos) processos de pré-processamento e controle de qualidade (QC). 

 

Esses processos são compostos por combinações complexas entre estratégias computacionais que irão quantificar as métricas de QC e a definição de parâmetros ótimos para o pré-processamento, geralmente realizados manualmente.

 

É aí que chegamos ao popsicleR, um pacote escrito em R, desenvolvido por pesquisadores da Universidade de Modena e Reggio Emilia para realizar o pré-processamento e a análise de controle de qualidade de dados de scRNA-seq. 

 

O workflow completo do pacote é composto de 7 funções : exploração de métricas de QC, filtragem de células de baixa qualidade, identificação de duplicações, normalização de dados, remoção de vieses técnicos e biológicos, clusterização de células e anotação de células.

O pacote popsicle R utiliza como inputs os arquivos de saída - outputs - provenientes da pipeline Cell Ranger da 10X Genomics e também de matrizes barcodes de contagens brutas geradas a partir de qualquer outra tecnologia de scRNA-Seq.    

O pacote em R é a combinação de diversos métodos implementados em pipelines testadas e validadas, que são utilizadas para realizar todas as principais etapas de pré-processamento e QC em dados de scRNA-seq.

 

Gostou do conteúdo? Não esqueça de deixar seu like, comentário, ou compartilhar o post!

 

Saiba mais: 

 

popsicleR

Github do popsicleR

What is Cell Ranger? 

 

#ciencia #bioinformatica  #edutaugc #singlecellsequencing #pipeline #rnaseq

Última atualização: Aug. 4, 2022, 10:24 p.m.

Posts Relacionados