Video 4 IGV Mariana Funari
Introdução à Ferramenta IGV
Apresentação da Palestrante
- Mariana, biomédica e biologista no L 42, responsável pelo setor de sequenciamento.
- Colaboradora do Cela, uma das facilites de sequenciamento em larga escala da faculdade de medicina.
Objetivo da Aula
- Apresentar a ferramenta IGV para visualização de variantes identificadas em sequenciamento em larga escala.
- Diferenciar entre resultados de sequenciamento por sangue e listas de variantes geradas por ferramentas específicas.
Funcionamento do IGV
Visualização das Variantes
- O IGV permite visualizar variantes e verificar a cobertura nas regiões genômicas.
- A altura dos picos na visualização indica a profundidade da cobertura; áreas cinzas representam regiões não cobertas.
Versões do Software
- O IGV possui versão desktop (instalável) e versão web (usável no navegador).
- A interface inclui um manual do usuário e links para vídeos com dicas sobre análise.
Importação e Análise de Dados
Seleção do Genoma Referência
- Primeiro passo é selecionar o genoma referência utilizado na análise (ex: hg19 ou hg38).
Importação dos Arquivos
- Os arquivos preferenciais são os arquivos BAM, que devem ser alinhados ao genoma referência.
Navegação e Busca no IGV
Localizando Variantes Específicas
- É possível buscar coordenadas específicas para visualizar variantes diretamente.
Análise da Cobertura
- A cobertura pode ser verificada clicando nas regiões coloridas; informações sobre quantas vezes foram sequenciadas estão disponíveis.
Configurações Avançadas
Modificação das Preferências
- Usuários podem ajustar critérios como o range de visibilidade e fração do alelo para chamar variantes.
Visualização Detalhada dos Genes
- Ao clicar nos genes, é possível acessar informações detalhadas sobre exons e transcritos principais.
Análise Final das Variantes
Identificação de Variantes Heterozigóticas
Análise de Reads em Sequenciamento
Agrupamento e Visualização de Reads
- O agrupamento dos reads pode ser feito por diversos critérios, permitindo a seleção e coloração dos mesmos. Por exemplo, no sequenciamento paired-end, os reads sense são marcados em vermelho e os antisense em azul.
- É possível visualizar deleções nas sequências. Uma deleção de uma única base aparece como uma barra preta no meio do read, enquanto uma deleção maior (como 16 nucleotídeos) é representada por uma diminuição brusca na cobertura.
- Inserções são indicadas com um símbolo roxo (Z), mostrando quantas bases foram inseridas e quais são essas bases. Neste caso específico, três bases foram inseridas.
Análise de Cobertura e Viés de Fita
- A coloração dos reads ajuda a identificar regiões de baixa cobertura. Em casos onde a variante está presente apenas nas sequências antisense, isso pode levar a falsos positivos na chamada de variantes.
- A visualização dos pares de reads é crucial para entender variantes próximas que não estão localizadas no mesmo read, mas dentro do mesmo fragmento da biblioteca.
Identificação de Variantes em Genes Candidatos
- Quando se analisa doenças autossômicas recessivas, o sequenciamento pode fornecer informações sobre heterozigose composta sem necessidade da segregação nos pais.
- Em casos onde não há variante detectada em um gene candidato forte, é importante verificar variantes comuns associadas à doença através das coordenadas no dado do sequenciamento.
Exemplo Prático: Síndrome de McCune-Albright
- No caso da síndrome de McCune-Albright, duas variantes frequentes no gene GNAS foram analisadas. Apesar da baixa frequência no sangue periférico devido ao mosaico celular, foi possível confirmar a presença da variante através de PCR digital após análise mais sensível.
Importância da Cobertura Genômica
- Ao analisar genes candidatos sem variantes patogênicas identificáveis, observar a cobertura geral do gene pode revelar quedas significativas que indicam possíveis deleções ou problemas na sequência.
- O IGV (Integrative Genomics Viewer) marca reads com cores específicas para indicar qualidade; por exemplo, cores brancas sinalizam baixa qualidade de mapeamento devido à homologia com pseudogenes.
Considerações Finais sobre Qualidade dos Dados
Análise de Rearranjos Estruturais em Sequenciamento Genético
Identificação de Rearranjos Estruturais
- O sequenciamento por end permite inferir a distância entre os reads sense e anti-sense, ajudando na identificação de rearranjos estruturais.
- Em casos de deleções, há uma perda de segmentos do cromossomo, resultando em aproximação dos reads que são visualizados com cores diferentes no programa.
- A fusão entre cromossomos é identificada pela coloração distinta dos reads provenientes de cada cromossomo, indicando que estão juntos.
- Inversões também geram padrões semelhantes, onde os reads são marcados com cores diferentes para facilitar a visualização das alterações.
- O programa permite capturar imagens das alterações identificadas durante a análise.
Utilização da Versão Web do Programa
- A versão web do programa é semelhante à versão instalada e pode ser utilizada quando não há possibilidade de instalação local.
- É necessário selecionar simultaneamente as opções "Ban" e "Buy" para importar arquivos corretamente no sistema.