Eletroferograma: bases mistas

Diversas vezes, nos eletroferogramas de resultados de sequenciamento, nos deparamos com letras diferentes das esperadas A, T, C e G. Você já se perguntou o que é isso?

Os eletroferogramas representam o fluxo de emissão de luz (eixo y no gráfico) ao longo do tempo (eixo x). Fundamentalmente, dois tipos de eletroferogramas estão gravados em cada arquivo “ab1”. O eletroferograma “bruto” – ou “raw”, em inglês – representa o real resultado da separação de fragmentos de DNA pela eletroforese capilar realizada no equipamento AB 3500 (Figura 1). Esses fragmentos de DNA estão marcados com fluoróforos e foram gerados a partir dos DNA-moldes e primers contidos nas amostras, sendo resultantes de repetidas reações de síntese de DNA (Sanger Sequencing).

Figura 1. Eletroferograma bruto.

O segundo eletroferograma é o “processado” ou “resolvido”, gerado por uma matriz matemática que corrige a posição dos picos do eletroferograma “bruto”, ajustando-os a uma imagem mais limpa e clara (Figura 2). A matriz matemática calcula a posição ideal dos picos levando em consideração a massa dos grupos fluoróforos incorporados às cadeias de DNA e outros fatores inerentes à eletroforese capilar.

Figura 2. Eletroferograma resolvido.

Algumas vezes, principalmente em virtude de contaminações da amostra, a linha-base pode apresentar picos mais altos. Quando esses picos ultrapassam 20% da altura dos picos principais, o programa de computador não é capaz de interpretar (“call”) o nucleotídeo representado, indicando as chamadas “bases mistas” em lugar de “A”, “C”, “G” ou “T”. As bases mistas são o resultado da interpretação dos sinais sobrepostos de fluorescência, conforme o diagrama abaixo:

Isso significa que, quando houve sobreposição de fluorescência entre uma citosina e uma timina, por exemplo, o software colocará a letra Y. Se for uma adenina, timina e guanina, ele retornará a letra D, e assim por diante.

Em outros casos, excelentes amostras com resultados de alta qualidade podem apresentar picos sobrepostos. Isso ocorre principalmente em casos de alelos em heterozigose, SNPs (single nucleotide polymorphisms) ou regiões mais amplas de nucleotídeos variáveis.

A visualização e a interpretação do eletroferograma são etapas fundamentais do processo de análise de resultados. Ela ajudará a melhor definir os nucleotídeos presentes em regiões de mais difícil resolução em virtude de contaminações ou variações em sequências de DNA-moldes.