6.1 PACIENTES
6.4.1 Mutações causativas identificadas e confirmadas
6.4.1.13 Rede 174 Síndrome Tricorinofalangeana Tipo 1
A Síndrome Tricorinofalangeana Tipo 1 é causada por mutações de perda de função no gene TRPS1 com herança genética autossômica dominante e é caracterizada por nariz em forma de pera, falanges em forma de cone, malformações do quadril e baixa estatura (OMIM 190350).
Após a análise dos dados moleculares da amostra Rede 174, com hipótese diagnóstica dessa síndrome, encontrou-se uma mutação em heterozigose no gene
TRPS1 (Tabela 22). Essa mutação ainda não foi reportada como causativa dessa
síndrome. A pequena porcentagem de nucleotídeos T encontrados na corrida é provavelmente devido a erros durante o sequenciamento.
Durante a avaliação clínica, o paciente apresentava fronte ampla, cabelos escassos com implantação alta na região frontal e occiptal com crescimento capilar lento. Nariz em forma de pêra, hipoplasia de asas nasais, lábios finos, má oclusão dentária, porém sem alteração de número e estrutura. Alargamento de primeiros quirodáctilos, desvio ulnar de segundo e quintos quirodáctilos bilateralmente com alargamento de articulação falangeal média. Presença de displasia ungueal em quirodáctilos. Nos pés, alargamento dos háluces, desvio radial de segundos pododáctilos e displasia ungueal dos primeiros pododáctilos.
Tabela 22: Dados da mutação no gene TRPS1 na amostra Rede 174.
Gene CDS Cobertura % A % C % G % T Mutação
TRPS1 3 177X 47,46 0 51,98 0,56 c.1693G>A p.Gln565Ter
Confirmou-se a mutação da amostra Rede 174 em heterozigose, como esperado (Figura 20) e o DNA controle não possui a mutação.
Figura 20: Eletroferograma do sequenciamento de Sanger para confirmação da mutação.
Amostra Rede 174, heterozigoto para a mutação e a amostra controle sem a mutação. A seta indica o local da mutação
7 DISCUSSÃO
Concentrando o poder do sequenciamento de DNA de alto desempenho em regiões específicas do DNA, foi possível desenvolver um painel para captura e sequenciamento de todos os éxons de 309 genes envolvidos em displasias esqueléticas, além de 28 regiões genômicas que sofrem deleções associadas com essas doenças e analisar um grupo de 72 amostras de pacientes com diversos fenótipos esqueléticos. Desse grupo final de 72 pacientes, 27 possuem uma hipótese diagnóstica definida, 30 possuem uma vaga descrição fenotípica e 15 possuem um diagnóstico de doenças sem genes causativos definidos.
Foi escolhido o painel de captura da Illumina® devido à facilidade de preparação do painel durante a seleção dos targets e um resumo final da qualidade do painel muito satisfatório, com uma cobertura das regiões de interesse de 99%, que representa a porcentagem de bases nitrogenadas cobertas pelas sondas, e uma estimativa de sucesso de 95%, que representa o intervalo de confiança que as sondas escolhidas vão cobrir a região dos alvos. Além disso, obteve-se menos de 4% de gaps no total da região de interesse, que são bases que teoricamente não serão capturadas e ocorrem normalmente no final de algumas regiões de interesse. Também foi visto que pouco mais de 2% dos alvos obtiveram uma pontuação baixa (abaixo de 50%), que é uma estimativa da própria fabricante que estima a porcentagem de sondas que serão enriquecidas com sucesso nas sequencias alvo. Essa predição é determinada baseada no conteúdo de bases GC e uniformidade da sonda. Com isso, esses parâmetros indicaram uma alta taxa de sucesso para o sequenciamento.
No entanto, é dito pela fabricante que o resultado final do experimento e a cobertura do sequenciamento podem variar entre essas regiões alvo devido a vários fatores incluindo a qualidade da biblioteca de DNA e a eficiência da hibridização das sondas. Isso foi observado neste trabalho, no qual sondas que tinham uma pontuação e cobertura de 100% não foram sequenciadas em mais de 50% das amostras (Apêndice D) e as sondas com pontuação teórica baixa foram sequenciadas normalmente. Isto confirma que as estatísticas fornecidas pelo fabricante são apenas um guia, e devem ser confirmados por dados de
sequenciamentos subsequentes. Estes dados serão compartilhados com a Illumina® e poderá ajudá-los a aumentar a eficiência do design e da predição.
Com o painel desenhado e seu tamanho final em aproximadamente 1,44Mb, calculou-se a capacidade de multiplex da corrida, ou seja, quantas amostras poderiam ser sequenciadas ao mesmo tempo com um cobertura ideal. Com uma capacidade de sequenciamento de aproximadamente 3,5Gb, calculou-se que fossem multiplexadas 12 amostras por sequenciamento. Com isso foi possível escolher o kit de captura e sequenciamento para 96 amostras, o qual alcançaria uma cobertura média teórica de 120X e é mais que suficiente para demonstrar tecnicamente a eficácia desse tipo de análise, haja vista que em casos de heterozigose espera-se aproximadamente 60 reads para cada alelo. Considerando ainda em proporções limites como 80/20 (o mínimo aceitável para representar homozigose) ainda é esperado 24 reads para o alelo menos sequenciado.
Com o painel desenhado, foram selecionados 93 amostras de pacientes do banco de dados de displasias esqueléticas do grupo de pesquisa do consórcio Rede Centro-Oeste. A intenção inicial era escolher primeiramente amostras com diagnóstico bem definido e alta probabilidade de encontrar uma mutação em um determinado gene para facilitar as análises iniciais. Porém, devido à pequena população amostral disponível no momento da preparação da primeira corrida, além da disponibilidade da quantidade mínima de DNA para a fragmentação dessas amostras, poucos indivíduos escolhidos para a primeira análise tinham teoricamente um diagnóstico bem definido.
Após a seleção do primeiro grupo de 12 amostras, foi iniciada a preparação das bibliotecas de DNA para sequenciamento. O primeiro passo é a fragmentação do DNA genômico e podem ser utilizadas duas metodologias, nebulização e ultrassonicação. Devido à disponibilidade de equipamentos, escolheu-se a primeira metodologia para a primeira corrida. A quantidade de DNA genômico necessário para as duas metodologias é a mesma de acordo com as instruções da fabricante, no entanto observou-se que a perda de material genômico durante a fragmentação por nebulização foi muito grande, chegando a 90% em 3 amostras, devido ao vazamento de material pelo nebulizador, sendo necessário uma maior quantidade de material genético do que o esperado. Além disso, existe uma etapa após a
fragmentação para recuperação dos fragmentos utilizando uma coluna de sílica, onde ocorre ainda mais perda de material genômico.
Com isso, para as sete corridas posteriores, buscou-se uma metodologia de fragmentação das amostras que fosse mais eficiente que a nebulização, para evitar principalmente a perda de amostra durante a fragmentação. Foi utilizado o ultrassonicador Covaris® na FCAV-UNESP em Joboticabal-SP, pois além de não haver perda de amostra, a fragmentação é homogênea, com menos variação do tamanho dos fragmentos, devido ao controle da fragmentação de todas as amostras serem realizadas pelo equipamento. Portanto, o uso dessa metodologia em amostras que tenham uma quantidade limitada de material genômico é recomendado.
Além disso, a vantagem de obterem-se fragmentos com menos variação de tamanho, e consequentemente bibliotecas com tamanho médio entre 350 e 500pb, é a melhora na obtenção de dados durante o sequenciamento, com a probabilidade maior de captura e sequenciamento da região de interesse ao invés das regiões adjacentes (Figura 21).
Figura 21 – Ilustração do tamanho da biblioteca, captura e sequenciamento das bibliotecas.
Fonte: Adaptado de ILLUMINA, 2012.
Após a preparação das sete bibliotecas restantes, observou-se que 26 amostras não tinham a quantidade mínima de DNA para justificar o início da captura. O resultado disso é devido à baixa qualidade do material genômico, que pode ser devido à pureza do mesmo ou tempo estocado. Com isso, a inclusão dessas
amostras não iriam influenciar as demais, no entanto a cobertura esperada seria mais baixa o que poderia impossibilitar a análise das mesmas.
Para a validação da primeira biblioteca, inicialmente foi utilizado o Qubit® para sua quantificação em vez da metodologia de qPCR, devido à disponibilidade de reagentes. Para as sete bibliotecas subsequentes foi utilizado a metodologia de qPCR, mais específica para a quantificação das bibliotecas de sequenciamento, pois somente fragmentos que gerarão clusters no sequenciador são quantificados.
A vantagem da utilização da qPCR para quantificação das bibliotecas pode ser observado após o sequenciamento. O grupo Seq1 e Seq2 foram sequenciados com a mesma diluição final de 10pM da biblioteca de sequenciamento, no entanto o primeiro tinha uma quantidade de 35,69nM, quantificado pelo Qubit®, e o segundo 19,52nM, quantificado por qPCR (Tabela 3). Após o sequenciamento, observou-se que mesmo com a mesma quantidade inicial teórica de ambas as bibliotecas para o sequenciamento, a corrida Seq2 obteve uma maior densidade que a Seq1, além de mais reads e dados gerados (Tabela 4). Portanto, utilizando uma metodologia de quantificação mais sensível é possível obter mais facilmente a concentração ideal de
clusters durante o sequenciamento, e consequentemente mais dados gerados.
Os resultados técnicos das corridas foram excelentes (Tabela 4), com uma boa quantidade de dados gerados de ótima qualidade. Com isso, foi realizada a análise das sequências pelo software NextGENe®, que através de uma interface
user-friendly possibilita o alinhamento das sequencias ao genoma referência e
consequente descoberta de SNP/Indels, além de gerar dados técnicos sobre todas as amostras multiplexadas, como a cobertura média e porcentagem de sequências ‘on target’.
A cobertura média de cada corrida variou entre 100 e 140X, com algumas abaixo da máxima teórica (200X), mas dentro da média esperada on target de 60- 90% (120X). Com os resultados das amostras com cobertura global abaixo do padrão aceitável pela literatura (50X) devido à baixa qualidade do DNA, conclui-se que além da quantidade mínima e da verificação de degradação do material genômico, pode ser útil a verificação da pureza das amostras de DNA através fluorômetros, como o Nanodrop® para evitar resultados ruins após o sequenciamento.
A cobertura na região de interesse foi muito satisfatória, e mesmo que 5% dos
targets tenham uma cobertura abaixo de 20X (Tabela 5), esta é uma boa abordagem
pra sequenciar uma grande quantidade de genes e para auxiliar o diagnóstico de pacientes com uma suspeita diagnóstica ou com um diagnóstico vago. No entanto, mesmo com bons dados técnicos, a análise desses dados depende de uma boa descrição clínica do paciente e uma colaboração com uma equipe médica especializada devido às mutações candidatas encontrada.
Em cada amostra, foram encontradas aproximadamente 500 variantes, entre elas variantes silenciosas (60%), de sentido trocado e sem sentido (40%). Após a filtragem das variantes silenciosas, 90% são variantes encontradas no dbSNP. Na filtragem inicial, estas são removidas e somente as variantes restantes são analisadas. No entanto, o dbSNP possui um canal com variantes clínicas, por isso a segunda etapa da análise envolve a busca de mutações candidatas nesse banco de dados (Figura 7). Ao final da filtragem inicial são analisadas entre 5-15 variantes candidatas que possam ser patológicas. Um relatório é preparado com esses dados e então discutido com a equipe médica para chegar a um diagnóstico molecular definitivo. Caso não haja um consenso sobre o diagnóstico, variantes descartadas durante a filtragem são analisadas e discutidas. Até o momento utilizando essa abordagem, 15 indivíduos foram diagnosticados com o auxílio dos dados moleculares.
Além das reuniões com um corpo médico para a análise dos resultados, conclui-se que essas reuniões também devem ocorrer durante a seleção de amostras pra esse tipo de abordagem molecular. Durante as análises, diversos pacientes foram excluídos devido a novas informações clínicas recebidas que diferiam das informações contidas no pedido médico recebido para a composição do banco de dados de amostras. Ao mesmo tempo, não foi possível chegar a um diagnóstico definitivo nos demais pacientes devido à falta de dados nos prontuários disponíveis para análise, sendo necessária uma reavaliação do paciente para reanálise dos dados clínicos e moleculares para uma nova hipótese diagnóstica, reforçando a necessidade de dados clínicos bem definidos antes de utilizar uma abordagem como o sequenciamento de exoma parcial.
Para a análise dos dados moleculares dos pacientes com hipótese diagnóstica de doenças sem gene causativo definido, todas as variantes serão
analisadas para descartar a possibilidade de encontrar uma mutação nos genes conhecidos causativos de displasias esqueléticas estudados neste trabalho.
Ainda, durante a seleção de amostras, foi sequenciada a amostra do paciente Rede 131 (Tabela 6) com um diagnóstico da síndrome de Smith-Lemli-Opitz o qual seu gene causativo não constava no painel, levando à exclusão da análise molecular dessa amostra haja vista que nenhuma variação encontrada durante a análise dos dados moleculares correspondia ao fenótipo do paciente. Durante a seleção de dados moleculares de doenças esqueléticas para a construção do painel de genes, foi utilizado como base a revisão do ano de 2010 do relatório da Nosologia e Classificação de Doenças Genéticas do Esqueleto (WARMAN et al., 2011) e relatos na literatura a partir do ano de 2010 sobre novos genes causativos de doenças esqueléticas (Apêndice B). No entanto, o gene causativo desta doença (DHCR7) está descrito desde 1998 (FITZKY et al., 1998). Também, antes do sequenciamento dessa amostra, não foi checado se o gene causativo dessa doença estava presente no painel, pois não era esperado que dados moleculares de doenças esqueléticas descritas antes do ano de 2010 não estivessem presentes no relatório da Nosologia.
Apesar desses imprevistos, os dados moleculares obtidos nessa abordagem foram usados no auxílio da definição do diagnóstico clinico de cinco amostras (Tabela 21), mesmo sem um diagnóstico clínico inicialmente definido.
Tabela 21: Pacientes com diagnóstico definitivo modificado devido à análise dos dados
moleculares.
Amostra Diagnóstico Médico Inicial Diagnóstico Médico Definitivo
Rede 82 Displasia Óssea Inespecífica Síndrome de Apert
Rede 121 Síndrome de Sotos Síndrome de Weaver
Rede 122 Síndrome de Goldenhar (Espectro OAV) Síndrome de Townes-Brocks
Rede 150 Displasia Óssea Inespecífica Hipocondroplasia
Rede 163 Displasia Óssea Inespecífica Displasia Espondiloepifisária Congênita
Em consulta com os médicos colaboradores, esses pacientes receberam o diagnóstico médico definitivo após a avaliação do relatório com as análises moleculares e mutações candidatas para cada paciente.
O paciente Rede 121 possuía um diagnóstico inicial de Síndrome de Sotos, porém não encontramos uma mutação no gene desta doença, então analisou-se as variações encontradas e foi apresentado ao corpo médico a possibilidade diagnóstica de síndrome de Weaver, que possui características similares à primeira (OMIM 277590). Após reavaliação do paciente, juntamente com os dados moleculares, definiu-se a síndrome de Weaver como doença causativa.
O diagnóstico definitivo do paciente Rede 122 ocorreu da mesma maneira. Os dados clínicos iniciais no pedido médico do paciente indicavam a suspeita de síndrome de Goldenhar com espectro OAV, e após a análise conjunta dos dados moleculares e clínicos, definiu-se que o paciente possuía a Síndrome de Townes- Brocks (OMIM 107480).
Esses casos exemplificam o objetivo desse projeto, de auxiliar o diagnóstico definitivo das displasias esqueléticas através da utilização em conjunto de dados moleculares e clínicos. Com a maior colaboração com a equipe médica antes, durante e após a utilização dessa abordagem, o rendimento de diagnósticos definitivos será muito maior.
E mesmo com suas limitações, esta abordagem ainda é promissora. Para aumentar a proporção de sequencias on target, pode utilizar-se outros kits comerciais disponíveis que utilizam a metodologias de captura e enriquecimento, considerando-se que esses kits geram diferentes resultados (BODI et al., 2013). Para evitar que regiões de baixa complexidade não sejam sequenciadas e possíveis mutações perdidas, trabalhos mostram que diminuir a concentração de clusters para 500-700 milhões de clusters/mm2 ou evitar os passos de enriquecimento por PCR
durante a preparação das bibliotecas (KIRCHER, HEYN; KELSO, 2011; OYOLA et al., 2012).
Também, durante o desenvolvimento desse projeto, desde o desenho do painel de genes à aplicação da metodologia, diversos novos genes causativos de doenças esqueléticas foram caracterizados na literatura e, portanto, não estão presentes no painel de genes utilizado neste trabalho. Ainda assim, para o diagnóstico clínico de doenças esqueléticas mais comuns, ou para triagem molecular em estudos de doenças mais complexas, este painel se torna viável, pois
contém a grande maioria dos genes conhecidos causadores de displasias esqueléticas. Ademais, para futuras utilizações este painel será atualizado.
Com isso, o diagnóstico genético de pacientes com displasias esqueléticas através do sequenciamento de exoma parcial em plataforma de sequenciamento de alto desempenho se mostra eficaz para a análise molecular de displasias esqueléticas, com o sequenciamento de todos os éxons dos genes conhecidos dessas displasias. Apesar de esta abordagem envolver o sequenciamento de diversos genes não relevantes ao diagnóstico de um paciente em particular, é viável para que muitos pacientes possam ser analisados ao mesmo tempo, independentemente do diagnóstico de displasia esquelética. O método descrito é mais rápido, preciso e de baixo custo quando comparado ao método de Sanger e evita a necessidade de vários painéis menores de genes. Além disso, ficou claro que é necessária uma boa colaboração com um corpo médico, durante a seleção das amostras para a utilização dessa metodologia e análise dos dados, além de um profissional com experiência para análise de rotina dos dados moleculares obtidos.
8 CONCLUSÃO
As displasias esqueléticas compreendem um grande grupo de doenças clinicamente distintas e geneticamente heterogêneas dificultando seu diagnóstico definitivo. Existem poucos grupos no mundo com a experiência multidisciplinar (especialmente perícia radiológica e clínica) com facilidade de distinguir a maioria das displasias esqueléticas. A raridade dessas doenças dificulta o diagnóstico clínico mesmo por geneticistas experientes e a incorporação de dados moleculares juntamente com a avaliação clínica poderá aumentar significativamente a capacidade de se chegar a um diagnóstico definitivo.
Com o desenvolvimento de técnicas moleculares e a elucidação das bases moleculares dessas doenças, os testes moleculares se tornaram úteis no auxílio do diagnóstico das displasias esqueléticas. A partir da metade da década de 2000 surgiram novas tecnologias de alto desempenho para o sequenciamento de DNA, que diminuíram drasticamente o custo de base nitrogenada sequenciada e ao mesmo tempo aumentaram significativamente o número de bases sequenciadas, viabilizando testes moleculares de grupos de genes específicos para triagem de mutações relevantes no diagnóstico e tratamento de doenças.
Aplicando o poder do sequenciamento de DNA de alto desempenho em regiões específicas do DNA, foi possível desenvolver um painel para captura e sequenciamento de todos os éxons de 309 genes envolvidos em displasias esqueléticas, além de 28 regiões genômicas que sofrem deleções associadas com essas doenças, com a geração de dados de alta qualidade, fidelidade, desempenho, velocidade e baixo custo ao analisar um grupo de amostras com diagnóstico clínico variado.
A rápida identificação de mutações causativas em pacientes com diagnóstico clínico variado, bem como o auxílio na definição de diagnósticos indefinidos ou imprecisos, refletem o principal objetivo desse trabalho, que é auxiliar no diagnóstico definitivo de pacientes com displasias esqueléticas. Foi rapidamente demonstrado que a técnica de sequenciamento de alto desempenho para múltiplos genes é eficaz, rápida e confiável na identificação de mutações em pacientes com essas
displasias. Ainda, com a colaboração de uma equipe médica, o diagnóstico definitivo pode ser simplificado, além de obtido mais rapidamente através da avaliação mútua dos dados clínicos e moleculares dos pacientes.
REFERÊNCIAS BIBLIOGRÁFICAS
ABUELO, D. N.; MERYASH, D. L. Neurofibromatosis with fully expressed Noonan syndrome. Am J
Med Genet. 29: 937-41. 1988.
ADACHI, M. et al. Generalized skeletal dysplasia in mother and daughter with 22q11 deletion syndrome. Am J Med Genet A. 117A: 295-8. 2003.
ADZHUBEI, I. A. et al. A method and server for predicting damaging missense mutations. Nat
Methods. 7: 248-9. 2010.
AL-GAZALI, L. I. et al. Birth prevalence and pattern of osteochondrodysplasias in an inbred high risk population. Birth Defects Res A Clin Mol Teratol. 67: 125-32. 2003.
ALANAY, Y.; LACHMAN, R. S. A review of the principles of radiological assessment of skeletal dysplasias. J Clin Res Pediatr Endocrinol. 3: 163-78. 2011.
ALVARADO, D. M. et al. Familial isolated clubfoot is associated with recurrent chromosome 17q23.1q23.2 microduplications containing TBX4. Am J Hum Genet. 87: 154-60. 2010.
BALEMANS, W. et al. A generalized skeletal hyperostosis in two siblings caused by a novel mutation in the SOST gene. Bone. 36: 943-7. 2005.
BAMSHAD, M. J. et al. Exome sequencing as a tool for Mendelian disease gene discovery. Nat Rev
Genet. 12: 745-55. 2011.
BARROSO, E. et al. Identification of the first de novo PAR1 deletion downstream of SHOX in an individual diagnosed with Leri-Weill dyschondrosteosis (LWD). Eur J Med Genet. 53: 204-7. 2010.
BECKER, J. et al. Exome sequencing identifies truncating mutations in human SERPINF1 in autosomal-recessive osteogenesis imperfecta. Am J Hum Genet. 88: 362-71. 2011.
BEDOYAN, J. K. et al. A complex 6p25 rearrangement in a child with multiple epiphyseal dysplasia.
Am J Med Genet A. 155A: 154-63. 2011.
BENTLEY, D. R. et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456: 53-9. 2008.