• Nenhum resultado encontrado

Variações genômicas e longos trechos contínuos de homozigose detectados por Array-CGH em pacientes com distúrbios do desenvolvimento cerebral: interpretação e implicações

N/A
N/A
Protected

Academic year: 2021

Share "Variações genômicas e longos trechos contínuos de homozigose detectados por Array-CGH em pacientes com distúrbios do desenvolvimento cerebral: interpretação e implicações"

Copied!
169
0
0

Texto

(1)

VARIAÇÕES GENÔMICAS E LONGOS TRECHOS CONTÍNUOS DE HOMOZIGOSE DETECTADOS POR

Array-CGH EM PACIENTES COM DISTÚRBIOS DO

DESENVOLVIMENTO CEREBRAL: Interpretação e Implicações

Dissertação submetida ao Programa de Pós-Graduação em Biologia Celular e do Desenvolvimento da Universidade Federal de Santa Catarina para a obtenção do Grau de Mestre em Biologia Celular e do Desenvolvimento.

Orientadora: Profª. Drª Angelica Francesca Maris.

FLORIANÓPOLIS - SC 2018

(2)
(3)
(4)
(5)

Este trabalho é dedicado aos meus avós, Maria Erotildes e João Pedro Chaves (in memorian).

(6)
(7)

Primeiramente um agradecimento especial aos mais pais, Roseli e Dair, e minha irmã Luara por sempre terem me dado forças e apoio, principalmente no momento de sair da minha pequena e humilde cidade natal para construir essa jornada longe de casa. Um agradecimento ao demais familiares e amigos.

Agradeço à minha orientadora Profª. Dra. Angélica Francesca Maris, por toda a confiança, apoio, críticas construtivas e por todos os ensinamentos transmitidos ao longo desse tempo, muito obrigado!

Ao meu colega e amigo, Luan Freitas de Oliveira, companheiro de laboratório, por toda a ajuda e incentivo que você sempre me ofereceu.

À Maristela Ocampos, por toda a ajuda científica, por estar sempre disposta a passar seu conhecimento, por todas as conversas, desabafos e críticas construtivas, o meu muito obrigado.

À Ingrid Tremel Barbato e toda equipe do Laboratório Neurogene, agradeço pelo apoio, parceria e confiança, muito obrigado!! Aos demais membros da equipe de pesquisa, Dr. Jorge Barbato, Drª. Gisele de Lucca, Drª Louise Lapagesse de Camargo Pinto e Drª Pricila Bernardi por terem conseguido um espaço nas suas agendas, para colaborar e responder os questionários necessários para que este estudo pudesse se realizar, muito obrigado.

Obrigada a todos os professores da Pós-graduação em Biologia Celular e do Desenvolvimento pelas disciplinas ministradas e pelos conhecimentos transmitidos.

Gostaria de agradecer imensamente a CAPES pelo apoio financeiro concedido através da bolsa, importante para execução deste trabalho e minha permanência nesta cidade.

Agradeço em especial aos membros da banca, Profª. Drª. Sara Lofgren e Profª Drª Yara Costa Netto Muniz e, por cordialmente aceitarem corrigir esta dissertação. Considerações que com certeza serão muito bem-vindas para a melhoria deste trabalho.

Obrigado a todos que de certa forma contribuíram para a realização deste trabalho.

(8)
(9)

“A atenção é a mais importante de todas as faculdades para o desenvolvimento da inteligência humana”.

(10)
(11)

CHAVES, T.F. Variações genômicas e longos trechos contínuos de

homozigose detectados por array-CGH em pacientes com distúrbios

do desenvolvimento cerebral: interpretação e implicações.

Florianópolis, 2018. Dissertação de Mestrado em Biologia Celular e do Desenvolvimento – Pós-Graduação em Biologia Celular e do Desenvolvimento, Universidade Federal de Santa Catarina, Santa Catarina, 2018.

Os distúrbios do desenvolvimento cerebral (DDC) são um grupo de doenças heterogêneas que inclui predominantemente a deficiência intelectual (DI) e/ou transtorno do espectro do autismo (TEA), sendo muitas vezes sindrômicos, e afetam em torno de 3-4% da população mundial. Centenas de genes e muitas alterações cromossômicas são associadas aos DDCs, porém cerca de 40% permanece sem esclarecimento etiológico. A técnica de citogenética molecular mais recomendada como exame genético de primeira escolha na avaliação da variação do número de cópias (CNVs) em pacientes com DDC é a técnica de hibridização genômica comparativa por arrays (array-CGH). As plataformas de array-CGH combinam sondas de oligonucleotídeos para detecção de CNVs com sondas para polimorfismos de nucleotídeo único (SNPs) que detectam regiões homozigóticas como os longos trechos contínuos de homozigose (LCSHs), fornecendo evidencias para investigação de dissomia uniparental (UPD) e consanguinidade. O presente trabalho teve como objetivo analisar e interpretar o significado clínico das CNVs, bem como avaliar as frequências e as implicações dos LCSHs detectados por array-CGH em exames realizados no Laboratório de Genética Humana Neurogene de Florianópolis. Estes exames foram solicitados entre os anos de 2013 a 2016 por médicos geneticistas e neurologistas de Santa Catarina para a investigação de pacientes com DDC, alguns destes exames (2%) são de familiares não afetados. Este trabalho é um estudo retrospectivo-prospectivo onde foram analisados 430 exames de array-CGH, com as plataformas CytoScan® HD (74%) e CytoScan® 750K (26%). A média de idade dos investigados foi de 9,5 anos (0 a 49 anos); 60% masculinos e 40% femininos, as informações clínicas e fenotípicas para relação fenótipo/genótipo foram fornecidas através de preenchimento de questionários pelos seus médicos e as análises foram feitas no software Chromosome Analysis Suite (Affymetrix®, EUA), com informações de bancos de dados públicos e privados. Resultados: analisando 420 pacientes com DDC para CNVs,

(12)

foram detectadas um total de 96 CNVs interpretadas como patogênicas em 18% dos casos, em 12% foram detectadas variantes de significado clínico incerto (VOUs) e 70% dos exames não revelaram CNVs de relevância clínica. A análise de fenótipos dessa população revelou que 67% dos participantes apresentou atraso no desenvolvimento neuropsicomotor (ADNPM), 41% participantes tinha com deficiência intelectual DI (incluindo muitos que apresentaram ADNPM), em conjunto representando 80% (ADNPM e/ou DI), 52% tinham dismorfias faciais e 32% TEA. Conforme análise univariada, os fenótipos preditivos de um resultado patogênico em indivíduos com DCC foram em ordem decrescente; obesidade (p-value = 0.006), baixa estatura (p-value = 0.032), anomalias e malformações geniturinárias (p-value = 0.032) e TEA (p-value = 0.039). Todos os 430 exames (incluindo alguns familiares não afetados) foram investigados para a presença de LCSHs (regiões de homozigose em cromossomos autossômicos ≥ do que 3 Mb), sendo que 95% dos participantes apresentaram de um a vários LCHS, somando um total de 1.478 LCSHs identificados. Para 10 casos (2,3%), os achados foram sugestivos de UPD. Cerca de 26% dos casos indicaram endogamia, dos quais 8% sugerem descendência de primeiro a quinto grau, que são mais propensos a causar um impacto clínico. Considerando LCSHs encontrados em uma frequência acima de 5% em indivíduos com DDC, foram delineadas algumas regiões consideradas homozigotas por representarem potenciais haplótipos ancestrais comuns na população de SC. A região mais comumente envolvida com homozigose foi 16p11.2p11.1 (49%), seguida de 1q21.2q21.3 (21%), 11p11.2p11.12 (19%), 3p21.31p21.2 (16%), 15q15 .1q21.1 (12%), 2q11.1q12.1 (9%), 1p33p32.3 (6%), 20q11.21q11.23 (6%), 10q22.1q23.31 (5%), 6p22.2p22.1 (5%) e 7q11.22q11.23 (5%). A taxa diagnóstica encontrada neste estudo foi de 18% e está dentro da relatada na literatura (15-20%), sendo que a interpretação de LCSHs sozinha não elevou a taxa diagnóstica, porém foi importante para direcionar a investigação posterior, além de permitir um “insight” para os LCSHs potencialmente ancestrais da população de SC. A interpretação clínica de CNVs encontradas e as implicações do LCSH ainda são um desafio e dependem, em grande parte, das informações de frequência e detecção em coortes com amostragem significativa, como a relatada neste estudo.

Palavras-chave: array-CGH, CNVs, deficiência intelectual, transtorno

do espectro do autismo, distúrbios do desenvolvimento cerebral, SNPs, LCSH.

(13)
(14)
(15)

CHAVES, T.F. Genomic variations and long continuous stretches of

homozygosity by array-CGH in patients with brain development disorders: interpretation and implications. Florianópolis, 2018.

Dissertação de Mestrado em Biologia Celular e do Desenvolvimento – Pós-Graduação em Biologia Celular e do Desenvolvimento, Universidade Federal de Santa Catarina, Santa Catarina, 2018.

Brain developmental disorders (BDD) are a heterogeneous group of diseases that predominantly include intellectual disability (ID) and/or Autism Spectrum Disorder (ASD), often syndromic, affecting around 3-4% of the world's population. Hundreds of genes and many chromosomal abnormalities are associated with BDD, however for about 40% the causes remain unclear. The molecular cytogenetic technique of comparative array genomic hybridization (array-CGH) is recommended as the first-tier genetic test for BDD and investigates genomic copy number variations (CNVs). Modern array-CGH platforms combine oligonucleotide probes for detection of CNVs with probes for single nucleotide polymorphisms (SNPs) that detect homozygous regions such as long continuous stretches of homozygosity (LCSHs), providing evidence for uniparental disomy (UPD) and consanguinity. The aim of the present study was to analyze and interpret the clinical significance of CNVs, as well as to evaluate the frequencies and the implications of LCSHs detected by array-CGH in tests performed at the Neurogene Human Genetics Laboratory of Florianópolis. Requested between 2013 to 2016 by geneticists and neurologists from Santa Catarina to investigate patients with CDD, some tests (2%) are from unaffected relatives. A total of 430 array-CGH exams were analyzed with the CytoScan® HD (74%) and CytoScan® 750K (26%) platforms. The mean age of the subjects was 9.5 years (0 to 49 years); 60% male and 40% female. It is a retrospective-prospective study. Clinical and phenotypic information for phenotype/genotype relationship were accessed through questionnaire completion by their physicians. The analyzes were done in the Chromosome Analysis Suite software (Affymetrix®, USA) and with information from public and private databases. Results: The analysis of the CNVs o the 430 participants revealed a total of 96 pathogenic CNVs, 18% of the cases. For 12% of the participants variants of uncertain clinical significance (VOUs) were found and for 70%,the exams did not reveal CNVs of clinical relevance. Analysis of phenotypes of this population revealed that 67% presented delayed neuropsychomotor development

(16)

and41% had ID (some of which also had delayed neuropsychomotor devlopment), together representing 80%; 52% had facial dysmorphia and 32% TEA. According to univariate analysis, the predictive phenotypes of a diagnostic outcome in individuals with BDD were, in descending order; obesity (p-value = 0.006), short stature (p-value = 0.032), anomalies and genitourinary malformations (p-value = 0.032) and TEA (p-value = 0.039). All 430 exams (including some unaffected relatives) were investigated for the presence of LCSHs (homozygous regions on autosomal chromosomes ≥ 3 Mbp), of which 95% of the participants had one to several LCHS, summing up a total of 1,478 LCSHs. For 10 cases (2.3%) the findings were suggestive of UPD. For about 26% of the cases, LCSHs indicated endogamy, of which 8% suggest descent from first to fifth grade, which are more likely to have a clinical impact. LCSHs found at a frequency above 5% in individuals with BDD, were considered to be homozygous for potentially representing common ancestral haplotypes in the SC population. The region most commonly involved with homozygosity was 16p11.2p11.1 (49%), followed by 1q21.2q21.3 (21%), 11p11.2p11.12 (19%), 3p21.31p21.2 (16%), 15q15 .1q21.1 (12%), 2q11.1q12.1 (9%), 1p33p32.3 (6%), 20q11.21q11.23 (6%), 10q22.1q23.31 (5%), 6p22.2p22.1 (5%) and 7q11.22q11.23 (5%). The diagnostic rate in this study was 18% and is within the reported in the literature (15-20%). The interpretation of LCSHs by itself did not raise the diagnostic rate, but was important to direct further investigation, besides allowing an insight into the potentially ancestral LCSHs of the SC population. The clinical interpretation of the CNVs found and the implications of LCSH are still a challenge and depend largely on frequency and detection information in cohorts with significant sampling, as reported in this study.

Keywords: array-CGH, CNVs, intellectual disability, autism spectrum

disorder, brain development disorders, SNPs, LCSH.

(17)

Figura 1: Representação esquemática de estádios do Neurodesenvolvimento, relacionados a fatores genéticos e ambientais e sua janela de tempo...02 Figura 2: Hibridização genômica comparativa por arrays - array-CGH...07 Figura 3: Durante o crossover na meiose I, a recombinação homóloga não alélica (NAHR) entre sequências repetidas de baixa cópia (LCRs), homólogas parálogas diretas, resulta em duplicações e deleções recíprocas e recorrentes. .... …………...13 Figura 4: Representação esquemática de rearranjos genômicos não recorrentes observados em distúrbios genômicos...………...14 Figura 5: CNVs não recorrentes alinhadas e revelando uma região de sobreposição em comum. .... ...………15 Figura 6: Esquema de rupturas de DNA de dupla cadeia (DSBs) e seu reparo por junção final não homóloga (NHEJ). .... ………...………...16 Figura 7: Replicação induzida por quebra (BIR). .... ...…………30

(18)
(19)

Gráfico 5.1 - Frequência de CNVs patogênicas por Cromossomo...48 Gráfico 5.2- Frequência de CNVs VOUs por Cromossomo...48 Gráfico 5.3 - Interpretação diagnóstica com base nas CNVs detectadas no estudo...49

(20)
(21)

Tabela 1 1 - Alguns estudos publicados que utilizaram o array-CGH para teste diagnostico na busca da etiologia genética em coorte de indivíduos afetados……... .24 Tabela 1 2 - Correlação entre porcentagem de LCSH e grau de relação parental dos genitores do probando………...…..27 Tabela 2-1 - CNVs patogênicas encontradas através do exame de array-CGH na coorte de Barreto (2015)...50 Tabela 2-2 - CNVs VOUs encontradas através do exame de array-CGH na coorte de Barreto (2015)...53 Tabela 2-3 - CNVs patogênicas encontradas através do exame de array-CGH na coorte de 2014-2016. ...54 Tabela 2-4 - CNVs VOUs encontradas através do exame de array-CGH na coorte de 2014-2016... 62 Tabela 2-5 - CNVs VOUs subclassificadas como VOUs potencialmente patogênicas encontradas através do exame de array-CGH na coorte de 2014-2016... 66 Tabela 2-6 - As características clínicas registradas em cada paciente, expressas em porcentagem e número de casos...67 Tabela 3-1 - Casos de LCSHs ≥ 10 Mb restritos a um cromossomo autossômico sugerindo uma possível UPD...79 Tabela 3-2 - Resultado da análise de consanguinidade nos casos que a soma total dos LCSHs ≥ 3 sugerem consanguinidade de primeiro a quinto grau dos genitores do probando...86 Tabela 3-3 - Regiões de LCSHs considerados comuns (frequência ≥ 5%) identificados dentre 430 exames de array-CGH de uma coorte com distúrbios do desenvolvimento………...88

(22)
(23)

AC - Anomalias congênitas;

ACMG – Colégio Americano de Genética Médica (American College of Medical Genetics)

ADNPM- Atraso no Desenvolvimento Neuropsicomotor; AG- Aconselhamento Genético;

AOH - ausência de heterozigosidade (absence of heterozygosity); Array-CGH- Hibridização Genômica Comparativa por microchip (array Comparative Genomic Hybridization);

AS- Síndrome de Asperger

BAC- Cromossomos Artificiais Bacterianos (Bacterial Artificial Chromosomes);

BIR- Replicação Induzida Por Quebra (break induced replication) CAGdb- Cytogenomics Array Group CNV Database;

CGG- Citosina, Guanina, Guanina (trinucleótido) CGH- Hibridização Genômica Comparativa ChAS- Chromosome Analysis Suite;

CNV- Variações do Número de Cópias (Copy Number Variation); CREBBP- Creb-Binding Protein;

dbGap- Database of Genotypes and Phenotypes;

dbSNP- Bando de dado Polimorfismos de Nucleotídeo Único (data base Single Nucleotide Polymorphism);

DDC - Distúrbios do desenvolvimento cerebral;

DECIPHER- Database of Chromosomal Imbalance and Phenotype in Humans using Ensembl Resources;

DGV- Banco de Dados de Variantes Genômicas (Database of Genomic Variants);

DI- Deficiência Intelectual; DIL- Deficiência Intelectual Leve; DIM- Deficiência Intelectual Moderada; DIS- Deficiência Intelectual Severa; DNA- Ácido Desoxirribonucleico;

DSM- Manual Diagnóstico e Estatístico de Transtornos Mentais (Diagnostic and Statistical Manual of Mental Disorders);

(24)

ECARUCA- European Cytogeneticists Association Register of Unbalanced Chromosome Aberrations;

FISH- Hibridização in situ fluorescente (Fluorescent In Situ Hybridization);

FMR1- X Frágil Retardo Mental (Fragile X Mental Retardation 1); GRCh- Consórcio Genoma Referência (Genome Reference Consortium); Hg- Genoma Humano (Human Genome);

HIJG- Hospital Infantil Joana de Gusmão;

IBD- Regiões Idênticas Por Descendência (Identical By Descente); IMPA- Monofosfatase de mio-inositol (Myo-inositol monophosphatase); ISCA- International Standards for Cytogenomic Arrays;

Kb- Kilo pares de base (mil pares bases);

LCR- Repetições de Baixa Cópia (low-copy repeats)

LCSH- Longos Trechos Contínuos De Homozigose (Long Contiguous Stretches Of Homozygosity);

LOH- Perda de Heterozigose (Loss of Heterosygosity); Mb- Mega pares de base (milhões de pares de bases);

NAHR- Recombinação homóloga não alélica (nonallelic homologous recombination)

NCBI- Centro Nacional para a Informação Biotecnológica (National Center for Biotechnology Information);

NHEJ- Junção de Extremidades Não-Homólogas (non-homologous end joining)

OMIM- Online Mendelian Inheritance in Man; PCR- Reação em Cadeia da Polimerase;

PubMed- US National Library of Medicine National Institutes of Health; PUC - Pontifícia Universidade Católica;

QI- Quociente de Inteligência;

RBMs - Recombination And Replication-Based Mechanisms RNA- Ácido ribonucleico;

RNAm- RNA mensageiro;

ROH- Corridas De Homozigose (Runs Of Homozygosity); SC- Santa Catarina;

SHOX- Short Stature Homeobox;

(25)

SNX- Sorting Nexin;

SSA- (single strand annealing);

TCLE- Termo de Consentimento Livre e Esclarecido; TEA - transtorno do espectro do autismo

UCSC- Universidade da Califórnia Santa Cruz (University of California Santa Cruz);

UFSC - Universidade Federal de Santa Catarina; UPD - disomia uniparental (uniparental disomy);

VOUS- Variantes de Significado Clínico Incerto (Variants of Uncertain clinical Significance);

YAC- Cromossomos Artificiais de Leveduras (Yeast Artificial Chromossome);

(26)
(27)

1 INTRODUÇÃO ... 1

1.1 DISTÚRBIOS DO DESENVOLVIMENTO CEREBRAL .... 1 1.2 EXAMES DIAGNÓSTICOS DE DDC ... 5

1.2.1 Array-CGH ... 7 1.2.1.1 Plataformas de Array-CGH ... 8 1.3 VARIAÇÃO DO NÚMERO DE CÓPIAS ... 9

1.3.1 Mecanismos moleculares que originam CNVs... 11

1.3.1.1 CNVs recorrentes ... 12 1.3.1.1.1 LCRs e Recombinação homóloga não alélica - NAHR ... 12 1.3.1.2 CNVs não recorrentes ... 13 1.3.1.2.1 Junção de extremidades não-homólogas - NHEJ ... 15

1.3.2 Interpretação das CNVs ... 16

1.3.2.1 Classificação das CNVs ... 18

1.3.3 Bioinformática na interpretação das CNVs ... 19

1.3.3.1 Bancos de dados de CNVs ... 20 1.3.3.1.1 Bancos de dados particulares: ... 20 1.3.3.1.2 Bancos públicos de dados de variações genéticas ... 21 1.3.3.1.3 Bancos de dados de indivíduos afetados ... 21 1.3.3.1.4 Bases de dados auxiliares ... 22 1.4 TAXA DIAGNÓSTICA DE DDC EM ESTUDOS DE Array-CGH ...23 1.5 LONGOS TRECHOS CONTÍNUOS DE HOMOZIGOSE .. 25

1.5.1 Consanguinidade ... 27 1.5.2 Dissomia uniparental ... 28

1.5.3 Homozigose por descendência devido a haplótipos

ancestrais ... 29

1.5.4 Homozigose devido ao reparo por replicação induzida por

(28)

2 JUSTIFICATIVA ... 33 3 OBJETIVOS ... 35 3.1 GERAL ... 35 3.2 ESPECÍFICOS ... 35 4 MATERIAIS E MÉTODOS ... 39 4.1 ASPECTOS ÉTICOS... 39 4.2 AMOSTRA ... 40 4.3 ANÁLISES GENÔMICAS... 40 4.3.1 Análise de CNVs ... 40 4.3.2 Análise de LCSH ... 41 4.3.3 Análise da consanguinidade ... 41 4.3.4 Dissomia uniparental ... 42 5 RESULTADOS E DISCUSSÃO I ... 47 5.1 RESULTADOS I ... 47

5.1.1 Reanálise da coorte Baretto (2015) ... 49 5.1.2 Análise da coorte de 2014-2016 ... 49 5.1.3 Caracterização Fenotípica ... 67

5.2 DISCUSSÃO I ... 70

6 RESULTADOS E DISCUSSÃO II ... 79

6.1 LCSHs nas Amostras ... 79 6.2 LCSHs levando a suspeita de UPD. ... 79 6.3 Investigação de consanguinidade ... 85 6.4 LCSHs com frequência ≥ 5%... 88

7 CONSIDERAÇÕES FINAIS ... 93

8 REFÊRENCIAS ... 96

9 ANEXO A – PARECER DO COMITÊ DE ÉTICA EM

PESQUISA... 113

10 ANEXO B – TERMO DE CONSENTIMENTO LIVRE E

ESCLARECIDO – MÉDICOS COLABORADORES ... 122

11 ANEXO C – TERMO DE CONSENTIMENTO

NEUROGENE ... 124

12 ANEXO D – TERMO DE CONSENTIMENTO LIVRE E

(29)

14 ANEXO F – TERMO DE ASSENTIMENTO – 12 A 18 ANOS...130

15 ANEXO G – JUSTIFICATIVA DA AUSÊNCIA DO

TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO ... 133

(30)
(31)
(32)
(33)

1 INTRODUÇÃO

1.1 DISTÚRBIOS DO DESENVOLVIMENTO CEREBRAL

Os distúrbios do desenvolvimento cerebral (DDC) que, em sua maioria, acarretam em deficiência intelectual (DI) e/ou transtorno do espectro do autismo (TEA), afetam em torno de 3–4% da população mundial (CAPPUCCIO et al., 2016; PEREIRA et al., 2014). Tais distúrbios, quando isolados, são denominados não sindrômicos e, quando associados à presença de dismorfismos ou de anomalias congênitas (AC) aparentes, são denominados sindrômicos (ABOU JAMRA et al., 2011).

A DI é uma condição caracterizada por déficits no funcionamento cognitivo – geralmente atestados por testes de quociente de inteligência com resultados iguais a QI < 70 – e no comportamento adaptativo, tendo início na infância. Há vários índices de comprometimento cognitivo, sendo eles: DI severa (QI< 20), DI grave (QI< 34), DI moderada (QI 35 - 49) e DI leve (QI 50 - 70). Por muito tempo esse aspecto clínico foi referido como retardo mental, termos posteriormente considerados inadequados e atualmente em desuso (COUTTON et al., 2014).

Sua etiologia envolve uma variedade de causas heterogêneas, tais como fatores ambientais, socioculturais, neurodesenvolvimentais e genéticos, os quais, muitas vezes, estão correlacionados entre si, conforme ilustrado na figura 1, a "janela de tempo crítica", em que diferentes fatores afetam o neurodesenvolvimento. O tempo de expressão gênica, combinado com fatores ambientais, determina o desenvolvimento do cérebro, principalmente na fase intrauterina (MANDY; LAI, 2016). A modulação do grau de comprometimento cognitivo frequentemente pode ser relacionada ao fator causal da DI. Fatores ambientais como asfixia perinatal, infecções pré-natais ou acidentes vasculares, assim como desequilíbrios cromossômicos grosseiros são mais comuns nos casos em que a intelectualidade é mais comprometida (DI severa) (DI severa).

Os fatores genéticos são responsáveis por cerca de 4% a 15% da DI leve e por 20% a quase 50% das DI mais acentuadas (SHASHI et al., 2014). Quando há história de consanguinidade parental, predominam alterações monogênicas autossômicas recessivas (KVARNUNG et al., 2013). Considerando a DI hereditária em geral, a síndrome do X-frágil (OMIM#300624), causada pela amplificação de uma repetição do trinucleótido (CGG) no gene FMR1, é o transtorno monogênico mais prevalente na DI leve a grave (STONE; LOS, 2017).

(34)

Com destaque, as aberrações cromossômicas (microscópicas e submicroscópicas) são uma das mais importantes etiologias genéticas da DI e representam 25% dos casos, sendo que a trissomia do cromossomo 21 isoladamente corresponde a mais de 7% dessas aberrações. Outras alterações cromossômicas típicas incluem as trissomias dos cromossomos 18 e do 13, monossomia do X, e as microdeleções, principalmente envolvendo as regiões cromossômicas 1p36, 2q37, 4p16, 5p15, 7q11.2, 8p23.1, 8q23q24, 9q34.3, 11p11.2, 15q11.2, 16p13.3, 17p13.3, 17p11.2, 17q21.3, 18q23, 22q11.2, 22q13 (MICLEA et al., 2015).

Alguns fatores ambientais podem interferir e alterar o funcionamento intelectual, agindo de forma penetrante, dependendo da Figura 1 Representação esquemática de estágios do

Neurodesenvolvimento, relacionados a fatores genéticos e ambientais e sua janela de tempo.

Fonte: Traduzido e modificado de Chiurazzi e Pirozzi (2016).

* Para fatores genéticos como causa etiológica da DI, o início dos sintomas ou o tempo de detecção é mostrado.

(35)

fase gestacional, da dose ou do tempo de exposição. Produtos químicos ambientais, poluentes, medicamentos, tabagismo e radiação ionizante excessiva, podem levar a mutações nas linhagens de células germinativas, causando alterações pontuais em genes relacionados ao neurodesenvolvimento de forma monogênica ou levando a mecanismos que resultam na alteração no número de cópias, podendo envolver genes sensíveis a dosagem de expressão. Igualmente, a exposição materna durante a gravidez ao uso de drogas, abuso de álcool, infecções e condições metabólicas como deficiência de iodo e má nutrição (da mãe e do feto), diabetes ou fenilcetonúria, são etiologias ambientais com efeitos variáveis (CHIURAZZI; PIROZZI, 2016).

O diagnóstico de DI é considerado apenas após os cinco anos de idade, uma vez que os instrumentos de avaliação da capacidade cognitiva disponíveis geralmente não são aplicáveis antes dessa idade. Utiliza-se para esses casos o termo atraso no desenvolvimento neuropsicomotor (ADNPM), uma vez que há a possibilidade de um mero atraso que eventualmente pode ser superado. Não ocorrendo a recuperação no desenvolvimento neurológico, após os cinco anos de idade o diagnóstico de DI é adequado (SHAFFER, 2005).

Outro DDC muito comum é o autismo, considerado o segundo distúrbio do neurodesenvolvimento mais frequente após a DI e afeta ~1 a cada 88 indivíduos. Mais comumente diagnosticado em indivíduos do sexo masculino na proporção de 4:1, sua incidência (ou diagnóstico) tem aumentado notavelmente ao longo dos anos (LANZ et al., 2013). No DSM-V (2013), foi criada a categoria dos Transtornos do Espectro Autista (TEA), que junta em uma só categoria o autismo, a síndrome de Asperger (AS) e o transtorno invasivo do desenvolvimento sem outra especificação, por ser considerado se tratarem de várias manifestações de uma mesma condição. A AS é um subtipo de TEA onde o desenvolvimento linguístico e cognitivo é preservado (HELLES et al., 2015).

O TEA é considerado um dos transtornos do neurodesenvolvimento com maior herdabilidade, estimada ser de 83 a 93%. Em aproximadamente 5 - 15% dos afetados, especialmente aqueles acompanhados com DI, podem ser identificados variações no número de cópias (CNVs, do inglês Copy Number Variations) de novo ou variantes raras de nucleotídeos únicos (cuja frequência populacional é de < 0,05%) afetando genes clinicamente relevantes. Convém ressaltar que, mesmo sendo de etiologia primordialmente genética, em cerca de 80% dos casos ainda não é possível esclarecer as alterações envolvidas. Até o momento, são conhecidos mais de 100 genes de suscetibilidade ao TEA com

(36)

variantes de expressividade e penetrância amplamente indeterminadas, porém a mecanística patogênica ainda não está clara (BETANCUR, 2011; DEVLIN; SCHERER, 2012; MARIANI et al., 2015).

As anomalias congênitas (ACs), que muitas vezes são a causa ou acompanham os DDC, consistem em malformações do padrão anatômico normal com origem embrionária, presentes ao nascimento (CHEN et al., 2014). Sua presença influencia seriamente a qualidade de vida dos afetados e são uma das principais causas da mortalidade infantil em todo o mundo. Em países desenvolvidos, como Estados Unidos, ACs representam em torno de 20% das mortes infantis (XU et al., 2016). Na Europa, dados da Vigilância Europeia de Anomalias Congênitas, mostraram uma taxa de mortalidade perinatal em torno de 9,3 neonatos com ACs a cada 10.000 nascimentos entre 2008 e 2012 (“EUROCAT”, [s.d.]). Nos países da América Latina as ACs estão entre a segunda e a quinta causa de óbito em crianças com idade inferior a um ano (BRONBERG et al., 2014), sendo que no Brasil, mais especificamente, são a segunda causa (EGBE et al., 2015). Estimativas mundiais apontam que cerca de 1 em 33 nascimentos vivos apresenta pelo menos uma AC, levando a um total de 3,2 milhões de recém-nascidos com ACs por ano (MAZZU-NASCIMENTO et al., 2017).

A etiologia das ACs envolve causas heterogêneas, fatores ambientais e genéticos, muitas vezes correlacionados entre si, que levam ao comprometimento da diferenciação e do desenvolvimento de tecidos, órgãos ou padrões corporais (membros, face, orelhas, olhos, etc...). Estimativas sugerem que cerca de 10% das ACs são resultado do efeito nocivo de fatores ambientais no desenvolvimento fetal, ou seja, dos efeitos de teratógenos. O termo teratógeno define qualquer fator ambiental que pode produzir uma AC (FRÍAS; GILBERT-BARNESS, 2008).

Já fatores genéticos como herança genética autossômica ou ligada ao X, desbalanços cromossômicos ou mutações novas ou “de novo”, representam 10 a 25% das causas conhecidas de ACs e 65% permanecem sem sua etiologia esclarecida, envolvendo fatores genéticos poligênicos, multifatoriais (interações gene-ambiente), anormalidades de desenvolvimento estocásticas ou interações sinérgicas com teratógenos como causa (BRENT, 2001).

Outros fenótipos com menor frequência, associados ou não com DI, TEA e AC, também caracterizam DDC, como a epilepsia que afeta aproximadamente 1% da população. Esta condição tem sua etiologia genética estimada em 40%, sendo que o fenótipo é parte da condição clínica não principal de mais de 200 distúrbios mendelianos, além da sua

(37)

associação com distúrbios não-mendelianas ("doenças complexas") e distúrbios cromossômicos que afetam genes relacionados aos canais de íons neuronais (BARTNIK et al., 2012; CORBETT et al., 2010).

Afetados com DDC por apresentarem habilidades adaptativas muitas vezes comprometidas, capacidade intelectual limitada, e frequente associação com outras comorbidades, impactam o cotidiano dos familiares, responsáveis pelos seus cuidados, assim como necessitam de suporte maior dos sistemas de saúde pública (ABOU JAMRA et al., 2011; D’AMOURS et al., 2014).

O diagnóstico adequado é necessário para o acompanhamento clínico dos indivíduos com DDC e para que se possa fornecer à família aconselhamento genético apropriado, possibilitando prevenir o risco de recorrência. (D’AMOURS et al., 2014). Devido à elevada heterogeneidade clínica e genética, estudar e diagnosticar DDCs é um dos campos mais complexos da área da saúde, pois tanto os fatores genéticos como os ambientais, isolados ou em conjunto podem desempenhar um papel importante na sua patogênese (ROSELLÓ et al., 2014a; WU et al., 2010).

1.2 EXAMES DIAGNÓSTICOS DE DDC

Exames citogenéticos clínicos estão em evolução e desenvolvimento constantes desde o início da introdução das técnicas de bandeamento cromossômico, no final da década de 1960 (MANNING; HUDGINS, 2010). Nesse sentido, a análise do cariótipo convencional tem sido uma ferramenta útil no diagnóstico genético, sendo por muito tempo o teste de citogenética padrão ouro. Porém, essa ferramenta permite detectar apenas alterações com mais de 5-10 Mb, dependendo da região cromossômica e da técnica utilizada, resultando, assim, em uma baixa definição, um baixo valor preditivo e uma baixa taxa diagnóstica e identificando alterações em cerca de apenas 3% dos indivíduos com DDC (COUTTON et al., 2014; SAGOO et al., 2015).

Para a caracterização de síndromes genéticas que envolvem deleções e duplicações abaixo dessa resolução foram desenvolvidas técnicas mais sensíveis, como a de hibridização in situ com sondas fluorescentes (do inglês fluorescent in situ hybridization – FISH), que se baseia na utilização de uma sonda genômica complementar à região de DNA envolvida na síndrome investigada. Essa sonda e uma sonda de controle são marcadas com corantes fluorescentes e hibridizadas ao DNA

(38)

das células do paciente, as quais se encontram, por sua vez, fixadas em uma lâmina de microscópio.

Na análise em microscopia de fluorescência, as células metafásicas são avaliadas quanto à presença ou ausência de emissões de fluorescentes das sondas, o que permite a identificação de deleções/duplicações nos tamanhos de 2-5 Mb. Mas, essa técnica exige que se saiba o local exato e a sequência que se deseja investigar como, por exemplo, quando se tem indícios de uma síndrome que envolve um grande rearranjo e as sondas fluorescentes serão específicas para a investigação de tal síndrome (CROTWELL; HOYME, 2012). O aprimoramento e a utilização dessa técnica marcou o início da citogenética molecular.

Já em 1992, no campo da citogenética molecular, surge um novo método para detecção de desequilíbrios cromossômicos denominado Hibridização Genômica Comparativa cromossômica (CGH), uma técnica baseada em hibridizar cromossomos inteiros de um genoma teste marcado com fluorescência de uma cor com um genoma de referência marcado com fluorescência de cor distinta (as mais utilizadas são moléculas fluorescentes em vermelho ou verde). O CGH clássico tem uma resolução média de 10-20 Mb e, mesmo não sendo capaz de detectar mudanças cromossômicas menores, tem sido amplamente utilizado na pesquisa de alterações no número de cópias em diversos tipos de câncer, pois possibilita a comparação direta do genoma das células normais com o genoma das células provenientes do tecido tumoral do indivíduo (WICKER et al., 2007).

Atualmente, a técnica de hibridização genômica comparativa por arrays (do inglês comparative genomic hibridization, array-CGH) (Figura 2), também conhecida por microarranjo cromossômico, microarray cromossômico, microarray ou simplesmente "matriz", possibilita a hibridização de pequenos fragmentos de um genoma teste versus um genoma de referência a sondas isoladas em “micropoços”, fixadas a uma matriz sólida (microchip), com o mesmo princípio de comparação de fluorescência do CGH. A exclusividade é que no array-CGH o genoma é desnaturado e fragmentado por endonucleases, permitindo agora uma análise mais minuciosa em trechos menores e possibilitando a detecção de microduplicações e microdeleções com resolução de 50-100 Kpb no genoma humano, dependendo da plataforma. Devido ao desenvolvimento tecnológico e ao potencial de aplicabilidade, em menos de uma década as plataformas de microarranjos genômicos evoluíram de matrizes de baixa resolução, contendo grandes clones de cromossomos artificiais bacterianos (BACs) ou menos de 100 mil sondas de oligonucleotídeos para o genoma, para versões de alta resolução com

(39)

mais de 1 milhão de sondas, utilizando oligonucleotídeos sintéticos (LAY-SON et al., 2015; PEREIRA et al., 2014; RETTERER et al., 2015). A limitação do array-CGH em relação ao cariótipo convencional refere-se ao fato de a detecção refere-ser quantitativa e, assim, não detectar alterações equilibradas, como pode ocorrer em algumas inversões e translocações.

1.2.1 Array-CGH

Inicialmente, a tecnologia de microarranjos genômicos utilizava sondas cuja matriz era feita a partir de segmentos de DNA clonados em vetores como BACs e cromossomos artificiais de leveduras (YAC – do inglês Yeast Artificial Chromossome) tendo como referência o Projeto Genoma Humano. Esses clones de DNA eram relativamente grandes, com tamanhos de aproximadamente 150 e 200 Kb. Portanto, geravam um sinal de hibridação intenso, com uma alta relação sinal-ruído, direcionado a regiões subteloméricas, pericentrômicas e a regiões envolvidas com síndromes recorrentes de microdeleção ou microduplicação já caracterizadas. Nas demais regiões do genoma, os clones (sondas) eram dispostos a uma cobertura de intervalos genômicos de ~ 1 Mb. Toda cobertura direcionada permitia o máximo de 1 Mb de resolução fora das regiões com maior número de sondas e, desse modo, não possuíam a capacidade de detectar microdeleções e microduplicação menores ou desconhecidas. Mesmo assim, o rendimento diagnóstico inicial da técnica é de 7% a 11% nos casos já triados com análise de citogenética clássica

Figura 2- Hibridização genômica comparativa por arrays - array-CGH

(40)

(CHIURAZZI; PIROZZI, 2016; KARAMPETSOU; MORROGH; CHITTY, 2014).

Com o aperfeiçoamento dessa tecnologia surgiram os arrays baseados em sonda de oligonucleótidos que, atualmente, são arrays predominantes e substituíram as sondas de BAC/YAC na prática clínica. A grande vantagem dos arrays de oligonucleótidos é o pequeno tamanho das sondas, que variam entre ~25 a 85 pb, possibilitando uma resolução maior, dependendo do número e do espaçamento (densidade) das sondas utilizadas na detecção de CNVs e aumentando o rendimento diagnóstico em 15% – 20% quando comparado à cariotipagem convencional (LAY-SON et al., 2015; MANNING; HUDGINS, 2010; SOUTH et al., 2013).

Atualmente arrays de oligonucleótidos de alta densidade comercialmente disponíveis apresentam três tecnologias diferentes: array-CGH, matrizes de genotipagem de polimorfismos de nucleotídeo único (SNP- do inglês, single nucleotide polymorphism) e plataformas combinadas array-CGH/SNP arrays.

A ferramenta array-CGH tem sido recomendada clinicamente como o teste de diagnóstico citogenético de primeira escolha na análise de pacientes com DDC – como atraso no desenvolvimento neuropsicomotor (ADNPM), TEA, DI e ACs (BARTNIK et al., 2014; D’AMOURS et al., 2014; HOCHSTENBACH et al., 2009; MILLER et al., 2010a; PEREIRA et al., 2014; SAGOO et al., 2015; SHOUKIER et al., 2013). Além de ser indicado como exame complementar nos casos de diagnóstico de crianças com atraso de crescimento, atraso ou regressão de fala e linguagem, esquizofrenia e epilepsias (SOUTH et al., 2013).

1.2.1.1 Plataformas de Array-CGH

As principais companhias que trabalham com as plataformas de oligonucleotídeos comerciais são: Agilent, Illumina e Affymetrix.

A Agilent Technologies® dispõe das várias plataformas array-CGH de oligonucleotídeos (1x1M, 2x400K, 4x180K e 8x60K). A plataforma 8X60K, por exemplo, tem oito áreas com ~60 mil sondas em cada uma, com sondas dispersas ao longo de todo o genoma (Agilent Technologies, Santa Clara, EUA), com uma média de espaçamento de 40 Kb entre as sondas.

A Illumina dispõe das plataformas de microarray CytoChip Oligo 2x105K (2 x ~105 mil sondas) e CytoChip ISCA, que possuem um design desenvolvido com foco em distúrbios do neurodesenvolvimento.

(41)

Uma das mais modernas plataformas de array-CGH é a Affymetrix CytoScan® HD (Affymetrix, Santa Clara, EUA), atualmente comprada pela Thermo Fisher, que oferece mais de 2,7 milhões de marcadores genômicos, incluindo 1,95 milhões de sondas distribuídas pelo genoma para detectar CNVs, além de 750 mil sondas para polimorfismos de nucleotídeo único (do inglês single nucleotide polymorphisms - SNPs). Nessa plataforma, o espaçamento médio da sonda para os genes RefSeq é de 400 pb, sendo que 96% dos genes estão representados por cobertura de sondas.

Outra plataforma da Affimetrix é a CytoScan® 750K Arrays. Com menor resolução e sondas empiricamente selecionadas a partir da CytoScan® HD, ela tem 750.000 marcadores genômicos, que consistem em 550.000 sondas únicas não polimórficas e, aproximadamente, 200.000 SNPs. Para ambas, a recomendação como parâmetro de análise é de 150 Kb para ganhos e 100 Kb para perdas genômicas, segundo as recomendações do ACMG (do inglês American College of Medical Genetics) (MILLER et al., 2010b).

1.3 VARIAÇÃO DO NÚMERO DE CÓPIAS

A sequência genética do genoma humano, assim como a de todos os organismos biológicos, está em constante mudança. Mutações estocásticas são alvos da seleção natural, através das alterações fenotípicas, muitas vezes imperceptíveis. Esse processo conduz a uma possibilidade de evolução e adaptação. O material genético dos seres humanos, em especial, é similarmente compartilhado entre indivíduos de todo o mundo e estimativas apontam para uma diferença de SNPs em cerca de apenas 0,1% da sequência de DNA entre as pessoas. Abordagens de detecção, análises e estudos dessa singela fração indicavam que ela era considerada como responsável pela variação genética entre os indivíduos, além de ser muito utilizada para correlações fenotípicas e de susceptibilidade a certas patologias (FEUK; CARSON; SCHERER, 2006).

Porém, o estudo das microduplicações e microdeleções no genoma humano através da técnica array-CGH demonstrou que muitas dessas alterações são CNVs presentes em pessoas consideradas “normais”, ou seja, não afetadas clinicamente (por fatores genéticos idiopáticos), mesmo apresentando deleções e/ou inserções de trechos genômicos de tamanho variado, inclusive contendo genes. As CNVs podem variar em tamanho a partir de dezenas de bases (> 50 pb) até megabases (Mb) dentro de um

(42)

único genoma humano, diferenciando os genomas humanos em até 1,2% em relação a CNVs, ou seja, trata-se de uma inesperada fonte de variação até então desconhecida, a ser explorada em adição aos SNPs (NOWAKOWSKA, 2017; PANG et al., 2010).

Em um dos estudos pioneiros a relacionar CNV a um fenótipo, Bridges (1936) descreveu a duplicação do gene Bar em Drosophila melanogaster, associada ao fenótipo do olho de tamanho reduzido, chamado olho em barra (“bar”). Atualmente, as CNVs tem sido destacadas como uma forma abundante de variação do genoma humano, cujo estudo tem demonstrado cada vez mais sua associação com a diversidade genética e fenotípica (BECKMANN; ESTIVILL; ANTONARAKIS, 2007; CONRAD et al., 2010; UDDIN et al., 2015). Trabalhos de recentes de Zarrei et al. (2015), com base em 55 estudos de CNVs detectadas em alta resolução em indivíduos não afetados, demonstraram que, aproximadamente, 100 genes podem ser eliminados homozigoticamente no genoma humano sem levar a efeitos fenotípicos aparentes.

Se, por um lado, as CNVs são fontes abundantes de variação genômica, por outro, também são importantes fatores genéticos nos DDCs. As CNVs podem afetar a função do gene de várias maneiras: a deleção ou a interrupção de um ou mais genes podem causar perda funcional por haploinsuficiência do(s) alelo(s) restante(s) ou por desmascarar mutações recessivas ou alterar a comunicação entre os alelos através da supressão de elementos regulatórios; além disso, duplicações podem alterar a expressão de alelos dominantes ou recessivos, de acordo com a função celular do produto do(s) gene(s) afetado(s). Em ambos os casos, há o potencial de ocorrerem fenótipos clínicos relevantes (CAPPUCCIO et al., 2016; COOK; SCHERER, 2008)). Existe um espectro contínuo de efeitos fenotípicos das CNVs, desde traços adaptativos até a letalidade embrionária (ZARREI et al., 2015).

Identificar e interpretar a contribuição de cada variação para o neurodesenvolvimento tem sido um desafio tanto na pesquisa quanto para os laboratórios de diagnósticos clínicos. Há um limite onde a correlação do fenótipo com a CNV começa a ser mais subjetiva, assim como a incidência de outros fatores – como origens étnicas ou fatores ambientais – dificulta a interpretação, principalmente quando essas CNVs são raras e não há recorrências de associação com o fenótipo (ZARREI et al., 2015). Essencialmente, CNVs patogênicas novas continuam a ser descritas para diferentes classes de doenças (LEE; SCHERER, 2010).

(43)

1.3.1 Mecanismos moleculares que originam CNVs

Vários são os mecanismos moleculares que originam as CNVs, muitas das variações arquitetônicas que ocorrem no genoma humano estão relacionadas com fatores genéticos patogênicos, assim como deleções, duplicações, triplicações, amplificações adicionais, ausência de heterozigosidade (AOH), cópias de inversões neutras, inserções e translocações. Estas variações envolvem a interrupção da estrutura da dupla fita de DNA, resultando em alterações que englobam muitos pares de bases (pb), diferentemente de variações como SNPs, que resultam em uma mudança restrita a uma ou poucas bases e são consequências de mecanismos baseados em recombinação e replicação, na síntese e no reparo do material genético (CARVALHO; LUPSKI, 2016).

Recentes publicações abordando os mecanismos moleculares de replicação, recombinação e reparo do DNA em seres humanos contribuíram para uma melhor compreensão sobre como as variações estruturais podem ocorrer em uma região genômica específica e acarretar na mudança de expressão gênica, tanto localmente quanto no genoma, devido a sua reestruturação (BASKIN et al., 2014; GHELDOF et al., 2013; GU et al., 2016; HAREL; LUPSKI, 2017; RICARD et al., 2010).

Uma das formas de se teorizar os potenciais mecanismos de formação de rearranjos genômicos envolvidos na formação de uma variação em um determinado locus específico é avaliar as características da região genômica em questão quanto a sua organização, observando a presença de sequências repetidas, sua orientação relativa, tamanho, densidade e distribuição. Segundo Lander et al. (2001), sequências repetitivas somam aproximadamente 50% de todo o genoma humano e consistem em elementos móveis, repetições de sequências simples, sequências repetitivas em tandem (consecutivas, típicas de centrômeros, telômeros, braços curtos dos cromossomos acrocêntricos e dos agrupamentos de genes ribossômicos) e, em especial, repetições de baixa cópia (LCRs, do inglês low-copy repeats). Também conhecidas como duplicações segmentares, as LCRs são elementos de 10 a 400 Kb de comprimento, com uma identidade de sequência maior que 95% (STANKIEWICZ; LUPSKI, 2002).

Para a formação de uma CNV, como já mencionado, inicialmente é necessário o rompimento (quebra) do DNA, seguido pela junção da sequência genômica, com ganho ou perda de trechos. Essa pode acontecer por crossover desigual entre sequências não alélicas ou por mecanismos de reparo (CARVALHO; LUPSKI, 2016).

(44)

1.3.1.1 CNVs recorrentes

Muitas CNVs que são encontradas de forma recorrente se originaram muito tempo atrás, sendo herdadas de uma geração para outra e, desse modo, típicas de certas populações ou subpopulações. Inclusive, é possível que algumas estejam relacionadas a variações fenotípicas populacionais. Porém, o que chama atenção são algumas CNVs não herdadas e que são frequentemente compartilhadas por indivíduos não relacionados. Essas provavelmente têm sua origem em rearranjos propensos a novas recorrências por mecanismos envolvendo sequências repetitivas (SHARP et al., 2006).

1.3.1.1.1 LCRs e Recombinação homóloga não alélica - NAHR A NAHR (do inglês nonallelic homologous recombination), também conhecida como recombinação ectópica (crossover fora do posicionamento correto), ocorre durante o crossover na meiose, entre sequências homólogas diretas parálogas (geradas por duplicação durante a evolução) que não estão em posições alélicas.

As LCRs são bastante propensas à NAHR, principalmente entre LCRs na mesma orientação (diretas). As regiões afetadas podem conter genes sensíveis à dosagem e originar uma CNV patogênica após uma NAHR (SHARP et al., 2006). Com pontos de quebra conservados, a NAHR produz deleções e duplicações recíprocas recorrentes, cuja frequência depende da distância e do comprimento das LCRs envolvidas (Figura 3).

Atualmente são conhecidos mais de 40 loci genômicos não sobrepostos associados à NAHR que resultam em síndromes de microdeleção e microduplicação relacionadas a distúrbios genômicos (WEISE et al., 2012). estimou a prevalência ao nascimento de CNVs recorrentes nas síndromes DiGeorge-Velo cardiofacial (del22q11.2), Williams-Beuren (del7q11.23) e Smith-Magenis (del17p11.2) em 1/4.000, 1/10.000 e 1/25.000, respectivamente.

(45)

Figura 3 - Durante o crossover na meiose I, a recombinação homóloga não alélica (NAHR) entre sequências repetidas de baixa cópia (LCRs), homólogas parálogas diretas, resulta em duplicações e deleções recíprocas e recorrentes

1.3.1.2 CNVs não recorrentes

As CNVs não recorrentes, na maioria das vezes, estão associadas a variáveis estruturais complexas e apresentam tamanhos únicos pela natureza aleatória e esparsa dos locais de ocorrência das suas junções de pontos de interrupção. Geralmente são CNVs de tamanho genômico exclusivo no indivíduo portador, o que as torna CNVs desafiadoras para a interpretação clínica (STANKIEWICZ; PURSLEY; CHEUNG, 2010).

Eventualmente as CNVs não recorrentes também podem ser delimitadas por LCRs. Carvalho et al (2016), exemplificam a formação de um rearranjo complexo de CNVs mediadas por repetições inversas parálogas (Figura 4-Ba), cujo produto final consistiu em uma triplicação invertida e intercalada e com segmentos genômicos duplicados, descrita como DUP–TRP/INV–DUP. Os mesmos autores relatam a formação de CNVs não recorrentes envolvendo regiões genômicas com LCRs em tandem (Figura 4-Bb), mas salientam que a maioria das CNVs não recorrentes patogênicas são formadas em regiões sem LCR (Figura 4-Bc) CNVs não recorrentes de tamanhos distintos que ocorrem em um determinado locus no genoma de indivíduos que compartilham fenótipos semelhantes podem ser alinhadas (Figura 5) para revelar a menor região de sobreposição, delimitando genes candidatos à manifestação do fenótipo (HAREL; LUPSKI, 2017).

O mecanismo mais comum de formação de CNVs não recorrentes é por junção de extremidades não homólogas (NHEJ).

(46)

Figura 4 - Representação esquemática de rearranjos genômicos não recorrentes observados em distúrbios genômicos. As linhas negras representam os segmentos genômicos de um determinado locus. Os genes sensíveis à dosagem que estão envolvidos no rearranjo são representados por asteriscos pretos. Repetições paralogas ou repetições de baixa cópia (LCRs) são representadas por setas de laranja horizontais invertidas ou orientadas diretamente. Linhas tracejadas indicam as regiões LCR. As variantes de números de cópias genômicas individuais (CNVs) são representadas por retângulos coloridos (segmentos excluídos (verde), segmentos duplicados (vermelho) e segmentos triplicados (azul) e identificados como CNV1, CNV2 e CNV3. As localizações dos pontos de interrupção das CNVs são indicadas por setas verticais cinzentas. Os suportes quadrados indicam regiões com agrupamento ou agrupamento de junções de pontos de interrupção. (B) Os rearranjos não recorrentes apresentam um tamanho e conteúdo genômica único em um dado local em indivíduos não aparentados. (Ba) DUP-TRP / INV-DUP (duplicação - triplicação invertida - duplicação) é estrutura não recorrentes, mas, em alguns casos, têm uma recorrência genômica limitando com o mapeamento de dois dos quatro pontos de interrupção para um par de repetição invertida. Nesses casos, os segmentos triplicados são invertidos em relação às duplicações. (Bb) Alguns distúrbios genômicos são caracterizados por rearranjos não recorrentes que mostram agrupamento de ponto de interrupção (em vez de agrupamento como nos casos recorrentes discutidos acima) dentro de repetições parálogas. (Bc) Em contraste, alguns distúrbios genómicos são caracterizados por rearranjos não recorrentes sem qualquer agrupamento ou agrupamentos de pontos de interrupção.

(47)

1.3.1.2.1 Junção de extremidades não-homólogas - NHEJ

A NHEJ (do inglês non-homologous end joining) é o principal mecanismo reparador de quebras cromossômicas – quebras de cadeia dupla no DNA – que ocorrem em células humanas (principalmente como resultado de danos oxidativos e de radiação ionizante) e está ativa durante todo o ciclo celular (Figura 6). Seu complexo de reparo é uma máquina multiprotéica cuja composição depende da complexidade da quebra dupla, sendo que a NEHJ essencialmente reconhece e emenda extremidades de DNA quebradas (REID; ROTHENBERG, 2015). O reparo por NHEJ é considerado mutagênico, em ~ 60% das emendas o alinhamento das cadeias duplas com apenas 1 ou 2 pb de microhomologia entre as extremidades e, disto causar CNVs únicas, também gera pequenas deleções e a inserção de nucleotídeos aleatórios nas junções dos pontos de quebras. A maioria das CNVs não recorrentes patogênicas para

Figura 5 – CNVs não recorrentes alinhadas e revelando uma região de sobreposição em comum que abrange um gene candidato aos fenótipos compartilhados pelos portadores de cada CNV.

(48)

DDC apresenta microhomologias de 2-33 pb de comprimento nessas junções. Adicionalmente, pode ocorrer a inserção de segmentos homólogos curtos (<100 pb) a regiões genômicas próximas. Essas regiões têm sido observadas em até 35% das junções de CNVs não recorrentes (LIU et al., 2012; PANNUNZIO et al., 2014).

1.3.2 Interpretação das CNVs

A interpretação das CNVs por array-CGH vem ampliando o leque de mutações conhecidas para muitos distúrbios genético-clínicos. Inicialmente, as plataformas e softwares de tratamento de dados brutos excluem por default as CNVs mais comuns que, geralmente, são

Fonte: Adaptada de Chang et al., (2017)

Figura 6- Esquema de rupturas de DNA de dupla cadeia (DSBs) e seu reparo por junção não homóloga (NHEJ) (topo). O heterodímero Ku70-Ku80 liga-se a DSBs e melhora a sua ligação subsequente pelos complexos NHEJ polimerase, nuclease e ligase. Essas enzimas podem atuar em DSB em qualquer ordem para ressecar e adicionar nucleotídeos. São possíveis várias rodadas de ressecção e adição, e as atividades de nuclease e polimerase em cada uma das duas extremidades do DNA parecem ser independentes. A microhomologia entre as duas extremidades do DNA, que já está presente (caixas tracejadas) ou recém-criada quando as polimerases adicionam nucleótidos de forma independente de modelo, é freqüentemente usada para guiar a junção final. O processo é propenso a erros e pode resultar em diversas seqüências de DNA na junção de reparo (parte inferior). Contudo, o NHEJ também é capaz de juntar duas extremidades de DNA sem perda de nucleotídeos, quer do final do DNA, quer sem qualquer adição. As adições de nucleotídeos são retratadas em minúsculas verdes.

(49)

relacionadas às variações populacionais, contribuindo para uma interpretação mais criteriosa.

Na interpretação clínica dos dados tratados, a maioria dos laboratórios aborda um fluxo de três etapas prévias visando caracterizar cada CNV detectada.

Inicialmente (etapa 1), os laboratórios buscam comparar as CNVs detectadas com conjuntos de dados controles (variações genômicas em indivíduos não afetados – muitas vezes, pais de pacientes – ou indivíduos cujo objetivo do exame de microarray tinha outro viés) de seus bancos de dados internos, bancos de dados nacionais e internacionais depositados em base de dados online, eliminando, desse modo, variações consideradas menos frequentes mas, ainda assim, consideradas “comuns” nos seres humanos (DE LEEUW et al., 2012). Para um maior detalhamento quanto a bancos de dados ver o item 1.3.3.1.

Outra forma de comparação com controle é o teste parental para buscar CNVs pequenas e raras herdadas, identificando variantes familiares particulares não observadas anteriormente em coortes de pacientes nem em um grupo de controle. Nesse caso, ainda é possível comparar amostras familiares adicionais como as de irmãos não afetados (VERMEESCH et al., 2012). Se uma CNV que é detectada no indivíduo afetado também é observada em um genitor ou irmão não afetado, é menos provável que ela seja patogênica. Entretanto, no caso de comparação de variantes familiares é importante não excluir essas CNVs das próximas etapas de análise, uma vez que há relatos de CNVs patogênicas hereditárias que podem ser de expressão/penetrância variável ou constituirem uma pista para a investigação de uma mutação recessiva no alelo restante no indivíduo afetado (KAMINSKY et al., 2011);

A segunda etapa dá-se através da comparação de CNVs detectadas com dados já encontrados e interpretados de outros indivíduos afetados, tanto em seus bancos de dados próprios como nas bases de dados de coortes de indivíduos afetados. Detalhe importante nessa etapa é o tamanho relativo da CNV: grandes CNVs (microscopicamente visíveis através da citogenética clássica, há décadas empregada na prática clínica) são muito frequentemente associadas a consequências fenotípicas por englobarem significativa quantidade de genes, além de serem as mais caracterizadas em coortes afetadas;

Por fim, a última etapa consiste em uma análise minuciosa de CNV não candidata, considerando se a mesma engloba sequências únicas, ricas em genes, em regiões regulatórias ou se é composta de elementos repetitivos e/ou pseudogenes.

(50)

Quando a CNV abrange genes, considera-se o conteúdo do gene e seu produto expresso quanto a suas associações clínicas relevantes, assim como os dados sobre sua sensibilidade à dosagem. No caso da CNV envolver gene de forma parcial (deletar ou duplicar apenas um/alguns éxons, regiões promotoras, regiões intrônicas), é importante analisar se essa variação estrutural no gene afeta seu produto, tanto na conformação da proteína ou molécula, quanto na sua quantidade. Ambas as análises têm como base o papel do gene e sua função prevista ou caracterizada em organismos modelo em estudos publicados na literatura científica. Em ressalva, observe-se que as conclusões sobre patogenicidade não podem ser delineadas até a variante ser bem caracterizada em indivíduos afetados (DE LEEUW et al., 2012).

Em contraste às CNVs frequentes ou polimórficas, que ocorrem na população com uma frequência superior a 1%, algumas CNVs são caracterizadas como CNVs raras quando ocorrem em uma frequência inferior a 1%. Ambos os tipos de CNVs têm ocorrência tanto na população normal quanto em indivíduos afetados, porém, as alterações patogênicas costumam ser raras ou muito raras (VALSESIA et al., 2013). Para uma interpretação adequada da CNV e para definir as principais manifestações clínicas associadas às microduplicações de microdeleções encontradas, a correlação fenótipo-genótipo é crucial. Portanto, é fundamental que os médicos que solicitam o exame façam uma descrição o mais precisa possível dos fenótipos clínicos e dismorfológicos do paciente (VERMEESCH et al., 2012; ROSELLÓ et al., 2014). O maior desafio ainda é distinguir, através da análise das CNVs, as variações benignas daquelas que podem ter relevância clínica (PALMER et al., 2014).

1.3.2.1 Classificação das CNVs

Após as triagens de comparação e análise, as CNVs são usualmente classificadas em três ou quatro categorias principais de significância clínica:

(1) as CNVs consideradas benignas, que são as encontradas com relativa frequência em pessoas normais e não apresentam indícios de relação com patologias;

(2) as CNVs patogênicas, geralmente raras ou muito raras, que são efetivamente relacionadas a desordens e abrangem trechos com significativo número de genes ou afetam de alguma forma a expressão e

(51)

a função de um ou mais genes críticos. São CNVs que, via de regra, não são relatadas em controles normais;

(3) CNVs ditas potencialmente patogênicas do tipo VOUs (do inglês variants of unknown significance), geralmente classificadas como potencialmente patogênicas quando são raras e abrangem genes de função importante, porém não estão relacionadas de forma inequívoca com alguma desordem;

(4) as CNVs ditas como incertas, VOUs, são as variações raras, que envolvem regiões contendo genes de função desconhecida ou de relevância incerta, RNAs não codificantes, ou mesmo sequências potencialmente regulatórias, não sendo possível descartar sua eventual patogenicidade (RIGGS; LEDBETTER; MARTIN, 2014). Para Starita et al. (2017), essas variantes estão "presas no vazio interpretativo" entre benignas e patogênicas, podendo sua interpretação ser confusa tanto para pacientes quanto para médicos, porque gera incertezas e não podem ser usadas para orientar o diagnóstico ou o aconselhamento genético.

1.3.3 Bioinformática na interpretação das CNVs

Ferramentas de bioinformática são grandes aliadas na busca da interpretação clínica das CNVs; em destaque, o navegador genômico da Universidade da Califórnia Santa Cruz (UCSC Genome Browser), que é uma interface gráfica online de fácil acesso e fornece apoio para pesquisadores interpretarem os recursos genômicos depositados na sua base de dados, possibilitando consultas complexas, análises detalhadas de dados, capacidade de interrogar regiões de interesse em conjuntos de dados diferentes de uma grande variedade de fontes, comparações entre genomas e download de dados (MEYER et al., 2013).

Sequências genômicas podem ser visualizadas nas "faixas de anotação", nas quais uma exibição completa e altamente flexível e os dados genômicos são graficamente dispostos ao longo do eixo de coordenadas de sequência com base na estrutura da sequência genômica de referência da espécie e versão escolhida pelo usuário. Essa interface possibilita uma grande variedade de modos de visualização, dos mais detalhados até gráficos com densidade compactada. Permite, ainda, alterar a visualização, aumentando ou diminuindo regiões genômicas de interesse, do cromossomo inteiro, da sequência de bases nucleotídicas, que podem ser chamadas utilizando uma variedade de identificadores de localização, incluindo coordenadas genômicas, nomes de genes,

(52)

identificadores de banda cromossômica e de SNPs (ROSENBLOOM et al., 2015).

O UCSC Genome Browser foi lançado inicialmente em 2001 para exibir o genoma humano recém-montado e tornou-se uma das ferramentas de bioinformática mais utilizadas em dados genômicos ou em mecanismos de busca pelo genoma por permitir integração com diversos outros bancos de dados em genética e genômica. Ele possibilita, por exemplo, a comparação de bancos de dados de variações patogênicas detectadas em coortes afetadas com variações polimórficas genotipadas em estudos populacionais (CASPER et al., 2018).

1.3.3.1 Bancos de dados de CNVs

Para o auxílio da interpretação de CNVs, estão disponíveis três categorias principais de bancos de dados:

1.3.3.1.1 Bancos de dados particulares:

São um conjunto de dados internos, processados pelo próprio laboratório (como, por exemplo, exames já interpretados) com CNVs e descrição fenotípica de cada caso, assim como casos-controle: como CNVs detectadas em pais não afetados ou indivíduos cujo objetivo do exame de microarray tinha outro viés (infertilidade, aconselhamento genético para casal sem história genética na família e que investigam as possibilidades da patogenia antes de ter seu primogênito) (NOWAKOWSKA, 2017).

Um exemplo é o CAGdb (Cytogenomics Array Group data base), que é uma base de dados derivada de uma rede de colaboração entre laboratórios de diagnóstico clínico da Carolina do Norte e da Carolina do Sul (EUA), com o objetivo de possibilitar a troca de informações sobre a interpretação das variantes constitucionais detectadas por microarray. Atualmente, essa base é acessível na web (http://www.cagdb.org/) e os laboratórios cadastrados podem depositar informações referentes aos achados genômicos dos microarrays através de um código de identificação anônimo, juntamente com os detalhes das variantes, das suas interpretações e dos fenótipos descritos. Essa abordagem permite que laboratórios menos experientes na interpretação das CNVs possam ter acesso a uma extensa base de dados, bem como um gerenciamento de seus próprios bancos de dados internos, disponível em uma plataforma online.

(53)

O CAGdb é gerenciado atualmente pelo Fullerton Genetics Laboratory at Mission Health System, não possui fins lucrativos e está disponível de forma gratuita para cadastro e participação de novos laboratórios (“CAGdb”, [s.d.]).

1.3.3.1.2 Bancos públicos de dados de variações genéticas

Tais plataformas são bancos de dados que dispõem de informações provenientes de diversos estudos populacionais em indivíduos não afetados ou “saudáveis”, geralmente desenvolvidos coletivamente como bases de referências a partir do depósito de informações sobre as variações estruturais genômicas relatadas em publicações para conhecimento público, de acesso livre e gratuito (DE LEEUW et al., 2012).

Destaque-se, também, o banco de dados DGV (Database of Genomic Variants), criado em 2004 com o objetivo de fornecer um resumo abrangente da variação estrutural no genoma humano (IAFRATE et al., 2004). Seu catálogo extensivo de CNVs humanas e da variação estrutural entre “indivíduos-controle" vem sendo continuamente organizado e atualizado.

Outra base de grandes variantes genômicas estruturais é o dbVar, que reúne mais de 3 milhões de registros de estudos e disponibiliza-os gratuitamente ao público para a realização de estudos populacionais e para comparações entre casos e controles. Os dados dispostos incluem CNVs, inserções, deleções, inversões, translocações e rearranjos cromossômicos complexos (PHAN et al., 2016).

1.3.3.1.3 Bancos de dados de indivíduos afetados

São bases de dados que na maioria das vezes fazem a correlação genótipo-fenótipo detalhada e incluem:

O DECIPHER começou a ser desenvolvido em 2004, com amplos objetivos, como o de disponibilizar uma ferramenta clínica e de pesquisa auxiliadora na difícil tarefa de interpretar os resultados dos microarranjos cromossômicos e de integrar o mapa genômico humano do navegador de genomas da UCSC. Ele relata todas as CNVs encontradas em indivíduos afetados – inclusive as benignas e incertas, não apenas as patogênicas –, porém, é possível acessar em cada alteração relatada o fenótipo e a

Referências

Documentos relacionados

Figure 3 - Array genomic hybridization results. A) array profile of chromosome 3: weighted log2 ratio plot, the red arrow points to the 20.5 Mb copy number gain between 3q26.32-3q29;

3 A preservação do ambiente global exige mudanças, nos níveis de desigualdade que existem no mundo.. desenvolvem a docência a uma faixa etária que está certamente muito receptiva

In the third case in which conventional analysis of cells from a long term culture re- vealed a 46,XX karyotype and the array-CGH analysis showed a male complement with an

Retornando às pedras, ou aos poemas agrestes de Geraldo Valença, men- cionem-se aqui dois outros rótulos, ou melhor, duas palavras igualmente proscritas em meio às teorias atuais,

A presença da gestão democrática na Lei de Diretrizes e Bases da Educação Nacional n. 9.394/96 foi uma conquista dos segmentos populares, em especial o de educadores, que lutaram para

A Tabela 39 apresenta as quatros simulações de aumento na demanda turística realizadas nas simulações obtidas por meio choques na carga tributária dos subsetores do turismo,

Este laboratório interage com o Instituto Brasileiro do Meio Ambiente e Recursos Naturais Renováveis (IBAMA) sobre processos de importação e exportação de agentes para

Para a seleção dos professores, inicialmente, fez-se um levantamento dos docentes alocados no Centro de Educação Física e Desportos (CEFD) a fim de identificar