• Nenhum resultado encontrado

2. Justificativa

4.2.2. Sequenciamento do exoma

4.2.2.2. Análise das variantes detectadas

As análises realizadas compreenderam quatro diferentes abordagens com o objetivo de identificar o maior número de possíveis variantes deletérias que pudessem ser associadas com o fenótipo dos pacientes. Nas análises foi utilizado o DNA de quatro homens férteis como controles masculinos normais.

Primeira abordagem: Compreendeu a busca de variantes possivelmente

deletérias na sequência de 94 genes, incluindo aqueles sabidamente relacionados com a diferenciação gonadal, tanto ovariana como testicular, e também genes candidatos decorrentes de investigações funcionais em humanos e modelos animais. Os 94 genes

selecionados, que neste trabalho serão denominados genes-alvo, estão descritos na Tabela 04.

As variantes foram inicialmente analisadas a partir das informações presentes nos arquivos Excel fornecidos pela empresa Novogene Bioinformatics Technology Co., Ltd, após a anotação pela ferramenta ANNOVAR. As variantes encontradas nos 94 genes pré-selecionados com frequência populacional inferior a 1%, exônicas, não sinônimas, ausente nos controles masculinos e consideradas deletérias por pelo menos duas ferramentas de predição foram consideradas como relevantes.

Para avaliar o caráter deletério de uma variante foram utilizadas informações obtidas das seguintes ferramentas: SIFT (Sorting Intolerant from Tolerant), Polyphen2 (Prediction of functional effects of humans SNPs), MutationTaster, LRT, MutationAssessor e FATHMM (Functional Analysis through Hidden Markov Models

(v2.3)), que predizem se a substituição de um aminoácido afeta a função da proteína; e

PhyloP score, SiPhy score, gerp++gt2 e CADD (Combined Annotation Dependent

Depletion), que são úteis para avaliar o nível de conservação da região. As pontuações

indicadas por essas ferramentas são usadas para encontrar locais funcionalmente importantes; portanto, variantes que conferem suscetibilidade aumentada podem apresentar pontuações elevadas. Essas informações estavam disponíveis nos arquivos com as anotações obtidas pela ferramenta ANNOVAR.

Variantes selecionadas como relevantes e descritas como novas foram investigadas na sequência do cDNA do gene no Ensembl genome browser 94 para garantir que a mesma não estava inscrita na base de dados dbSNP - Short Genetic

Variations e tivesse frequência populacional elevada.

Além disso, as variantes em regiões de splicing foram analisadas por três ferramentas de predição, Human splicing finder, EX-SKIP e Spliceman, para avaliação do efeito das mesmas durante o processo de splicing. Apenas variantes com resultados deletérios indicados por duas ferramentas foram selecionadas para validação.

Finalmente, para garantir que as variantes selecionadas eram raras, foi verificada novamente a frequência populacional nas bases de dados ExAC Browser (Beta) (Exome

Aggregation Consortium), Ensembl genome browser 94, Varsome - The Human Genomics Community e dbSNPe 1000 Genomes. As variantes com frequência

As variantes selecionadas foram verificadas na base de dados BIPMed (Brazilian Initiative on Precision Medicine), uma base de dados genômicos da população brasileira composta por 106 indivíduos saudáveis do Sudeste do Brasil. A presença de variantes em uma base de dados de indivíduos saudáveis é um indício de ausência de efeito deletério e, portanto, variantes encontradas nesta base de dados foram removidas da lista de variantes relevantes.

Variantes sinônimas e em região de 5’ e 3’UTR só foram selecionadas para validação quando outra alteração exônica no mesmo gene foi identificada na análise.

Quando disponível, a presença das variantes foi verificada nos resultados do sequenciamento do exoma dos genitores.

Tabela 04: Genes pré-selecionados para a busca inicial de variantes (genes-alvo).

Genes Nome Genes Nome

ARX Aristaless related homeobox GNRHR gonadotropin releasing hormone receptor AKR1C4 aldo-keto reductase family 1 member C4 HHAT hedgehog acyltransferase

AMH anti-Mullerian hormone HOXA4 homeobox A4

AMHR2 anti-Mullerian hormone receptor type 2 WNT4 wingless-type MMTV integration site family, member 4 AR androgen receptor HSD17B3 hydroxysteroid 17-beta dehydrogenase 3 ATF3 activating transcription factor 3 HSD3B2 hydroxy-delta-5-steroid dehydrogenase, 3 beta- and

steroid delta-isomerase 2 ATRX alpha thalassemia/mental retardation syndrome X-linked IGF1R insulin-like growth factor 1 receptor BMP15 bone morphogenetic protein 15 INSL3 insulin like 3

BMP4 bone morphogenetic protein 4 INSR insulin receptor BMP7 bone morphogenetic protein 7 INSRR insulin receptor related receptor BNC2 basonuclin 2 KDM3A

(JMJD1) lysine (K)-specific demethylase 3A CBX2 chromobox homolog 2 KISS1 KISS-1 metastasis-suppressor CHD7 chromodomain helicase DNA binding protein 7 KISS1R KISS1 receptor CTGF connective tissue growth factor LHB luteinizing hormone beta polypeptide CTNNB1 catenin (cadherin-associated protein), beta 1, 88kDa LHCGR luteinizing hormone/choriogonadotropin receptor

CYB5A cytochrome b5 type A LHX9 LIM homeobox 9 CYP11A1 cytochrome P450 family 11 subfamily A member 1 LMO4 LIM domain only 4

CYP1A1 cytochrome P450 family 1 subfamily A member 1 MAMLD1 mastermind-likedomaincontaining 1 CYR61 cysteine rich angiogenic inducer 61 MAP3K1 mitogen-activated protein kinase kinasekinase 1, E3

ubiquitin protein ligase

DGKK diacylglycerol kinase kappa MAP3K4 mitogen-activated protein kinase kinasekinase 4 DHCR7 7-dehydrocholesterol reductase MID1 midline 1

DHH Deserthedgehog NOBOX NOBOX oogenesis homeobox DMRT1 doublesex and mab-3 related transcription factor 1 NR0B1 (DAX1) nuclear receptor subfamily 0, group B, member 1 DMRT2 doublesex and mab-3 related transcription factor 2 NR5A1 (SF1) nuclear receptor subfamily 5, group A, member 1 DMRT3 doublesex and mab-3 related transcription factor 3 PBX1 PBX homeobox 1

Genes Nome Genes Nome

EMX2 empty spiracles homeobox 2 PROK2 prokineticin 2 EPHB2 EPH receptor B2 PROKR2 prokineticin receptor 2

ESR1 estrogen receptor 1 PROP1 PROP paired-like homeobox 1 ESR2 estrogen receptor 2 PSMC3IP PSMC3 interactingprotein FGF8 fibroblast growth factor 8 PTCH1 patched 1 FGF9 fibroblast growth factor 9 RSPO1 R-spondin 1 FGFR1 fibroblast growth factor receptor 1 [Homo sapiens SIX1 SIX homeobox1 FGFR2 fibroblast growth factor receptor 2 SIX4 SIX homeobox4 FKBP4 FK506 binding protein 4 SOX10 SRY (sex determining region Y)-box 10 FOXF2 forkhead box F2 SOX3 SRY (sex determining region Y)-box 3 FOXL2 forkhead box L2 SOX8 SRY (sex determining region Y)-box 8 FSHB follicle stimulating hormone beta subunit SOX9 sex determining region Y - box 9 FSHR folliclestimulatinghormone receptor SRD5A2 steroid 5 alpha-reductase 2 GADD45G growth arrest and DNA damage inducible gamma SRY sex determining region on the Y chromosome

GATA4 GATA bindingprotein4 STAR steroidogenic acute regulatory protein GNRH1 gonadotropin releasing hormone 1 TAC3 tachykinin 3

TACR3 tachykinin receptor 3 WT1 Wilms tumor 1 TSPYL1 TSPY-like 1 WTAP WT1 associated protein TUBB3 tubulin beta 3 class III WTIP WT1 interacting protein WDR11 WD repeat domain 11 WWOX WW domaincontainingoxidoreductase

WDR5 WD repeat domain 5 ZFPM2 (FOG2) zinc finger protein, FOG family member 2

Segunda abordagem: Teve como objetivo a detecção de novos genes

candidatos. A nova estratégia foi realizada para todos os indivíduos, independente do resultado encontrado na análise anterior. Para essa abordagem, a frequência populacional máxima estipulada foi de 0,001; portanto, variantes com frequência superior foram excluídas. Variantes herdadas de pais fenotipicamente não afetados e (ou) presentes nos controles masculinos normais foram também excluídas da análise pela menor probabilidade de serem causa de disgenesia gonadal, já que espera-se que a mutação resulte em ambiguidade genital e (ou) infertilidade. Também foram excluídas nessa etapa variantes recorrentes em mais de três pacientes da casuística, já que a recorrência da mesma variante entre os pacientes pode ser indício de um artefato da técnica. A análise das variantes de cada indivíduo seguiu as etapas descritas na Figura 03.

Após a filtragem, as variantes remanescentes foram avaliadas em relação à predição in silico, sendo que aquelas consideradas deletérias por pelo menos três

ferramentas de predição foram selecionadas. O caráter deletério das variantes foi avaliado utilizando as mesmas ferramentas descritas na abordagem anterior.

Para as variantes selecionadas, foram coletadas informações nas seguintes bases de dados: Gene – NCBI (National Center for Biotechnology Information), Pubmed – NCBI,

GeneCards (Human Gene Database), The Human Protein Atlas, HPM (Human Proteome Map), STRING - Protein-Protein Interaction Networks, Bio-Grid (Biological General Repository for Interaction Datasets) e HumanBase (data-driven predictions of gene expression, function, regulation, and interactions in human). Informações em relação ao

local e período de expressão, função, vias de interação e qualquer outra informação relevante que pudesse associar os genes ao desenvolvimento sexual ajudaram a definir os genes candidatos.

Terceira abordagem: Teve como objetivo a busca de variantes recorrentes entre

os pacientes, visando encontrar genes candidatos que se sobrepõem na casuística do estudo. Para isso foram utilizadas as mesmas etapas de análise da estratégia anterior, porém nessa etapa foram analisadas as variantes presentes em mais de um paciente. O estudo dos genes foi realizado como na segunda abordagem.

Quarta abordagem: Buscou verificar a recorrência dos genes selecionados como

candidatos dentre os indivíduos da casuística.

A cobertura e a profundidade das variantes foram revisadas com os arquivos BAM no programa Integrative Genome Viewer (IGV). Esse programa também foi utilizado para verificar a presença das variantes nos genitores e nos controles masculinos. Variantes com profundidade baixa foram descartadas na segunda, terceira e quarta abordagem de análise. Após a seleção das variantes, a presença das mesmas foi verificada na base de dados BIPMed.