• Nenhum resultado encontrado

Análises em Bioinformática

5. Filtragem das variantes

As variantes anotadas foram filtradas com auxílio do software R, versão 3.2.1 (The R Foundation for Statistical Computing, 2015) e complementadas pelo programa Microsoft Excel 2010. Do total de variantes anotadas, foram utilizados os seguintes filtros, representados simplificadamente na Figura 11, na ordem em que foram aplicados:

 Filtro A (exclusão): em cada amostra foram eliminadas todas as ocorrências aqui denominadas “ocorrências de genótipo consenso ou indeterminado”, isto é,

aquelas que continham notação “GT=0/0” (não foi detectada variante naquela posição para a amostra), bem como as ocorrências representadas como “GT=./.” (não foi determinado genótipo para a “variante” na amostra).

 Filtro B (exclusão): foram eliminadas todas as variantes anotadas em éxon do tipo sinônima.

 Filtro C (inclusão): das variantes que passaram pelo filtro B, foram selecionadas somente aquelas localizadas em regiões de éxon (exceto sinônimas, já excluídas anteriormente) e de splicing. Portanto, foram excluídas todas as variantes classificadas de acordo com a função como: regiões do DNA que fazem referência a RNA noncoding (de éxons, íntrons e de regiões UTR - untranslated regions), regiões upstream e downstream do DNA, regiões intergênicas e intrônicas, regiões UTR 3’ e 5’.

 Filtro D (inclusão): do total de variantes que passou pelos filtros anteriores, foram selecionadas somente aquelas que pertenciam a um ou mais dos quatro conjuntos de genes conhecidamente ou potencialmente implicados na fisiopatologia das doenças neoplásicas mieloides, conjuntos estes denominados “painéis de bioinformática” neste trabalho.

Os quatro painéis de bioinformática construídos para a filtragem de variantes nos casos estudados foram elaborados após ampla discussão no nosso grupo de pesquisa e revisão em literatura específica.

O painel de bioinformática 1 reúne 56 genes recorrentemente mutados em neoplasias mieloides e implicados na fisiopatologia dessas doenças [53, 90-92]. Variantes nos genes desse painel foram investigadas em todos os três casos clínicos descritos na Casuística deste trabalho.

Figura 11. Fluxograma desenvolvido para a filtragem de variantes identificadas por sequenciamento completo do exoma nos casos estudados.

Filtro A

Ocorrências com genótipo do tipo “consenso” ou “indeterminado”

Filtro B Variantes sinônimas

Filtro C

Variantes fora de regiões exônicas ou de splicing

Filtro D

Somente variantes presentes em genes contemplados pelos painéis de

bioinformática

Filtro E

Variantes com baixa cobertura (<10% da cobertura média de cada amostra)

Painel de bioinformática 1. Relação dos 56 genes recorrentemente mutados em neoplasias mieloides selecionados para a filtragem de variantes nos casos estudados.

ABL1 CBLB ETV6 IDH1 MET PHF6 SMC3

ASXL1 CBLC EZH2 IDH2 MLL PTEN SRSF2

ATRX CDKN2A FBXW7 IKZF1 MPL PTPN11 STAG2

BCOR CEBPA FLT3 JAK2 MYD88 RAD21 TET2

BCORL1 CSF3R GATA1 JAK3 NOTCH1 RUNX1 TP53

BRAF CUX1 GATA2 KDM6A NPM1 SETBP1 U2AF1

CALR DDX41 GNAS KIT NRAS SF3B1 WT1

CBL DNMT3A HRAS KRAS PDGFRA SMC1A ZRZR2

O painel de bioinformática 2 agrupa 16 genes que codificam enzimas hepáticas metabolizadoras de xenobióticos, selecionados exclusivamente para a filtragem de variantes nas amostras do caso 1, alguns dos quais já estão associados à progressão da síndrome mielodisplásica em leucemia aguda [93-94]. A influência de polimorfismos em alguns dos genes do painel 2 já havia sido investigada pelo nosso grupo na resposta ao tratamento da leucemia aguda e síndrome mielodisplásica, em estudo realizado por Palodetto et al. [95].

Painel de bioinformática 2. Relação dos 16 genes que codificam enzimas hepáticas metabolizadoras de xenobióticos selecionados para a filtragem de variantes nas amostras do caso 1.

CYP1A2 CYP2C8 CYP2J2 GSTM1

CYP2A6 CYP2C9 CYP3A4 GSTT1

CYP2B6 CYP2D6 CYP3A5 MDR1

Naqueles casos em que não foram identificadas variantes patogênicas, deletérias e com frequência menor que 1% em todas as populações combinadas em qualquer dos 56 genes relacionados no painel 1, também foram pesquisadas variantes em 19 genes relacionados a vias de reparo de danos ao DNA (painel 3). O rastreamento de variantes nos genes do painel 3 foi realizado apenas nas amostras dos casos 2 e 3. A relação de genes contemplados pelo painel 3 foi obtida de [96-98].

Painel de bioinformática 3. Genes relacionados a vias de reparo de danos ao DNA selecionados para a filtragem de variantes nas amostras dos pacientes dos casos 2 e 3.

FANCA FANCE FANCL ERCC4

(FANCQ)

FANCB FANCF FANCM RAD51

(FANCR)

FANCC FANCG PALB2

(FANCN) BRCA1 (FANCS) BRCA2 (FANCD1) FANCI RAD51C (FANCO) UBE2T (FANCT) FANCD2 BRIP1 (FANCJ) SXL4 (FANCP)

Por último, foram investigadas variantes em 19 genes (painel de bioinformática 4) com menor incidência de mutações em neoplasias mieloides [53, 90-92]. Variantes nos genes incluídos nesse painel foram pesquisadas somente nas amostras dos casos 2 e 3.

Painel de bioinformática 4. Genes com menor incidência de mutações em neoplasias mieloides selecionados para a filtragem de variantes nas amostras dos casos 2 e 3.

ATM GNB1 LUC7L2 PDSS2

BRCC3 GPRC5A MXRA5 PIGA

CTCF HNRNPK NCOR2 PTPN11

DCLRE1C IRF1 NF1 SF1

 Filtro E (exclusão): excluíram-se as variantes com baixa profundidade de cobertura. Foram estabelecidos valores de corte individuais para cada amostra nos valores de profundidade (Tabela 5), de acordo com a fórmula:

𝑉𝐶 = 10𝐶𝑀

100

,

onde VC é o valor de corte e CM corresponde à profundidade de cobertura média para cada uma das amostras.

Tabela 5. Valores de corte estabelecidos para o critério profundidade de cobertura em cada uma das 12 amostras sequenciadas. As amostras estão identificadas pelo número do caso (C1, C2 ou C3), número do paciente em cada caso (III-2, III-3, II-1, I-2 ou II-3) e população celular de origem do DNA sequenciado (MO, células nucleadas totais de medula óssea; CD3+, linfócito T CD3+ de sangue periférico; e CD34+, célula-tronco hematopoiética CD34+ de medula óssea).

Amostra Origem Cobertura

Média Valores de Corte C2.II-1 MO 146,081 15 C3.I-2 CD3+ 177,532 18 C3.I-2 CD34+ 68,4283 7 C1.III-2 CD34+ 131,205 13 C1.III-2 CD3+ 108,492 11 C3.II-1 CD34+ 36,7846 4 C3.II-1 CD3+ 75,3873 8 C1.III-3 CD34+ 133,980 13 C1.III-3 CD3+ 75,4225 8 C3.II-3 CD34+ 65,0768 7 C3.II-3 CD3+ 68,1149 7 C2.II-1 CD3+ 98,8338 10 MÉDIA - 98,7782 10

Documentos relacionados