UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIA
LEONARDO GRANATO PISSINATO
ESTUDO DA MUTAGÊNESE E REPARO DO GENE IL7R MEDIANTE QUEBRA DO DNA POR CRISPR-CAS9 E IMPLICAÇÕES NA LEUCEMIA LINFOIDE AGUDA DE
CÉLULAS T
STUDY OF IL7R GENE MUTAGENESIS AND REPAIR UPON DNA BREAKAGE BY CRISPR-CAS9 AND IMPLICATIONS IN T-CELL ACUTE LYMPHOBLASTIC LEUKEMIA
CAMPINAS 2019
LEONARDO GRANATO PISSINATO
ESTUDO DA MUTAGÊNESE E REPARO DO GENE IL7R MEDIANTE QUEBRA DO DNA POR CRISPR-CAS9 E IMPLICAÇÕES NA LEUCEMIA LINFOIDE AGUDA DE
CÉLULAS T
STUDY OF IL7R GENE MUTAGENESIS AND REPAIR UPON DNA BREAKAGE BY CRISPR-CAS9 AND IMPLICATIONS IN T-CELL ACUTE LYMPHOBLASTIC LEUKEMIA
Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Genética e Biologia Molecular, na Área de Genética Animal e Evolução.
Dissertation presented to the Institute of Biology of the State University of Campinas as part of the requisites required to obtain a Master's degree in Genetics and Molecular Biology, in the Animal Genetics and Evolution Area.
Orientador: José Andrés Yunes
Este trabalho corresponde à versão final da dissertação defendida pelo aluno Leonardo Granato Pissinato, e orientada pelo Prof. Dr. José Andrés Yunes.
CAMPINAS 2019
COMISSÃO EXAMINADORA
Prof. Dr. José Andrés Yunes (Presidente)
Prof. Dr. Carlos Frederico Martins Menck (Membro)
Prof. Dr. Jörg Kobarg (Membro)
Os membros da Comissão Examinadora acima mencionados assinaram a Ata de Defesa, que se encontra no processo de vida acadêmica do aluno.
DEDICATÓRIA
Dedico este trabalho a todos aqueles que empregam suas vidas em produzir e disseminar o conhecimento, em suas mais variadas formas. E também àqueles que lutaram ou ainda lutam contra as diversas faces do câncer.
AGRADECIMENTOS
Agradeço, primeiramente, à minha família pela educação e oportunidades que me deram, o que me permitiu alcançar, entre muitas coisas, a conclusão deste mestrado. E também por todo o apoio e suporte oferecido não somente neste período do mestrado, mas durante todos os momentos em que precisei. Apoio e suporte esses que me influenciaram de forma positiva a seguir no meio acadêmico da pesquisa científica.
Agradeço à minha namorada, Gabriela, que, mesmo com todas as dificuldades e contratempos enfrentados neste período, nunca faltou com conselhos e ânimo que me encorajaram a entregar o meu melhor. Agradeço também aos amigos pelas conversas e momentos de descontração, tão importantes em meio a uma rotina corrida e cheia.
Agradeço muito ao meu orientador Dr. José Andres Yunes pelo crescimento pessoal e profissional que me foi proporcionado durante esses anos. Agradeço-o pela confiança depositada em mim e por toda a paciência, extremamente necessária, durante esse tempo. Também agradeço aos colegas de laboratório que, felizmente, são muitos. O ambiente descontraído e, ao mesmo tempo, construtivo proporcionado pela postura de todos no local de trabalho tiveram papel fundamental de tornar esse processo mais prazeroso.
Agradeço à direção do Hospital Boldrini, em especial à Dra. Silvia Brandalise, por permitir a realização deste trabalho nas dependências do hospital, sempre oferecendo a estrutura e recursos necessários.
Finalmente, agradeço a CAPES pelo auxílio financeiro oferecido durante a maior parte do desenvolvimento do trabalho e também à UNICAMP pela formação de biólogo que adquiri no passado e que me permitiu ingressar no mestrado.
O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil (CAPES) – Código de Financiamento 001.
RESUMO
Aproximadamente dez por cento das leucemias linfoide aguda pediátrica de células T (LLA-T) apresentam uma inserção de resíduo cisteína na porção justamembrana do receptor IL7R, que leva à homodimerização e sinalização constitutiva JAK/STAT, contribuindo para a leucemogênese. As mutações concentram-se em um trecho de 26pb do éxon 6 do gene IL7R e são caracterizadas por grandes inserções. A análise das mutações sugere que as mesmas têm início por quebras dupla-fita, seguidas de reparo por via NHEJ (non-homologous end
joining), e a grande maioria das mutações apresenta códon cisteína, sendo que este
é quase sempre formado pelas regiões inseridas, e não pelas regiões flanqueando a “cicatriz” de reparo. É possível que a enzima TdT (Terminal deoxynucleotidyl
Transferase), específica de linfócitos e encarregada da adição de nucleotídeos sem
sequência-molde às junções V(D)J, esteja por trás das inserções no gene IL7R. A hipótese principal deste trabalho é que quebras dupla-fita, por si sós, no hotspot mutagênico do IL7R causem a inserção de cisteína nesse sítio. Outras hipóteses levantadas também são as de que a polimerase TdT seja responsável pelas inserções observadas no IL7R, e que deficiências nas proteínas de reparo Ku70 e XRCC4, e no fator TdIF2, que exerce atividade reguladora sobre a TdT, contribuam para o aumento do tamanho dessas inserções. É esperado que, quanto maiores as inserções, maiores serão as chances de se observar um códon cisteína. Para estudar os possíveis papéis da TdT, Ku70, XRCC4 e TdIF2 no tamanho das inserções no IL7R, utilizamos tecnologia CRISPR e shRNA, em linhagem celular HPB-ALL, com o intuito de gerar quebras dupla-fita nesse hotspot mutagênico e de inibir a atividade dessas proteínas, respectivamente, a fim de comparar resultados das cicatrizes de reparo entre células com e sem atividade desses fatores através de sequenciamento de nova geração.
A análise dos resultados revelou que em todas as condições de silenciamento, e também na amostra controle, houve a inserção de códon cisteína no sítio de quebra, o qual se tornou mais frequente conforme as inserções aumentaram em tamanho. Porém o silenciamento dos fatores selecionados, Ku70 principalmente, não alterou a frequência e tamanho geral das inserções. Além disso, diferente das inserções totalmente aleatórias que eram esperadas, foram observados eventos específicos nos quais o reparo foi feito utilizando diferentes
moldes: sequências repetitivas (STRs), sequências específicas de outros locais genômicos e sequências adjacentes ao sítio de quebra. Interessantemente, sem atividade TdT a frequência e tamanho das inserções no sítio de quebra cai drasticamente e os eventos específicos acima mencionados deixam de ocorrer.
Estes achados revelam aspectos importantes de como, em linhagens linfoides, mutações no gene IL7R são ocasionadas. Além disso, este trabalho revela também novos possíveis mecanismos de reparo e de atuação da enzima TdT, e aponta para a TdT como possível alvo de quimioterápicos para impedir o surgimento de novos clones malignos durante o tratamento da LLA.
ABSTRACT
Approximately ten percent of pediatric T-cell acute lymphoblastic leukemia (T-ALL) have an insertion of a cysteine residue in the justamembrane portion of the IL7R receptor, which leads to homodimerization and constitutive JAK/STAT signaling, contributing to leukemogenesis. Mutations are concentrated in a 26bp portion of éxon 6, called hotspot, of the IL7R gene and are characterized by large insertions. The analysis of this mutations suggests they are initiated by double-strand breaks (DSBs), followed by repair by NHEJ (non-homologous end joining) pathway, and most mutations presents a cysteine codon, which is almost always formed by the inserted regions, not by regions flanking the repair “scar”. It is possible that the lymphocyte-specific TdT (Terminal Deoxynucleotidyl Transferase) enzyme, responsible for the addition of non-templated nucleotides to the VDJ junctions, is behind the insertions observed in the IL7R gene. The main hypothesis of this work is that DNA double-strand breaks, by themselves, in the IL7R mutagenic hotspot causes insertion of cysteine codons at this site. Other hypothesis raised are that the TdT polymerase is responsible for the insertions in the IL7R, and that deficiencies in the Ku70 and XRCC4 repair proteins, as well as the TdIF2 factor, which exerts regulatory activity on TdT, contribute to increasing the size of these insertions. It is expected that, the larger the insertions, the greater the chances of observing a cysteine codon. In order to study the possible roles of TdT, Ku70, XRCC4 and TdIF2 in the size of IL7R insertions, we used CRISPR and shRNA technology in HPB-ALL cell line, with the aim of generating double-strand breaks in this mutagenic hotspot and inhibiting activity of these proteins, respectively, in order to compare results of repair "scars" between cells with and without activity of these factors through next generation sequencing.
The analysis of the results showed that in all the silencing conditions, as well in the control sample, the insertion of cysteine codon at the break site was found, becoming more frequent as the insertions grew in lenght. However, the silencing of the chosen factors, Ku70 especially, did not alter the overall frequency and sizes of insertions. Furthermore, unlike the totally random insertions that were expected, specific events were observed in which the repair was done using different templates: short tandem repeats (STRs), specific sequences from other genomic sites and sequences adjacent to the breaking site. Interestingly, without TdT activity
the frequency and sizes of insertions at the break site drops dramatically and the specific events mentioned above no longer occur.
These findings reveal important aspects of how, in lymphoid lines, mutations in the IL7R gene are caused. In addition, this work also reveals new possible DNA repair and TdT activity mechanisms, and points to TdT as a possible target of chemotherapeutics to prevent the emergence of new malignant clones during the treatment of ALL.
SUMÁRIO
INTRODUÇÃO...13
Cicatriz no DNA do IL7R mutante é provavelmente gerada após quebra dupla-fita do DNA...16
Cicatriz no DNA do IL7R mutante indica atividade da via de reparo NHEJ...19
Cicatriz no DNA do IL7R mutante apresenta sinais da ação da TdT...21
Modulação da atividade da polimerase TdT...22
Possível deficiência de fatores NHEJ na LLA-T com IL7R mutante...23
HIPÓTESES...25 OBJETIVOS...26 Objetivo geral...26 Objetivos específicos...26 PANORAMA DO TRABALHO...27 RESULTADOS...29
Silenciamento dos genes XRCC4, XRCC6 e DNTTIP2...29
Transdução lentiviral resulta em maior número de células transformadas...30
Geração de quebras dupla-fita e análise das cicatrizes por sequenciamento de nova geração...33
Número de reads por amostra e qualidade dos sequenciamentos...33
Eficiência das sondas sgRNA e frequência dos tipos de mutações...34
As frequências inseridas, em ambos os sítios, apresentam alto conteúdo %GC...37
Análise do tamanho das inserções observadas...38
Frequência dos aminoácidos inseridos...40
Frequência de inserção de códon cisteína por tamanho da cicatriz...41
As sequências inseridas podem não ser completamente aleatórias...42
DISCUSSÃO...48
Estratégia de shRNAs combinados rende melhores silenciamentos...49
Transdução lentiviral é mais eficiente, em linfócitos T, para obter uma maior quantidade de células modificadas...49
Polimorfismo no éxon 6 do IL7R reduziu consideravelmente a eficiência da sonda sgRNA...50
Padrão das mutações observadas no IL7R independe do local da quebra do DNA dentro do gene...51
Silenciamento de XRCC4, Ku70 e TdIF2 não produziu efeitos significantes nas inserções observadas no IL7R...52
Quebras dupla-fita por CRISPR-Cas9 são suficientes para causar inserção de cisteína no éxon 6 do IL7R e a frequência de cisteína aumenta conforme as inserções aumentam...53
Knockout de TdT reduz drasticamente a frequência, tamanho e padrão das inserções...54
As inserções no IL7R aparentam não serem completamente aleatórias...56
CONCLUSÕES...59
MATERIAIS E MÉTODOS...60
Cultura de células...60
Construção dos vetores lentivirais de shRNA...60
Análise de silenciamento por qRT-PCR...62
Construção dos vetores de expressão de CRISPR-Cas9...63
Eletroporação de células HPB-ALL...65
Produção de partículas lentivirais e transdução...65
Citometria de fluxo...67
Construção de biblioteca de sequenciamento e sequenciamento de nova geração...68
Análise das cicatrizes de reparo...70
Análise de sequências repetitivas e alinhamentos de inserções no genoma humano...71
REFERÊNCIAS BIBLIOGRÁFICAS...72
ANEXOS...78
Anexo 1 – Aprovação do comitê de biossegurança...78
1. INTRODUÇÃO
A leucemia linfoide aguda (LLA), patologia ocasionada pela proliferação anormal de células de linhagem linfoide, é a neoplasia pediátrica mais comum e afeta majoritariamente crianças e adolescentes com menos de 20 anos. Em indivíduos dessa faixa etária, 85% dos casos de LLA são caracterizados pela proliferação de clones malignos de precursores de células B (LLA-B) enquanto que os outros 15% são caracterizados pela proliferação de clones malignos de precursores de células T, sendo classificados como leucemia linfoide aguda de células T (LLA-T). Dentre as diferentes manifestações clínicas da LLA se destacam a leucocitose, acumulo de blastos na medula óssea, imunodeficiência e, frequentemente, infiltração no sistema nervoso central. Hoje em dia, em países desenvolvidos, são alcançadas taxas de cura de aproximadamente 80% para LLA-T (PUI CH, 2006). No entanto em entre 15% e 20% dos casos de LLA, ainda hoje, ocorre recaída da doença, que muitas vezes retorna resistente ao tratamento, o que está associado a um prognóstico ruim (VICENTE; COOLS, 2015).
Dentre os diversos fatores causadores da LLA-T já documentados (rearranjos cromossômicos, mutações indel, etc.), mutações nos genes NOTCH1 e CDKN2A/2B são os eventos mais comuns, estando presentes em mais de 50% dos casos de LLA-T (GIRARDI et al., 2017).
Nosso grupo foi um dos primeiros a descrever a ocorrência de mutações oncogênicas (ganho de função) no éxon 6 do gene que codifica a cadeia alfa do IL7R (IL7R) em aproximadamente 10% dos casos de LLA-T pediátrica (ZENATTI et al., 2011) (Figura 1). Recentemente foi observado que a presença do IL7R mutante em casos dessa patologia está relacionada com resistência a tratamento por esteroides e, consequentemente, piores respostas ao tratamento (LI et al., 2016).
Figura 1 - Mutações do IL7R na LLA-T. Sequência de aminoácidos do éxon 6 do IL7R em 17 pacientes de LLA-T (ZENATTI et al., 2011). A região transmembrana predita com ferramenta TMPRED aparece enquadrada, e os aminoácidos inseridos pela mutação estão em vermelho. O resíduo de cisteína (destacado em fundo preto) aparece na maior parte dos pacientes na região extracelular próxima à membrana.
Além da inserção de códon cisteína, trabalho recente desenvolvido no nosso laboratório revelou que inserção de aminoácidos positivamente carregados (lisina, arginina e histidina) no mesmo sítio do IL7R leva a uma hipersensibilidade do receptor, que se torna até 10 vezes mais sensível a IL-7 do que o receptor normal (CAMPOS et al., 2019). Conhecer a etiologia dessas mutações pode revelar aspectos importantes da leucemogênese e propiciar medidas preventivas.
O IL7R selvagem é uma proteína transmembrana formada pelas subunidades IL7Re IL2R, que constituem um heterodímero quando ligados a IL-7. A heterodimerização do IL7Re IL2Rpropicia a fosforilação das quinases JAK1 e JAK3 acopladas na porção citosólica dessas proteínas. Uma vez fosforiladas, JAK1 e/ou JAK3 fosforilam e ativam o STAT5 acoplado na cauda citosólica da cadeia IL7R. O STAT5 por sua vez, após ser ativado, é translocado para o núcleo, onde regula a transcrição de diversos genes-alvo (TAKADA; JAMESON, 2009).Essa sinalização de IL-7 via seu receptor contribui, dentre outros efeitos, para viabilidade de precursores de células T (KIM, Kyungjae et al., 1998). No caso dos IL7Rmutantes acima mencionados, foi identificada a inserção de um resíduo de cisteína na porção justamembrana extracelular que leva à formação de homodímeros IL7R-IL7R covalentemente unidos por ligação dissulfeto e ativação constitutiva de JAK1/STAT5 independente de IL-7(Figura 2). Portanto, é possível
afirmar que células contendo essa mutação tendem a possuir vantagem proliferativa quando comparadas a células normais.
Figura 2: Esquema do receptor IL7R normal (esquerda) e IL7R mutante (direita). O receptor normal forma heterodímero com IL2Rγ e, na presença de IL-7, promove sinalização via STAT5. O receptor mutante forma homodímero IL7Rα através de ponte dissulfeto e promove sinalização STAT5 mesmo na ausência de IL-7.
Os mutantes com inserção de resíduos positivamente carregados, por outro lado, não apresentam ativação constitutiva do receptor e ainda necessitam da interação com o ligante IL-7. No entanto a maior sensibilidade do receptor promove sinalização mais forte e, consequentemente, vantagem proliferativa às células mutantes. O trabalho de Laouar e colaboradores (2004) suporta essas afirmações através da observação de que a superexpressão de IL7R em camundongos AKR/J fornece a timócitos em estágios iniciais de desenvolvimento uma vantagem seletiva sobre timócitos normais (LAOUAR, 2004). Além de apontar para o IL7R como alvo de futuras intervenções terapêuticas, este achado desperta alguns questionamentos sobre a causa das mutações.
1.1. Cicatriz no DNA do IL7R mutante é provavelmente gerada após quebra dupla-fita do DNA
Mutações focalizadas têm sido amplamente descritas nos diversos tipos de leucemia, e decorrem, por exemplo, da presença de sequências repetitivas Alu (MARTINELLI et al., 2000), sítios de DNA topoisomerase (MISTRY et al., 2005) e sequências RSS (reconhecidas pela RAG na recombinação V(D)J) (NOVARA et al., 2009). Nos últimos anos, nosso grupo identificou sítios RSS como causa de mutações no gene PTEN (MENDES et al., 2014).
Além de focalização, sabe-se que a mutagênese pode ocorrer de maneira adaptativa. Em situações de estresse, são ativadas DNA polimerases com maior propensão a erros (RANDO; VERSTREPEN, 2007). No caso da leucemia linfoide, merece destaque a maquinaria de recombinação V(D)J. Primeiro, pela presença das RAGs que podem reconhecer e clivar sítios RSS no genoma, abrindo uma porta para a ocorrência de mutações. E, segundo, pela presença da enzima TdT (Terminal deoxynucleotidyl Transferase), membro da família de polimerases polX, que participa da recombinação V(D)J adicionando nucleotídeos sem sequência-molde entre os segmentos V, D e J, mas também pode adicionar nucleotídeos espúrios no processo de reparo de quebras dupla-fita, ocasionando mutações (MOTEA; BERDIS, 2010).
No caso do IL7R, as mutações concentram-se em um trecho pequeno de 26pb do éxon 6, chamado daqui pra frente de hotspot. Não sabemos qual a causa desta focalização. Talvez isso ocorra porque mutações em outros lugares do IL7R não levem a ganho de função como quando nessa região justamembrana.
Pela análise da cicatriz, como foi chamado o resultado de reparo, no DNA do IL7R mutante (Tabela 1), desconfiamos que as mutações neste gene, na LLA, decorram de quebras dupla-fita (DSBs), as quais possibilitam a ação da TdT, o que explica a ocorrência de grandes inserções, como abaixo será melhor discutido.
Tabela 1: Mutações no IL7R em LLA-T e LLA-B-derivada. Análise das “cicatrizes” no IL7R, apresentando as sequências das inserções (entre parênteses), as sequências vizinhas e as deleções, assim como seus tamanhos, %GC, presença de homopolímeros e dinucleotídeos. Em vermelho, códons cisteína formados pelas inserções.
Mutação N Inserção N Deleção %GC Homopolímero
LLA-T (ZENATTI et al., 2011)
GATCCTATC(-->CCCCAGGGCGGGT)GCATTTTGAGGTTTT 13 Del 13 TTACTAACCATCA 0,85 CCCC-GGG-GGG GATC(-->GGTTTTGTCCCCA)CATCAGCATTTTGAG 13 Del 13 CTATCTTACTAAC 0,54 TTTT-CCCC GATCCTATCTTACTA(-->TGTGCCCAA)CCATCAGCATTT 9 0,56 CCC
AGTTTTTTCTCTG(-->GCCCATCCC)TCGCTCTGTTGG 9 0,78 CCC-CCC
GATC(-->TTAAGT)GCATTTTGAGTTTTTT 6 Del 18
CTATCTTACTAACCATCA 0,17 GATCCTATCTT(-->TCACCCTTTTAACTGTGGAC)CCATCAGCATT 20 Del 5 ACTAA 0,45 CCC-TTTT GATCCTATCTT(-->TCCCCATCAGCATTGT)ACCATCAGCATTTTG 16 Del 4 ACTA 0,50 CCCC
GATC(-->TCCAATCAT)GCATTTTGAGTTTTTTCT 9 Del 18
CTATCTTACTAACCATCA 0,33 GATCCTATCTTAC(-->GACTTGAGTGCG)TAACCATCAGCATTTTGA 12 0,58 ATGGA(-->CCAGTCCCCCTCCTGCT)TAACCATCAGCATTTTGA 17 Del 11 TCCTATCTTAC 0,71 CCCCC GATCCT(mut. TG)CTTA(-->GAAGGC)CTAACCATCAGCATT 6 0,67 ATTTTGAGTTTTTTCT(-->GGAA)TCTGTTGGTCATCTT 4 Del 7 CTGTCGC 0,50
LLA-T (SHOCHAT et al., 2011)
TATCTTACTA(-->TTTTGTCGGAAGGAC)ACCATCAGCA 15 0,47 TTTT
TATCTTACT(-->GAGATGC)ACCATCAGCA 7 Del 1 A 0,57
CTATCTTAC(-->CGTGCCCCCT)CATCAGCATTT 10 Del 4 TAAC 0,80 CCCCC ATCTTACTAA(-->TGCCCGAGCAAGATTGCCCCA)CCATCAGCAT 21 0,62 CCC-CCCC TAGCTCAGGG(-->CCTCCTGGTGC)GCTAACCATCA 11 Del 17 AGATGGATCCTATCTTA 0,73 GATCCTATCT(-->GCCCCC)CCATCAGCAT 6 Del 6 TACTAA 1,00 CCCCC CCTATCTTAC(-->GCTGCCCGTCC)ACCATCAGCA 11 Del 2 TA 0,82 CCC ATCCTATCTT(-->CGACTGTATTGGGGGTC)CTAACCATCA 17 Del 1 A 0,59 GGGGG CTTACTAACC(-->CACCGTGGGT)GCATTTTGAG 10 Del 4 ATCA 0,70 GGG CCTATCTTAC(-->CCCTCTGTTCGG)CCATCAGCAT 12 Del 3 TAA 0,67 CCC
TTTCTCTGTC(-->GAGAGGCCG)GCTCTGTTGG 9 0,78
CCTATCTTAC(-->CCATTTATCGGTGTGTCCT)CATCAGCATT 19 Del 4 TAAC 0,47 TTT AGCTCAGGGG(-->CCTCCTGGTGC)CTAACCATCA 11 Del 17 AGATGGATCCTATCTTA 0,73
ATCCTATCTT(-->TGAGTGT)CTAACCATCA 7 Del 1 A 0,43
ATCCTATCTT(-->TACCTGCCCGT)CCATCAGCAT 11 Del 5 ACTAA 0,64 CCC TCCTATCTTA(-->TGCCCCTCTCC)AACCATCAGC 11 Del 2 CT 0,73 CCCC
TTCTCTGTCG(-->AAAAAG)TGTTGGTCAT 6 Del 3 CTC 0,17 AAAAA
TTACTAACCA(-->GTCATCAGCCCT)GCATTTTGAG 12 Del 3 TCA 0,58 CCC ATTTTGAGTT(-->GTTCAACCATCAGCATTTTGAGTT)TTTTCTCTGT 24 0,38 TTTT ATCAGCATTT(-->GTCAAAG)TGTCGCTCTG 7 Del 13 TGAGTTTTTTCTC 0,43 AAA GATCCTATCT(-->GTGGTATAAGGGAA)ACCATCAGCA 14 Del 5 TACTA 0,43 GGG
CCTATCTTAC(-->GGCTGT)TAACCATCAG 6 0,67
CCTATCTTAC(-->GCTGTA)TAACCATCAG 6 0,50
AGATGGATCC(-->GTGCCGTCCCCAT)CTAACCATCA 13 Del 7 TATCTTA 0,69 CCCC
TCCTATCTTA(-->GGCTGTA)TAACCATCAG 7 Del 1 C 0,57
TCTTACTAAC(-->ACTTCCCTGCGTCTAC)CATCAGCATT 16 0,56 CCC GATCCTATCT(-->GCTGGATGAA)ACTAACCATC 10 Del 1 T 0,50 ATCTTACTAA(-->AGAAATGCACAAA)CATCAGCATT 13 Del 1 C 0,31 AAA-AAA
LLA-T “Early T-phenotype” (ZHANG, Jinghui et al., 2012)
TTTTTCTCTG(-->GGTTCTCTG)TCGCTCTGTT 9 0,56
TCCTATCTTA(-->GGTTGC)CTAACCATCA 6 0,67
TGGATCCTAT(-->TACCCTGTATTGTAAGAC)CTTACTAACC 18 0,39 CCC GATCCTATCT(>GACACACGGGTTTATAATTCTATTTGCT)TTACTAACCA 28 0,36 GGG-TTT-TTT TTTCTCTGTC(>TCCCTAATCCTTATTGTGCCGTGCGCCTGCGAGCTA)GCTCTGTTGG 36 0,56 CCC
LLA B-derivada BCR-ABL1-Like (ROBERTS et al., 2014)
ATCTTACTAA(-->AAGGGTGCC)CCATCAGCAT 9 0,67 GGG
ATCTTACTAA(-->ATG)CCATCAGCAT 3 0,33
ATCTTAC(-->GGGTTCCCGGAT)GCATTTTGA 12 Del 7 TAACCAT 0,67 GGG-CCC
ATCTTACTAA(-->GTCCCC)CCATCAGCAT 6 0,83 CCCC
Leucemias agudas e tumores sólidos (KIM, Min Sung et al., 2013)
TATCTTACTA(-->TCAAGGTGCCTA)ACCATCAGCA 12 0,50
TCCAGGGGAG(-->CCCTGTAA)AACCATCAGC 8 Del 17 ATGGATCCTATCTTACT 0,50 CCC
GATGGATCCT(-->TGTTCT)ATCTTACTAA 6 0,33
CCTATCTTAC(-->GGCGGA)TAACCATCAG 6 0,83
TCCTATCTTA(-->CTAACGGCCCGGGGGTGT)CTAACCATCA 18 0,72 CCC-GGGGG
Quebras dupla-fita no DNA, abreviadas em DSBs, podem ser geradas tanto de forma natural quanto artificial. Entre as causas naturais estão: colapso da forquilha de replicação devido a lesões no DNA (como aquelas produzidas por espécies reativas de oxigênio) (Shen, Z & Nickoloff, 2007); rearranjos genômicos induzidos por nucleases (PâQUES; HABER, 1999); recombinação V(D)J (FRANCO; ALT; MANIS, 2006); meiose (KEENEY; NEALE, 2006) e outros. DSBs são extremamente letais e precisam ser corrigidas para garantir a sobrevivência das células. Ainda não sabemos o que causaria as DSBs no IL7R. Kalender e colaboradores reportam um caso de LLA-T com o gene IL7R fusionado ao gene do TCR (T-cell receptor), gene que, assim como os genes de imunoglobulinas, sofre recombinação V(D)J (KALENDER ATAK et al., 2013). Este achado leva a desconfiar que a quebra possa ocorrer por ação das RAGs. Além de sítios RSS, as RAGs também reconhecem inespecificamente, causando quebras e rearranjos genômicos, regiões de cromatina aberta, regiões com H3K4me3, sequencias de DNA com conformação não-B, e regiões metil-CpG deaminadas (RAGHAVAN et al., 2005; TSAI et al., 2008; ZHANG, Ming; SWANSON, 2008). Neste mestrado não investigamos o que ocasiona a quebra, nem sua localização, mas se quebras no
hotspot mutagênico do IL7R são suficientes para gerar inserção de códon cisteína
para o aumento no tamanho das inserções no IL7R, aumentando as chances de inserção do códon cisteína e, logo, produção de um receptor oncogênico. Uma vez que, teoricamente, quanto maior o tamanho de inserção de nucleotídeos, maiores as chances de ocorrer um códon cisteína, pode-se pensar que deficiências na maquinaria de reparo (como a falta ou ineficiência de um ou mais fatores) podem ter parte na mutagênese do IL7R na LLA.
1.2. Cicatriz no DNA do IL7R mutante indica atividade da via de reparo NHEJ
As DSBs são essencialmente reparadas por dois métodos gerais: recombinação homóloga (RH) e junção de extremidades não-homólogas (NHEJ). Em uma célula normal, há um balanço entre as vias de reparo RH e NHEJ e ambas ocorrem simultaneamente na célula. No entanto, a RH geralmente é restrita às fases G2 e S do ciclo celular, quando o DNA replicou e as cromátides irmãs estão disponíveis como moldes de reparo. Já a via NHEJ está disponível durante todo o ciclo celular, mas é mais representada na fase G1, na qual RH é limitada (MIMITOU; SYMINGTON, 2009).O reparo por RH é dividido em diferentes mecanismos, que variam de acordo com a maquinaria utilizada e tipo/posição da quebra dupla-fita. Entre eles, temos: Single-Strand Annealing (SSA), recombinação por Rad51,
Break-Induced Recombination (BIR) e conversões gênicas com ou sem crossover (HABER,
2018).O reparo por RH é tido como o principal responsável pela manutenção da integridade genômica, uma vez que é guiado por sequências-molde e homologias e, portanto, apresenta baixa probabilidade de introduzir erros.
As cicatrizes no DNA dos IL7R mutantes (Tabela 1) caracterizam-se por inserções relativamente grandes. Durante a Iniciação Científica (FAPESP 14/25151-4), tentamos mapear as sequências dessas diferentes inserções no genoma humano (colaboração com Dr. Michel Eduardo Beleza Yamagishi, EMBRAPA), em busca de algum local homólogo próximo ao ponto da mutação ou em outro locus. Entretanto, as sequências dessas diferentes inserções não puderam ser alinhadas em qualquer trecho contíguo do genoma humano (dados não apresentados), descartando-se, portanto, que estas inserções sejam fruto de reparo por recombinação homóloga. A única explicação plausível para a ocorrência dessas inserções é o envolvimento da
TdT. A TdT possui atividade de incorporação de nucleotídeos independente de molde, como foi constatado, sendo recrutada no reparo pela via NHEJ.
Durante a iniciação científica (e neste trabalho) corroboramos a hipótese de participação da TdT no reparo do IL7R nas LLA. Quebras dupla-fita do éxon 6 do
IL7R, induzidas por CRISPR, em uma linhagem celular sem TdT (célula HEK293T),
resultaram em cicatrizes sem as inserções típicas das cicatrizes do IL7R encontradas na LLA (Tabela 2).
Tabela 2: Cicatrizes do IL7R em células HEK293T após quebras dupla-fita causadas por CRISPR. Nucleotídeos em vermelho sublinhados são inserções. As deleções são mostradas como traços vermelhos.
Clones Sequência de nucleotídeos
IL7R(parte do éxon 6) GAGATGGATCCTATCTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 1 GAGATGGATCCTATC-TACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 2 GAGATGGATCCTATCTTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 3 GAGATGGAT---TACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 4 GAGATGGATCCTATCTTACTA---ATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 5 GAGATGGATCCTATCTTA---TCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 6 GAGATGGATCCTATCTTTACTAACCATCAGCATTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT 7 GAGATGGA---GTTTTTTCTCTGTCGCTCTGTTGGTCATCT 8 GAGATGGATCCTATC---TTTTGAGTTTTTTCTCTGTCGCTCTGTTGGTCATCT
No caso do reparo por NHEJ, existem a via clássica e a via alternativa (Figura 3). A via alternativa (alternative end-joining, A-EJ) envolve processamento éxonucleolítico da DSB até que se encontre sequências complementares (micro-homologia) em ambos os lados da quebra que permitam o pareamento. Esse processo de remoção pode ser mediado pela éxonuclease CtIP (CtBP – interacting
protein). Após o pareamento nas regiões de homologia, as extremidades são unidas
por uma ligase ainda não conhecida (BUNTING; NUSSENZWEIG, 2013). A cicatriz no DNA do IL7R mutante não revela micro-homologias, descartando a hipótese de reparo A-EJ.
A via clássica de junção de extremidades não-homólogas (C-NHEJ), envolve a ligação do heterodímero Ku70-Ku80 à quebra de DNA, seguida do recrutamento de DNA-PKcs e diversos outros fatores, incluindo a DNA Ligase 4 (LIG4) que propiciam a ligação das extremidades. Esse processo não requer sequência molde e pode causar pequenas mutações, como inserções ou deleções de um pequeno número de nucleotídeos na junção da quebra. A cicatriz no IL7R é tipicamente formada por deleções e inserções, sugerindo ser C-NHEJ o mecanismo de reparo usado. É importante mencionar que células de LLA primária apresentam níveis elevados das proteínas que compõem a via de reparo NHEJ (CHIOU et al., 2007).
1.3. Cicatriz no DNA do IL7R mutante apresenta sinais da ação da TdT
A TdT apresenta preferência pela incorporação de dGTP e dCTP, dos quais dGTP mais frequentemente (BASU; HEDGE; MODAK, 1983). Além disso, as interações entre as bases adjacentes (interações base stacking) anteriores à nova Figura 3: Mecanismos de reparo por junção de extremidades clássica (C-NHEJ) e alternativa (A-EJ). Figura obtida de Bunting e Nussenzweig (2013).
base incorporada afetam a atividade da TdT, de forma que dinucleotídeos purina-purina e pirimidina-pirimidina ocorrem mais frequentemente do que o esperado por um evento aleatório. Essas interações base stacking também podem favorecer a formação de homopolímeros pela TdT (GAUSS; LIEBER, 1996). Como pode ser visto na Tabela 1, 32 dos 50 casos analisados tem % de GC maior que 50%, dos quais 22 têm %GC maior que 60%. Além disso, 40 dos 50 casos têm presença de homopolímeros e/ou dinucleotídeos (sendo 32 casos com homopolímeros).
As regiões N inseridas pela TdT possuem geralmente em torno de 2-5pb (MICKELSEN et al., 1999). O tamanho das inserções no IL7R (Tabela 1) apresenta uma mediana de 11 nucleotídeos, sendo que 40 dos 50 casos apresentaram 7 ou mais nucleotídeos. Como o códon cisteína (TGT ou TGC) é formado quase que exclusivamente pelos nucleotídeos inseridos, é lógico pensar que quanto maior for a região de cicatriz, maiores são as chances de ocorrência do códon cisteína, principalmente TGC. O tamanho das inserções verificadas no IL7R, no entanto, é maior do que o esperado da TdT em situações normais (2 a 5pb). A deficiência de alguns outros fatores do reparo NHEJ, que modulam a atividade da TdT, poderiam explicar estas inserções de tamanho maiores.
1.4. Modulação da atividade da polimerase TdT
Embora, in vitro, a TdT não requeira nenhum outro fator para adicionar nucleotídeos em finais 3’OH, in vivo a situação é diferente, envolvendo vários fatores. Tanto na recombinação V(D)J quanto na via de reparo NHEJ, a polimerase TdT faz parte de um complexo proteico do qual participam o heterodímero Ku70-Ku80 (MAHAJAN et al., 1999), a DNA PKc (MICKELSEN et al., 1999), a nuclease Artemis, XRCC4, Cernunos (XLF) e a LIG4 (MALU et al., 2012).
Regiões de cicatriz anormalmente longas (11 a 27pb) foram reportadas no caso de reparo de quebras dupla-fita de DNA de plasmídeo, quando em células sem a proteína Ku80 (SANDOR et al., 2004).Ku80, juntamente com Ku70, atua no reconhecimento das extremidades do DNA quebrado, recrutando os demais fatores NHEJ, incluindo TdT. Ao mesmo tempo em que Ku80 recruta TdT para o local do reparo, também inibe a atividade da mesma, conforme mostrado por Boubakour-Azzouz e colaboradores (BOUBAKOUR-AZZOUZ et al., 2012). Por outro lado, in
regiões N. As raras exceções (i.e. cicatrizes com nucleotídeos N) são inserções grandes, acima de 10bp. Isto foi visto tanto em experimento com plasmídeos em células deficientes em Ku80 (PURUGGANAN et al., 2001) quanto em contexto cromossômico em camundongos Ku80-/- (BOGUE et al., 1997). Estes achados fortalecem a hipótese de que deficiências nos fatores de reparo NHEJ podem contribuir, em alguns eventos, com inserções muito grandes, aumentando as chances de ocorrência aleatória de um códon cisteína.
Condizente com estes achados, estudo mais recente mostrou que o reparo de quebra dupla-fita (gerada por enzima de restrição I-SceI) em um cromossomo de células CHO, somente apresenta adição de nucleotídeos N na presença da TdT, Ku80 e XRCC4. Células deficientes em Ku80 ou em XRCC4 apresentam reparos sem inserção de nucleotídeos N e com grandes deleções nas extremidades que foram unidas (BOUBAKOUR-AZZOUZ et al., 2012). Porém, uma análise minuciosa do trabalho de Boubakour-Azzouz e colaboradores revelou que alguns poucos casos de reparo em células deficientes em XRCC4 apresentaram grandes inserções. Novamente vemos que a deficiência em um fator de reparo NHEJ leva a uma grande maioria de cicatrizes sem ação de TdT, porém com algumas exceções em que a adição de nucleotídeos N é muito grande. Na ausência dos fatores de reparo (Ku80 ou XRCC4, nos exemplos acima) a ação normal de TdT é afetada em dois níveis: (1) não mais é recrutada para as pontas do DNA, explicando a maioria das cicatrizes sem região N, mas (2) nos raros casos em que encontra as pontas do DNA, acaba polimerizando além do normal, pela falta do controle inibitório normalmente exercido pelas maquinaria NHEJ.
1.5. Possível deficiência de fatores NHEJ na LLA-T com IL7R mutante
Os achados acima (BOUBAKOUR-AZZOUZ et al., 2012; SANDOR et al., 2004) reforçam nossa hipótese de que deficiências na maquinaria de reparo (falta de Ku80 ou XRCC4, por exemplo) podem levar a inserções maiores durante a junção de quebras de DNA.
Análise da expressão gênica de microarranjos de LLA-T do Centro Infantil Boldrini, com e sem a mutação no IL7R, revelou que os casos com a mutação tem menor expressão de várias proteínas que regulam negativamente a atividade in
vitrode TdT, como TdIF1 e TReP-132 (FUJISAKI et al., 2006), TdIF2 (FUJITA et al.,
2003) e PCNA (IBE et al., 2001), ou de proteínas que participam da maquinaria NHEJ, como Ku70, Ku80, Artemis, XRCC4 e Cernunnos (SEKIGUCHI; FERGUSON, 2006)(Figura 4).
Não sabemos se a menor expressão desses fatores foi causadora da deficiência de reparo NHEJ que levou a inserções grandes no IL7R ou se é a ativação constitutiva do IL7R que ocasiona a inibição da transcrição desses genes. Neste trabalho testamos a primeira possibilidade, analisando a cicatriz de reparo do
IL7R em células de LLA silenciadas para TdIF2, Ku70 e XRCC4.
Figura 4: Expressão dos genes da via de reparo NHEJ nas LLA-T. Expressão de genes NHEJ em LLA-T com o IL7R mutante (vermelho) versus demais LLA-T (preto), obtido por microarranjos Affymetrix Gene 1.0ST. Cada círculo representa o valor de expressão de uma LLA. Números correspondem ao p-valor para a comparação de cada grupo pelo teste Mann Whitney.
2. HIPÓTESES
Para este mestrado foram levantadas três diferentes hipóteses a serem testadas, que serão listadas a seguir:
Geração de DSBs no éxon 6 do geneIL7R por CRISPR-Cas9 é suficiente para causar inserção de cisteínas no sítio de quebra. E quanto maiores as inserções, maior a chance de aparecimento de códon cisteína.
A polimerase TdT, específica de células linfoides, é responsável pelas inserções observadas no éxon 6 do IL7R.
Silenciamento dos fatores XRCC4, Ku70 e TdIF2 causa mudança no tamanho das inserções que ocorrem no IL7R.
3. OBJETIVOS
3.1. Objetivo Geral
Analisar cicatrizes de quebra do DNA em linhagens HPB-ALL silenciadas para XRCC4, Ku70 e TdIF2, além de controle scramble e outra linhagem knockout para TdT, a fim de observar se os diferentes silenciamentos e knockout têm algum efeito nas cicatrizes do IL7R produzidas por DSBs através de CRISPR-Cas9.
3.2. Objetivos Específicos
Estabelecer linhagens HPB-ALL silenciadas para três diferentes genes:
XRCC4(XRCC4), XRCC6(Ku70) e DNTTIP2(TdIF2), além de outra
linhagem knockout para TdT.
Gerar DSBs no éxon 6 e em região intrônica do gene IL7R das linhagens produzidas através da metodologia CRISPR-Cas9.
Analisar as cicatrizes de reparo por análise bioinformática e comparar os resultados entre as linhagens produzidas e sítios de quebra a fim de observar se existem diferenças entre as cicatrizes de reparo de amostras modificadas e amostras controle (scramble).
4. PANORAMA DO TRABALHO
Utilizamos a tecnologia shRNA para silenciar os genes selecionados (XRCC4,
XRCC6e DNTTIP2) em linhagem celular HPB-ALL (ACC 483 – DSMZ). O método
utilizado para entrega dos vetores de shRNA foi o de transdução lentiviral, com o vetor pLKO.1.Após transduzidas, as células foram selecionadas com puromicina e mediu-se o nível de expressão dos três genes por qRT-PCR.Uma vez confirmados os silenciamentos, as linhagens silenciadas foram expandidas. Além disso, foi produzida linhagem HPB-ALL knockout para TdT.
Testamos dois métodos para entrega do vetor de CRISPR-Cas9 para IL7R nas linhagens modificadas: eletroporação e transdução lentiviral. Após estabelecer e otimizar os protocolos para ambos os métodos, decidimos prosseguir utilizando o método de transdução lentiviral, uma vez que este apresentou melhores resultados para a finalidade deste trabalho.
Após transdução com vetores lentivirais de CRISPR-Cas9, as células foram novamente selecionadas, desta vez com blasticidina, e o DNA genômico foi extraído. O sítio de quebra no DNA foi amplificado por PCR e o produto da reação foi utilizado para construção de biblioteca de sequenciamento e posterior sequenciamento na plataforma Illumina MiSeq.
Os dados de sequenciamento foram analisados por diversas ferramentas de bioinformática, assim como manualmente, e os resultados de diferentes linhagens foram comparados a fim de observar se houve alguma diferença no reparo do DNA entre as diferentes linhagens silenciadas e knockout. O panorama do trabalho está ilustrado na Figura 5.
Figura 5: Fluxograma esquematizando passo-a-passo o plano de trabalho executado neste mestrado.
5. RESULTADOS
5.1. Silenciamento dos genes XRCC4, XRCC6 e DNTTIP2
Inicialmente foi feito o silenciamento dos genes XRCC4, XRCC6 e DNTTIP2 na linhagem HPB-ALL. Testamos o silenciamento utilizando apenas 1 shRNA para cada gene e, depois, comparamos os resultados entre os dois shRNAs (sh1 e sh2) para decidir qual shRNA seria utilizado baseado em qual produziu maior nível de silenciamento. Para controle negativo dos experimentos de silenciamento foi utilizado um vetor scramble que expressa um shRNA que não atinge nenhum gene conhecido de mamíferos. Após transdução das células com os vetores lentivirais de shRNA, as células foram selecionadas com puromicina e o nível de silenciamento foi avaliado por qRT-PCR. Como controle endógeno foi escolhido o gene ABL. Os shRNA1 (sh1) apresentaram níveis de silenciamento de 63% para XRCC4 e, diferente do esperado, praticamente não apresentaram silenciamento nenhum para os genes XRCC6 e DNTTIP2. Já os shRNA2 (sh2) apresentaram níveis mais altos de silenciamento, quando comparados aos shRNA1, sendo 74% para XRCC4, 20% para XRCC6 e 56% para DNTTIP2. Para observar se era possível obter níveis mais altos de silenciamento, decidimos utilizar os dois shRNAs disponíveis para cada gene em uma única população de células. Através dessa nova estratégia foi possível obter silenciamentos de 82% para XRCC4, 50% para XRCC6 e 62% para DNTTIP2 (Figura 6). As linhagens celulares silenciadas para XRCC4, XRCC6 e DNTTIP2 receberam os nomes “HPB_X”, “HPB_K” e “HPB_T” respectivamente. A linhagem celular que recebeu o vetor scramble recebeu o nome “HPB_Scr”.
Figura 6: Níveis de expressão relativos, medidos por qRT-PCR, observados para cada gene utilizando três diferentes estratégias: usando somente 1 shRNA (sh1 ou sh2) por gene e usando os dois shRNAs (sh1+2) por gene. Células HPB-ALL foram transduzidas com os vetores pLKO.1 de shRNA e selecionadas com puromicina (2µg/mL) por 5 dias. O método utilizado para obter os valores de expressão relativos foi o método ∆∆cT e a amostra HPB_Scr foi utilizada como controle de expressão (linha tracejada). Como controle endógeno para normalização foi utilizado o gene ABL. As barras representam o valor médio ± desvio padrão (N=3).
Baseando-se nesses dados, decidimos utilizar as células transduzidas com ambos os shRNAs para as próximas etapas do trabalho, uma vez que um maior nível de silenciamento provavelmente resultaria em efeitos mais drásticos no reparo do DNA.
5.2. Transdução lentiviral resulta em maior número de células transformadas
O planejado inicialmente para o trabalho era transformar 1 milhão de células silenciadas com os vetores de CRISPR-Cas9 por eletroporação. Testamos dois protocolos, sendo um descrito por Chicaybam e colaboradores (CHICAYBAM et al., 2013) que utiliza tampões caseiros como alternativa simples e mais barata aos kits comerciais da Lonza, e outro utilizando o Kit V da Lonza, indicado para uso com a linhagem HPB-ALL. O vetor utilizado para testar a eletroporação foi o plasmídeo “pX458 IL7Rex6”, que expressa a nuclease Cas9, assim como a sonda sgRNA para o éxon 6 do IL7R e um repórter eGFP. Os parâmetros utilizados para avaliar a eletroporação são viabilidade e eficiência, sendo o primeiro a fração de células que sobrevive ao procedimento e o segundo quantas das células viáveis expressam o
construto. Dentre os tampões descritos no trabalho de Chicaybam e colaboradores escolhemos utilizar o tampão 3P, pois esse foi o que apresentou os melhores resultados no trabalho em questão. Após a eletroporação, as células foram cultivadas por 24 horas e então a população celular foi avaliada por citometria de fluxo. Para o tampão 3P, os melhores resultados obtidos em nossos experimentos foram 8,15% de viabilidade e 64% de eficiência. Utilizando o Kit V obtivemos 35,7% de viabilidade e 10,6% de eficiência (Figura 7). Partindo de 1 milhão de células, foi possível obter aproximadamente 52 mil e 38 mil células transformadas através do protocolo do tampão 3P e do Kit V, respectivamente. No entanto, em todos os testes realizados as populações eletroporadas apresentavam praticamente 100% de morte celular 72 horas após o procedimento.
Figura 7: Comparação entre os dois protocolos de eletroporação. (A) Análise por citometria de fluxo de células eletroporadas com o tampão 3P. 1x106 de células foram eletroporadas utilizando 4µg de plasmídeo e cultivadas por 24 horas. (B) Citometria de fluxo de células eletroporadas com o Kit V (Lonza). 1x106 de células foram eletroporadas utilizando 2µg de plasmídeo e cultivadas por 24 horas. A viabilidade e morfologia celular foram medidas por plotagem SSC x FSC e a expressão do transgene foi medida via expressão de GFP através do canal FITC. Os gates foram definidos a partir de populações celulares não-eletroporadas. O valor de “céls. Obtidas” corresponde ao valor de células viáveis e expressando o construto ao final do experimento, levando em conta a viabilidade e eficiência alcançadas. As eletroporações foram feitas no aparelho Nucleofector Device 2b (Lonza) e o plasmídeo utilizado foi o pX458 IL7Rex6.
Devido à baixa viabilidade observada no método de eletroporação, decidimos testar o método de transdução lentiviral como método alternativo para transformar as células. Os testes para a transdução lentiviral foram realizados utilizando o vetor lentiviral “lcGFP IL7Rex6” que, assim como o vetor utilizado na eletroporação, expressa a maquinaria do CRISPR, a sonda para o éxon 6 do IL7R além do repórter eGFP. Utilizamos os mesmos parâmetros utilizados na eletroporação (viabilidade e eficiência) para avaliar a transdução. As células foram avaliadas por citometria de fluxo 48 horas após o experimento. Esse método apresentou, nos melhores resultados obtidos, 61,1% de viabilidade e 54,4% de eficiência (Figura 8). Empregando essa metodologia foi possível obter, a partir de 1 milhão de células, aproximadamente 332 mil células transformadas. Diferentemente do que ocorreu na eletroporação, as células transduzidas sobreviveram normalmente durante até 5 dias após o procedimento, que foi quando o acompanhamento das células acabou.
Figura 8: Análise, por citometria de fluxo, de células transduzidas com vetor lentiviral lcGFP IL7Rex6. 1x106 de células foram transduzidas pelo método de spinfection usando polibreno (8µg/mL) e cultivadas por 48 horas. Viabilidade e morfologia celular foram medidas por plotagem SSC x FSC e a expressão do transgene foi medida através do sinal de GFP usando o canal FITC. O gate de células foi definido a partir de uma população de células não-transduzidas.
Diante dos resultados obtidos, decidimos adotar a transdução lentiviral como método padrão deste trabalho para expressar o sistema CRISPR-Cas9 nas linhagens HPB-ALL previamente modificadas. Apesar de ser mais trabalhoso e demorado, o método de transdução mostrou ser mais adequado para adquirir um maior número de células transformadas assim como para manter a células transduzidas em cultivo para eventuais experimentos funcionais.
5.3. Geração de quebras dupla-fita e análise das cicatrizes por sequenciamento de nova geração
Para avaliar a cicatriz de quebra no DNA mediante atividade do CRISPR e comparar entre diferentes regiões do gene IL7R, foram construídos dois vetores lentivirais de CRISPR: um vetor específico para o éxon 6 do IL7R (“LCv2 IL7Rex6”) e outro para o intron 3 do mesmo gene (“LCv2 IL7Rin3”). Os dois vetores foram utilizados em todas as linhagens silenciadas para comparar também as cicatrizes de quebra entre linhagens com os diferentes silenciamentos. As linhagens HPB_X, HPB_K, HPB_T, HPB_Scr e HPB-ALL foram transduzidas com ambos os vetores, cada vetor em um experimento separado, selecionadas com blasticidina e então o DNA genômico foi extraído e utilizado para construção da biblioteca de sequenciamento. Foi construído também um vetor lentiviral de CRISPR para o éxon 2 do gene DNTT, que codifica a polimerase TdT, com o objetivo de produzir uma linhagem HPB-ALL knockout para TdT. Dessa forma seria possível observar se a TdT de fato atua nas inserções observadas no IL7R através da comparação das cicatrizes de reparo entre a linhagem TdT knockout, nomeada “HPB_dntt”, e as outras linhagens. Linhagem HEK293T também foi modificada com vetor de CRISPR-Cas9 para o éxon 6 do IL7R com o objetivo de comparar as cicatrizes de reparo entre os diferentes tipos celulares em maior escala do que o que foi mostrado na Tabela 2.
Além disso, a fim de observar se há alguma diferença na quebra e reparo do DNA entre células transformadas com as metodologias de eletroporação e transdução, utilizamos também amostras de HPB-ALL e HPB_Scr eletroporadas com o vetor “pX458 IL7Rex6” para construir a biblioteca de sequenciamento.
5.3.1. Número de reads por amostra e qualidade dos
sequenciamentos
As amostras de células modificadas com os vetores de CRISPR foram então utilizadas para construção da biblioteca de sequenciamento e sequenciadas na plataforma MiSeq. Todos os sequenciamentos realizados apresentaram mais de 99% dos reads com índice Phred de qualidade acima de Q30 (Tabela 3 e Figura 9). Os números de reads obtidos para cada amostra estão listados na Tabela 3. As
amostras que receberam o CRISPR para o éxon 6 receberam o sufixo “sgEx6” em seus nomes, enquanto as amostras com o CRISPR intrônico receberam o sufixo “sgInt”.
Tabela 3: Quantidade de reads por amostra e qualidade dos sequenciamentos. As amostras do éxon 6 e do intron 3 foram sequenciadas em corridas separadas.
Amostra Número de reads % de reads ≥ Q30
HEK293T_sgEx6 470.318 99,9% HPB_Scr_sgEx6 1.014.235 99,8% HPB_X_sgEx6 1.055.527 99,8% HPB_K_sgEx6 1.025.306 99,8% HPB_T_sgEx6 983.686 99,8% HPB_dntt_sgEx6 2.586.984 99,7% HPB_Scr_sgInt 1.790.030 99,6% HPB_X_sgInt 1.872.538 99,6% HPB_K_sgInt 1.931.096 99,7% HPB_T_sgInt 1.915.236 99,6%
Figura 9: Gráfico de qualidade do sequenciamento da amostra HPB_Scr. A análise de qualidade foi feita utilizando a ferramenta FastQC. Todas as outras amostras sequenciadas apresentam o mesmo padrão de qualidade.
5.3.2. Eficiência das sondas sgRNA e frequência dos tipos de mutações
Para este trabalho fizemos a análise do sequenciamento utilizando dois parâmetros: número de reads e número de cicatrizes. O número de reads (Tabela 3) corresponde à quantidade de reads observados para determinada sequência. Já o número de cicatrizes (Tabela 4) está relacionado com a quantidade de diferentes
cicatrizes de reparo encontradas, independentemente do número de reads observado por sequência. O número de reads nos permite observar a abundância de cada sequência, todavia o número de cicatrizes nos permite avaliar a variedade de mutações que foram originadas. Na Tabela abaixo estão listados os números de cicatrizes observadas por amostra (Tabela 4). As amostras de HPB-ALL e HPB_Scr eletroporadas não apresentaram nenhuma cicatriz de reparo e, portanto, foram removidas das análises.
Amostra Número de cicatrizes
HPB_Scr_sgEx6 633 HPB_X_sgEx6 254 HPB_K_sgEx6 685 HPB_T_sgEx6 1713 HPB_dntt_sgEx6 359 HPB_Scr_sgIn3 603 HPB_X_sgIn3 366 HPB_K_sgIn3 667 HPB_T_sgIn3 457
A análise dos dados de sequenciamento foi feita utilizando as ferramentas de bioinformática CRISPR-GA (GÜELL; YANG; CHURCH, 2014), AGE-seq (XUE; TSAI, 2015) e CRISPResso (PINELLO et al., 2016). A eficiência de quebra das duas sondas desenhadas para o IL7R (éxon 6 e intron 3) foi avaliada através da comparação da quantidade de reads contendo indels com o número total de reads sequenciados por amostra. Foram 2,39% para HPB_Scr, 1,04% para HPB_X, 2,73% para HPB_K, 6,26% para HPB_T, 3,68% para HPB_dntt e 12,75% para HEK293T (Figura 10A). Já no caso da sonda intrônica, não houve transdução da linhagem HPB_dntt, apenas das silenciadas. Foram 2,54% para HPB_Scr, 1,31% para HPB_X, 2,65% para HPB_K e 1,17% para HPB_T (Figura 10A). Após analisar os dados de sequenciamento descobrimos que a linhagem HPB-ALL possui um SNP (rs6897932) (GREGORY et al., 2007) em 50% dos reads sequenciados e está localizado justamente no sítio de reconhecimento da sonda sgRNA do éxon 6 do
IL7R. O alelo contendo o SNP teve frequência de mutações muito mais baixa do que
o alelo normal, representando em torno de 10% dos reads com indel em cada amostra (Figura 10B).
Tabela 4: Quantidade de cicatrizes observadas por amostra.
Análise de mudança no frame de leitura revelou que, em todas as amostras, aproximadamente 75% das mutações observadas eram de frameshift, 25% in-frame e uma fração praticamente nula correspondendo a mutações não codificantes, provavelmente originadas de erros no sequenciamento (Figura 10C).
Figura10: Frequência de mutações observadas. (A) Porcentagem de reads por amostra, partindo da biblioteca total, contendo mutações. O número de reads contendo mutações foi dividido pelo número total dos reads da biblioteca por amostra. (B) Frequência de mutações por alelo do IL7R Ex6. Os reads contendo mutações foram divididos entre os dois alelos e o número de reads com mutações para cada alelo foi dividido pelo número total de reads com mutações por amostra. As sequências de cada alelo estão descritas ao lado direito do gráfico. (C) Frequência de mutações frameshift e in-frame, obtidas por análise em software CRISPResso.
Para verificar se as diversas condições de silenciamento e knockout resultaram em frequências de inserção/deleção diferentes, foi feita análise manual das cicatrizes de cada amostra. A quantidade de cicatrizes com apenas inserções (In), apenas deleções (Del) e ambos os eventos (In+Del) foi contada e comparada com a quantidade total de cicatrizes contendo indels por amostra (Figura 11). Diferente do que ocorre em outras linhagens celulares não-linfoides, o evento mais comum que ocorreu foram as inserções, em ambos os sítios de quebra estudados, com exceção da amostra HPB_dntt que teve como evento mais abundante as deleções. O sítio intrônico apresentou um padrão levemente diferente de mutações, quando comparado ao sítio do éxon 6, apresentando maior frequência de inserções e, consequentemente, menos deleções (Figura 11).
Figura 11: Frequência de cada tipo de mutação (in, del ou ambos). A quantidade de reads contendo cada tipo de mutação foi somada e dividida pelo total de reads com mutações por amostra.
5.3.3. As frequências inseridas, em ambos os sítios, apresentam alto conteúdo %GC
Analisamos o conteúdo %GC das cicatrizes por amostra com o objetivo de observar se haveriam mudanças no conteúdo %GC entre as diferentes amostras. Para tal, as sequências inseridas foram separadas e o conteúdo %GC foi analisado manualmente.
Todas as amostras analisadas apresentaram inserções com conteúdo geral de %GC maior que 50%, porém não houve grande diferença entre diferentes amostras e sítios de quebra, com exceção da amostra HPB_dntt que apresentou inserções com conteúdo %GC levemente maior, chegando a 64% (Figura 12).
Figura 12: Conteúdo %GC das cicatrizes observadas por amostra. O conteúdo %GC foi calculado somando a quantidade de guaninas e citosinas e dividindo pelo número total de nucleotídeos inseridos por amostra. Não foi levado em consideração o número de reads por sequência. Os números acima das colunas correspondem à porcentagem de GC observada por amostra.
5.3.4. Análise do tamanho das inserções observadas
Após a análise da frequência de inserção e deleção nas amostras, decidimos observar se as diferentes amostras apresentavam um aumento ou redução no tamanho das inserções com relação à amostra controle (HPB_Scr). Para isso novamente foi feita análise manual das inserções, que foram contadas de acordo com o tamanho e comparadas com a quantidade total de inserções. No caso das inserções observadas no éxon 6, a amostra de HPB_X apresentou inserções de 3pb como as mais abundantes. As amostras HPB_Scr, HPB_K e HPB_T, por sua vez, tiveram as inserções de 4pb como as mais abundantes sendo que a amostra HPB_T manteve níveis mais altos, quando comparada às outras amostras, de inserções de 5 e 6 pb. Na amostra HPB_dntt, a grande maioria das inserções observadas foram de apenas 1pb (Figura 13).
Figura 13: Distribuição do tamanho das inserções observadas no éxon 6 do IL7R. (A) Frequência de cicatrizes (linha contínua) e reads (linha pontilhada) por tamanho das inserções. Os números em cima dos picos das curvas representam o tamanho das inserções mais frequentes. (B) Sobreposição das curvas de cicatrizes de todas as amostras. A amostra HPB_dntt está com preenchimento para efeito de comparação com as outras amostras.
Para as quebras no intron 3, não houve diferença entre as amostras e todas apresentaram as inserções de 5pb como as mais abundantes, com exceção da amostra HPB_X que mostrou inserções de 3pb em frequência praticamente igual às de 5pb (Figura 14).
Figura 14: Distribuição do tamanho das inserções observadas no intron 3 do IL7R. (A) Frequência de cicatrizes (linha contínua) e reads (linha pontilhada) por tamanho das inserções. Os números em cima
dos picos das curvas representam o tamanho das inserções mais frequentes. (B) Sobreposição das curvas de cicatrizes de todas as amostras.
5.3.5. Frequência dos aminoácidos inseridos
Para analisar a frequência dos aminoácidos inseridos, as cicatrizes foram manualmente traduzidas e os aminoácidos que foram inseridos/modificados foram contados e comparados com o total de aminoácidos inseridos por amostra. Para esse procedimento foram utilizadas apenas as inserções in frame. Além disso, esse procedimento foi feito apenas para os dados do éxon 6, uma vez que o intron 3 não é traduzido. Em todas as amostras, com exceção da HPB_dntt, o aminoácido mais inserido foi a Glicina (Gly), com frequências entre 15% e 20% aproximadamente. Todas as amostras, exceto a amostra HPB_dntt, tiveram cisteínas (Cys) inseridas in
frame, todavia em frequências mais baixas variando entre 1% e 1,5%
aproximadamente (Figura 15).
As inserções da amostra HPB_dntt mostraram um padrão completamente diferente das demais amostras, tendo o aminoácido Fenilalanina como o mais abundante (33,3%), seguido por Serina (26,67%) e Ácido Aspártico (20%) (Figura 15).
Figura 15: Frequência dos aminoácidos inseridos por amostra. Os aminoácidos foram ordenados por relevância para o trabalho. (A) Frequência dos aminoácidos inseridos nas amostras silenciadas e
scramble. O grupo KRH+ corresponde aos aminoácidos positivamente carregados (Lisina, Arginina e Histidina). (B) Frequência dos aminoácidos inseridos na amostra HPB_dntt.
5.3.6. Frequência de inserção de códon cisteína por tamanho da cicatriz
Com exceção da amostra HPB_dntt, todas as outras amostras apresentaram inserção de cisteína in frame no éxon 6. Os códons de cisteína ocorreram em inserções in frame de até 12pb. Para verificar se a inserção do códon cisteína ocorre mais frequentemente conforme o tamanho das inserções aumenta, inserções de 3pb, 6pb, 9pb e 12pb foram contadas e separadas em grupos de acordo com o tamanho. Então, as inserções contendo cisteínas dentro de cada grupo foram contadas e comparadas com seus respectivos grupos. As frequências de códon cisteína para os grupos de 3pb, 6pb, 9pb e 12pb foram 3,04%, 3,43%, 9,02% e 11,11%, respectivamente (Figura 16). É importante mencionar que todos os códons de cisteína inseridos observados no nosso sequenciamento foram formados exclusivamente pelas sequências inseridas e não tiveram participação da sequência adjacente à quebra. Dentre os códons de cisteína, o mais frequente foi TGC (tabela da Figura 16).
Figura 16: Porcentagem de inserções in-frame códon cisteína. Os números de vezes que cada códon foi inserido estão na tabela da direita, assim como as proporções com relação ao total de códons cisteína inseridos.
5.3.7. As sequências inseridas podem não ser completamente aleatórias
Ao analisar de forma mais profunda algumas inserções maiores (≥11pb), observamos que, em alguns casos, as mesmas sequências eram inseridas na mesma posição em diferentes amostras. Isso nos levou a questionar se, nesses casos específicos, as inserções realmente ocorreram na ausência de sequência-molde, como era esperado. Um exemplo de inserção que se repetiu em diferentes amostras foi a inserção5’CATCAGCATTTTGAGTTTT3’ (19pb), que ocorreu nas amostras HPB_Scr e HPB_T. Diante disso decidimos aprofundar mais a análise de sequências com inserções maiores.
Inicialmente, inserções maiores do que 16pb foram alinhadas no genoma humano utilizando a ferramenta BLAST. Escolhemos analisar apenas inserções maiores do que 16pb porque, de acordo com o trabalho de Vergni e colaboradores (VERGNI; SANTONI, 2016), a partir de 11 pb já é possível encontrar sequências únicas (nullomers) que ocorrem apenas uma vez no genoma humano, todavia para sequências de 11pb o número de ocorrências únicas ainda é muito baixo, fazendo com que alinhamentos com sequências desse tamanho tenham chances altas de ocorrerem por acaso ou incorretamente. Observamos que, a partir de 16pb o número de ocorrências únicas é bastante alto, reduzindo drasticamente a chance de alinhamentos incorretos ou por acaso. Através do alinhamento observamos diversos sítios genômicos onde as sequências inseridas alinhavam perfeitamente e por completo. A maioria dos alinhamentos ocorreu em regiões intergênicas (63,3%), no entanto diversos dos alinhamentos ocorreram em regiões gênicas, que são mostradas na Tabela 5.
Tabela5: Lista de genes onde as sequências inseridas foram alinhadas por análise no BLASTn.
Gene Posição (Cromossomo)
IL7R 5: 35874478 to 35874495 TRIM35 8: 27291116 to 27291133 ASCC1 10: 72168237 to 72168254 KIAA1468 18: 62219271 to 62219288 HECW1 7: 43365693 to 43365710 CLUAP1 16: 3519387 to 3519404 TSPAN12 7: 120838464 to 120838482 DAW1 2: 227901401 to 227901418
CCDC12 3: 46953126 to 46953143 KDM4C 9: 7086525 to 7086542 ERAP2 5: 96895858 to 96895875 AGA 4: 177437264 to 177437282 GCC2 2: 108453096 to 108453113 TBC1D2B 15: 78041556 to 78041573 USP9Y Y: 12841581 to 12841599 RIMS2 8: 103904205 to 103904222 RNLS 10: 88546542 to 88546559 PTPRG 3: 62248122 to 62248139 SCAF8 6: 154831905 to 154831922 ITGA1 5: 52878411 to 52878429 DNAH9 17: 11770429 to 11770446 SUPT20H 13: 37013913 to 37013930 AATF 17: 36983707 to 36983724 PRKG1 10: 51808081 to 51808103 PPP4R2 3: 73001018 to 73001035 PELI2 14: 56151720 to 56151739 OPHN1 X: 68085530 to 68085548 IMMP2L 7: 111080746 to 111080763 DLG2 11: 85599714 to 85599731 DRC3 17: 17979420 to 17979437 MUC16 19: 8942140 to 8942156 MAGI1 3: 65876323 to 65876340 STAM2 2: 152142838 to 152142855 PER3 1: 7841141 to 7841158 KCNQ3 8: 132362231 to 132362248 XKRX X: 100891883 to 100891900 RNF17 13: 24784193 to 24784210 ERC2 3: 55907332 to 55907348 DPH5 1: 101002813 to 101002829 NTM 11: 131455101 to 131455117 PDE2A 11: 72587997 to 72588013 NDEL1 17: 8469040 to 8469056 SP140 2: 230252986 to 230253002 NETO1 18: 72751115 to 72751132 COBL 7: 51236354 to 51236370 IRGM 5: 150879108 to 150879124 ITGA8 10: 15649779 to 15649795 RELN 7: 103615078 to 103615095 MAST2 1:46002719 to 46002735 MASTL 10: 27182902 to 27182918
Além disso, ao observar os alinhamentos produzidos notamos que diversas dessas inserções eram compostas por pequenas repetições. Para observar quais dessas inserções eram compostas por repetições, utilizamos o software online
Tandem Repeats Finder (BENSON, 1999) para analisar as inserções e procurar por
sequências repetitivas (Tabela 6). Diversas das inserções observadas possuíam repetições, e percebemos que essas inserções com repetições alinhavam em diversos locais genômicos, em uma frequência muito acima do que outras sequências sem repetições. Essas inserções foram classificadas como sendo STRs (Short Tandem Repeats) e foram removidas do alinhamento por estarem distribuídas por todo o genoma. É importante mencionar que a amostra HPB_dntt não apresentou inserções com repetições, assim como as inserções observadas nos pacientes reportados na literatura (Tabela 1) também não apresentam repetições.
Tabela6: Sequências das inserções compostas por repetições em tandem no éxon 6 e intron 3 do
IL7R.
Sítio de
quebra Seq. inserida (5’->3’) Repetição
Éxon 6 CTAACTATCCTATCTAACTATCCTATC CTAACTATCCTAT CATCAGCATTTACTAACCATTTACTAACCAT CATTTACTAAC AGTATCCTATCCTATCAGTATCCTATCCTATCCTA AGTATCCTATCCTATC CTATCCTATCCTACTAATCCTATCCTATCCTATCCTATCC CTATC CTAACTGATCCTACTAACTGATCCTACTAGCTGA CTAACTGATCCTA CATCTATCCTATCCTATCCTATCCTATCCTACCG CTATC AACTATACTAACTAACTATACTAACTAACTATCCTA AACTATACTAACT TACTAACCATCCTATTACTAACCTATCCTA TACTAACCTATCCTAT ATCTAGGATAGGATAAGTTAGTTATAGGATAAGTTAGTTCGT ATAGGATAAGTTAGTT ATCTATCTATCCTATCATCTATCCTATCATCCTATCATG ATCTATCCTATC ATGGATTCTATCTATGGATTCTATCTATCTATGGATTCTATCC ATGGATTCTATCT AACTAAAAATACTAACATACTAACATACTAAAATACTACAAAA ATACTAAC TATGGATCCTATCCTATCCTA ATCCT TTACTAACTTACTAACTTACTAGTTAC TTACTAAC AGCATTAGCATTAGCA AGCATT TAATCCTATTAATCCTATCTA TAATCCTAT CTTATCCTATCTTATCCTATCCTATCCTC TATCC GAGGATAGGATAGGATAGGATAC AGGAT CTATCTAACTATCTAA CTATCTAA ATCCTATCTATCCTATCTATGCTT ATCCTATCT AACTAACCTATCCTATCCTATCC CCTAT CTATCCTATCCTATCGGGGGC CTATC
CTATGGATCCTATCATCCTATCAT ATCCTATC ATCCTATCCTATCCTATC ATCCT ATTACTAACCATTACTAACCATA ATTACTAACC GGCTAACTAACTAACTATCCTATCTCC CTAA CTTTATATATCCTATCCTATCCTATATATCCTATCCTTC TATCC CGGATCCATCTATCCATCCTATC ATCCATCCT ACTAATACTAAATACTAAC AATACTA GATGGATGGATGGATC GATG ATCCTATCCTATCATCCTATCATT ATCCTATC CTTATCTTATCCTATCTATCTTATCCTATCCTATCTC TATCTTATCCTATCC CATCTAACATTTACTAACCATTT CTAACCATTTA CTATCCTATCCTATCCTATCC CTATC ACTAACTATCCTATCTACTAACTATCCTATC ACTAACTATCCTATCT ATCCTATCCTATCCTT ATCCT ATCTCCAAAAAGTTACTCACTTTTTTTACTAACTTTTT TTACTAACTTTTT TACTATTATTATTATTATCCTA TAT TACCATCTATTACCATCCTATTACCCTG TACCATCCTAT CTTATTCTTATTCTTATTCTTGC CTTATT GGGTTGAGCCTAATTGAGCCTAATTG TTGAGCCTAA ATATTGGATCCTATCATATATGGATCCTATCCTA ATATTGGATCCTATC GTTGTCTTATGGATCCTATCTGTTGATCCTATCTGTTGTTT GATCCTATCTGTT Intron 3 CTTATTCTTATTCTTATTCTTGC CTTATT
GGGTTGAGCCTAATTGAGCCTAATTG TTGAGCCTAA
Separamos os sítios genômicos de alinhamento por cromossomo, a fim de observar se as sequências inseridas se concentram mais em algum cromossomo específico (Figura 17). A análise do alinhamento revelou que os cromossomos 3, 5 e 15 tiveram maiores frequências de hits quando comparados aos outros cromossomos, com mais de 1 hit a cada 10 milhões de pares de base.