• Nenhum resultado encontrado

Estudo dos domínios de Interação entre os hómologos eIF4G/eIF4A e eIF4G/eIF4E e em L major.

5.1. Estudo da interação entre hómologos do eIF4G com as demais subunidades do complexo eIF4F e PABP, em L major

5.1.3. Estudo dos domínios de Interação entre os hómologos eIF4G/eIF4A e eIF4G/eIF4E e em L major.

Uma vez identificadas as interações específicas entre os homólogos das subunidades do eIF4F de L. major, tornou-se importante estabelecer que região/domínios das proteínas eIF4G poderiam estar mediando estas interações, com seus parceiros, tentando correlacionar com semelhanças e/ou diferenças das interações já descritas em outros eucariotos. Foram escolhidas as proteínas LmEIF4G3-4, cujos resultados de interação às proteínas LmEIF4AI e

LmEIF4E3 foram considerados mais consistentes, para iniciar os ensaios de localização de

domínios. Fragmentos gênicos codificando para o domínio MIF4G (LmEIF4G326-310 e

88 respectivas proteínas radioativas foram analisadas quanto a sua capacidade de ligar-se as

proteínas recombinantes GST-LmEIF4AI e GST-LmEIF4AIII (Figura 22A). Como já descrito anteriormente, o LmEIF4G3 liga-se ao GST-LmEIF4AI através de seu domínio MIF4G (Dhalia et al., 2005), e aqui é mostrado que a ligação também ocorre com a proteína completa. Já no caso do LmEIF4G4, embora a proteína inteira interaja com o LmEIF4AI (Figura 20B), o domínio MIF4G isoladamente não parece ser capaz de realizar esta interação.

Para identificar o domínio na proteína LmEIF4G4 envolvido na ligação às proteínas

LmEIF4AI e LmEIF4E3, construções plasmidais contendo as regiões codificantes para as

regiões N-terminal+MIF4G (LmEIF4G41-362), MIF4G+C-terminal (LmEIF4G437-765) e o gene completo do LmEIF4G4 foram utilizados para a obtenção das respectivas proteínas marcadas com 35S. As proteínas obtidas foram incubadas (em ensaios de pull down) com as proteínas GST, GST-LmEIF4AI e GST-LmEIF4E3. A proteína GST-LmEIF4E3 é capaz de interagir com o fragmento protéico N-terminal+MIF4G e com a proteína completa, entretanto essa interação não acontece com o domínio MIF4G+C-terminal (Figura 22B). Esse resultado indica que o motivo de ligaçãoda proteína LmEIF4G4 à LmEIF4E3 se encontra na sua curta região N-terminal, ou que esta região seja necessária para que a proteína assuma o dobramento apropriado para que ocorra a ligação. Outro dado relevante, obtido neste ensaio, é que a proteína GST-LmEIF4AI interage com as proteínas C-terminal+MIF4G e proteína completa LmEIF4G4, todavia o mesmo não ocorre com o N-terminal+MIF4G (Figura 22B), corroborando o resultado da figura 22A que mostra a necessidade além do MIF4G, do segmento C-terminal para que ocorra a interação com a proteína LmEIF4A1. Esta região, como mostrado anteriormente, pode abrigar o domínio MA3 que também ligase ao eIF4A em mamíferos.

89 Figura 22. Análise da interação entre os homólogos do eIF4A e eIF4E com diferentes

domínios dos homólogos EIF4G3-4 de L. major. As proteínas recombinantes fusionadas à GST (LmEIF4AI, LmEIF4AIII e LmEIF4E3) foram imobilizadas na resina Glutationa Sefarose 4B e incubadas com as diferentes proteínas EIF4G3-4 marcadas com 35S. (A) O domínio MIF4G do LmEIF4G3 e as proteínas completas LmEIF4G3-4 ligam-se à LmEIF4AI. A proteína LmEIF4G3 completa também liga-se, mais fracamente, a LmEIF4AIII (setas). (B) A região N-terminal+MIF4G e a proteína completa LmEIF4G4 interagem com a proteína

LmEIF4E3, enquanto o segmento protéico C-terminal+MIF4G e a proteína inteira se ligam a

90 5.1.4. Alinhamento múltiplo das seqüências LmEIF4G3-4 e identificação de motivos

conservados

Das cinco proteínas homólogas ao eIF4G, encontradas em L. major, as proteínas

LmEIF4G3 e LmEIF4G4 foram as únicas capazes de ligar-se de forma satisfatória aos

homólogos eIF4A e eIF4E. Além disso, elas são as únicas que apresentam homologia e arquitetura semelhante, fora do seu domínio MIF4G, com os demais homólogos de eIF4G descritos em outros eucariotos (Dhalia et al., 2005). O alinhamento da figura 23 mostra vários segmentos conservados na região N-terminal, o domínio central MIF4G e uma região C- terminal com alguns trechos conservados. Dentro da região N-terminal destas proteínas, algumas seqüências se assemelham ao motivo de ligação [YXXXXLΦ (onde X pode ser qualquer aminoácido e Φ é um resíduo hidrofóbico – L, M ou F)] ao eIF4E presente no eIF4G de outros eucariotos (Mader et al., 1995). Dois segmentos conservados nos homólogos EIF4G3-4 de L.major, assemelham-se ao motivo YX4LΦ. Estes são os motivos F/Y/MXXXXI/LR/L (aminoácidos 3-9 no LmEIF4G3 – FTVEQIR) e FSLXXV/IV/L (aminoácidos 23-29 no LmEIF4G3 – FSLDEVV), com a segunda seqüência mais conservada quando comparada ao peptídeo de ligação descrito. Um terceiro possível motivo de ligação ao eIF4E é encontrado apenas na região N-terminal dos homólogos do EIF4G4, FN/KL/PRGI/VV/T (aminoácidos 3-9 no LmEIF4G4 – FNLRGIV), porém assumindo que ambos homólogos EIF4G3-4 deveriam interagir com parceiros do eIF4E, usando seqüências similares, consideramos esta seqüência não comum mas potencialmente candidata a ser um motivo de ligação ao eIF4E. Outro aspecto importante, relativo à curta região N-terminal das proteínas EIF4G3-4, é que ela pode não abrigar a região de ligação à PABP, diferentemente do que tem sido mostrado para os homólogos do eIF4G de levedura e humano (Tarun et al., 1997; Imataka et al., 1998).

91 O alinhamento também destaca várias seqüências conservadas entre os homólogos

EIF4G3-4, posicionados dentro da região C-terminal destas proteínas (Figura 23). Análises de predição das estruturas secundárias sugerem que estas regiões são principalmente composta de α-hélices, em contraste como os outros homólogos ao eIF4G nos tripanossomatídeos. No eIF4G de mamíferos, o C-terminal das proteínas contém dois domínios HEATs compostos de α-hélices também envolvidas em interações proteína-proteína, MA3 e W2 (Bellsolell et al., 2006). Nenhuma homologia significativa, porém, foi observada entre o C-terminal do eIF4G humano e os homólogos EIF4G3-4, quando comparadas as seqüências de proteínas em análises utilizando a ferramenta BLAST. No entanto a presença de dois resíduos conservados de triptofano (W), na região C-terminal das proteínas de tripanossomatídeos, nos orientou a estudar algumas similaridades funcionais com o domínio W2 do eIF4G de mamíferos, considerando que ele também é caracterizado pela presença de dois resíduos de W (Bellsolell

et al., 2006). De fato estes resíduos de W, somados a aminoácidos vizinhos, assemelham-se as

duas caixas aromáticas acídicas conservadas previamente observadas no C-terminal no eIF4G de mamíferos e proteínas relacionadas (Bellsolell et al., 2006; Liberman et al., 2008). Adicionalmente, quando tentamos encontrar resíduos conservados presentes nos domínios MA3 e W2 depositados no banco de dados do pfam, dentro das regiões equivalentes das seqüências EIF4G3-4, várias coincidências com elementos conservados dentro destas proteínas foram observadas. Assim, no contexto geral parece que os domínios MA3 e W2, divergentes em seqüência devido à grande distância evolutiva entre tripanossomatídeos e eucariotos superiores, estão presentes nos homólogos EIF4G3 e 4 (Figura 23).

92 *******

↓ ↓↓ ⇓ ↓↓↓ ↓↓↓ ⇓ ↓↓↓ LmEIF4G3 1 M QFTVEQIRSV RNNYLEP-PY PGFSLDEVVR RRRLTQT--- ---KLVRGEN AWVAKG-TAQ TTEEWVQRLL HGTLNKLTEE

TbEIF4G3 1 MH VYTIDQILEL RSLYPEP-PY PGFSLEEACR RKKQTQT--- ---KLVRGPN AWAARG-SAK TTAEWVERLV YGSLNKLSAA

TcEIF4G3 1 MH VYSIQQILEV RSMYKDA-PY PGFSLEEACR RKKMTQT--- ---KLVRGAN AWVARG-SAK TTEEWVERLV QGSLNKLSTA

LmEIF4G4 1 MLFNLRGIVP QKEEKVKN-- QMTLADILAF RDTWTAI-PE PNFSLERVLL TARLEKQRKA EIPKLVTSEN GFRVRDKKDM DASELELRRV QGSLNKLTDK TbEIF4G4 1 MLFKPRGVTS NDPRYAGGSR LMSVSDLLAY RDTWRGRPPT ESFSLAQILR DARAADCKPV VTEKLVMSEN GFKVKSRDSI DSLERGVRAV QSALNKLTEW TcEIF4G4 1 MLFKPRGVTS NDPKYAGNSR IMTIPDLLAY RDTWKER-LS DDFSLGRILF AARAAKSKPA APEKLVMTSN GFKVKDRDAI APSERGVRMV QSTLNKLTES

MIF4G – HEAT DOMAIN

************************************************************************************************************* LmEIF4G3 74 NKDIMIDKLL TKELFATEDI MNMVVNIIFK KALDEPENSK LYAGVCHSLA LYEAKVLRDG HK--- --- GE-RPQSQLR DAIISTAQHE

TbEIF4G3 75 NFNEIVSQLQ TNTIFSSDEM LKKTVSIIFN KALGEPENSN VYAGLCYKLA EYEVSLNVVQ KQ--- --- KEGKRLSKLR NAVVGIAQTE

TcEIF4G3 75 NFDDMVAKLQ TEVIFSTKET LNIAVRIIFK KALDEPECSK SYAGVCYKLA EFEVGITAAK QK--- --- AEGKKYSKLR NAVVSIAQEE

LmEIF4G4 98 NFDAVVEEAL SPDLVLNPLV LKGAVDIIFN KAMAEPVFSG IYAQLCQRIK VYEQDLVAEA AENPTSELGQ LMAAVQAGDE DQKNVNGRVR NALVKRCQEF

TbEIF4G4 101 NFDVVVQTVL TPDIIINNEV VKDVVRLIYE KALMEPVFAG LYARMCFSIV RFEYEYRTKF LP--- --- GTCQVPSAVR VAIVEKCQQM TcEIF4G4 100 NFDLIAKAIL VPEIILNANV VADVVRLIYD KALVEPVFAG LYARLCYMIV RYEYDYRSTQ SG--- --- EVDAQKSEVR VAIVEKCQQM

MIF4G – HEAT DOMAIN

************************************************************************************************************* LmEIF4G3 155 FRTLSKELSK MEDKSEEELE YERSNVMRRK RSNMRFIGEL YLCTALTHST MFTVMDLTMR CS---DKTGF PSSENIELLA ALLNTIGDRL DKN---

TbEIF4G3 157 FQNR-RNVPS SEGLSEEEVE QQRSSFMRRK VANMRFIGEL FLHKVLSHST MMDIINIIMQ P----EKGGY PASEDLEFLT VLFTIVGKSL DSIA---

TcEIF4G3 157 FLSR-RKMPS MEGLTEEEME LRRTTFMRRK RANMKFIGEL FMHKVLSCNT MMNIIQTIMQ EA---ERGGY PTSEDIEFLT ELFLTIGESL DAVP---

LmEIF4G4 198 HDSFVKQP-- -PPRNAEAEE QLR----KRN MANIKFVGEL YMRSLISHRV ILAVCSTALV LGFIPSPKLV TTDADLEMMV SLMNVIGKRF DENAGMALNH

TbEIF4G4 183 FTNAVEESK- -QTMSEEQAE RLR----KRN VNNIKFAGEL FLKTLITQKI IDRILNERIY E---MV PNDMELEVII NLLEVVGKLY EEKN--- TcEIF4G4 182 FDGATKAVR- -ETASEEEAE KVR----KRN VNNIKFAGEL FLKSLITQKI IDRILGEKLF N---IT PNDMDLEVVV NLLEVVGKMY EEKH--- MIF4G – HEAT DOMAIN

******************************************************

LmEIF4G3 244 ---HKK TLDPYFTSLE NFNKKSDCPY PPRIRFKIMD LLDLR-KRGW GLKPKPV--- --- --- --- ---KA

TbEIF4G3 245 ---ELRP KLDAYFKVLE GLK-DQK-IY PPRICFKMLD LIELRRDRNW ESR--- --- --- --- ---ET

TcEIF4G3 246 ---ELRV RLNGYFELLE KLK-DQKEVY PPRIRFKMLD LIELRSKFNW ERR--- --- --- --- ---AT

LmEIF4G4 291 VPKDAAAAAH PHDTIWRALN SSM--NDPRF SRRIRFLIQN LLEWR-NDGW KPKESPAQGS SGGSADDSNN TTNNDRSNHR SSNNACNHSN TGGFSGPNEQ

TbEIF4G4 263 ---PD AQEQLWKMLS SMQ--ENRRY SMRIRFLLQN LIDRR-NGGW KPREPEQVVI EDIQSQQQPQ QQSQQQQQQQ --- ---QQ TcEIF4G4 262 ---PA AQPALWKLLG ELQ--EERRF SNRIRFLLQN LIERR-NGGW KPREPEQVIV EDPQ--- ----QQQQQQ --- ---QQ

LmEIF4G3 296 ALPPSHGKDK KYATAPPPKK GGRDQGSAAA A--- --- --SKSWRDAA TTKTGTAAAP APSADKGLNG RGTSSAAPAA NTAALSSSSA

TbEIF4G3 293 VMPKTSAATQ K----EPPRA SDRAVRSSTT P--- --- --NSSNASSS GSKKGKGAGP CDSALG---- -QRAAASTVG KDAREGLKSR

TcEIF4G3 295 AAPKTSSQTQ R----EPTRV TDKVVATRS- --- --- ---SMNASSS GSKKGRQDSV SDPAS--- -QQAAAAAAA KTAMGEAGGR

LmEIF4G4 388 MHRNTAPNNF GSGGSWQQQM QQQHSGGRGP IIGSSNAGGN RGGTRPPSMA DRGDEKYGRG GGPGGLRQGP VSSFNDLSQF PASNDHMMPP PPPFAAPPPP

TbEIF4G4 335 QQSQQQPQQQ QQQGQKHYSQ QQRHQQSFPH HNQPQSHGGY HQHPPPPPPP PRNSEYQHTP GMKRGGSYHE VSSSLGMGGR CSQSTNDLTR GGSYNNMPPP

TcEIF4G4 324 QQQQQQHQQQ RYHFHHHHHQ QQQHQQHHQQ HHQQQ--- --- QRNSDQLQTP IGKRAKSYQD VSNPYGVGAR RSTSHLDLPG YGAYAMPPPP

POSSIBLE MA3 DOMAIN

******************************************************************************** LmEIF4G3 374 --- ---STAA ATAPAGASFR DEASPQVPLV KFELRVASMF QEWVADRTND VILHWVDQFN TCDRFFESES ELCVAVAQEV IHSACTTTRK

TbEIF4G3 362 --- ---AWRD VVKSEIVACD DHEMTVTESV AFEERVRSLF QEWLSGYRTG CLPNWQEEFR DCGARPIPDM DLPTAVAAQV VREACMTTRK

TcEIF4G3 360 --- ---SWSN VVKSPQSPRD ATVARAVETV NFEARVRSLF QEWVAECSND FIPEWMNEFR HCQRHFDSED ALCKAAAEVV VREACMTTKK

LmEIF4G4 488 FPGEGIMPPS MAPQAASAPG PQMSDEDRKL MALSTPPKCV DADLSSRILS CIRDAHTDGD WAAAGKAIVE A---VPQDAA HMCRMCAVFV IAKKVTETSS

TbEIF4G4 434 --- ----AHGFSD SRLAPEERKR LNFARPPAQL LEEFKKNILF IVRDAAEEGM ADPEGMKVQL N-ALVPQDSN APISEVSVYV TLIRALMDAN

TcEIF4G4 409 PP---P PPTLQYAGVE EQLSVDERKL IVLARPPETL TEEVRRNIFR IARDAVEDGL PNRDWITNDL SRVLGPNESS SQSLMTSVYV ILLRALMDPK

▲ ▲ ▲ ▲▲ ▲ ▲

POSSIBLE MA3 DOMAIN POSSIBLE W2 DOMAIN

********************************************** ***************************************************** ⇓ ⇓ ⇓ LmEIF4G3 459 DAQREAFSFL VVGLYMIDTE VFDGFASALA SAIEDGLLED VPKFGERFMS MLRLTSTEQ- -ETRADVYFD AANVLRLTYN RLESPDDSAV DTLMSFWDRV

TbEIF4G3 447 DAQCEASRLM VIGLFLEDDQ VFNGFAAALS SAIEEGILED VPKFSERFAN MLRFTSGD-- -DVKTDVYYD AVRVLCTAYG MLRDPDEMSL STLMEFWGKI

TcEIF4G3 445 EAQREASSFL IVGLFLEDDE VLDGFAMALV SAIEEGILED VPKFSERFIN MLRITSGE-- -NTVADVYYD TARVLCTAYG LMREPDEMVL DTMMEFWEKI

LmEIF4G4 585 EADRELFMNS LNSGMFDIKE LTRGYSWCLT SAVAYNVKED FPKVYSRFVA CVTATKSMDF LSMVSNVMAR TANYLDALYV PLEGAQMEWE EDFLEVWTSV TbEIF4G4 520 ESERKLLLSV LQKGSFENHI LTRGFSWALA KIISDRDCDD CPRIYARFAE AVWSIPSFNF RCVTKDIVSR TAIHLGALSV EYE-SEGEWE EDFIAVWENI TcEIF4G4 502 ESERTLFCTA LESGNWERSI LGRGFAWCLT KIIAERDVAD CPRIYSRFVD VVTRVTELNF LCVTKDIIAR TARYLDVLQV VYD-ETEEWE EDFIHVWDKL ▲ ▲ ▲ ▲▲ ▲ ▲ ▲ ▲ ▲ ▲ ▲▲

POSSIBLE W2 DOMAIN

************************************************************************

LmEIF4G3 557 PLP-STDEEN MIRMDLDVVY SLCNPEGVQD GLEKLLSRII HSMLQMQLMD AEVLDEFLCL DVEDGLCAKV IADYKERFPK 635

TbEIF4G3 544 PPP-EKKED- -AIFSLPVVQ SLVTMTKL-- GRAQITGHII SSLHANGLVD DATLHEWLGT PGGE-VDAEV KDAFRKATVG KGTLT 622

TcEIF4G3 542 PRP-ATDEN- -AVLPLQVVQ SLVEMSTR-- GQAPLTGRII ASLHSIGLVH DETVREWLAT PHEE-TSAEV VEAFKKANK 614 LmEIF4G4 685 LGKWREAHPG D-KSTGSDIL NCIASIKQRP FMKDIVSDFM MELSQQGYLD DAETKTWIRE NRTNEKYKVF VDQMEQMYPD TA 765

TbEIF4G4 619 VTASETGRQG ESKPSVADMM ESIAPSCTVP FMCNVLPDFV AVMVQARFFT EEELGAWRNK NKDNSKVFSL LEELSVIYA 697

TcEIF4G4 601 LVA----RQA PNKVTAAESM ESMSFTRLGS FLRGILPDFV ASMVQAGFFT EDELRQWRQE NESNPKFRAI TEELAQLYP 675 ▲ ▲▲ ▲

Figura 23. Alinhamento múltiplo, por Clustal W, comparando as seqüências dos homólogos LmEIF4G3 e LmEIF4G4 com seus ortólogos em T. brucei e T.cruzi. Notar a presença dos motivos

M/F/YXXXXI/LL e FSLXXXX na porção N-terminal (setas simples), que poderiam constitui um putativo motivo de ligação à subunidade eIF4E. A região de conservação indicada pelos asteriscos é referente ao domínio conservado MIF4G, comum aos cinco homólogos identificados, e de duas regiões candidatas aos domínios MA3 e W2 identificadas apenas nos EIF4G3-4 nos Tritryps.

93

5.1.5. Estudo da interação entre mutantes LmEIF4G3-4 com homólogos das