Este capítulo foi baseado no artigo a ser submetido para publicação (Anexo 4):
Bittencourt, D., Dittmar, K., Lewis, R.V., Rech, E.L. How old are ampolada principal silks?
Introdução
As aranhas (Araneae) consistem de duas linhagens principais, a saber, a Mesothelae, e a Opisthothelae, que contém a Mygalomorphae, (caranguejeiras e semelhantes), e a Araneomorphae (aranhas verdadeiras). Recente prova filogenética mostra nitidamente a relação de monofilia e de grupo-irmão das infraordens migalomorfas e araneomorfas (Coddington et al., 2004; Hedin e Bond, 2006, Ayoub et
al., 2007). Os cálculos da divergência de tempo estimam suas respectivas origens de 392
até 340 milhões de anos atrás (Ayoub et al., 2007).
Todas as aranhas produzem seda, mas usam grupos de proteínas da seda de tarefas específicas para tecer as teias, construir casulos ou dispersar (Garb e Hayashi, 2005). Acredita-se que a síntese de diferentes proteínas das sedas esteja intimamente ligada a diferenciação morfológica das glândulas sericígenas; motivo pelo qual as sedas são normalmente classificadas de acordo com sua glândula de origem (Vollrath, 1992, Challis et al., 2006). As migalomorfas possuem apenas um ou dois tipos de glândulas, elas não constroem teias orbiculares, e acredita-se que teçam apenas um tipo de seda "ancestral" (Vollrath, 1992). Por outro lado, as aranhas de fiação orbicular (Araneomorphae: Orbiculária) podem ter até sete glândulas morfologicamente distintas que, conseqüentemente, sintetizam tipos diferentes de seda. Por exemplo, considera-se que três tipos de glândulas sejam responsáveis pela produção de fibras usadas na teia orbicular para a captura de presas: as glândulas ampoladas principais (espidroínas da ampolada principal 1 e 2 - MaSp), as glândulas ampoladas secundárias (espidroínas da ampolada secundária 1 e 2 - MiSp) e as glândulas flageliformes (espidroínas das flageliformes - Flag) (Gatesy et al., 2001). Embora as proteínas análogas de seda MaSp1 sejam conhecidas a partir de aranhas não orbiculárias (Tai et al., 2004, Tian et al., 2004), a presença de MaSp, MiSP e Flag na base da divergência Deinopidae (tecedoras orbiculares com cribelo)- Araneidae (tecedoras orbiculares sem cribelo) seja interpretada como apoio pela origem única das aranhas orbiculares (Garb et al., 2006).
Porém, a maioria dos estudos com referência às características moleculares das sedas de aranhas é baseada na Orbiculariae (Aranaeomorphae), apenas algumas seqüências são conhecidas das espidroínas de migalomorfas (Gatesy et al., 2001, Tai et
al., 2004). Aqui relatamos as seqüências de cDNA de dois genes de seda de uma aranha
migalomorfa (Avicularia juruensis) encontrada na região da Amazônia, Brasil. Embora um gene seja típico de outras espidroínas isoladas de migalomorfas (por exemplo,
Euagrus chisoseus), o outro, curiosamente, mostra uma clara relação entre as sedas da
ampolada principal.
Resultados
Biblioteca de cDNA
Apesar da presença de apenas uma ou duas glândulas sericígena na A. juruensis, interessantemente, foi possível agrupar os trinta e quatro clones positivos, entre os 1.248 clones analisados na biblioteca de cDNA, em dois grupos distintos. O transcrito mais abundante foi chamado de Espidroína 1 (3.154 pb), e o segundo cDNA de espidroína foi denominado Espidroína 2 (1.874 pb) (Anexo 2). Todos os clones de cDNA seqüenciados foram parciais na direção 5’ e como as outras espidroínas suas traduções caracterizou unidades repetidas de aminoácidos seguidas por uma região C-terminal não repetitiva. Foram descobertas três transcrições supostamente parálogas para o gene da Espidroína 1 (Espidroína 1A - 2 clones, 1B - 9 clones e 1C - 17 clones). Outros cinco clones contendo apenas a seqüência repetitiva da Espidroína 1 também foram identificados. O maior número de clones representando a Espidroína 1 em comparação com o gene da
Espidroína 2 (somente um clone), sugere que esse gene seja mais expresso.
A fim de confirmar a expressão de ambas as espidroínas na glândula sericígena da
A. juruensis, a RT-PCR foi realizada usando-se iniciadores flanqueando a região C-
terminal das transcrições da Espidroína 1 (219 pb) e da Espidroína 2 (356 pb) (Figura
1). Todos os cDNAs analisados foram positivos devido a sua presença na(s) glândula(s)
sericígena(s) (Figura 1), eliminando a possibilidade de contaminação de transcritos ou recombinação de clone.
1Kb
Ladder1
2
3
1 kb 500 pb 400 pb 350 pb 300 pbFigura 1: RT-PCR com RNA total da(s) glândula(s) sericígena(s) de A. juruensis. 1,
Espidroína 1 cDNA (219 pb); 2, Espidroína 2 cDNA (356 pb); 3, controle negativo. 1Kb DNA ladder (Invitrogen).
Análise das seqüências
Entre todos os transcritos analisados foi possível identificar traduções para duas proteínas distintas (Figura 2). A seqüência de aminoácidos da Espidroína 1 apresentou uma seqüência longa repetitiva (183 pb através da tradução do trancrito 1C) rica em serina e alanina, com uma cadeia de treoninas. Entretanto, a Espidroína 2 apresentou uma seqüência altamente repetitiva com os motivos (GlyAla)n e (GlySer)n. Ambas proteínas também possuíam uma região C-terminal não repetitiva altamente conservada em comparação com espidroínas descritas previamente (Figuras 3 e 4).
Espidroína 1
YSLASSIASAASSSASSAAAAASSSSAAAGAAAASEAAASAAATSTTTTTSTSRAAAAASAAAAASASGAAG AAGAASAASAASASSSLQQSLGSALAQSSSFAAAFAQASSAASAAAIAYALAQTVANQIGFSSYSSAFARAA SSAVYSIGGLASASAYAFAFASAFSQVLSNYGLLNINNA
Espidroína 2
GAG(A/S)GSGSGSGS
Figura 2: Região repetitiva das Espidroínas 1 e 2 expressas pela A. juruensis. Os motivos
de aminoácidos encontrados nas espidroínas estão representados como: verde-An, vermelho-GA e azul-GS. 1A GLLPPLFVLPSNSATERISSMVSSLLSAVSSNGLDASSFGDTIASLVSQISVNNSDLSSS 60 1B GLLPPLSILPSDSANERISSVVSSLLAAVSSNGLDASSLGDNLASLVSQISANNADLSSS 60 1C NLLPPLSVLPSDSANERISSVVSSLLSAISSNGLDASSLGGTIASLVSQISVSNAKLSSS 60 .***** :***:**.*****:*****:*:*********:*..:********..*:.**** 1A QVLLEALLEILSGMVQILSYAEVGTVNTKTVSSTSAAVAQAISSAFSGNQNS 112
1B QVMVEALLEVLSGIVQILSYAEVGAVNTETVSSTSSAVAQAISSAVLG---- 108
1C QVFLEALLEVLSGMVQILSYAEVGAVNTDTVISTSSAVAQAISSAVSG---- 108
**::*****:***:**********:***.** ***:*********. *
Figura 3: Alinhamento da região C-termninal das três traduções supostamente parálogas
para o gene da Espidroína 1 (1A, 1B e 1C) de A. juruensis. Aminoácidos estão abreviados com uma letra. “-”, indica “gaps” nas seqüências opara um melhor alinhamento; “*”, indica que o aminoácido presente naquela coluna é idêntico em todas as seqüências; “:”, indica que uma substituição conservada ocorreu de acordo com as corres (vermelho-aa pequeno, azul - aa ácido, rosa - aa básico, verde- hidroxila+amino+básico-Q); e “.”, indica que substituições semi-concervativas ocorreram.
Espidroína2 A.jur ARLSSPQASSRVSSAFFSLVSSGPTSPGALSNAISSVVSQVSASNPGLSGCDVLVQALLE 60
MaSp2a D.spi SRMSTPGSGSRISNAVSNILSSGVSSSSGLSNAISNISSSISASNPGLSGCDVLVQVLLE 60
MaSp2 A.amo SRLSSPQASSRVSSAVSSLVSSGPTNPAALSNAMSSVVSQVSASNPGLSGCDVLVQALLE 60
MaSp2 A.tri SRLSSPQASSRVSSAVSTLVSSGPTNPASLSNAISSVVSQVSSSNPGLSGCDVLVQALLE 60
MaSp2 A.aur SRLSSPQASSRVSSAVSTLVSSGPTNPAALSNAISSVVSQVSASNPGLSGCDVLVQALLE 60
MaSp2 A.bic SRLSSSAASSRVSSAVSSLVSSGPTTPAALSNTISSAVSQISASNPGLSGCDVLVQALLE 60
MaSp2 L.hes SALSSPTTHARISSHASTLLSSGPTNAAALSNVISNAVSQVSASNPGSSSCDVLVQALLE 60
MaSp2 L.geo SALSSPTTHARISSHASTLLSSGPTNSAAISNVISNAVSQVSASNPGSSSCDVLVQALLE 60
MaSp2 N.cla SRLASPDSGARVASAVSNLVSSGPTSSAALSSVISNAVSQIGASNPGLSGCDVLIQALLE 60
MaSp2 N.mad SRLASPDSGARVASAVSNLVSSGPTSSAALSSVISNAVSQIGASNPGLSGCDVLIQALLE 60
MaSp2 N.sen SRLASPDSGARVASAVSNLVSSGPTSSAALSSVIXNAVSQIGASNPGLSGCDVLIXALLE 60
MaSp2 G.mam SRLSSPQAGARVSSAVSALVASGPTSPAAVSSAISNVASQISASNPGLSGCDVLVQALLE 60
MaSp2 U.div SRLNSPASTSRVASAVSSLASAGAPSVGSLSSVISSLSSSVSASNPGLSGCELLTQVLLE 60
MaSp2 A.ven NRLSSSGAANRVSSNVAAIASGG---AAALPNVMSNIYSGVLGS--GVSSSEALIQALLE 55
ADF-3 A.dia SRLSSPAASSRVSSAVSSLVSSGPTKHAALSNTISSVVSQVSASNPGLSGCDVLVQALLE 60
ADF-4 A.dia SVYLRLQPRLEVSSAVSSLVSSGPTNGAAVSGALNSLVSQISASNPGLSGCDALVQALLE 60
. .::. : :.* ..:...: . * : .* * *..: * .***
Espidroína2 A.jur IVS---QYASLVGQ-SVNQALRY 79
MaSp2a D.spi VISALVHILGSASVGQVG--SSPQNAQMVAANAVANAFS- 97
MaSp2 A.amo IVSALVHILGSSSIGQINYAASSQYAQMVGQ-SVAQALA- 98
MaSp2 A.tri IVSALVHILGSSSIGQINYAASSQYAQLVGQ-SLTQALG- 98
MaSp2 A.aur LVSALVHILGSSSIGQINYAAS--- 82
MaSp2 A.bic VVSALVHILGSSSVGQINYGASAQYAQMV--- 89
MaSp2 L.hes IITALISILDSSSVGQVNYGSSGQYAQIVGQ-SMQQAMG- 98
MaSp2 L.geo LITALISIVDSSNIGQVNYGSSGQYAQMVG--- 90
MaSp2 N.cla IVSACVTILSSSSIGQVNYGAASQFAQVVGQ-SVLSAF-- 97
MaSp2 N.mad IVSACVTILSSSSIGQVNYGAA--- 82
MaSp2 N.sen IVSACVTILSSSSIGQVNYGAA--- 82
MaSp2 G.mam IVSALVSILSSASIGQINYGASGQYAAMI--- 89
MaSp2 U.div VVSALVALLGSARVGPVDVSSSQQYAGLVSS-AIAQAL-- 97
MaSp2 A.ven VISALMHVLGSASIGNVSSAGLDSTLNVVQN-AVSQYAG- 93
ADF-3 A.dia VVSALVSILGSSSIGQINYGASAQYTQMVGQ-SVAQALA- 98
ADF-4 A.dia LVSALVAILSSASIGQVNVSSVSQSTQMISQ-ALS--- 94
: : :
Figura 4: Alinhamento da região C-terminal da Espidroína 2 de A. juruensis com
proteínas MaSp2 de diferentes espécies de aranhas. Abreviações são as mesmas descritas para o alinhamento da figura 2. Abreviações das espécies de aranhas e número de acesso no GenBank (de cima para baixo): A.jur, Avicularia juruensis; D.spi, Deinopis spinosa (ABD61593); A.amo, Argiope amoena (AAR13813); A.tri, Argiope trifasciata (AAK30596); A.aur, Argiope aurantia (AAK30592); A.bic, Araneus bicentenarius (AAC04503); L.hes, Latrodectus hesperus (AAY28936); L.geo, Latrodectus geometricus (AAK30603); N.cla, Nephila clavipes (AAT75315); N.mad, Nephila inaurata
madagascariensis (AAZ15322); N.sen, Nephila senegalensis (AAK30609); G.mam, Gasteracantha mammosa (AAK30601); U.div, Uloborus diversus (ABD61599); A.ven, Araneus ventricosus (AAN85281); A.dia, A. diadematus (AAC47010 e AAC47011).
Freqüência de codons
A Espidroína 2 da A. juruensis mostrou uma preferência por A (adenina) ou T (timina) como a terceira base de três para codificar os aminoácidos mais prevalecentes em sua seqüência de proteínas (Tabela 1). A preferência de codons para glicina foi GGA/T em 82% dos casos, para serina a preferência para A e T foi de 91%, e os codons de alanina também usaram A ou T na posição de oscilação em 86% dos casos. Por outro lado, semelhante à seqüência das espidroínas da glândula tubuliforme, os codons da
Espidroína 1 para os aminoácidos alanina e serina são apenas moderadamente
tendenciosos para A e T, com valores de 67 % e 56 %, respectivamente.
Tabela 2
Escolha de codons para os aminoácidos mais freqüentes nas espidroínas de A. juruensis
Freqüencia (%) Freqüencia (%) AmAc Codon Espidroína 1 Espidroína 2 AmAc Codon Espidroína 1 Espidroína 2 Ala GCG 10 06 Gly GGC 10 14
Ala GCA 45 61 Ser AGT 06 34
Ala GCT 22 25 Ser AGC 12 03
Ala GCC 23 07 Ser TCG 13 02
Gly GGG 13 04 Ser TCA 18 41
Gly GGA 33 39 Ser TCT 32 16
Gly GGT 44 43 Ser TCC 19 03
Discussão
As aranhas da espécie A. juruensis possuem apenas uma ou duas glândula sericígena indiferenciadas, entretando foram identificadas duas espidroínas diferentes, Espidroínas 1 e 2. Embora não seja comum, diferentes proteínas de seda produzidas pela mesma glândula foram também encontradas nas aranhas orbiculáreas com glândulas especializadas. Por exemplo, a MaSp1 foi identificada como sendo produzida pelas glândulas tubuliformes das aranhas Aranues diadematus e Latrodectus hesperus (Guerette et al., 1996; Garb e Hayashi, 2005). Foi igualmente demonstrado que duas
proteínas podem estar presentes na mesma seda, como a MaSp1 e a MaSp2 na seda ampolada principal (Xu e Lewis, 1990), sugerindo que a combinação de proteínas deve possuir aplicações funcionais com relação às qualidades mecânicas da seda. Entretanto, não se sabe até que ponto as espidroínas produzidas por A. juruensis são ou não usadas simultaneamente na produção de suas fibras.
A maioria das proteínas da seda de aranhas é conhecida como sendo composta de combinações de quatro motivos simples de aminoácidos (poli-Ala, (GlyAla)n, GlyGlyX (onde X representa um pequeno subconjunto de aminoácidos), e GlyProGlyX(X)n. Entretanto, esses três motivos são deficientemente representados nas espidroínas encontradas na biblioteca de cDNA da glândula sericígena de A. juruensis.
As traduções dos três transcritos encontrados para Espidroína 1 mostraram alta similaridade entre as suas repetições e as regiões C-terminais com poucas substituições e deleções de aminoácidos, com identidades de até 85% em ambos os casos. A proteína da seda Fibroína 1 de Euagrus chisoseus, também uma aranha migalomorfa, possui unidades repetitivas de ~180 aminoácidos de comprimento, e semelhantemente a Espidroína 1, é composta por uma seqüência rica em serina e alanina, inclusive com uma cadeia de treoninas (Gatesy et al., 2001). Embora as regiões ricas em alanina sejam encontradas em diferentes sedas de aranhas, a treonina é um aminoácido raro nas espidroínas de Araneidae (tecedoras de teia orbicular). Análises utilizando o programa BLASTX (Altschul, 1997) mostraram que a seqüência repetitiva da Espidroína 1 também é similar a cylindrical silk protein 1 (BAE54450) da aranha Nephila clavata.
A Espidroína 2 mostrou um padrão completamente novo em sua seqüência de aminoácidos se comparada com outras proteínas de seda descritas de aranhas migalomorfas. Embora tenhamos encontrado o motivo (GlyAla)n na composição repetitiva de aminoácidos da Espidroína 2, um motivo importante na composição das espidroínas de aranhas tecedoras de teia orbicular, também achamos em uma grande quantidade de motivo (GlySer)n, até o momento um motivo descrito apenas nas espidroínas das aranhas de tecedoras de teia não orbicular Kukulcania hibernalis e
Agelenopsis aperta (Tian et al., 2004). Outra característica interessante é que a região C-
terminal da Espidroína 2 é bem parecida com aquela das aranhas Araneomorphae, a MaSp2. O alinhamento entre as seqüências de aminoácidos da região C-terminal da
Espidroína 2 da A. juruensis com a MaSps 2 de diferentes aranhas mostrou valores de identidade de 86% para a Argiope amoena e 83% para a Argiope trifasciata. Tai et al. (2004) também descobriram uma alta similaridade entre as regiões C-terminal de um gene análogo da MaSp1 da aranha migalomorfa Macrothele holsti com a MaSp1 de aranhas de tecedoras de teia orbicular. As aranhas migalomorfas são conhecidas por possuir apenas uma glândula sericígena não diferenciada e suas fiandeiras pouco desenvolvidas (Foelix, 1996), sugerindo que a região C-terminal das principais espidroínas foi conservada desde antes da separação filogenética das aranhas araneomorfas e migalomorfas há aproximadamente 340-390 milhões de anos (Ayoub et
al., 2007). Uma razão para a conservação da região C-terminal durante evolução entre as
espidroínas de diferentes aranhas poderia estar relacionada com uma função importante. Sugere-se que a função da região C-terminal poderia evitar a prematura formação de fibras enquanto a proteína ainda estivesse na glândula, ou estar relacionada com o enovelamento das proteínas, uma vez que essa região ainda encontra-se presente na fibra polimerizada (Beckwitt e Arcidiacono, 1994; Sponner, 2004).
A falta dos motivos poli-Ala, (GlyAla)n, GlyGlyX e GlyProGlyXX encontrada na maioria das proteína de aranhas tecedores de teia orbicular nas espidroínas da A.
juruensis, uma aranha rudimentar que não constrói teias orbiculares, apóia a correlação
entre as seqüências primárias de proteínas, estrutura secundária e propriedades mecânicas onde as repetições habituais ricas em motivos de alanina e/ou glicina pode ser fundamental para sedas envolvidas na captura de presas (Hayashi et al., 1999). Embora a Espidroína 1 apresente o motivo poli-Ala e a Espidroína 2 (GlyAla)n em suas seqüências de aminoácidos, a presença de apenas um desses motivos não deve ser suficiente para produzir uma teia para a captura de presas, uma vez que a combinação de diferentes sedas compostas por proteínas com motivos variáveis é necessária para a produção de uma teia orbicular (Vollrath, 1994).