RELATIVIDADE RESTRITA E ESPAÇO-TEMPO PLANO

(1)

Cap´ıtulo 1

RELATIVIDADE RESTRITA E

ESPAC

¸ O-TEMPO PLANO

1.1 Coordenadas e Observadores Inerciais

O maior obstáculo à compreensão da Teoria da Relatividade (Restrita e Geral) é a dificuldade de identificar de imediato os pressupostos subjacentes à natureza do espa¸co e do tempo na teoria newtoniana, antes mesmo de construir o continuum 4-dimensional onde a teoria de Einstein é naturalmente descrita, como mostrou Herman Minkowski em 1908:

“Daqui em diante o espa¸co só por si e o tempo só por si estão condenados a tornarem-se meras sombras, e só uma união dos dois preservará uma realidade independente”.

Tanto na f´ısica newtoniana como na relatividade restrita, os observadores (ou refe-renciais) inerciais constituem uma classe privilegiada. Porém, enquanto na f´ısica de Galileu e Newton os referenciais inerciais são considerados equivalentes para a descri¸cão das leis da Mecânica, na relatividade restrita (RR) estes referenciais são equivalentes para descrever todas as leis f´ısicas. Para isso foi necessário generalizar a lei e esten-der o grupo de transforma¸cões entre as coordenadas de dois observadores inerciais de modo a deixar as equa¸cões de Maxwell invariantes, e com isso a própria estrutura do espa¸co e do tempo foi reformulada culminando na constru¸cão de um continuum 4-dimensional, o espa¸co-tempo, caracterizado por uma métrica pseudo-euclidiana, que automaticamente traduz os dois postulados da RR de Einstein.

Embora, na f´ısica newtoniana, falemos habitualmente do espa¸co e do tempo separa-damente e, s´o na relatividade restrita, falamos de espa¸co-tempo, em ambas as teorias

(2)

podemos falar de um espa¸co-tempo cont´ınuo, composto de acontecimentos (f´ısicos): sendo cada acontecimento definido por quatro coordenadas: (t, ~r) ≡ (t, x, y, z). Mas é claro, aquilo que é natural na RR, é algo artificial na Mecânica Newtoniana.

Todos os acontecimentos, pelo menos numa vizinhan¸ca de um dado acontecimento (ori-gem), podem ser unicamente caracterizados por 4 números reais (as suas coordenadas): dizemos que o espa¸co-tempo é uma variedade (diferenciável) 4-D, M4_.

O mundo f´ısico da nossa experiência, é agora representado por um espa¸co a quatro di-mensões, o espa¸co-tempo. Cada ponto do espa¸co-tempo é um acontecimento f´ısico, representado por quatro coordenadas (t, x, y, z): t representa o instante e (x, y, z) dá-nos a localiza¸cão do acontecimento. Diferentes observadores (inerciais) usam coorde-nadas diferentes para o mesmo acontecimento. O conjunto de todos os acontecimentos da vida de um observador (ou de uma part´ıcula) formam uma trajectória do espa¸co-tempo a que se dá o nome de linha do Universo. Para os observadores inerciais as linhas do Universo são geodésicas (neste caso, por se tratar de um espa¸co-tempo plano, linhas rectas) deste espa¸co-tempo. Se dois observadores se cruzam e tomam esse acontecimento como a origem das respectivas coordenadas de espa¸co e de tempo, a invariância da velocidade da luz no vácuo exige que

x2+ y2+ z2− c2t2 = x02+ y02+ z02− c2t02

onde (t, x, y, z) e (t0_{, x}0_{, y}0_{, z}0_{) s˜ao as coordenadas dum mesmo acontecimento para cada}

um dos observadores. `

A semelhan¸ca do que acontece com a geometria euclidiana, onde a generaliza¸c˜ao do teorema de Pit´agoras nos diz que

∆r2 = ∆x2+ ∆y2+ ∆z2

é um comprimento invariante numa rota¸cão, também a geometria do espa¸co-tempo da relatividade restrita pode ser caracterizada pelo invariante fundamental,

∆s2 _{= −c}2_∆t2_{+ ∆x}2 _{+ ∆y}2_{+ ∆z}2_, _(1.1)

que traduz a invariância da velocidade da luz no vácuo, e também é habitualmente interpretado como uma “distância”entre dois pontos (acontecimentos) deste espa¸co-tempo a quatro dimensões e, por isso, designado intervalo do Universo. Porém, devido à existência de três sinais positivos e um negativo (na linguagem matemática diz-se que se trata de uma forma quadrática indefinida) esta “distância”nem sempre é positiva como na geometria euclidiana.

Dados dois acontecimentos cuja separa¸cão espacial é ∆r e cuja separa¸cão temporal é ∆t, três situa¸cões diferentes podem ocorrer

a) ∆r2_−c2_∆t2 _{= 0, a distˆancia entre os dois acontecimentos ´e exactamente percorrida}

pela luz no intervalo de tempo que os separa. Diz-se que os dois acontecimentos formam um par tipo-luz.

(3)

b) ∆r2 _{− c}2_∆t2 _{< 0, a distˆancia entre os dois acontecimentos ´e menor que o espa¸co}

percorrido pela luz no intervalo de tempo que os separa. Diz-se ent˜ao que os dois acontecimentos formam um par tipo-tempo.

c) ∆r2 _{− c}2_∆t2 _{> 0, no intervalo de tempo que separa os dois acontecimentos a luz}

n˜ao pode percorrer a distˆancia que os separa. Diz-se neste caso que os dois acontecimentos formam um par tipo-espa¸co.

Todos os pares de acontecimentos que estão numa rela¸cão de causa-efeito pertencem às categorias a) ou b). Nenhuma informa¸cão pode ser transmitida com velocidade maior do que a da luz. Logo, dois acontecimentos que perten¸cam à categoria c) não podem estar causalmente relacionados. Como as part´ıculas materiais viajam com uma velocidade inferior à da luz em todos os referenciais inerciais, dois quaisquer aconteci-mentos da vida de uma part´ıcula material formam um par tipo-tempo para todos os observadores inerciais, isto é, a sua separa¸cão temporal é maior do que a sua separa¸cão espacial.

Como consequência deste último facto, vemos imediatamente que dados dois aconte-cimentos que formam um par do tipo tempo, eles pertencem necessariamente à vida de uma dada part´ıcula material, e ocorrem no mesmo ponto do espa¸co no referencial próprio dessa part´ıcula, isto é, no referencial onde a part´ıcula está em repouso. Por-tanto, dados dois acontecimentos que formam um par de tipo tempo, existe sempre um referencial onde eles ocorrem no mesmo ponto do espa¸co.

Por outro lado, dados dois acontecimentos que formam um par do tipo espa¸co, existe sempre um referencial onde são simultâneos, bastando para isso provar que eles se localizam necessariamente sobre um eixo espacial de um dado referencial inercial. Antes da teoria da RR, admitia-se que o espa¸co-tempo tinha a seguinte estrutura adicional: dado um acontecimento p do espa¸co-tempo, devia existir uma no¸cão natural, independente-do-observador, de “acontecimentos que ocorrem no mesmo instante que p”(no¸cão de simultaneidade com p). Mais precisamente, dados dois acontecimentos p e q, devia-se verificar uma das três possibilidades mutuamente exclusivas:

[1] ´E poss´ıvel, em princ´ıpio, para um observador ou part´ıcula material, ir de um acontecimento q para outro acontecimento p: q 7→ p (diz-se, neste caso, que q pertence ao passado de p).

[2] ´E poss´ıvel, em princ´ıpio, para um observador ou part´ıcula material, ir de um acontecimento p para outro acontecimento q: p 7→ q (diz-se que q pertence ao futuro de p)

[3] É imposs´ıvel, em princ´ıpio, a um observador ou part´ıcula material, estar pre-sente em ambos os acontecimentos p e q (diz-se que p e q são acontecimentos simultâneos).

(4)

Na f´ısica Newtoniana supõe-se que os acontecimentos que se encontram na terceira categoria formam um só conjunto 3-D e definem a no¸cão de simultaneidade com p, enquanto que em RR existem infinitos conjuntos 3-D de acontecimentos simultâneos, nomeadamente quaisquer dois observadores inerciais distintos têm diferentes conjuntos de acontecimentos simultâneos com o acontecimento p. Em concreto, na teoria da RR também se verifica uma classifica¸cão das rela¸cões causais entre os acontecimentos, mas com a seguinte modifica¸cão: devemos substituir (3) por

[3’] Os acontecimentos simultˆaneos com p formam mais do que um conjunto 3-D. Estes acontecimentos ainda se subdividem em:

[i] Acontecimentos que est˜ao na fronteira do conjunto de pontos que formam o futuro de p. Estes acontecimentos n˜ao podem ser atingidos por uma part´ıcula material que parta de p mas podem ser atingidos por sinais luminosos emitidos em p e formam o cone de luz do futuro de p (espa¸co 3-D).

[ii] Acontecimentos que formam o cone de luz do passado de p (espa¸co 3-D) definido de modo semelhante.

[iii] Acontecimentos que n˜ao est˜ao no futuro nem no passado de p e que se dizem espacialmente relacionados com p (os quais formam um conjunto 4-D).

O ponto essencial a destacar é o da ausência de uma no¸cão de simultaneidade absoluta em RR; não existem superf´ıcies 3-D espaciais absolutas no espa¸co-tempo, ao contrário do que acontece na f´ısica pré-relativista, onde os acontecimentos simultâneos com um dado acontecimento p formam uma superf´ıcie 3-D (única) no espa¸co-tempo. Ainda é poss´ıvel a um observador em RR definir acontecimentos simultâneos com um dado acontecimento p–definindo assim uma superf´ıcie 3-D no espa¸co-tempo–mas essa no¸cão depende do seu estado de movimento.

1.1.1 Postulados da Relatividade Restrita

Em 1905 A. Einstein constrói a teoria da RR partindo dos seguintes postulados: Postulado 1 Os observadores inerciais são equivalentes para a formula¸cão de todas as leis f´ısicas.

Postulado 2 A luz propaga-se no v´acuo com uma velocidade finita c, a mesma para todos os observadores inerciais, independentemente da velocidade relativa entre a fonte e o observador. (Princ´ıpio da Invariˆancia da velocidade da luz).

(5)

O primeiro postulado (P1), conhecido por Princ´ıpio da Relatividade de Einstein, assume a equivalência dos referenciais de inércia (RI). E o segundo postulado (P2), afirma a invariância da velocidade da luz no vácuo.

Importa esclarecer alguns pontos. Um referencial inercial é um sistema de referência onde as part´ıculas livres se movem com velocidade uniforme segundo linhas rectas no espa¸co (e no espa¸co-tempo). Por observador inercial entendemos um observador em repouso num referencial inercial, conhecido por referencial próprio, equipado com os respectivos instrumentos de medida (relógios e réguas).

Note que, de acordo com o Princ´ıpio da Relatividade de Galileu, os observadores iner-ciais também são equivalentes, mas só para as experiências da mecânica de Galileu-Newton.

1.1.2 O efeito de Doppler e a dilata¸c˜

ao do tempo

Vamos come¸car por examinar o efeito do movimento relativo sobre a taxa de progressão do tempo medido por dois observadores inerciais distintos. Consideremos então dois observadores inerciais, sejam eles Duarte e Mariana, em movimento relativo com ve-locidade v. Vejamos como podem estes observadores medir a sua distância relativa num dado instante do tempo próprio de um deles, isto é, o tempo medido no refe-rencial onde o observador está parado. Comecemos por admitir que os observadores se cruzaram num instante anterior e, nesse instante, acertaram os seus relógios. Para medir distâncias e comparar os tempos dos seus relógios, Duarte e Mariana podem trocar sinais “luminosos”que, de acordo com o segundo postulado, se deslocam com velocidade c em rela¸cão a qualquer deles.

O Duarte poderá medir a que distância se encontra a Mariana, num dado instante do seu tempo próprio, se enviar um sinal luminoso no instante tA, que será entretanto

reflectido pela Mariana e chega de novo ao Duarte no instante posterior tB > tA. Dir´a

então que a Mariana estava à distância d = (tB− tA)/2 segundos-luz (se assumirmos

c = 1, e medirmos o espa¸co e o tempo em segundos-luz) no momento em que o sinal luminoso foi reflectido pela Mariana. O instante correspondente a esse acontecimento, tC, também facilmente se calcula, no referencial próprio do Duarte, em fun¸cão de tA e

tB,

tC =

1

2(tA+ tB).

Mas ´e claro que a um intervalo de tempo T , no referencial do Duarte, corresponde um intervalo maior T0 _{= KT, k > 1 no referencial da Mariana. Se n˜ao vejamos isso com}

o aux´ılio do seguinte exemplo (ver Fig(1.1)). Suponhamos que a Mariana se afasta do Duarte com uma velocidade v = 0.6(c = 1), e que o Duarte envia os seus sinais para a Mariana a intervalos regulares de 6 meses do seu tempo próprio. Quando envia o primeiro sinal, estando a Mariana já a uma distância de 0.5 anos-luz, então o sinal leva 1.25 anos a atingi-la. Seis meses depois de enviar o primeiro sinal, Duarte envia o

(6)

T

T'=KT

D M

Figura 1.1: O Duarte envia dois sinais luminosos para a Mariana, separados de um intervalo T . A Mariana recebe esses sinais separados de um intervalo maior T0 _{= KT ,}

onde K > 1 ´e fun¸c˜ao da velocidade relativa entre os 2 observadores inerciais. segundo sinal luminoso. Durante esse tempo T = 1

2 ano-luz, a Mariana afastou-se mais

0.3 anos-luz, de modo que o sinal luminoso vai ter de percorrer uma distância maior para atingi-la. De modo que, pelo menos do ponto de vista do Duarte, é evidente que a um intervalo de 6 meses entre dois sinais emitidos corresponde um intervalo maior entre os dois sinais recebidos pela Mariana; concretamente, Duarte mede um intervalo entre os dois sinais recebidos pela Mariana de 1.25 anos. Isto não nos diz ainda qual o intervalo de tempo medido pela Mariana, mas é com certeza uma indica¸cão de que esse intervalo não será 6 meses, como para o Duarte. Um efeito semelhante ocorrerá se os sinais fossem agora enviados da Mariana para o Duarte. E é de esperar, que sendo a velocidade relativa a mesma, que o factor K que relaciona os intervalos de tempo seja o mesmo. Como veremos a partir das fórmulas deduzidas adiante, no nosso caso K = 2 e portanto ao intervalo de 6 meses do Duarte corresponde um intervalo de 1 ano na recep¸cão desses mesmos sinais pela Mariana. E se os sinais recebidos pela Mariana forem (imediatamente) reflectidos de modo a regressarem ao Duarte, este recebê-los-á separados de dois anos (ver Fig(1.2)).

Consideremos então dois observadores inerciais em movimento relativo, que podem continuar a ser o Duarte e a Mariana. Duarte envia um sinal luminoso, espera um intervalo de tempo T do seu relógio (tempo próprio), e envia então um segundo sinal. A Mariana mede um intervalo de tempo entre a recep¸cão desses dois sinais como sendo

T0 _{= KT} _(1.2)

Se a Mariana estivesse em repouso em rela¸cão ao Duarte, então ter´ıamos K = 1, isto é, os intervalos de tempo seriam os mesmos para os dois observadores. Neste caso, as suas linhas do Universo seriam paralelas. Mas se os observadores se afastam

(7)

T

T'=KT

D M

T''=KT'

anos-luz

Figura 1.2: O Duarte envia dois sinais luminosos para a Mariana, separados de um intervalo T , e esta devolve-os assim que os recebe.

K > 1, e se os observadores se aproximam K < 1. Se soubermos a velocidade entre os 2 observadores facilmente poderemos determinar K. Na verdade, se os rel´ogios da Mariana e do Duarte foram previamente acertados, quando a Mariana se cruzou com o Duarte, ent˜ao a partir das coordenadas do acontecimento C da Fig. (1.3) poderemos relacionar K com a velocidade v,

   tC = 1₂(tA+ tB) = 1₂(K2T + T ) xC = 1₂(tB− tA) = 1₂(K2T − T ) (1.3) Logo, vem v = xC tC = K 2_{− 1} K2_{+ 1} ⇒ K = s 1 + v 1 − v. (1.4)

Note-se que daqui também se pode obter a fórmula da dilata¸cão do tempo, com-parando o tempo entre 2 acontecimentos que ocorrem no mesmo ponto do espa¸co de um dado observador, e em pontos do espa¸co diferentes do outro observador. Assim, t0 C = T0 = KT com tC = (K2+ 1)T /2 vem t0 C tC = 2K K2_{+ 1} = √ 1 − v2_, e portanto, T0 _{= t}√_{1 − v}2 _(1.5)

Uma das formas mais práticas de medir a quantidade K é através da medi¸cão do comprimento de onda (c.d.o.) da luz observada, ou de qualquer outra radia¸cão elec-tromagnética, desde que se conhe¸ca o c.d.o. da radia¸cão emitida. Esta é a base das

(8)

KT=T ' T KT ' A B C t C Duarte Mariana

Figura 1.3: No instante tA, Duarte envia um sinal luminoso para Mariana, que o devolve

imediatamente no instante tC de Duarte. Este recebe-o de volta no seu instante tB.

medidas de deslocamento para o vermelho da radia¸c˜ao emitida por um corpo que se afasta do observador.

Se um observador se afasta de nós, o Duarte por exemplo, e envia uma radia¸cão de c.d.o. λe, vamos recebê-la com c.d.o. dado por

λo= Kλe, (1.6)

pois o per´ıodo da radia¸c˜ao emitida ´e dado λe = c∆τe, e a este per´ıodo corresponde

∆τo = K∆τe, para o per´ıodo da radia¸c˜ao observada, de acordo com a eq.(1.2).

Esta mudan¸ca de c.d.o. é fácil de medir directamente a partir do espectro da luz recebida. Pode fazer-se esta medida através da identifica¸cão no espectro observado de uma linha cujo c.d.o. é conhecido na fonte (como é o caso da ‘linha α’de c.d.o. 121.5 nm do espectro do Hidrogénio), que depois é comparado com o c.d.o. recebido. Com frequência, o resultado da medida é expresso em termos do parâmetro do deslocamento para o vermelho,z, definido por

1 + z = λo λe

= K. (1.7)

Com este resultado ficamos a perceber que K, conhecido por factor de Bondi, est´a associado ao efeito de Doppler entre dois observadores inerciais em movimento relativo.

(9)

1.1.3 A adi¸c˜

ao de velocidades

Consideremos agora três observadores inerciais, cujas linhas do Universo são dadas pela Fig.(1.3) Nesta figura o observador B tem velocidade v1 em rela¸cão a A, e observador

T

T'

A B

T'' C

Figura 1.4: O observador B afasta-se do observador A com velocidade v1 e o observador

C afasta-se do observador B com velocidade v2

C tem uma velocidade v2 em rela¸c˜ao a B. Pretendemos saber qual ´e a velocidade

relativa, v12, de C em rela¸cão a O. Atendendo à linearidade entre K e v, é de esperar

que

T0 = K1T, T00= K12T.

Mas tamb´em podemos admitir que o observador B emite sinais para C separados de um intervalo T0_{, pelo que}

T00 _{= K}

2T0.

Combinando as rela¸c˜oes anteriores conclu´ımos que T00 _{= K}

BCKABT e portanto

KAC = KABKBC, (1.8)

Atendendo `a rela¸c˜ao entre o factor de Bondi e a velocidade eqs.(1.4), vAC = K 2 AC− 1 K2 AC + 1 = K 2 ABKBC2 − 1 K2 ABKBC2 + 1 ou vAC = 1 + vAB 1 − vAB 1 + vBC 1 − vBC − 1 1 + vAB 1 − vAB 1 + vBC 1 − vBC + 1 = vAB+ vBC 1 + vABvBC (1.9)

(10)

Com base nesta fórmula de composi¸cão de velocidades, vemos que a velocidade da luz não pode ser ultrapassada: se uma destas velocidades vAB ou vBC é igual a c = 1, a

velocidade resultante vem vAC = 1.

1.1.4 Dedu¸c˜

ao das transforma¸c˜

oes de Lorentz

A partir das considera¸cões anteriores, é fácil obter as fórmulas de Transforma¸cão de Lorentz, ou seja, as rela¸cões que permitem converter as coordenadas de espa¸co e de tempo de um acontecimento, observado num dado referencial (inercial), com as coorde-nadas correspondentes do mesmo acontecimento num outro referencial (inercial). Para isso consideremos a Fig.(1.5)

O A P P' Q Q'

Figura 1.5: Dois observadores cruzam-se no acontecimento O e acertam os seus relógios. No acontecimento P é enviado um sinal luminoso, que se cruza com o outro observador em P0 _{e é reflectido no acontecimento, regressando ao mesmo ponto do espa¸co. No seu}

(11)

Chamando S e S0 _{os dois referenciais, temos em S}    tA = 1₂(tP + tQ) xA = 1₂(tQ− tP) (1.10) e em S0    t0 A = 12(t0P0+ t0Q0) x0 A = 12(t0Q0− t0_P0) (1.11) Tendo em conta que t0

P0 = Kt_P e t_Q= Kt0_Q0, vem para um acontecimento A arbitr´ario

  

t0_{− x}0 _{= K(t − x)}

t + x = K(t0_{+ x}0₎

donde se deduz: −t02_{+ x}02_{= −t}2_{+ x}2_{, bem como}    t0 ₌ 1 2(K + K−1)t − 12(K − K−1)x = γ(x − vt) x0 ₌ 1 2(K + K−1)x −12(K + K−1)t = γ(t − vx) (1.12) com γ = √ 1 1 − v2.

Assim, segundo Einstein, dados dois observadores inerciais arbitr´arios, O e O0_{, as}

coordenadas de um certo acontecimento P estão relacionadas entre si por uma trans-forma¸cão de Lorentz, definida no caso particular em que v só tem componente segundo x, e os dois referenciais estão igualmente orientados por

x0 _{= γ(x − vt)} y0 _{= y} z0 _{= z} t0 _{= γ(t − vx/c}2₎          transforma¸c˜ao de Lorentz (1.13) e onde γ = q 1 1 − v2_/c2.

Representando as coordenadas de O0 _{por uma barra em vez de uma plica, e}

multipli-cando a coordenada temporal pela velocidade da luz no v´acuo, c, para que todas as coordenadas fiquem com a mesma dimens˜ao espacial, podemos escrever as coordenadas do mesmo acontecimento f´ısico nos dois referenciais inerciais

xa= (ct, x, y, z) e ¯xc = (¯t, ¯x, ¯y, ¯z), com c = (0, 1, 2, 3). (1.14) e podemos escrever a transforma¸c˜ao de Lorentz como uma rela¸c˜ao matricial ¯X = L X dada por ¯ xc₌X3 a=0 Lc axa, (1.15)

(12)

onde Lc

a representa a matriz da transforma¸c˜ao de Lorentz. Note que os dois ´ındices

c e a dizem respeito a sistemas de coordenadas diferentes; por essa raz˜ao talvez fosse prefer´ıvel representar a matriz da transforma¸c˜ao de Lorentz por Lc0

a e a transforma¸c˜ao

das coordenadas por

xc0 = 3 X a=0 Lc_a0 xa. (1.16)

1.2 Espa¸co-tempo de Minkowski

A invariância da velocidade da luz no vácuo, c, implica a invariância da forma qua-drática

s2 = −c2t2 + x2+ y2+ z2 = −c2¯t2 + ¯x2+ ¯y2+ ¯z2, (1.17) conhecida por intervalo do Universo. Esta forma quadr´atica caracteriza um espa¸co 4-dimensional a que chamamos espa¸co-tempo de Minkowski, M4

0, en honra de Hermann

Minkowski que o propôs em Setembro de 1908 como o espa¸co adequado à descri¸cão da teoria da RR de Einstein.

Recordemos que, devido à constância da velocidade da luz e à isotropia da sua pro-paga¸cão no vácuo, uma vez emitido um sinal luminoso num dado ponto do espa¸co e num dado instante, que se tomam respectivamente como origens espacial e temporal dos referenciais S e S0_{, este satisfaz simultaneamente as equa¸cões}

x2 _{+ y}2_{+ z}2_{− c}2_t2 _{= ¯}_x2_{+ ¯}_y2_{+ ¯}_z2_{− c}2_¯t2 _{= 0,}

ou seja, os pontos do espa¸co que num dado instante de cada referencial se encontram na mesma fase de vibra¸cão formam uma onda esférica que está centrada na origem do referencial respectivo. Tendo em conta as transforma¸cões de Lorentz e a relatividade do espa¸co e do tempo, escusado será dizer que o conjunto dos pontos do espa¸co que estão na mesma fase de vibra¸cão para os observadores de S é diferente dos pontos do espa¸co que estão na mesma fase de vibra¸cão em S´. Só assim se poderá compreender que em ambos os referenciais os respectivos observadores vejam uma onda luminosa esférica em torno de cada um deles.

1.2.1 Intervalo do Espa¸co-tempo e cone de luz

A equa¸cão anterior permite definir a quantidade invariante dada por (1.1), isto é, uma quantidade que toma a mesma forma em todos os referenciais inerciais—relacionados entre si por uma transforma¸cão de Lorentz—indissoluvelmente ligada à invariância da velocidade da luz, e que no caso de 2 acontecimentos cujas coordenadas têm valores infinitesimalmente próximos, se escreve

(13)

Este invariante pode ser entendido como uma generaliza¸cão da defini¸cão habitual de distância a um espa¸co a quatro dimensões, o conhecido por espa¸co-tempo de Minkows-ki1_{, e é conhecido por intervalo do Universo entre o acontecimento origem (ct, x, y, z)}

e o acontecimento de coordenadas (c(t + dt), x + dx, y + dy, z + dz). Na verdade, tal como a f´ormula euclidiana ∆x2 _{+ ∆y}2 _{+ ∆z}2 _{= ∆r}2 _{caracteriza o espa¸co ordin´ario}

3-dimensional, e representa o quadrado da distância entre dois pontos cujas coordenadas diferem (∆x, ∆y, ∆z), também a fórmula ∆r2 _{− c}2_∆t2 _{pode servir para caracterizar o}

espa¸co-tempo de Minkowski e poder´a igualmente designar o quadrado da distˆancia entre dois acontecimento cujas coordenadas diferem (∆r, c∆t), neste espa¸co-tempo 4-dimensional.

Exerc´ıcio 1 Verifique que a as transforma¸cões de Lorentz (1.13)satisfazem a rela¸cão de invariância (1.1).

1.2.2 Pares de acontecimentos e estrutura causal

Consideremos dois acontecimentos infinitesimalmente próximos. Reduzindo o espa¸co-tempo a duas dimensões, uma dimensão espacial e uma espa¸co-temporal, e fazendo coincidir essa direçcão espacial com a direçcão da velocidade relativa entre os dois referenciais, escrevemos o intervalo infinitesimal

ds2 _{= dx}2_{− c}2_dt2 _{= d¯}_x2_{− c}2_d¯t2_. _(1.19)

Se os 2 acontecimentos ocorrem no mesmo ponto de S0_{, d¯}_{x = 0 ⇒ ds}2 _{< 0, e podemos}

escrever (1.5) da seguinte forma

dx2_{− c}2_dt2 _{= −c}2_d¯t2 e portanto d¯t = dt s 1 − v2 c2 (1.20)

onde v = dx/dt ´e a velocidade de S0 _{em S.}

Conclu´ımos que o intervalo de tempo ´e diferente em S e S0 _{e que ´e mais curto no}

refe-rencial onde os acontecimentos ocorrem no mesmo ponto do espa¸co. Esse referefe-rencial, 1_{Hermann Minkowski foi o primeiro a mostrar em 1908 que: “daqui em diante o espa¸co s´o por si e}

o tempo só por si estão condenados a tornarem-se meras sombras, e só uma união dos dois preservará uma realidade independente”.

(14)

neste caso S0_{, designa-se referencial pr´}_{oprio para esses acontecimentos. Assim, em}

qualquer referencial diferente do referencial próprio o tempo é dilatado. Note-se ainda que embora d¯x = 0, dx = vdt 6= 0 (use as transforma¸cões de Lorentz (1.13)), isto é, os dois acontecimentos ocorrem no mesmo ponto de S0 _{mas ocorrem em pontos diferentes}

de S.

Consideremos agora d¯t = 0 (acontecimentos simultˆaneos em S0_{). Vem ds}2 _{> 0 e usando}

as TL vemos que dt = vdx/c2_{, logo}

ds2 _{= dx}2_{− c}2_dt2 _{= d¯}_x2 _{> 0 (par tipo-espa¸co).}

Vemos que acontecimentos simultˆaneos em S0_{, e que ocorrem em pontos diferentes do}

espa¸co de S0_{, não são simultâneos em S : dt 6= 0.}

1.2.3 Diagramas de espa¸co-tempo

Os diagramas de espa¸co-tempo, vulgarmente conhecidos por diagramas de Minkows-ki, têm um papel pedagógico relevante na assimila¸cão dos efeitos cinemáticos da RR (dilata¸cão do tempo e contraçcão do espa¸co) e na compreensão da estrutura causal do espa¸co-tempo plano. Estes diagramas são, aliás, um bom ponto de partida para introduzir os conceitos fundamentais da RR. Mas aqui poderão ter uma fun¸cão com-plementar da discussão algébrica anterior.

Comecemos por usar os diagramas do espa¸co-tempo para evidenciar o car´acter relativo da simultaneidade entre acontecimentos distantes no espa¸co. Observemos as figuras (1.6) e (1.7), O x x' t _t' A simultaneidade em S simultaneidade em S A'

Figura 1.6: Os acontecimentos simultâneos em S estão sobre linhas paralelas ao eixo do x. Por exemplo, os acontecimentos (O, A) são simultâneos em S.

(15)

onde se observam os pares (O, A) e (O, A0_{). O primeiro par ´e constitu´ıdo por}

acon-tecimentos simultˆaneos em S e o segundo por aconacon-tecimentos simultˆaneos em S0_{. As}

linhas de simultaneidade em cada um dos referenciais, S e S0_{, s˜ao paralelas aos eixos}

x e x0 _{≡ ¯}_{x, respectivamente.} O x x' t _t' simultaneidade em S' simultaneidade em S' A' A

Figura 1.7: Os acontecimentos simultˆaneos em S0 _{est˜ao sobre linhas paralelas ao eixo}

x0_{. Por exemplo, os acontecimentos (O, A}0_{) s˜ao simultˆaneos em S}0 _{: ¯t}

A0 = ¯t_O = 0. Mas

claramente, tA0 > t_O = 0. Note que a plica em t0_A0 refere-se ao tempo ¯t no referencial

S0_.

Dilata¸c˜ao do tempo

Vimos já que dados dois acontecimentos que formam um par no tempo, há um refe-rencial onde eles ocorrem no mesmo ponto do espa¸co, o chamado referefe-rencial próprio. Em qualquer outro referencial, o intervalo de tempo entre esses mesmos dois aconte-cimentos é maior do que o intervalo de tempo próprio. E por essa razão se fala em dilata¸cão do tempo. Este facto, já conhecido e discutido previamente em termos algébricos, torna-se muito evidente com o aux´ılio do diagrama de espa¸co-tempo que se segue (1.8).

Tendo em conta a invariˆancia do intervalo do Universo, associada ao grupo de Lorentz, temos para o par temporal (O, C)

∆s2

OC = −t2C+ x2C = −t02C ⇒ t2C = x2C+ t02C (1.21)

conclu´ımos que t0

C < tC, e os acontecimentos O, C e B ocorrem todos na origem espacial

de S.

Este diagrama representa a seguinte situa¸c˜ao f´ısica: um rel´ogio de S0 _{desloca-se em}

rela¸c˜ao a S com velocidade v = xC/tC, e no seu percurso cruza-se com dois rel´ogios

(16)

x=t C B A O –1 0 1 2 3 4 t –4 –3 –2 –1 1 2 3 4 x

Figura 1.8: O ramo de hipérbole que passa pelos pontos A e B define o lugar geométrico dos pontos do espa¸co-tempo (acontecimentos) que estão à mesma distância da origem do sistema de coordenadas. Logo, tA = t0B e como t0C < tB0 e tA = tC vem t0C < tC.

Tenha em aten¸c˜ao que estamos a admitir que o eixo do tempo do referencial S passa pelos pontos O e A e que o eixo do referencial S0 _{passa pelos pontos O, C e B.}

espaciais x = 0 e x = xC. Atendendo à figura, vemos que o relógio de S0 é acertado

pelo rel´ogio de S colocado na origem espacial, de modo que ambos come¸cam a marcar t = 0 e t0 _{= 0 no mesmo acontecimento O. Quando o rel´ogio de S}0 _{se cruza com o}

outro rel´ogio de S que est´a a marcar tC, marca o tempo t0C < tC, e por isso se diz que

o relógio de S0 _{se atrasa em rela¸cão aos dois relógios de S. O valor exacto do atraso é}

f´acil de determinar a partir da equa¸c˜ao (1.21), t2

C − x2C = t02C ⇒ t0C = tC

q

1 − x2

C/t2C (1.22)

Fixemos assim esta ideia simples: na dilata¸cão do tempo compara-se o intervalo de tempo entre dois acontecimentos, medido por um mesmo relógio (tempo próprio), com o intervalo correspondente medido por dois outros relógios. Isto supõe que os dois acontecimentos ocorrem no mesmo ponto do espa¸co do primeiro relógio, e em pontos do espa¸co diferentes no referencial dos outros dois relógios, localizados onde esses mesmos dois acontecimentos ocorrem. Sendo o movimento um conceito relativo, não podemos pois afirmar simplesmente que os relógios em movimento se atrasam em rela¸cão aos relógios em repouso. Mas sim que havendo um movimento relativo entre um relógio de um referencial e dois relógios de outro, o relógio do primeiro referencial atrasa-se em rela¸cão aos dois relógios do outro, entendendo-se que os acontecimentos em causa, cujo intervalo de tempo se está a medir, ocorrem no mesmo ponto do espa¸co do primeiro referencial, e em dois pontos distintos do espa¸co do segundo referencial, onde estão localizados os dois relógios (previamente sincronizados). A melhor forma de introduzir implicitamente a no¸cão de movimento e sintetizar o resultado anterior é afirmar que o tempo próprio entre dois acontecimentos é sempre mais curto que o tempo correspondente medido noutro referencial qualquer, onde os acontecimentos ocorrem em pontos do espa¸co diferentes.

(17)

Contrac¸c˜ao de Comprimentos

Pelo que vimos anteriormente, há uma perfeita simetria entre os diferentes referenci-ais inercireferenci-ais. A dilata¸cão do tempo ocorre porque se faz uma compara¸cão entre um relógio de um referencial e dois relógios espacialmente separados de outro referenci-al. E embora possa sincronizar quantos relógios quiser de um mesmo referencial, não posso sincronizar vários relógios de referenciais diferentes. Isto é uma consequência do carácter relativo da simultaneidade entre acontecimentos espacialmente separados, que naturalmente decorre da finitude da velocidade da luz (no vácuo). De igual modo, os comprimentos na direçcão do movimento serão sempre maiores no referencial próprio e serão observados contra´ıdos em todos os outros referencias em rela¸cão aos quais os objectos se movem.

Na realidade, a dilata¸cão do tempo e a contraçcão dos comprimentos não são efeitos independentes, na mesma medida em que o tempo e o espa¸co não são coordenadas independentes. Recordemos a afirma¸cão de Minkowski a propósito da constru¸cão do espa¸co-tempo. Para medir o comprimento de uma barra que se desloca longitudinal-mente, devo observar simultaneamente as suas extremidades e assim determinar as suas coordenadas.

Na Fig. (1.9) vemos que as extremidades da barra, que est´a em repouso em S0_,

descre-vem duas linhas do Universo paralelas; a primeira passa pela origem O, e coincide com o eixo t0_{, e a segunda passa pelos acontecimentos A e B. Claramente, o comprimento}

da barra em S0 _{´e dado por x}0

B, visto que x0O = 0, e o comprimento em S ´e xA = 1

unidade da escala, e sabemos pela observa¸c˜ao da hip´erbole que xA< x0B. Note que se

verificam as seguintes rela¸c˜oes:

x2_A = x02_A− t02_A= x02_B³1 − v2´ (1.23) xA = x0B

√

1 − v2 _{= 1} _(1.24)

1.2.4 Resolu¸c˜

ao do paradoxo dos g´

emeos

Nos últimos anos têm surgido na literatura da especialidade muitos trabalhos sobre as “Máquinas do Tempo”, isto é, constru¸cões geométricas de espa¸co-tempo, solu¸cões das equa¸cões de Einstein da Gravita¸cão, que admitem curvas temporais fechadas: qual-quer observador que seguisse ao longo dessas linhas do Universo poderia re-visitar o seu passado. Na sequência dessa discussão voltaram a aparecer artigos sobre o chamado paradoxo dos gémeos e sua resolu¸cão no âmbito da teoria da relatividade (restrita). O paradoxo dos gémeos (também conhecido por paradoxo de Langevin) é uma “expe-riência de pensamento”, esquematizada na figura (1.10), onde dois gémeos se separam num dado instante, iniciando um deles uma viagem numa nave que se desloca a uma velocidade próxima da velocidade da luz (v ≈ 1) até uma estrela distante, e regressa logo em seguida à Terra. Ao encontrar-se com o seu gémeo que ficou na Terra verifica

(18)

A B x=t x’ t’ 0 1 2 3 4 t 1 2 3 4 x

Figura 1.9: O ramo de hipérbole que passa pelo ponto A define o lugar geométrico dos pontos do espa¸co-tempo (acontecimentos) que estão à distância de uma unidade da origem do sistema de coordenadas. Ora, os acontecimentos O e B são simultâneos em S0 _{e, por isso permitem medir o comprimento próprio da barra em S}0_{, o qual é}

claramente maior que o comprimento medido a partir de S a partir dos acontecimentos O e A, simultˆaneos em S. Note que o ramo de hip´erbole intersecta a barra num ponto com x0 _{< x}0

B.

que este est´a muito mais velho, significando isto que o tempo anda mais lentamente para o g´emeo viajante.

Comecemos por esclarecer dois pontos sobre os quais se teceram, sobretudo na literatura mais antiga, muitas considera¸cões erróneas que devem ser clarificadas desde o in´ıcio. Em primeiro lugar, a questão em ep´ıgrafe não é de modo algum um paradoxo da teoria da relatividade, e em segundo lugar não é necessário invocar a teoria da relatividade generalizada para a resolver. Estas duas confusões eram justificadas com os seguintes argumentos: sendo o movimento um conceito relativo, qualquer dos gémeos poderia admitir que estava em repouso no seu referencial e o outro em movimento. Sendo assim não se percebia a assimetria do resultado. É contra o senso comum admitir que dois gémeos possam ter idade diferente. Ainda por cima isso era explicado como uma consequência do movimento relativo entre os dois gémeos. Ora, na verdade não há simetria entre os dois gémeos pois um deles poderá ser considerado inercial (o que ficou na Terra) mas o viajante, que vai e volta, sofre algures no seu trajecto uma acelera¸cão para poder inverter o sentido da viagem e poder voltar à Terra. Só assim os dois gémeos se poderão voltar a cruzar depois de se terem separado.

(19)

t

O

_x

A

B

10

3

Figura 1.10: Dois gémeos separam-se no instante O, em que acertam os seus relógios um pelo outro, ficando um deles em repouso no referencial do laboratório (Terra), com coordenadas (t, x) enquanto o outro viaja, com velocidade v = 0.8 (c = 1), até uma estrela a 8 anos-luz da Terra, e no instante em que lá chega (acontecimento B) regressa de imediato ao mesmo ponto do espa¸co onde tinha ficado o primeiro gémeo (acontecimento A).

Retomando o nosso exemplo dos gémeos, vamos então concretizá-lo para o analisar em pormenor (ver Fig.1.10). Sejam as nossas gémeas Patty e Selma Bouvier, as irmãs mais velhas de Marge Simpson. Admitamos que Patty fica cá na Terra enquanto Selma se desloca numa nave espacial, até um planeta distante (à procura do terceiro marido), com uma velocidade v = 0.8(c = 1), em rela¸cão à Terra (e a Patty). Se Selma se afasta da Terra durante 3 anos do seu tempo próprio, τ , então do ponto de vista de Patty, a viagem de ida ocorre num tempo dilatado e demora

t = √ τ

1 − v2 =

3 √

1 − 0.82 = 5 anos.

Como tal, Selma afasta-se uma distˆancia de 4 anos-luz, de acordo com os observadores do referencial Terra. Com estes dados podemos escrever o intervalo do espa¸co-tempo para o par de acontecimentos (O,B),

τ2 = t2− x2 → 32 = 52− 42,

que exprime a invariância da velocidade da luz (no vácuo). Note-se igualmente que, para a gémea viajante, o espa¸co percorrido é uma contraçcão do espa¸co medido por Patty, isto é,

x0 _{= x}√_{1 − v}2 _{= 4 × 0.6 = 2.4 anos-luz.}

O que está em concordância com o tempo medido pelo relógio de Selma, onde só tinha passado τ = x0_{/v = 2.4/0.8 = 3 anos. Admitindo que esta regressa de imediato à}

(20)

Terra com a mesma velocidade v = 0.8, as duas gémeas voltam a encontrar-se passados 10(=8/0.8) anos, no referencial de Patty, após a partida de Selma, mas simplesmente 4.8 anos no relógio de Selma. Em resumo as duas “gémeas”fazem agora uma diferen¸ca de 5.2 anos de idade, sendo Patty a mais velha. Este é sempre um resultado surpreendente, por muita familiaridade que tenhamos com a teoria da relatividade.

t

t'

T

O

x

B

x

A

C

D

t

_B

B

x'

Figura 1.11: As duas g´emeos separam-se no instante O, quando t = t0 _{= 0; no instante}

tA = 1 (ano) sai um sinal luminoso de Patty que chega a Selma no acontecimento B

(t0

B = 3 anos). Este mesmo acontecimento ´e visto por Patty no instante tC = 9 anos.

Continuando a nossa análise, vamos admitir que as duas gémeas estão munidas de po-tentes telescópios de modo a poderem observar os relógios de pulso uma da outra, para procurarem compreender em que medida o tempo é relativo. Assim, Selma vai obser-vando o relógio de Patty ao longo da viagem e regista o valor observado no momento em que atinge o afastamento máximo da Terra e inicia o seu regresso (acontecimento B, no diagrama da Fig.1.11). Selma vê o relógio de Patty marcar tA= 1 ano, quando

o seu rel´ogio marca t0

B = 3 anos, pois

t0 = Kt =

s

1 + v

1 − vt = 3 × t,

atendendo ao efeito de Doppler. Por outro lado, Patty vê Selma atingir o acontecimento B, e a iniciar o regresso, quando o seu relógio marca 9 anos, pois para Patty, a sua gémea viajante leva 5 anos a atingir o planeta distante e a luz leva mais 4 anos a regressar à Terra, mostrando Selma a chegar ao planeta distante. Assim para Patty o relógio de Selma, que marca 3 anos, parece estar a trabalhar a um ter¸co da velocidade do seu relógio (3/9). Exactamente como acontece com Selma que vê o relógio de Patty trabalhar a um ter¸co da velocidade do seu (1/3).

Na viagem de regresso, Patty vê o relógio de Selma passar de 3 anos para 6 anos num só ano do seu relógio: intervalo de tempo tD − tC do relógio de Patty. Ou seja, Patty

(21)

vê agora o relógio de Selma avan¸car 3 anos num ano do seu tempo próprio, o que corresponde a uma velocidade três vezes maior. Por sua vez Selma vê, durante o seu regresso, o relógio de Patty avan¸car de 1 ano para 10 anos, enquanto o seu relógio marca um tempo próprio de três anos. Selma é também levada a concluir que ela vê o relógio de Patty a trabalhar a uma velocidade três vezes maior do que o seu. E ambas concordam que no fim da viagem, têm idades diferentes estando Patty 5.2 anos mais velha que Selma, a gémea viajante, que não teve tempo de encontrar o terceiro marido no planeta distante. A diferen¸ca de idades deve ser entendida como uma consequência da assimetria entre as duas gémeas: Patty ficou sempre no mesmo referencial (inercial) Terra, enquanto Selma teve que mudar de referencial e, por isso, o seu referencial próprio sofreu uma acelera¸cão, logo Selma não é uma observadora inercial. Note-se ainda que Patty e Selma concordam na leitura do relógio de Selma quando esta chega ao planeta distante, mas essas leituras correspondem a dois acontecimentos distintos com tempos diferentes no relógio de Patty.

O

x_Ax_B

_x

A

C

t

A=

t

B B

t

5

4

3

Figura 1.12: Nesta figura est˜ao indicados dois caminhos poss´ıveis para o g´emeo via-jante, conforme v = 0.6 ou v = 0.8. No primeiro tA = 5 anos mas τA = 4 anos, e no

segundo temos tamb´em tB = 5 anos, mas τB = 3 anos, como no exemplo de Patty e

Selma.

Note-se ainda que se a velocidade relativa entre os dois gémeos fosse menor, a diferen¸ca de idades no momento do re-encontro também seria menor. Por outras palavras, o gémeo viajante pode teoricamente ir a uma velocidade tão próxima de c = 1 quanto se queira e assim reduzir o seu tempo próprio tanto quanto se queira, fazendo assim aumentar a diferen¸ca de idades. No limite, se o gémeo pudesse viajar como um fotão, ao re-encontrar o seu irmão teria a mesma idade com que partiu.

Na Fig. (1.12) vemos dois exemplos do que ficou dito atrás, para v = 0.6 e v = 0.8. Em ambos os casos a viagem leva 10 anos para o gémeo que ficou na Terra. Mas no primeiro caso, o gémeo viajante afasta-se uma distância de 3 anos-luz num tempo

(22)

próprio de 4 anos, e no segundo caso, o gémeo viajante afasta-se 4 anos-luz num tempo próprio de 3 anos.

Fica assim resolvido, no âmbito da teoria da relatividade restrita, o chamado “pa-radoxo”dos gémeos. De caminho foi poss´ıvel apreciar a interliga¸cão entre dilata¸cão do tempo e contraçcão do espa¸co, e o efeito de Doppler entre dois observadores em movimento relativo.

1.3 Simetrias do Espa¸co-tempo Plano

Um sistema de coordenadas em RR é, por defini¸cão, uma correspondência 1-1 entre os pontos de M4

0 e o conjunto R4 caracterizado por 4 n´umeros ordenados xc, com

c = 0, 1, 2, 3 e x0 _{= ct, (x}1 _{= x, x}2 _{= y, x}3 _{= z) = (x}i_{) = ~x, isto ´e,}

xa_{= (x}0_{, x}i_{) = (ct, ~r)}

Com esta nota¸c˜ao compacta o intervalo do Universo pode escrever-se s2 ₌ X3 a,b=0 ηabxaxb = 3 X a,b=0 ηabx¯ax¯b

onde a matriz da forma quadr´atica, η, conhecida por m´etrica do espa¸co-tempo de Minkowski, tem os seguintes elementos diferentes de zero: η00 = −ηii = −1, com

i = 1, 2, 3.

Dados dois referenciais inerciais e as coordenadas respectivas xa _{e x}b0

de um mesmo acontecimento f´ısico p de M4

0, admitimos que ´e sempre poss´ıvel exprimir os xb

0

como fun¸c˜oes dos xa _{e vice-versa:}

xb0

=X

c

Lb0

cxc

de modo a preservar o intervalo s2_{. Pelo teorema da fun¸c˜ao inversa, diremos que}

a transforma¸cão de coordenadas é uma aplica¸cão 1-1 (i.e, tem inversa) num certo dom´ınio U, se e só se a matriz Jacobiana ∂xb0

/∂xa _{tiver um determinante n˜ao nulo}

nesse dom´ınio. O conjunto L das matrizes L devem assim obedecer `a seguinte rela¸c˜ao

3 X a0_,b0₌₀ ηa0_b0xa 0 xb0 = 3 X a0_,b0₌₀ 3 X c,d=0 ηa0_b0La 0 cLb 0 dxcxd= 3 X c,d=0 ηcdxcxd. (1.25)

Como esta rela¸c˜ao se deve verificar para qualquer xa_{, conclu´ımos que}

ηcd = 3 X a0_,b0₌₀ ηa0_b0La 0 cLb 0 d (1.26)

(23)

Utilizando agora uma nota¸cão matricial compacta, seja X a matriz-coluna cujo ele-mento genérico é [xa_{], isto é}

X =      x0 x1 x2 x3     .

Podemos agora escrever o intervalo do Universo s2 _{como um produto de matrizes}

s2 _{= X}T_ηX _(1.27)

bem como a transforma¸c˜ao de Lorentz ¯

X = LX.

1.3.1 Grupos de Lorentz e Poincar´

e

Defini¸c˜ao 1 O grupo de Lorentz, L, é o grupo das transforma¸cões lineares homogéneas das coordenadas do espa¸co-tempo M4

0 que deixam invariante a forma quadr´atica:

XT_{ηX =} ³ _x0 _x1 _x2 _x3 ´      −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1           x0 x1 x2 x3      = −(x0)2+ (x1)2+ (x2)2+ (x3)2 (1.28) ou seja, ´e o conjunto das matrizes 4 × 4, L, que satisfazem a condi¸c˜ao

LT_{ηL = η} _(1.29)

Nota: Se ¯X = LX, então a invariância da forma quadrática (5) —ou seja, a invariância da velocidade da luz para todos os observadores inerciais—implica ¯XT_{η ¯}_{X = X}T_{ηX ⇒}

XT_LT_{ηLX = X}T_{ηX ⇔ L}T_{ηL = η.}

´

E fácil mostrar que o conjunto de transforma¸cões L, com uma lei de composi¸cão ade-quada, forma um grupo cont´ınuo. Em primeiro lugar notemos que sendo

η =      −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1      vem η2 _{= I. Efectivamente,} Ã −1 01×3 03×1 I3×3 ! Ã −1 01×3 03×1 I3×3 ! = I4×4,

(24)

onde In×n ´e a matriz identidade num espa¸co de dimens˜ao n.

Vamos agora mostrar que o conjunto das matrizes L que satisfazem a condi¸cão (1.29), juntamente com a opera¸cão de multiplica¸cão de matrizes, simbolicamente representado por [L, ·], goza das quatro propriedades seguintes:

1. O produto de duas transforma¸c˜oes de Lorentz (TL) L1 e L2 ´e uma TL L3. Seja

L3 = L1· L2, ent˜ao LT3ηL3 = LT2LT1ηL1L2 = LT2ηL2 = η, pois L1 e L2 obedecem

`a Eq.(3) separadamente.

2. A multiplica¸c˜ao de TL’s ´e associativa:

(L1· L2) · L3 = L1· (L2· L3)

´e uma propriedade geral do produto de matrizes! 3. A identidade ´e uma TL, i.e. IT_{ηI = η.}

4. Qualquer TL, L, tem uma inversa, L−1_{, que ´e tamb´em uma TL; pois, sendo}

LT_{ηL = η vem ηL}T_{ηL = η}2 _{= I o que ⇒ L}−1 _{= ηL}T_{η. Por outro lado,}

(L−1₎T_ηL−1 _{= (ηL}T_η)T_η(ηLT_{η) = ηLη}2_ηLT_{η = ηLηL}T_{η = ηLL}−1 _{= G, i.e.}

L−1 _{= ηL}T_{η ∈ L.}

Pod´ıamos ter obtido este ´ultimo resultado recorrendo a uma variante da rela¸c˜ao (1.29).

Exerc´ıcio 2 Mostre que se L ∈ L, ent˜ao LηLT _{= η, e L}−1 _{tamb´em pertence a L.}

J´a mostr´amos que:

• se L1, L2 ∈ L ent˜ao L1· L2 ∈ L;

• se L ∈ L ent˜ao L−1 _{∈ L}

• I ∈ L.

Juntando a estas propriedades a associatividade do produto de matrizes, podemos concluir que o conjunto L de todas as TL constitui um grupo em rela¸cão à opera¸cão binária multiplica¸cão matricial.

(25)

Estrutura do Grupo de Lorentz

O grupo de Lorentz pode ser representado como um certo subconjunto do espa¸co R16

visto que uma matriz de Lorentz L (4 × 4) tem à partida 16 elementos diferentes. Porém nem todos são independentes, pois existem 10 condi¸cões dadas pelas equa¸cões

LT_{ηL = η.}

Note que G ´e uma matriz sim´etrica, o mesmo acontecendo a LT_{ηL. Assim, qualquer}

L ∈ L tem só 6 parâmetros reais independentes, e L dá origem a um sub-espa¸co a 6 dimensões de R16_{. Qualquer matriz L deve satisfazer a rela¸cão}

(detL)2 = 1 ⇒ detL = ±1

Como o determinante de uma matriz varia continuamente à medida à medida que variam os elementos de matriz em fun¸cão dos parâmetros, não é poss´ıvel deslocarmo-nos ao longo de uma curva cont´ınua de L desde um valor de L com detL = +1 até um valor L0 _{com detL}0 _{= −1. Ou seja, os conjuntos}

L+ = {L : detL = +1} e L−= {L : detL = −1}.

não podem ser ligados por uma curva cont´ınua em L; são portanto desconexos. ´E necessário saltar de L+ para L− ou vice-versa, de uma maneira descont´ınua.

´

E poss´ıvel usar a condi¸c˜ao (1.29) de um modo mais eficiente, separando L em todas as suas partes desconexas. Para simplificar a escrita voltamos a representar a matriz de Lorentz por La

c sem distinguir os dois tipos de ´ındices, e escrevemos (LTηL)00 = η00=

−1, ou seja, (LT₎0 0η00L00 + (LT)0iηijLj0 = −(L00)2+ 3 X j=1 (Lj₀)2 _{= −1.} temos ent˜ao, L0₀ = ± v u u t_{1 +}X3 j=1 (Lj₀)2_{, |L}0 0| ≥ 1. (1.30)

A condi¸cão (1.30) divide L em duas regiões que, tal como acontecia antes, não podem ser ligadas por uma curva cont´ınua; são pois desconexas também. As duas regiões são:

L↑ _{= [L : L}0

0 ≥ +1], L↓ = [L : L00 ≤ −1].

As setas põem em evidência o efeito de L sobre a componente temporal de 4-vector (tipo-tempo). Se L ∈ L↑ _{então L}0

.0U0 tem o mesmo sinal que U0, mas se L ∈ L↓, ent˜ao

L0

(26)

do tempo, e por isso se chamam ortochronous (aportuguesando, diremos ort´ocronas), e L↓ _{´e o conjunto das TL que invertem o sentido do tempo: transformam um vector}

temporal, dirigido para o futuro (d.p.f.) num vector-temporal, dirigido para o passado (d.p.p) e vice-versa.

Podemos, portanto, dividir o espa¸co L em quatro regi˜oes: L↑+, L↑−, L↓+, L↓−,

cujo significado é evidente; estas quatro regiões são desconexas, tal como se explicou atrás. A TL I ∈ L↑+, a qual constitui um subgrupo do grupo de Lorentz, conhecido

por subgrupo pr´oprio ort´ocrono ou componente conexa da identidade.

Esta parti¸cão de L em quatro sub-espa¸cos distintos, permite-nos reconhecer duas trans-forma¸cões de Lorentz muito importantes: a paridade P = Ls e a inversão no tempo

T = Lt. A TL P muda o sinal das coordenadas espaciais e preserva o do tempo,

P : (t, ~r) 7→ (t, −~r). Evidentemente, detP = −1, P0

.0 ≥ 1, pelo que P ∈ L↑−. ´E interessante notar que se

L ∈ L↑+, ent˜ao P · L ∈ L↑−, visto que

det(P · L) = det(P ) · det(L) = −1, (P · L)0₀ = P0₀· L0₀ = L0₀ ≥ +1.

Igualmente, se L ∈ L↑− ent˜ao P · L ∈ L↑+. Portanto, P permite definir uma

corres-pondˆencia 1 − 1 entre L↑+ e L↑−.

A TL invers˜ao no tempo, T , muda somente o sinal do tempo, T : (t, ~r) 7→ (−t, ~r), logo, detT = −1, T0

0 ≤ −1; a matriz T tem a forma

Ta b =      −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1     = diag(−1, 1, 1, 1) (1.31)

T estabelece, portanto uma correspondˆencia 1 − 1 entre L↑₊ e L↓₋, como facilmente se verifica. Finalmente, o operador (a matriz) P T = Ls· Lttem det(P T ) = +1, (P T )0. 0=

−1; Logo, P T ∈ L↓₊ e pode pois ser usado para estabelecer uma correspondˆencia 1 − 1 entre L↑₊ e L↓₋.

Conclu´ımos que não é necessário considerar todo o conjunto L = L↑+∪ L↓+∪ L↑−∪ L↓−;

basta-nos tomar o subgrupo L↑₊ das TL próprias e ortócronas e juntar as transfor-ma¸cões de Lorentz discretas P e T . Com estas transfortransfor-ma¸cões podemos obter todos

(27)

os elementos de L. A distin¸cão entre transforma¸cões próprias e impróprias, e entre transforma¸cões ortócronas e as outras, é importante. Todos os resultados experimen-tais são invariantes em rela¸cão às transforma¸cões (próprias) L+ = L↑+∪ L↓+; mas, como

é sabido, em 1957 foi descoberta a viola¸cão de paridade em decaimentos radioactivos, por sugestão de T.D. Lee e C.N. Yang. Assim, não devemos exigir a invariância dos resultados experimentais e, portanto, das teorias que os podem prever, em rela¸cão à totalidade do grupo de Lorentz; é mais razoável exigir essa invariância só em rela¸cão ao subgrupo L↑+.

Este grupo é gerado por dois conjuntos de matrizes que designaremos respectivamente por LB (“boosts”) e LR(rota¸cões). Um exemplo de “boost” (ou TL especial) é a matriz

LB(φ) =      cosh(φ) −senh(φ) 0 0 −senh(φ) cosh(φ) 0 0 0 0 1 0 0 0 0 1      (1.32)

onde φ é um número real. Esta matriz LB(φ) representa uma TL especial na direçcão

Ox, sem rota¸cão espacial e sem alterar o sentido do tempo. Por vezes, é designada por “rota¸cão de Lorentz”, no plano (t, x), por analogia com as rota¸cões espaciais. A partir da Eq.(1.32) é fácil construir “rota¸cões de Lorentz” nos planos (t, y) ou (t, z). Finalmente, consideremos agora as matrizes 4 × 4

LR= Ã 1 01×3 03×1 R ! (1.33) onde R é uma matriz 3 × 3 que é solu¸cão de RT_{R = I, det(R) = 1.}

Exerc´ıcio 3 Verifique que LT

RGLR= G se RTR = I.

A condi¸c˜ao RT_{R = I define o conjunto das matrizes ortogonais O(3) = [R : R}T_{R = I].}

Como se sabe, estas matrizes são caracterizadas por preservarem os comprimentos euclidianos. Não é dif´ıcil mostrar que o conjunto O(3) é um grupo—o grupo ortogonal tri-dimensional (3-D) ou grupo das rota¸cões no espa¸co ordinário.

O grupo O(3), tal como o grupo de Lorentz, tem duas partes n˜ao conexas, O+(3) = [R : RTR = I, det(R) = +1],

(28)

Estas duas partes est˜ao relacionadas pelo operador paridade, P P =    −1 0 0 0 −1 0 0 0 −1   

visto que se R ∈ O+(3) := SO(3) ent˜ao P · R ∈ O−(3) e se R0 ∈ O−(3), ent˜ao

P · R0 _{∈ O}

+(3). Vamos, portanto, considerar unicamente SO(3), que ´e a parte de O(3)

conexa com a unidade e, por isso, com estrutura de grupo.

Quando referidas a uma base não ortonormada ou, em geral, quando se usam coorde-nadas curvil´ıneas, as matrizes ortogonais são definidas pela condi¸cão:

RT_{GR = G,} _(1.34)

onde a matriz G que figura na Eq. (1.34) é agora a matriz da forma quadrática positiva associada à distância Euclidiana em R3_{. Há pois seis condi¸cões (1.34) entre os nove}

elementos que constituem cada matriz R, de modo que ficam só três elementos de matriz independentes: os três parâmetros que caracterizam uma rota¸cão, tantos quantos os parâmetros do grupo SU(2). Podemos escolher, portanto, um ângulo θ e uma direçcão ~n no espa¸co – a direçcão do eixo de rota¸cão (note que podemos sempre escolher ~n unitário: ~n · ~n = 1). A matriz correspondente R representa uma rota¸cão de um ângulo θ em torno de ~n. Esta parametriza¸cão de R torna claro o carácter rotacional de todas as matrizes ortogonais.

O espa¸co dos parâmetros (θ, ~n) pode ser representado por pontos numa bola densa de raio π, onde cada ponto p tem coordenadas (θ, ~n), sendo θ = à distância radial | ~Op| e estando ~n apontando na direçcão do raio vector ~Op. Como a rota¸cão de um ângulo π em torno de ~n dá o mesmo resultado que uma rota¸cão de −π em torno de ~n, é necessário identificar os pontos opostos sobre a superf´ıcie da esfera fronteira, i.e. os pontos que se encontram nas extremidades de um diâmetro, para estabelecer um isomorfismo entre o espa¸co dos parâmetros e o espa¸co gerado por todas as matrizes R: a variedade grupo SO(3). Este grupo é um grupo de Lie e, como veremos mais adiante, todo o grupo de Lie é simultaneamente uma variedade diferenciável cuja dimensão é igual à dimensão do grupo.

Grupo de Poincar´e

Todos os pontos (acontecimentos) do espa¸co-tempo de Minkowski são equivalentes para a descri¸cão das leis f´ısicas. Do ponto de vista matemático, diremos que o espa¸co é homogéneo. O grupo de simetria deste espa¸co é, portanto, mais vasto que o grupo de Lorentz pois deve incluir as transla¸cões. No conjunto temos 10 simetrias: 4 transla¸cões, 3 rota¸cões e 3 transforma¸cões de Lorentz puras. Por isso dizemos que as coordenadas inerciais gozam da seguinte propriedade: dados dois sistemas de coordenadas inerciais,

(29)

existe sempre uma matriz 4 × 4 n˜ao singular, L, e um vector-coluna constante A tais que para todo o ponto p de M

¯

X = LX + A, (1.35)

e inversamente

X = L−1X − L¯ −1A, onde X e ¯X s˜ao as coordenadas de p em S e ¯S.

Esta propriedade permite dar um conte´udo matem´atico ao Princ´ıpio da Relatividade, nomeadamente:

Defini¸c˜ao 2 As equa¸cões que representam uma dada lei f´ısica, expressa em fun¸cão das coordenadas, deverão ser invariantes em rela¸cão às transforma¸cões (1.35).

Defini¸c˜ao 3 O grupo de Poincaré, P, ou grupo de Lorentz não homogéneo, como também é conhecido, é o conjunto de todas as transforma¸cões de coordenadas da forma (1.35), com

L ∈ L = [L : LT_{ηL = η] e A ´e um 4-vector constante.}

Numa teoria f´ısica, expressa em termos de coordenadas, o objecto matemático mais importante é o conjunto de todas as transforma¸cões de coordenadas que deixam as leis da teoria invariantes. Este conjunto de transforma¸cões formam um grupo: o grupo de simetria da teoria. Efectivamente, dadas duas transforma¸cões entre coordenadas inerciais, as suas inversas são igualmente transforma¸cões entre coordenadas inerciais e a composi¸cão dessas transforma¸cões é também uma transforma¸cão de coordenadas inerciais; por sua vez, a transforma¸cão identidade está inclu´ıda no conjunto dessas transforma¸cões. Ou seja, dadas duas transforma¸cões de coordenadas que deixam as leis da teoria invariantes, então quer as suas inversas quer o produto dessas duas trans-forma¸cões também deve deixar as leis da teoria invariantes. A única dificuldade que poderá surgir na verifica¸cão dos axiomas de grupo tem a ver com o facto das leis se-rem, em geral, expressas por equa¸cões diferenciais; assim, é necessário garantir que os objectos matemáticos que representam as grandezas f´ısicas sejam suficientemente diferenciáveis.

Partindo das equa¸cões que exprimem as leis, facilmente se encontra o grupo de simetria da teoria. Mas, inversamente, conhecendo o grupo de simetria também é poss´ıvel retirar muita informa¸cão acerca da estrutura das próprias leis. Ao construir uma teoria, depois de ter sido escolhido o grupo de simetria, só são permitidas aquelas leis que sejam invariantes em rela¸cão às transforma¸cões do grupo.

Defini¸cão 4 (Covariˆancia) Diz-se que uma equa¸cão é covariante em rela¸cão a um dado grupo de transforma¸cões de coordenadas se a forma dessa equa¸cão é mantida inalterada por esse grupo de transforma¸cões.

(30)

´

E claro que se os dois membros de uma equa¸cão forem tensores do mesmo tipo, a equa¸cão é manifestamente covariante. Mas as equa¸cões de Maxwell, por exemplo, são covariantes em rela¸cão ao grupo de Lorentz mesmo quando não estão escritas numa forma tensorial. A escrita tensorial torna, simplesmente, essa covariância manifesta.

1.4 Objectos geom´

etricos

Pretendemos definir os vectores como objectos geométricos que não dependem de um sistema de coordenadas particular. Em geral, todas as grandezas f´ısicas deverão ser formuladas em termos de objectos geométricos bem comportados (isto é, com propri-edades de diferenciabilidade conhecidas) de modo a assegurar que tais leis são verda-deiras para todos os observadores e em todos os sistemas de coordenadas. Se então seleccionarmos um sistema de coordenadas, podemos expressar os vectores ou quais-quer outros objectos geométricos em termos das suas componentes nesse sistema de coordenadas. Mudando de sistemas de coordenadas, estas componentes mudarão de acordo com regras precisas, mas a natureza geométrica e independente do observador dos objectos geométricos utilizados assegurará que as leis f´ısicas no seu conjunto são invariantes relativamente a uma transforma¸cão do grupo de transforma¸cões da teoria (grupo de simetria da variedade base). No âmbito da RR o grupo de transforma¸cões é o grupo de Lorentz não homogéneo ou grupo de Poincaré.

No espa¸co Euclidiano 3-dimensional S ⊂ R3_{, qualquer par de pontos (a, b) define um}

vector −→ab que os une. O vector−→ab depende somente da diferen¸ca das coordenadas dos pontos a e b, e assim um dado vector pode ser representado de muitas formas: a pode ser escolhido arbitrariamente e ent˜ao o vector −→ab determina o outro ponto b = a +−→ab. Podemos transportar esta ideia para o espa¸co-tempo de Minkowski M4

0. Associaremos

um vector a cada par de acontecimentos. E dois pares de acontecimentos (A, B) e (A0_{, B}0_{) ser˜ao chamados equivalentes–(A, B) ∼ (A}0_{, B}0_{)–se as diferen¸cas das suas}

coor-denadas s˜ao iguais

Xa_{(B) − X}a_{(A) = X}a_(B0_{) − X}a_(A0_),

para um dado sistema de coordenadas inerciais xa_{, e portanto para qualquer sistema}

inercial de coordenadas, atendendo à linearidade das transforma¸cões de Lorentz. A rela¸cão ∼ é uma rela¸cão de equivalência.

Defini¸c˜ao 5 Um vector do espa¸co-tempo de Minkowski é uma classe de equivalência de pares de acontecimentos f´ısicos (A, B), · · · , (A0_{, B}0_{) para a rela¸cão de equivalência}

definida por Xa_{(B) − X}a_{(A) = · · · = X}a_(B0_{) − X}a_(A0_).

Por outras palavras, identificamos um dado vector X com a coleçcão de todos os pares de pontos para os quais a diferen¸ca das coordenadas seja igual às componentes do

(31)

vector. O vector da classe de equivalˆencia a que pertence o par de pontos (A, B) representa-se por X ≡−→AB. Ou seja, o vector que permite associar o ponto B ao ponto A, B := A + X, tem componentes

Xc= Xc(B) − Xc(A)

Fazer uma transforma¸cão de coordenadas corresponde a fazer uma transforma¸cão de Lorentz, pelo que as componentes de X no novo sistema de coordenadas são dadas por

¯

Xa₌X

c

La cXc

onde L representa uma matriz de Lorentz. O conjunto das componentes de um vector num dado sistema de coordenadas caracteriza completamente o vector.

Por razões que se tornarão óbvias mais adiante, quando tratarmos com espa¸cos curvos, designaremos o conjunto de todos os vectores por TpM onde p é um ponto arbitrário

do espa¸co-tempo de Minkowski. Como TpM ≡ TqM, quaisquer que sejam os pontos

p e q de M, escrevemos o espa¸co tangente num ponto do espa¸co-tempo de Minkowski simplesmente como T.M. Trata-se de um espa¸co vectorial, uma vez definidas as

opera¸cões de adi¸cão entre elementos de TpM e multiplica¸cão por um escalar.

Assim, se X e Y s˜ao vectores de T.M, definimos o vector X + Y como aquele cujas

componentes s˜ao Xa _{+ Y}a_{, e de modo semelhante para o produto aX com a ∈ R.}

Note-se que embora tenhamos recorrido a coordenadas para definir vectores e adi¸cão de vectores, estas defini¸cões não dependem de um sistema de coordenadas particular, e são portanto independentes das coordenadas.

A defini¸cão de vector—segmento orientado que une dois ‘pontos’ da variedade—só é válida num espa¸co-tempo plano. Num tal espa¸co há outra maneira equivalente de defi-nir vector, mais adequada à indispensável generaliza¸cão deste conceito a uma variedade curva. Consideremos o segmento de recta

Γ(λ) = A + λ(B − A), λ ∈ [0, 1] ,

com λ = 0 correspondendo à origem e λ = 1 à extremidade, isto é, Γ(0) = A e Γ(1) = B. Definimos o vector tangente no ponto A de M4

0 como sendo

XA=

d

dλ[A + λ(B − A)] = B − A.

Esta defini¸c˜ao permite-nos substituir a ideia de um vector como um objecto dependendo de dois pontos por um conceito local

XA = Ã d dλΓ(λ) ! λ=0 , (1.36)

o vector tangente `a curva Γ(λ) no ponto A = Γ(λ = 0) ´e a derivada ao longo da curva no ponto A.