Cap´ıtulo 1
RELATIVIDADE RESTRITA E
ESPAC
¸ O-TEMPO PLANO
1.1
Coordenadas e Observadores Inerciais
O maior obst´aculo `a compreens˜ao da Teoria da Relatividade (Restrita e Geral) ´e a dificuldade de identificar de imediato os pressupostos subjacentes `a natureza do espa¸co e do tempo na teoria newtoniana, antes mesmo de construir o continuum 4-dimensional onde a teoria de Einstein ´e naturalmente descrita, como mostrou Herman Minkowski em 1908:
“Daqui em diante o espa¸co s´o por si e o tempo s´o por si est˜ao condenados a tornarem-se meras sombras, e s´o uma uni˜ao dos dois preservar´a uma realidade independente”.
Tanto na f´ısica newtoniana como na relatividade restrita, os observadores (ou refe-renciais) inerciais constituem uma classe privilegiada. Por´em, enquanto na f´ısica de Galileu e Newton os referenciais inerciais s˜ao considerados equivalentes para a descri¸c˜ao das leis da Mecˆanica, na relatividade restrita (RR) estes referenciais s˜ao equivalentes para descrever todas as leis f´ısicas. Para isso foi necess´ario generalizar a lei e esten-der o grupo de transforma¸c˜oes entre as coordenadas de dois observadores inerciais de modo a deixar as equa¸c˜oes de Maxwell invariantes, e com isso a pr´opria estrutura do espa¸co e do tempo foi reformulada culminando na constru¸c˜ao de um continuum 4-dimensional, o espa¸co-tempo, caracterizado por uma m´etrica pseudo-euclidiana, que automaticamente traduz os dois postulados da RR de Einstein.
Embora, na f´ısica newtoniana, falemos habitualmente do espa¸co e do tempo separa-damente e, s´o na relatividade restrita, falamos de espa¸co-tempo, em ambas as teorias
podemos falar de um espa¸co-tempo cont´ınuo, composto de acontecimentos (f´ısicos): sendo cada acontecimento definido por quatro coordenadas: (t, ~r) ≡ (t, x, y, z). Mas ´e claro, aquilo que ´e natural na RR, ´e algo artificial na Mecˆanica Newtoniana.
Todos os acontecimentos, pelo menos numa vizinhan¸ca de um dado acontecimento (ori-gem), podem ser unicamente caracterizados por 4 n´umeros reais (as suas coordenadas): dizemos que o espa¸co-tempo ´e uma variedade (diferenci´avel) 4-D, M4.
O mundo f´ısico da nossa experiˆencia, ´e agora representado por um espa¸co a quatro di-mens˜oes, o espa¸co-tempo. Cada ponto do espa¸co-tempo ´e um acontecimento f´ısico, representado por quatro coordenadas (t, x, y, z): t representa o instante e (x, y, z) d´a-nos a localiza¸c˜ao do acontecimento. Diferentes observadores (inerciais) usam coorde-nadas diferentes para o mesmo acontecimento. O conjunto de todos os acontecimentos da vida de um observador (ou de uma part´ıcula) formam uma traject´oria do espa¸co-tempo a que se d´a o nome de linha do Universo. Para os observadores inerciais as linhas do Universo s˜ao geod´esicas (neste caso, por se tratar de um espa¸co-tempo plano, linhas rectas) deste espa¸co-tempo. Se dois observadores se cruzam e tomam esse acontecimento como a origem das respectivas coordenadas de espa¸co e de tempo, a invariˆancia da velocidade da luz no v´acuo exige que
x2+ y2+ z2− c2t2 = x02+ y02+ z02− c2t02
onde (t, x, y, z) e (t0, x0, y0, z0) s˜ao as coordenadas dum mesmo acontecimento para cada
um dos observadores. `
A semelhan¸ca do que acontece com a geometria euclidiana, onde a generaliza¸c˜ao do teorema de Pit´agoras nos diz que
∆r2 = ∆x2+ ∆y2+ ∆z2
´e um comprimento invariante numa rota¸c˜ao, tamb´em a geometria do espa¸co-tempo da relatividade restrita pode ser caracterizada pelo invariante fundamental,
∆s2 = −c2∆t2+ ∆x2 + ∆y2+ ∆z2, (1.1)
que traduz a invariˆancia da velocidade da luz no v´acuo, e tamb´em ´e habitualmente interpretado como uma “distˆancia”entre dois pontos (acontecimentos) deste espa¸co-tempo a quatro dimens˜oes e, por isso, designado intervalo do Universo. Por´em, devido `a existˆencia de trˆes sinais positivos e um negativo (na linguagem matem´atica diz-se que se trata de uma forma quadr´atica indefinida) esta “distˆancia”nem sempre ´e positiva como na geometria euclidiana.
Dados dois acontecimentos cuja separa¸c˜ao espacial ´e ∆r e cuja separa¸c˜ao temporal ´e ∆t, trˆes situa¸c˜oes diferentes podem ocorrer
a) ∆r2−c2∆t2 = 0, a distˆancia entre os dois acontecimentos ´e exactamente percorrida
pela luz no intervalo de tempo que os separa. Diz-se que os dois acontecimentos formam um par tipo-luz.
b) ∆r2 − c2∆t2 < 0, a distˆancia entre os dois acontecimentos ´e menor que o espa¸co
percorrido pela luz no intervalo de tempo que os separa. Diz-se ent˜ao que os dois acontecimentos formam um par tipo-tempo.
c) ∆r2 − c2∆t2 > 0, no intervalo de tempo que separa os dois acontecimentos a luz
n˜ao pode percorrer a distˆancia que os separa. Diz-se neste caso que os dois acontecimentos formam um par tipo-espa¸co.
Todos os pares de acontecimentos que est˜ao numa rela¸c˜ao de causa-efeito pertencem `as categorias a) ou b). Nenhuma informa¸c˜ao pode ser transmitida com velocidade maior do que a da luz. Logo, dois acontecimentos que perten¸cam `a categoria c) n˜ao podem estar causalmente relacionados. Como as part´ıculas materiais viajam com uma velocidade inferior `a da luz em todos os referenciais inerciais, dois quaisquer aconteci-mentos da vida de uma part´ıcula material formam um par tipo-tempo para todos os observadores inerciais, isto ´e, a sua separa¸c˜ao temporal ´e maior do que a sua separa¸c˜ao espacial.
Como consequˆencia deste ´ultimo facto, vemos imediatamente que dados dois aconte-cimentos que formam um par do tipo tempo, eles pertencem necessariamente `a vida de uma dada part´ıcula material, e ocorrem no mesmo ponto do espa¸co no referencial pr´oprio dessa part´ıcula, isto ´e, no referencial onde a part´ıcula est´a em repouso. Por-tanto, dados dois acontecimentos que formam um par de tipo tempo, existe sempre um referencial onde eles ocorrem no mesmo ponto do espa¸co.
Por outro lado, dados dois acontecimentos que formam um par do tipo espa¸co, existe sempre um referencial onde s˜ao simultˆaneos, bastando para isso provar que eles se localizam necessariamente sobre um eixo espacial de um dado referencial inercial. Antes da teoria da RR, admitia-se que o espa¸co-tempo tinha a seguinte estrutura adicional: dado um acontecimento p do espa¸co-tempo, devia existir uma no¸c˜ao natural, independente-do-observador, de “acontecimentos que ocorrem no mesmo instante que p”(no¸c˜ao de simultaneidade com p). Mais precisamente, dados dois acontecimentos p e q, devia-se verificar uma das trˆes possibilidades mutuamente exclusivas:
[1] ´E poss´ıvel, em princ´ıpio, para um observador ou part´ıcula material, ir de um acontecimento q para outro acontecimento p: q 7→ p (diz-se, neste caso, que q pertence ao passado de p).
[2] ´E poss´ıvel, em princ´ıpio, para um observador ou part´ıcula material, ir de um acontecimento p para outro acontecimento q: p 7→ q (diz-se que q pertence ao futuro de p)
[3] ´E imposs´ıvel, em princ´ıpio, a um observador ou part´ıcula material, estar pre-sente em ambos os acontecimentos p e q (diz-se que p e q s˜ao acontecimentos simultˆaneos).
Na f´ısica Newtoniana sup˜oe-se que os acontecimentos que se encontram na terceira categoria formam um s´o conjunto 3-D e definem a no¸c˜ao de simultaneidade com p, enquanto que em RR existem infinitos conjuntos 3-D de acontecimentos simultˆaneos, nomeadamente quaisquer dois observadores inerciais distintos tˆem diferentes conjuntos de acontecimentos simultˆaneos com o acontecimento p. Em concreto, na teoria da RR tamb´em se verifica uma classifica¸c˜ao das rela¸c˜oes causais entre os acontecimentos, mas com a seguinte modifica¸c˜ao: devemos substituir (3) por
[3’] Os acontecimentos simultˆaneos com p formam mais do que um conjunto 3-D. Estes acontecimentos ainda se subdividem em:
[i] Acontecimentos que est˜ao na fronteira do conjunto de pontos que formam o futuro de p. Estes acontecimentos n˜ao podem ser atingidos por uma part´ıcula material que parta de p mas podem ser atingidos por sinais luminosos emitidos em p e formam o cone de luz do futuro de p (espa¸co 3-D).
[ii] Acontecimentos que formam o cone de luz do passado de p (espa¸co 3-D) definido de modo semelhante.
[iii] Acontecimentos que n˜ao est˜ao no futuro nem no passado de p e que se dizem espacialmente relacionados com p (os quais formam um conjunto 4-D).
O ponto essencial a destacar ´e o da ausˆencia de uma no¸c˜ao de simultaneidade absoluta em RR; n˜ao existem superf´ıcies 3-D espaciais absolutas no espa¸co-tempo, ao contr´ario do que acontece na f´ısica pr´e-relativista, onde os acontecimentos simultˆaneos com um dado acontecimento p formam uma superf´ıcie 3-D (´unica) no espa¸co-tempo. Ainda ´e poss´ıvel a um observador em RR definir acontecimentos simultˆaneos com um dado acontecimento p–definindo assim uma superf´ıcie 3-D no espa¸co-tempo–mas essa no¸c˜ao depende do seu estado de movimento.
1.1.1
Postulados da Relatividade Restrita
Em 1905 A. Einstein constr´oi a teoria da RR partindo dos seguintes postulados: Postulado 1 Os observadores inerciais s˜ao equivalentes para a formula¸c˜ao de todas as leis f´ısicas.
Postulado 2 A luz propaga-se no v´acuo com uma velocidade finita c, a mesma para todos os observadores inerciais, independentemente da velocidade relativa entre a fonte e o observador. (Princ´ıpio da Invariˆancia da velocidade da luz).
O primeiro postulado (P1), conhecido por Princ´ıpio da Relatividade de Einstein, assume a equivalˆencia dos referenciais de in´ercia (RI). E o segundo postulado (P2), afirma a invariˆancia da velocidade da luz no v´acuo.
Importa esclarecer alguns pontos. Um referencial inercial ´e um sistema de referˆencia onde as part´ıculas livres se movem com velocidade uniforme segundo linhas rectas no espa¸co (e no espa¸co-tempo). Por observador inercial entendemos um observador em repouso num referencial inercial, conhecido por referencial pr´oprio, equipado com os respectivos instrumentos de medida (rel´ogios e r´eguas).
Note que, de acordo com o Princ´ıpio da Relatividade de Galileu, os observadores iner-ciais tamb´em s˜ao equivalentes, mas s´o para as experiˆencias da mecˆanica de Galileu-Newton.
1.1.2
O efeito de Doppler e a dilata¸c˜
ao do tempo
Vamos come¸car por examinar o efeito do movimento relativo sobre a taxa de progress˜ao do tempo medido por dois observadores inerciais distintos. Consideremos ent˜ao dois observadores inerciais, sejam eles Duarte e Mariana, em movimento relativo com ve-locidade v. Vejamos como podem estes observadores medir a sua distˆancia relativa num dado instante do tempo pr´oprio de um deles, isto ´e, o tempo medido no refe-rencial onde o observador est´a parado. Comecemos por admitir que os observadores se cruzaram num instante anterior e, nesse instante, acertaram os seus rel´ogios. Para medir distˆancias e comparar os tempos dos seus rel´ogios, Duarte e Mariana podem trocar sinais “luminosos”que, de acordo com o segundo postulado, se deslocam com velocidade c em rela¸c˜ao a qualquer deles.
O Duarte poder´a medir a que distˆancia se encontra a Mariana, num dado instante do seu tempo pr´oprio, se enviar um sinal luminoso no instante tA, que ser´a entretanto
reflectido pela Mariana e chega de novo ao Duarte no instante posterior tB > tA. Dir´a
ent˜ao que a Mariana estava `a distˆancia d = (tB− tA)/2 segundos-luz (se assumirmos
c = 1, e medirmos o espa¸co e o tempo em segundos-luz) no momento em que o sinal luminoso foi reflectido pela Mariana. O instante correspondente a esse acontecimento, tC, tamb´em facilmente se calcula, no referencial pr´oprio do Duarte, em fun¸c˜ao de tA e
tB,
tC =
1
2(tA+ tB).
Mas ´e claro que a um intervalo de tempo T , no referencial do Duarte, corresponde um intervalo maior T0 = KT, k > 1 no referencial da Mariana. Se n˜ao vejamos isso com
o aux´ılio do seguinte exemplo (ver Fig(1.1)). Suponhamos que a Mariana se afasta do Duarte com uma velocidade v = 0.6(c = 1), e que o Duarte envia os seus sinais para a Mariana a intervalos regulares de 6 meses do seu tempo pr´oprio. Quando envia o primeiro sinal, estando a Mariana j´a a uma distˆancia de 0.5 anos-luz, ent˜ao o sinal leva 1.25 anos a atingi-la. Seis meses depois de enviar o primeiro sinal, Duarte envia o
T
T'=KT
D M
Figura 1.1: O Duarte envia dois sinais luminosos para a Mariana, separados de um intervalo T . A Mariana recebe esses sinais separados de um intervalo maior T0 = KT ,
onde K > 1 ´e fun¸c˜ao da velocidade relativa entre os 2 observadores inerciais. segundo sinal luminoso. Durante esse tempo T = 1
2 ano-luz, a Mariana afastou-se mais
0.3 anos-luz, de modo que o sinal luminoso vai ter de percorrer uma distˆancia maior para atingi-la. De modo que, pelo menos do ponto de vista do Duarte, ´e evidente que a um intervalo de 6 meses entre dois sinais emitidos corresponde um intervalo maior entre os dois sinais recebidos pela Mariana; concretamente, Duarte mede um intervalo entre os dois sinais recebidos pela Mariana de 1.25 anos. Isto n˜ao nos diz ainda qual o intervalo de tempo medido pela Mariana, mas ´e com certeza uma indica¸c˜ao de que esse intervalo n˜ao ser´a 6 meses, como para o Duarte. Um efeito semelhante ocorrer´a se os sinais fossem agora enviados da Mariana para o Duarte. E ´e de esperar, que sendo a velocidade relativa a mesma, que o factor K que relaciona os intervalos de tempo seja o mesmo. Como veremos a partir das f´ormulas deduzidas adiante, no nosso caso K = 2 e portanto ao intervalo de 6 meses do Duarte corresponde um intervalo de 1 ano na recep¸c˜ao desses mesmos sinais pela Mariana. E se os sinais recebidos pela Mariana forem (imediatamente) reflectidos de modo a regressarem ao Duarte, este recebˆe-los-´a separados de dois anos (ver Fig(1.2)).
Consideremos ent˜ao dois observadores inerciais em movimento relativo, que podem continuar a ser o Duarte e a Mariana. Duarte envia um sinal luminoso, espera um intervalo de tempo T do seu rel´ogio (tempo pr´oprio), e envia ent˜ao um segundo sinal. A Mariana mede um intervalo de tempo entre a recep¸c˜ao desses dois sinais como sendo
T0 = KT (1.2)
Se a Mariana estivesse em repouso em rela¸c˜ao ao Duarte, ent˜ao ter´ıamos K = 1, isto ´e, os intervalos de tempo seriam os mesmos para os dois observadores. Neste caso, as suas linhas do Universo seriam paralelas. Mas se os observadores se afastam
T
T'=KT
D M
T''=KT'
anos-luz
Figura 1.2: O Duarte envia dois sinais luminosos para a Mariana, separados de um intervalo T , e esta devolve-os assim que os recebe.
K > 1, e se os observadores se aproximam K < 1. Se soubermos a velocidade entre os 2 observadores facilmente poderemos determinar K. Na verdade, se os rel´ogios da Mariana e do Duarte foram previamente acertados, quando a Mariana se cruzou com o Duarte, ent˜ao a partir das coordenadas do acontecimento C da Fig. (1.3) poderemos relacionar K com a velocidade v,
tC = 12(tA+ tB) = 12(K2T + T ) xC = 12(tB− tA) = 12(K2T − T ) (1.3) Logo, vem v = xC tC = K 2− 1 K2+ 1 ⇒ K = s 1 + v 1 − v. (1.4)
Note-se que daqui tamb´em se pode obter a f´ormula da dilata¸c˜ao do tempo, com-parando o tempo entre 2 acontecimentos que ocorrem no mesmo ponto do espa¸co de um dado observador, e em pontos do espa¸co diferentes do outro observador. Assim, t0 C = T0 = KT com tC = (K2+ 1)T /2 vem t0 C tC = 2K K2+ 1 = √ 1 − v2, e portanto, T0 = t√1 − v2 (1.5)
Uma das formas mais pr´aticas de medir a quantidade K ´e atrav´es da medi¸c˜ao do comprimento de onda (c.d.o.) da luz observada, ou de qualquer outra radia¸c˜ao elec-tromagn´etica, desde que se conhe¸ca o c.d.o. da radia¸c˜ao emitida. Esta ´e a base das
KT=T ' T KT ' A B C t C Duarte Mariana
Figura 1.3: No instante tA, Duarte envia um sinal luminoso para Mariana, que o devolve
imediatamente no instante tC de Duarte. Este recebe-o de volta no seu instante tB.
medidas de deslocamento para o vermelho da radia¸c˜ao emitida por um corpo que se afasta do observador.
Se um observador se afasta de n´os, o Duarte por exemplo, e envia uma radia¸c˜ao de c.d.o. λe, vamos recebˆe-la com c.d.o. dado por
λo= Kλe, (1.6)
pois o per´ıodo da radia¸c˜ao emitida ´e dado λe = c∆τe, e a este per´ıodo corresponde
∆τo = K∆τe, para o per´ıodo da radia¸c˜ao observada, de acordo com a eq.(1.2).
Esta mudan¸ca de c.d.o. ´e f´acil de medir directamente a partir do espectro da luz recebida. Pode fazer-se esta medida atrav´es da identifica¸c˜ao no espectro observado de uma linha cujo c.d.o. ´e conhecido na fonte (como ´e o caso da ‘linha α’de c.d.o. 121.5 nm do espectro do Hidrog´enio), que depois ´e comparado com o c.d.o. recebido. Com frequˆencia, o resultado da medida ´e expresso em termos do parˆametro do deslocamento para o vermelho,z, definido por
1 + z = λo λe
= K. (1.7)
Com este resultado ficamos a perceber que K, conhecido por factor de Bondi, est´a associado ao efeito de Doppler entre dois observadores inerciais em movimento relativo.
1.1.3
A adi¸c˜
ao de velocidades
Consideremos agora trˆes observadores inerciais, cujas linhas do Universo s˜ao dadas pela Fig.(1.3) Nesta figura o observador B tem velocidade v1 em rela¸c˜ao a A, e observador
T
T'
A B
T'' C
Figura 1.4: O observador B afasta-se do observador A com velocidade v1 e o observador
C afasta-se do observador B com velocidade v2
C tem uma velocidade v2 em rela¸c˜ao a B. Pretendemos saber qual ´e a velocidade
relativa, v12, de C em rela¸c˜ao a O. Atendendo `a linearidade entre K e v, ´e de esperar
que
T0 = K1T, T00= K12T.
Mas tamb´em podemos admitir que o observador B emite sinais para C separados de um intervalo T0, pelo que
T00 = K
2T0.
Combinando as rela¸c˜oes anteriores conclu´ımos que T00 = K
BCKABT e portanto
KAC = KABKBC, (1.8)
Atendendo `a rela¸c˜ao entre o factor de Bondi e a velocidade eqs.(1.4), vAC = K 2 AC− 1 K2 AC + 1 = K 2 ABKBC2 − 1 K2 ABKBC2 + 1 ou vAC = 1 + vAB 1 − vAB 1 + vBC 1 − vBC − 1 1 + vAB 1 − vAB 1 + vBC 1 − vBC + 1 = vAB+ vBC 1 + vABvBC (1.9)
Com base nesta f´ormula de composi¸c˜ao de velocidades, vemos que a velocidade da luz n˜ao pode ser ultrapassada: se uma destas velocidades vAB ou vBC ´e igual a c = 1, a
velocidade resultante vem vAC = 1.
1.1.4
Dedu¸c˜
ao das transforma¸c˜
oes de Lorentz
A partir das considera¸c˜oes anteriores, ´e f´acil obter as f´ormulas de Transforma¸c˜ao de Lorentz, ou seja, as rela¸c˜oes que permitem converter as coordenadas de espa¸co e de tempo de um acontecimento, observado num dado referencial (inercial), com as coorde-nadas correspondentes do mesmo acontecimento num outro referencial (inercial). Para isso consideremos a Fig.(1.5)
O A P P' Q Q'
Figura 1.5: Dois observadores cruzam-se no acontecimento O e acertam os seus rel´ogios. No acontecimento P ´e enviado um sinal luminoso, que se cruza com o outro observador em P0 e ´e reflectido no acontecimento, regressando ao mesmo ponto do espa¸co. No seu
Chamando S e S0 os dois referenciais, temos em S tA = 12(tP + tQ) xA = 12(tQ− tP) (1.10) e em S0 t0 A = 12(t0P0+ t0Q0) x0 A = 12(t0Q0− t0P0) (1.11) Tendo em conta que t0
P0 = KtP e tQ= Kt0Q0, vem para um acontecimento A arbitr´ario
t0− x0 = K(t − x)
t + x = K(t0+ x0)
donde se deduz: −t02+ x02= −t2+ x2, bem como t0 = 1 2(K + K−1)t − 12(K − K−1)x = γ(x − vt) x0 = 1 2(K + K−1)x −12(K + K−1)t = γ(t − vx) (1.12) com γ = √ 1 1 − v2.
Assim, segundo Einstein, dados dois observadores inerciais arbitr´arios, O e O0, as
coordenadas de um certo acontecimento P est˜ao relacionadas entre si por uma trans-forma¸c˜ao de Lorentz, definida no caso particular em que v s´o tem componente segundo x, e os dois referenciais est˜ao igualmente orientados por
x0 = γ(x − vt) y0 = y z0 = z t0 = γ(t − vx/c2) transforma¸c˜ao de Lorentz (1.13) e onde γ = q 1 1 − v2/c2.
Representando as coordenadas de O0 por uma barra em vez de uma plica, e
multipli-cando a coordenada temporal pela velocidade da luz no v´acuo, c, para que todas as coordenadas fiquem com a mesma dimens˜ao espacial, podemos escrever as coordenadas do mesmo acontecimento f´ısico nos dois referenciais inerciais
xa= (ct, x, y, z) e ¯xc = (¯t, ¯x, ¯y, ¯z), com c = (0, 1, 2, 3). (1.14) e podemos escrever a transforma¸c˜ao de Lorentz como uma rela¸c˜ao matricial ¯X = L X dada por ¯ xc=X3 a=0 Lc axa, (1.15)
onde Lc
a representa a matriz da transforma¸c˜ao de Lorentz. Note que os dois ´ındices
c e a dizem respeito a sistemas de coordenadas diferentes; por essa raz˜ao talvez fosse prefer´ıvel representar a matriz da transforma¸c˜ao de Lorentz por Lc0
a e a transforma¸c˜ao
das coordenadas por
xc0 = 3 X a=0 Lca0 xa. (1.16)
1.2
Espa¸co-tempo de Minkowski
A invariˆancia da velocidade da luz no v´acuo, c, implica a invariˆancia da forma qua-dr´atica
s2 = −c2t2 + x2+ y2+ z2 = −c2¯t2 + ¯x2+ ¯y2+ ¯z2, (1.17) conhecida por intervalo do Universo. Esta forma quadr´atica caracteriza um espa¸co 4-dimensional a que chamamos espa¸co-tempo de Minkowski, M4
0, en honra de Hermann
Minkowski que o propˆos em Setembro de 1908 como o espa¸co adequado `a descri¸c˜ao da teoria da RR de Einstein.
Recordemos que, devido `a constˆancia da velocidade da luz e `a isotropia da sua pro-paga¸c˜ao no v´acuo, uma vez emitido um sinal luminoso num dado ponto do espa¸co e num dado instante, que se tomam respectivamente como origens espacial e temporal dos referenciais S e S0, este satisfaz simultaneamente as equa¸c˜oes
x2 + y2+ z2− c2t2 = ¯x2+ ¯y2+ ¯z2− c2¯t2 = 0,
ou seja, os pontos do espa¸co que num dado instante de cada referencial se encontram na mesma fase de vibra¸c˜ao formam uma onda esf´erica que est´a centrada na origem do referencial respectivo. Tendo em conta as transforma¸c˜oes de Lorentz e a relatividade do espa¸co e do tempo, escusado ser´a dizer que o conjunto dos pontos do espa¸co que est˜ao na mesma fase de vibra¸c˜ao para os observadores de S ´e diferente dos pontos do espa¸co que est˜ao na mesma fase de vibra¸c˜ao em S´. S´o assim se poder´a compreender que em ambos os referenciais os respectivos observadores vejam uma onda luminosa esf´erica em torno de cada um deles.
1.2.1
Intervalo do Espa¸co-tempo e cone de luz
A equa¸c˜ao anterior permite definir a quantidade invariante dada por (1.1), isto ´e, uma quantidade que toma a mesma forma em todos os referenciais inerciais—relacionados entre si por uma transforma¸c˜ao de Lorentz—indissoluvelmente ligada `a invariˆancia da velocidade da luz, e que no caso de 2 acontecimentos cujas coordenadas tˆem valores infinitesimalmente pr´oximos, se escreve
Este invariante pode ser entendido como uma generaliza¸c˜ao da defini¸c˜ao habitual de distˆancia a um espa¸co a quatro dimens˜oes, o conhecido por espa¸co-tempo de Minkows-ki1, e ´e conhecido por intervalo do Universo entre o acontecimento origem (ct, x, y, z)
e o acontecimento de coordenadas (c(t + dt), x + dx, y + dy, z + dz). Na verdade, tal como a f´ormula euclidiana ∆x2 + ∆y2 + ∆z2 = ∆r2 caracteriza o espa¸co ordin´ario
3-dimensional, e representa o quadrado da distˆancia entre dois pontos cujas coordenadas diferem (∆x, ∆y, ∆z), tamb´em a f´ormula ∆r2 − c2∆t2 pode servir para caracterizar o
espa¸co-tempo de Minkowski e poder´a igualmente designar o quadrado da distˆancia entre dois acontecimento cujas coordenadas diferem (∆r, c∆t), neste espa¸co-tempo 4-dimensional.
Exerc´ıcio 1 Verifique que a as transforma¸c˜oes de Lorentz (1.13)satisfazem a rela¸c˜ao de invariˆancia (1.1).
1.2.2
Pares de acontecimentos e estrutura causal
Consideremos dois acontecimentos infinitesimalmente pr´oximos. Reduzindo o espa¸co-tempo a duas dimens˜oes, uma dimens˜ao espacial e uma espa¸co-temporal, e fazendo coincidir essa direc¸c˜ao espacial com a direc¸c˜ao da velocidade relativa entre os dois referenciais, escrevemos o intervalo infinitesimal
ds2 = dx2− c2dt2 = d¯x2− c2d¯t2. (1.19)
Se os 2 acontecimentos ocorrem no mesmo ponto de S0, d¯x = 0 ⇒ ds2 < 0, e podemos
escrever (1.5) da seguinte forma
dx2− c2dt2 = −c2d¯t2 e portanto d¯t = dt s 1 − v2 c2 (1.20)
onde v = dx/dt ´e a velocidade de S0 em S.
Conclu´ımos que o intervalo de tempo ´e diferente em S e S0 e que ´e mais curto no
refe-rencial onde os acontecimentos ocorrem no mesmo ponto do espa¸co. Esse referefe-rencial, 1Hermann Minkowski foi o primeiro a mostrar em 1908 que: “daqui em diante o espa¸co s´o por si e
o tempo s´o por si est˜ao condenados a tornarem-se meras sombras, e s´o uma uni˜ao dos dois preservar´a uma realidade independente”.
neste caso S0, designa-se referencial pr´oprio para esses acontecimentos. Assim, em
qualquer referencial diferente do referencial pr´oprio o tempo ´e dilatado. Note-se ainda que embora d¯x = 0, dx = vdt 6= 0 (use as transforma¸c˜oes de Lorentz (1.13)), isto ´e, os dois acontecimentos ocorrem no mesmo ponto de S0 mas ocorrem em pontos diferentes
de S.
Consideremos agora d¯t = 0 (acontecimentos simultˆaneos em S0). Vem ds2 > 0 e usando
as TL vemos que dt = vdx/c2, logo
ds2 = dx2− c2dt2 = d¯x2 > 0 (par tipo-espa¸co).
Vemos que acontecimentos simultˆaneos em S0, e que ocorrem em pontos diferentes do
espa¸co de S0, n˜ao s˜ao simultˆaneos em S : dt 6= 0.
1.2.3
Diagramas de espa¸co-tempo
Os diagramas de espa¸co-tempo, vulgarmente conhecidos por diagramas de Minkows-ki, tˆem um papel pedag´ogico relevante na assimila¸c˜ao dos efeitos cinem´aticos da RR (dilata¸c˜ao do tempo e contrac¸c˜ao do espa¸co) e na compreens˜ao da estrutura causal do espa¸co-tempo plano. Estes diagramas s˜ao, ali´as, um bom ponto de partida para introduzir os conceitos fundamentais da RR. Mas aqui poder˜ao ter uma fun¸c˜ao com-plementar da discuss˜ao alg´ebrica anterior.
Comecemos por usar os diagramas do espa¸co-tempo para evidenciar o car´acter relativo da simultaneidade entre acontecimentos distantes no espa¸co. Observemos as figuras (1.6) e (1.7), O x x' t t' A simultaneidade em S simultaneidade em S A'
Figura 1.6: Os acontecimentos simultˆaneos em S est˜ao sobre linhas paralelas ao eixo do x. Por exemplo, os acontecimentos (O, A) s˜ao simultˆaneos em S.
onde se observam os pares (O, A) e (O, A0). O primeiro par ´e constitu´ıdo por
acon-tecimentos simultˆaneos em S e o segundo por aconacon-tecimentos simultˆaneos em S0. As
linhas de simultaneidade em cada um dos referenciais, S e S0, s˜ao paralelas aos eixos
x e x0 ≡ ¯x, respectivamente. O x x' t t' simultaneidade em S' simultaneidade em S' A' A
Figura 1.7: Os acontecimentos simultˆaneos em S0 est˜ao sobre linhas paralelas ao eixo
x0. Por exemplo, os acontecimentos (O, A0) s˜ao simultˆaneos em S0 : ¯t
A0 = ¯tO = 0. Mas
claramente, tA0 > tO = 0. Note que a plica em t0A0 refere-se ao tempo ¯t no referencial
S0.
Dilata¸c˜ao do tempo
Vimos j´a que dados dois acontecimentos que formam um par no tempo, h´a um refe-rencial onde eles ocorrem no mesmo ponto do espa¸co, o chamado referefe-rencial pr´oprio. Em qualquer outro referencial, o intervalo de tempo entre esses mesmos dois aconte-cimentos ´e maior do que o intervalo de tempo pr´oprio. E por essa raz˜ao se fala em dilata¸c˜ao do tempo. Este facto, j´a conhecido e discutido previamente em termos alg´ebricos, torna-se muito evidente com o aux´ılio do diagrama de espa¸co-tempo que se segue (1.8).
Tendo em conta a invariˆancia do intervalo do Universo, associada ao grupo de Lorentz, temos para o par temporal (O, C)
∆s2
OC = −t2C+ x2C = −t02C ⇒ t2C = x2C+ t02C (1.21)
conclu´ımos que t0
C < tC, e os acontecimentos O, C e B ocorrem todos na origem espacial
de S.
Este diagrama representa a seguinte situa¸c˜ao f´ısica: um rel´ogio de S0 desloca-se em
rela¸c˜ao a S com velocidade v = xC/tC, e no seu percurso cruza-se com dois rel´ogios
x=t C B A O –1 0 1 2 3 4 t –4 –3 –2 –1 1 2 3 4 x
Figura 1.8: O ramo de hip´erbole que passa pelos pontos A e B define o lugar geom´etrico dos pontos do espa¸co-tempo (acontecimentos) que est˜ao `a mesma distˆancia da origem do sistema de coordenadas. Logo, tA = t0B e como t0C < tB0 e tA = tC vem t0C < tC.
Tenha em aten¸c˜ao que estamos a admitir que o eixo do tempo do referencial S passa pelos pontos O e A e que o eixo do referencial S0 passa pelos pontos O, C e B.
espaciais x = 0 e x = xC. Atendendo `a figura, vemos que o rel´ogio de S0 ´e acertado
pelo rel´ogio de S colocado na origem espacial, de modo que ambos come¸cam a marcar t = 0 e t0 = 0 no mesmo acontecimento O. Quando o rel´ogio de S0 se cruza com o
outro rel´ogio de S que est´a a marcar tC, marca o tempo t0C < tC, e por isso se diz que
o rel´ogio de S0 se atrasa em rela¸c˜ao aos dois rel´ogios de S. O valor exacto do atraso ´e
f´acil de determinar a partir da equa¸c˜ao (1.21), t2
C − x2C = t02C ⇒ t0C = tC
q
1 − x2
C/t2C (1.22)
Fixemos assim esta ideia simples: na dilata¸c˜ao do tempo compara-se o intervalo de tempo entre dois acontecimentos, medido por um mesmo rel´ogio (tempo pr´oprio), com o intervalo correspondente medido por dois outros rel´ogios. Isto sup˜oe que os dois acontecimentos ocorrem no mesmo ponto do espa¸co do primeiro rel´ogio, e em pontos do espa¸co diferentes no referencial dos outros dois rel´ogios, localizados onde esses mesmos dois acontecimentos ocorrem. Sendo o movimento um conceito relativo, n˜ao podemos pois afirmar simplesmente que os rel´ogios em movimento se atrasam em rela¸c˜ao aos rel´ogios em repouso. Mas sim que havendo um movimento relativo entre um rel´ogio de um referencial e dois rel´ogios de outro, o rel´ogio do primeiro referencial atrasa-se em rela¸c˜ao aos dois rel´ogios do outro, entendendo-se que os acontecimentos em causa, cujo intervalo de tempo se est´a a medir, ocorrem no mesmo ponto do espa¸co do primeiro referencial, e em dois pontos distintos do espa¸co do segundo referencial, onde est˜ao localizados os dois rel´ogios (previamente sincronizados). A melhor forma de introduzir implicitamente a no¸c˜ao de movimento e sintetizar o resultado anterior ´e afirmar que o tempo pr´oprio entre dois acontecimentos ´e sempre mais curto que o tempo correspondente medido noutro referencial qualquer, onde os acontecimentos ocorrem em pontos do espa¸co diferentes.
Contrac¸c˜ao de Comprimentos
Pelo que vimos anteriormente, h´a uma perfeita simetria entre os diferentes referenci-ais inercireferenci-ais. A dilata¸c˜ao do tempo ocorre porque se faz uma compara¸c˜ao entre um rel´ogio de um referencial e dois rel´ogios espacialmente separados de outro referenci-al. E embora possa sincronizar quantos rel´ogios quiser de um mesmo referencial, n˜ao posso sincronizar v´arios rel´ogios de referenciais diferentes. Isto ´e uma consequˆencia do car´acter relativo da simultaneidade entre acontecimentos espacialmente separados, que naturalmente decorre da finitude da velocidade da luz (no v´acuo). De igual modo, os comprimentos na direc¸c˜ao do movimento ser˜ao sempre maiores no referencial pr´oprio e ser˜ao observados contra´ıdos em todos os outros referencias em rela¸c˜ao aos quais os objectos se movem.
Na realidade, a dilata¸c˜ao do tempo e a contrac¸c˜ao dos comprimentos n˜ao s˜ao efeitos independentes, na mesma medida em que o tempo e o espa¸co n˜ao s˜ao coordenadas independentes. Recordemos a afirma¸c˜ao de Minkowski a prop´osito da constru¸c˜ao do espa¸co-tempo. Para medir o comprimento de uma barra que se desloca longitudinal-mente, devo observar simultaneamente as suas extremidades e assim determinar as suas coordenadas.
Na Fig. (1.9) vemos que as extremidades da barra, que est´a em repouso em S0,
descre-vem duas linhas do Universo paralelas; a primeira passa pela origem O, e coincide com o eixo t0, e a segunda passa pelos acontecimentos A e B. Claramente, o comprimento
da barra em S0 ´e dado por x0
B, visto que x0O = 0, e o comprimento em S ´e xA = 1
unidade da escala, e sabemos pela observa¸c˜ao da hip´erbole que xA< x0B. Note que se
verificam as seguintes rela¸c˜oes:
x2A = x02A− t02A= x02B³1 − v2´ (1.23) xA = x0B
√
1 − v2 = 1 (1.24)
1.2.4
Resolu¸c˜
ao do paradoxo dos g´
emeos
Nos ´ultimos anos tˆem surgido na literatura da especialidade muitos trabalhos sobre as “M´aquinas do Tempo”, isto ´e, constru¸c˜oes geom´etricas de espa¸co-tempo, solu¸c˜oes das equa¸c˜oes de Einstein da Gravita¸c˜ao, que admitem curvas temporais fechadas: qual-quer observador que seguisse ao longo dessas linhas do Universo poderia re-visitar o seu passado. Na sequˆencia dessa discuss˜ao voltaram a aparecer artigos sobre o chamado paradoxo dos g´emeos e sua resolu¸c˜ao no ˆambito da teoria da relatividade (restrita). O paradoxo dos g´emeos (tamb´em conhecido por paradoxo de Langevin) ´e uma “expe-riˆencia de pensamento”, esquematizada na figura (1.10), onde dois g´emeos se separam num dado instante, iniciando um deles uma viagem numa nave que se desloca a uma velocidade pr´oxima da velocidade da luz (v ≈ 1) at´e uma estrela distante, e regressa logo em seguida `a Terra. Ao encontrar-se com o seu g´emeo que ficou na Terra verifica
A B x=t x’ t’ 0 1 2 3 4 t 1 2 3 4 x
Figura 1.9: O ramo de hip´erbole que passa pelo ponto A define o lugar geom´etrico dos pontos do espa¸co-tempo (acontecimentos) que est˜ao `a distˆancia de uma unidade da origem do sistema de coordenadas. Ora, os acontecimentos O e B s˜ao simultˆaneos em S0 e, por isso permitem medir o comprimento pr´oprio da barra em S0, o qual ´e
claramente maior que o comprimento medido a partir de S a partir dos acontecimentos O e A, simultˆaneos em S. Note que o ramo de hip´erbole intersecta a barra num ponto com x0 < x0
B.
que este est´a muito mais velho, significando isto que o tempo anda mais lentamente para o g´emeo viajante.
Comecemos por esclarecer dois pontos sobre os quais se teceram, sobretudo na literatura mais antiga, muitas considera¸c˜oes err´oneas que devem ser clarificadas desde o in´ıcio. Em primeiro lugar, a quest˜ao em ep´ıgrafe n˜ao ´e de modo algum um paradoxo da teoria da relatividade, e em segundo lugar n˜ao ´e necess´ario invocar a teoria da relatividade generalizada para a resolver. Estas duas confus˜oes eram justificadas com os seguintes argumentos: sendo o movimento um conceito relativo, qualquer dos g´emeos poderia admitir que estava em repouso no seu referencial e o outro em movimento. Sendo assim n˜ao se percebia a assimetria do resultado. ´E contra o senso comum admitir que dois g´emeos possam ter idade diferente. Ainda por cima isso era explicado como uma consequˆencia do movimento relativo entre os dois g´emeos. Ora, na verdade n˜ao h´a simetria entre os dois g´emeos pois um deles poder´a ser considerado inercial (o que ficou na Terra) mas o viajante, que vai e volta, sofre algures no seu trajecto uma acelera¸c˜ao para poder inverter o sentido da viagem e poder voltar `a Terra. S´o assim os dois g´emeos se poder˜ao voltar a cruzar depois de se terem separado.
t
O
x
A
B
10
3
3
Figura 1.10: Dois g´emeos separam-se no instante O, em que acertam os seus rel´ogios um pelo outro, ficando um deles em repouso no referencial do laborat´orio (Terra), com coordenadas (t, x) enquanto o outro viaja, com velocidade v = 0.8 (c = 1), at´e uma estrela a 8 anos-luz da Terra, e no instante em que l´a chega (acontecimento B) regressa de imediato ao mesmo ponto do espa¸co onde tinha ficado o primeiro g´emeo (acontecimento A).
Retomando o nosso exemplo dos g´emeos, vamos ent˜ao concretiz´a-lo para o analisar em pormenor (ver Fig.1.10). Sejam as nossas g´emeas Patty e Selma Bouvier, as irm˜as mais velhas de Marge Simpson. Admitamos que Patty fica c´a na Terra enquanto Selma se desloca numa nave espacial, at´e um planeta distante (`a procura do terceiro marido), com uma velocidade v = 0.8(c = 1), em rela¸c˜ao `a Terra (e a Patty). Se Selma se afasta da Terra durante 3 anos do seu tempo pr´oprio, τ , ent˜ao do ponto de vista de Patty, a viagem de ida ocorre num tempo dilatado e demora
t = √ τ
1 − v2 =
3 √
1 − 0.82 = 5 anos.
Como tal, Selma afasta-se uma distˆancia de 4 anos-luz, de acordo com os observadores do referencial Terra. Com estes dados podemos escrever o intervalo do espa¸co-tempo para o par de acontecimentos (O,B),
τ2 = t2− x2 → 32 = 52− 42,
que exprime a invariˆancia da velocidade da luz (no v´acuo). Note-se igualmente que, para a g´emea viajante, o espa¸co percorrido ´e uma contrac¸c˜ao do espa¸co medido por Patty, isto ´e,
x0 = x√1 − v2 = 4 × 0.6 = 2.4 anos-luz.
O que est´a em concordˆancia com o tempo medido pelo rel´ogio de Selma, onde s´o tinha passado τ = x0/v = 2.4/0.8 = 3 anos. Admitindo que esta regressa de imediato `a
Terra com a mesma velocidade v = 0.8, as duas g´emeas voltam a encontrar-se passados 10(=8/0.8) anos, no referencial de Patty, ap´os a partida de Selma, mas simplesmente 4.8 anos no rel´ogio de Selma. Em resumo as duas “g´emeas”fazem agora uma diferen¸ca de 5.2 anos de idade, sendo Patty a mais velha. Este ´e sempre um resultado surpreendente, por muita familiaridade que tenhamos com a teoria da relatividade.
t
t'
T
O
x
Bx
A
C
D
t
BB
x'
Figura 1.11: As duas g´emeos separam-se no instante O, quando t = t0 = 0; no instante
tA = 1 (ano) sai um sinal luminoso de Patty que chega a Selma no acontecimento B
(t0
B = 3 anos). Este mesmo acontecimento ´e visto por Patty no instante tC = 9 anos.
Continuando a nossa an´alise, vamos admitir que as duas g´emeas est˜ao munidas de po-tentes telesc´opios de modo a poderem observar os rel´ogios de pulso uma da outra, para procurarem compreender em que medida o tempo ´e relativo. Assim, Selma vai obser-vando o rel´ogio de Patty ao longo da viagem e regista o valor observado no momento em que atinge o afastamento m´aximo da Terra e inicia o seu regresso (acontecimento B, no diagrama da Fig.1.11). Selma vˆe o rel´ogio de Patty marcar tA= 1 ano, quando
o seu rel´ogio marca t0
B = 3 anos, pois
t0 = Kt =
s
1 + v
1 − vt = 3 × t,
atendendo ao efeito de Doppler. Por outro lado, Patty vˆe Selma atingir o acontecimento B, e a iniciar o regresso, quando o seu rel´ogio marca 9 anos, pois para Patty, a sua g´emea viajante leva 5 anos a atingir o planeta distante e a luz leva mais 4 anos a regressar `a Terra, mostrando Selma a chegar ao planeta distante. Assim para Patty o rel´ogio de Selma, que marca 3 anos, parece estar a trabalhar a um ter¸co da velocidade do seu rel´ogio (3/9). Exactamente como acontece com Selma que vˆe o rel´ogio de Patty trabalhar a um ter¸co da velocidade do seu (1/3).
Na viagem de regresso, Patty vˆe o rel´ogio de Selma passar de 3 anos para 6 anos num s´o ano do seu rel´ogio: intervalo de tempo tD − tC do rel´ogio de Patty. Ou seja, Patty
vˆe agora o rel´ogio de Selma avan¸car 3 anos num ano do seu tempo pr´oprio, o que corresponde a uma velocidade trˆes vezes maior. Por sua vez Selma vˆe, durante o seu regresso, o rel´ogio de Patty avan¸car de 1 ano para 10 anos, enquanto o seu rel´ogio marca um tempo pr´oprio de trˆes anos. Selma ´e tamb´em levada a concluir que ela vˆe o rel´ogio de Patty a trabalhar a uma velocidade trˆes vezes maior do que o seu. E ambas concordam que no fim da viagem, tˆem idades diferentes estando Patty 5.2 anos mais velha que Selma, a g´emea viajante, que n˜ao teve tempo de encontrar o terceiro marido no planeta distante. A diferen¸ca de idades deve ser entendida como uma consequˆencia da assimetria entre as duas g´emeas: Patty ficou sempre no mesmo referencial (inercial) Terra, enquanto Selma teve que mudar de referencial e, por isso, o seu referencial pr´oprio sofreu uma acelera¸c˜ao, logo Selma n˜ao ´e uma observadora inercial. Note-se ainda que Patty e Selma concordam na leitura do rel´ogio de Selma quando esta chega ao planeta distante, mas essas leituras correspondem a dois acontecimentos distintos com tempos diferentes no rel´ogio de Patty.
O
xAxBx
AC
t
A=t
B Bt
5
5
4
4
3
3
Figura 1.12: Nesta figura est˜ao indicados dois caminhos poss´ıveis para o g´emeo via-jante, conforme v = 0.6 ou v = 0.8. No primeiro tA = 5 anos mas τA = 4 anos, e no
segundo temos tamb´em tB = 5 anos, mas τB = 3 anos, como no exemplo de Patty e
Selma.
Note-se ainda que se a velocidade relativa entre os dois g´emeos fosse menor, a diferen¸ca de idades no momento do re-encontro tamb´em seria menor. Por outras palavras, o g´emeo viajante pode teoricamente ir a uma velocidade t˜ao pr´oxima de c = 1 quanto se queira e assim reduzir o seu tempo pr´oprio tanto quanto se queira, fazendo assim aumentar a diferen¸ca de idades. No limite, se o g´emeo pudesse viajar como um fot˜ao, ao re-encontrar o seu irm˜ao teria a mesma idade com que partiu.
Na Fig. (1.12) vemos dois exemplos do que ficou dito atr´as, para v = 0.6 e v = 0.8. Em ambos os casos a viagem leva 10 anos para o g´emeo que ficou na Terra. Mas no primeiro caso, o g´emeo viajante afasta-se uma distˆancia de 3 anos-luz num tempo
pr´oprio de 4 anos, e no segundo caso, o g´emeo viajante afasta-se 4 anos-luz num tempo pr´oprio de 3 anos.
Fica assim resolvido, no ˆambito da teoria da relatividade restrita, o chamado “pa-radoxo”dos g´emeos. De caminho foi poss´ıvel apreciar a interliga¸c˜ao entre dilata¸c˜ao do tempo e contrac¸c˜ao do espa¸co, e o efeito de Doppler entre dois observadores em movimento relativo.
1.3
Simetrias do Espa¸co-tempo Plano
Um sistema de coordenadas em RR ´e, por defini¸c˜ao, uma correspondˆencia 1-1 entre os pontos de M4
0 e o conjunto R4 caracterizado por 4 n´umeros ordenados xc, com
c = 0, 1, 2, 3 e x0 = ct, (x1 = x, x2 = y, x3 = z) = (xi) = ~x, isto ´e,
xa= (x0, xi) = (ct, ~r)
Com esta nota¸c˜ao compacta o intervalo do Universo pode escrever-se s2 = X3 a,b=0 ηabxaxb = 3 X a,b=0 ηabx¯ax¯b
onde a matriz da forma quadr´atica, η, conhecida por m´etrica do espa¸co-tempo de Minkowski, tem os seguintes elementos diferentes de zero: η00 = −ηii = −1, com
i = 1, 2, 3.
Dados dois referenciais inerciais e as coordenadas respectivas xa e xb0
de um mesmo acontecimento f´ısico p de M4
0, admitimos que ´e sempre poss´ıvel exprimir os xb
0
como fun¸c˜oes dos xa e vice-versa:
xb0
=X
c
Lb0
cxc
de modo a preservar o intervalo s2. Pelo teorema da fun¸c˜ao inversa, diremos que
a transforma¸c˜ao de coordenadas ´e uma aplica¸c˜ao 1-1 (i.e, tem inversa) num certo dom´ınio U, se e s´o se a matriz Jacobiana ∂xb0
/∂xa tiver um determinante n˜ao nulo
nesse dom´ınio. O conjunto L das matrizes L devem assim obedecer `a seguinte rela¸c˜ao
3 X a0,b0=0 ηa0b0xa 0 xb0 = 3 X a0,b0=0 3 X c,d=0 ηa0b0La 0 cLb 0 dxcxd= 3 X c,d=0 ηcdxcxd. (1.25)
Como esta rela¸c˜ao se deve verificar para qualquer xa, conclu´ımos que
ηcd = 3 X a0,b0=0 ηa0b0La 0 cLb 0 d (1.26)
Utilizando agora uma nota¸c˜ao matricial compacta, seja X a matriz-coluna cujo ele-mento gen´erico ´e [xa], isto ´e
X = x0 x1 x2 x3 .
Podemos agora escrever o intervalo do Universo s2 como um produto de matrizes
s2 = XTηX (1.27)
bem como a transforma¸c˜ao de Lorentz ¯
X = LX.
1.3.1
Grupos de Lorentz e Poincar´
e
Defini¸c˜ao 1 O grupo de Lorentz, L, ´e o grupo das transforma¸c˜oes lineares homog´eneas das coordenadas do espa¸co-tempo M4
0 que deixam invariante a forma quadr´atica:
XTηX = ³ x0 x1 x2 x3 ´ −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 x0 x1 x2 x3 = −(x0)2+ (x1)2+ (x2)2+ (x3)2 (1.28) ou seja, ´e o conjunto das matrizes 4 × 4, L, que satisfazem a condi¸c˜ao
LTηL = η (1.29)
Nota: Se ¯X = LX, ent˜ao a invariˆancia da forma quadr´atica (5) —ou seja, a invariˆancia da velocidade da luz para todos os observadores inerciais—implica ¯XTη ¯X = XTηX ⇒
XTLTηLX = XTηX ⇔ LTηL = η.
´
E f´acil mostrar que o conjunto de transforma¸c˜oes L, com uma lei de composi¸c˜ao ade-quada, forma um grupo cont´ınuo. Em primeiro lugar notemos que sendo
η = −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 vem η2 = I. Efectivamente, Ã −1 01×3 03×1 I3×3 ! Ã −1 01×3 03×1 I3×3 ! = I4×4,
onde In×n ´e a matriz identidade num espa¸co de dimens˜ao n.
Vamos agora mostrar que o conjunto das matrizes L que satisfazem a condi¸c˜ao (1.29), juntamente com a opera¸c˜ao de multiplica¸c˜ao de matrizes, simbolicamente representado por [L, ·], goza das quatro propriedades seguintes:
1. O produto de duas transforma¸c˜oes de Lorentz (TL) L1 e L2 ´e uma TL L3. Seja
L3 = L1· L2, ent˜ao LT3ηL3 = LT2LT1ηL1L2 = LT2ηL2 = η, pois L1 e L2 obedecem
`a Eq.(3) separadamente.
2. A multiplica¸c˜ao de TL’s ´e associativa:
(L1· L2) · L3 = L1· (L2· L3)
´e uma propriedade geral do produto de matrizes! 3. A identidade ´e uma TL, i.e. ITηI = η.
4. Qualquer TL, L, tem uma inversa, L−1, que ´e tamb´em uma TL; pois, sendo
LTηL = η vem ηLTηL = η2 = I o que ⇒ L−1 = ηLTη. Por outro lado,
(L−1)TηL−1 = (ηLTη)Tη(ηLTη) = ηLη2ηLTη = ηLηLTη = ηLL−1 = G, i.e.
L−1 = ηLTη ∈ L.
Pod´ıamos ter obtido este ´ultimo resultado recorrendo a uma variante da rela¸c˜ao (1.29).
Exerc´ıcio 2 Mostre que se L ∈ L, ent˜ao LηLT = η, e L−1 tamb´em pertence a L.
J´a mostr´amos que:
• se L1, L2 ∈ L ent˜ao L1· L2 ∈ L;
• se L ∈ L ent˜ao L−1 ∈ L
• I ∈ L.
Juntando a estas propriedades a associatividade do produto de matrizes, podemos concluir que o conjunto L de todas as TL constitui um grupo em rela¸c˜ao `a opera¸c˜ao bin´aria multiplica¸c˜ao matricial.
Estrutura do Grupo de Lorentz
O grupo de Lorentz pode ser representado como um certo subconjunto do espa¸co R16
visto que uma matriz de Lorentz L (4 × 4) tem `a partida 16 elementos diferentes. Por´em nem todos s˜ao independentes, pois existem 10 condi¸c˜oes dadas pelas equa¸c˜oes
LTηL = η.
Note que G ´e uma matriz sim´etrica, o mesmo acontecendo a LTηL. Assim, qualquer
L ∈ L tem s´o 6 parˆametros reais independentes, e L d´a origem a um sub-espa¸co a 6 dimens˜oes de R16. Qualquer matriz L deve satisfazer a rela¸c˜ao
(detL)2 = 1 ⇒ detL = ±1
Como o determinante de uma matriz varia continuamente `a medida `a medida que variam os elementos de matriz em fun¸c˜ao dos parˆametros, n˜ao ´e poss´ıvel deslocarmo-nos ao longo de uma curva cont´ınua de L desde um valor de L com detL = +1 at´e um valor L0 com detL0 = −1. Ou seja, os conjuntos
L+ = {L : detL = +1} e L−= {L : detL = −1}.
n˜ao podem ser ligados por uma curva cont´ınua em L; s˜ao portanto desconexos. ´E necess´ario saltar de L+ para L− ou vice-versa, de uma maneira descont´ınua.
´
E poss´ıvel usar a condi¸c˜ao (1.29) de um modo mais eficiente, separando L em todas as suas partes desconexas. Para simplificar a escrita voltamos a representar a matriz de Lorentz por La
c sem distinguir os dois tipos de ´ındices, e escrevemos (LTηL)00 = η00=
−1, ou seja, (LT)0 0η00L00 + (LT)0iηijLj0 = −(L00)2+ 3 X j=1 (Lj0)2 = −1. temos ent˜ao, L00 = ± v u u t1 +X3 j=1 (Lj0)2, |L0 0| ≥ 1. (1.30)
A condi¸c˜ao (1.30) divide L em duas regi˜oes que, tal como acontecia antes, n˜ao podem ser ligadas por uma curva cont´ınua; s˜ao pois desconexas tamb´em. As duas regi˜oes s˜ao:
L↑ = [L : L0
0 ≥ +1], L↓ = [L : L00 ≤ −1].
As setas p˜oem em evidˆencia o efeito de L sobre a componente temporal de 4-vector (tipo-tempo). Se L ∈ L↑ ent˜ao L0
.0U0 tem o mesmo sinal que U0, mas se L ∈ L↓, ent˜ao
L0
do tempo, e por isso se chamam ortochronous (aportuguesando, diremos ort´ocronas), e L↓ ´e o conjunto das TL que invertem o sentido do tempo: transformam um vector
temporal, dirigido para o futuro (d.p.f.) num vector-temporal, dirigido para o passado (d.p.p) e vice-versa.
Podemos, portanto, dividir o espa¸co L em quatro regi˜oes: L↑+, L↑−, L↓+, L↓−,
cujo significado ´e evidente; estas quatro regi˜oes s˜ao desconexas, tal como se explicou atr´as. A TL I ∈ L↑+, a qual constitui um subgrupo do grupo de Lorentz, conhecido
por subgrupo pr´oprio ort´ocrono ou componente conexa da identidade.
Esta parti¸c˜ao de L em quatro sub-espa¸cos distintos, permite-nos reconhecer duas trans-forma¸c˜oes de Lorentz muito importantes: a paridade P = Ls e a invers˜ao no tempo
T = Lt. A TL P muda o sinal das coordenadas espaciais e preserva o do tempo,
P : (t, ~r) 7→ (t, −~r). Evidentemente, detP = −1, P0
.0 ≥ 1, pelo que P ∈ L↑−. ´E interessante notar que se
L ∈ L↑+, ent˜ao P · L ∈ L↑−, visto que
det(P · L) = det(P ) · det(L) = −1, (P · L)00 = P00· L00 = L00 ≥ +1.
Igualmente, se L ∈ L↑− ent˜ao P · L ∈ L↑+. Portanto, P permite definir uma
corres-pondˆencia 1 − 1 entre L↑+ e L↑−.
A TL invers˜ao no tempo, T , muda somente o sinal do tempo, T : (t, ~r) 7→ (−t, ~r), logo, detT = −1, T0
0 ≤ −1; a matriz T tem a forma
Ta b = −1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 = diag(−1, 1, 1, 1) (1.31)
T estabelece, portanto uma correspondˆencia 1 − 1 entre L↑+ e L↓−, como facilmente se verifica. Finalmente, o operador (a matriz) P T = Ls· Lttem det(P T ) = +1, (P T )0. 0=
−1; Logo, P T ∈ L↓+ e pode pois ser usado para estabelecer uma correspondˆencia 1 − 1 entre L↑+ e L↓−.
Conclu´ımos que n˜ao ´e necess´ario considerar todo o conjunto L = L↑+∪ L↓+∪ L↑−∪ L↓−;
basta-nos tomar o subgrupo L↑+ das TL pr´oprias e ort´ocronas e juntar as transfor-ma¸c˜oes de Lorentz discretas P e T . Com estas transfortransfor-ma¸c˜oes podemos obter todos
os elementos de L. A distin¸c˜ao entre transforma¸c˜oes pr´oprias e impr´oprias, e entre transforma¸c˜oes ort´ocronas e as outras, ´e importante. Todos os resultados experimen-tais s˜ao invariantes em rela¸c˜ao `as transforma¸c˜oes (pr´oprias) L+ = L↑+∪ L↓+; mas, como
´e sabido, em 1957 foi descoberta a viola¸c˜ao de paridade em decaimentos radioactivos, por sugest˜ao de T.D. Lee e C.N. Yang. Assim, n˜ao devemos exigir a invariˆancia dos resultados experimentais e, portanto, das teorias que os podem prever, em rela¸c˜ao `a totalidade do grupo de Lorentz; ´e mais razo´avel exigir essa invariˆancia s´o em rela¸c˜ao ao subgrupo L↑+.
Este grupo ´e gerado por dois conjuntos de matrizes que designaremos respectivamente por LB (“boosts”) e LR(rota¸c˜oes). Um exemplo de “boost” (ou TL especial) ´e a matriz
LB(φ) = cosh(φ) −senh(φ) 0 0 −senh(φ) cosh(φ) 0 0 0 0 1 0 0 0 0 1 (1.32)
onde φ ´e um n´umero real. Esta matriz LB(φ) representa uma TL especial na direc¸c˜ao
Ox, sem rota¸c˜ao espacial e sem alterar o sentido do tempo. Por vezes, ´e designada por “rota¸c˜ao de Lorentz”, no plano (t, x), por analogia com as rota¸c˜oes espaciais. A partir da Eq.(1.32) ´e f´acil construir “rota¸c˜oes de Lorentz” nos planos (t, y) ou (t, z). Finalmente, consideremos agora as matrizes 4 × 4
LR= Ã 1 01×3 03×1 R ! (1.33) onde R ´e uma matriz 3 × 3 que ´e solu¸c˜ao de RTR = I, det(R) = 1.
Exerc´ıcio 3 Verifique que LT
RGLR= G se RTR = I.
A condi¸c˜ao RTR = I define o conjunto das matrizes ortogonais O(3) = [R : RTR = I].
Como se sabe, estas matrizes s˜ao caracterizadas por preservarem os comprimentos euclidianos. N˜ao ´e dif´ıcil mostrar que o conjunto O(3) ´e um grupo—o grupo ortogonal tri-dimensional (3-D) ou grupo das rota¸c˜oes no espa¸co ordin´ario.
O grupo O(3), tal como o grupo de Lorentz, tem duas partes n˜ao conexas, O+(3) = [R : RTR = I, det(R) = +1],
Estas duas partes est˜ao relacionadas pelo operador paridade, P P = −1 0 0 0 −1 0 0 0 −1
visto que se R ∈ O+(3) := SO(3) ent˜ao P · R ∈ O−(3) e se R0 ∈ O−(3), ent˜ao
P · R0 ∈ O
+(3). Vamos, portanto, considerar unicamente SO(3), que ´e a parte de O(3)
conexa com a unidade e, por isso, com estrutura de grupo.
Quando referidas a uma base n˜ao ortonormada ou, em geral, quando se usam coorde-nadas curvil´ıneas, as matrizes ortogonais s˜ao definidas pela condi¸c˜ao:
RTGR = G, (1.34)
onde a matriz G que figura na Eq. (1.34) ´e agora a matriz da forma quadr´atica positiva associada `a distˆancia Euclidiana em R3. H´a pois seis condi¸c˜oes (1.34) entre os nove
elementos que constituem cada matriz R, de modo que ficam s´o trˆes elementos de matriz independentes: os trˆes parˆametros que caracterizam uma rota¸c˜ao, tantos quantos os parˆametros do grupo SU(2). Podemos escolher, portanto, um ˆangulo θ e uma direc¸c˜ao ~n no espa¸co – a direc¸c˜ao do eixo de rota¸c˜ao (note que podemos sempre escolher ~n unit´ario: ~n · ~n = 1). A matriz correspondente R representa uma rota¸c˜ao de um ˆangulo θ em torno de ~n. Esta parametriza¸c˜ao de R torna claro o car´acter rotacional de todas as matrizes ortogonais.
O espa¸co dos parˆametros (θ, ~n) pode ser representado por pontos numa bola densa de raio π, onde cada ponto p tem coordenadas (θ, ~n), sendo θ = `a distˆancia radial | ~Op| e estando ~n apontando na direc¸c˜ao do raio vector ~Op. Como a rota¸c˜ao de um ˆangulo π em torno de ~n d´a o mesmo resultado que uma rota¸c˜ao de −π em torno de ~n, ´e necess´ario identificar os pontos opostos sobre a superf´ıcie da esfera fronteira, i.e. os pontos que se encontram nas extremidades de um diˆametro, para estabelecer um isomorfismo entre o espa¸co dos parˆametros e o espa¸co gerado por todas as matrizes R: a variedade grupo SO(3). Este grupo ´e um grupo de Lie e, como veremos mais adiante, todo o grupo de Lie ´e simultaneamente uma variedade diferenci´avel cuja dimens˜ao ´e igual `a dimens˜ao do grupo.
Grupo de Poincar´e
Todos os pontos (acontecimentos) do espa¸co-tempo de Minkowski s˜ao equivalentes para a descri¸c˜ao das leis f´ısicas. Do ponto de vista matem´atico, diremos que o espa¸co ´e homog´eneo. O grupo de simetria deste espa¸co ´e, portanto, mais vasto que o grupo de Lorentz pois deve incluir as transla¸c˜oes. No conjunto temos 10 simetrias: 4 transla¸c˜oes, 3 rota¸c˜oes e 3 transforma¸c˜oes de Lorentz puras. Por isso dizemos que as coordenadas inerciais gozam da seguinte propriedade: dados dois sistemas de coordenadas inerciais,
existe sempre uma matriz 4 × 4 n˜ao singular, L, e um vector-coluna constante A tais que para todo o ponto p de M
¯
X = LX + A, (1.35)
e inversamente
X = L−1X − L¯ −1A, onde X e ¯X s˜ao as coordenadas de p em S e ¯S.
Esta propriedade permite dar um conte´udo matem´atico ao Princ´ıpio da Relatividade, nomeadamente:
Defini¸c˜ao 2 As equa¸c˜oes que representam uma dada lei f´ısica, expressa em fun¸c˜ao das coordenadas, dever˜ao ser invariantes em rela¸c˜ao `as transforma¸c˜oes (1.35).
Defini¸c˜ao 3 O grupo de Poincar´e, P, ou grupo de Lorentz n˜ao homog´eneo, como tamb´em ´e conhecido, ´e o conjunto de todas as transforma¸c˜oes de coordenadas da forma (1.35), com
L ∈ L = [L : LTηL = η] e A ´e um 4-vector constante.
Numa teoria f´ısica, expressa em termos de coordenadas, o objecto matem´atico mais importante ´e o conjunto de todas as transforma¸c˜oes de coordenadas que deixam as leis da teoria invariantes. Este conjunto de transforma¸c˜oes formam um grupo: o grupo de simetria da teoria. Efectivamente, dadas duas transforma¸c˜oes entre coordenadas inerciais, as suas inversas s˜ao igualmente transforma¸c˜oes entre coordenadas inerciais e a composi¸c˜ao dessas transforma¸c˜oes ´e tamb´em uma transforma¸c˜ao de coordenadas inerciais; por sua vez, a transforma¸c˜ao identidade est´a inclu´ıda no conjunto dessas transforma¸c˜oes. Ou seja, dadas duas transforma¸c˜oes de coordenadas que deixam as leis da teoria invariantes, ent˜ao quer as suas inversas quer o produto dessas duas trans-forma¸c˜oes tamb´em deve deixar as leis da teoria invariantes. A ´unica dificuldade que poder´a surgir na verifica¸c˜ao dos axiomas de grupo tem a ver com o facto das leis se-rem, em geral, expressas por equa¸c˜oes diferenciais; assim, ´e necess´ario garantir que os objectos matem´aticos que representam as grandezas f´ısicas sejam suficientemente diferenci´aveis.
Partindo das equa¸c˜oes que exprimem as leis, facilmente se encontra o grupo de simetria da teoria. Mas, inversamente, conhecendo o grupo de simetria tamb´em ´e poss´ıvel retirar muita informa¸c˜ao acerca da estrutura das pr´oprias leis. Ao construir uma teoria, depois de ter sido escolhido o grupo de simetria, s´o s˜ao permitidas aquelas leis que sejam invariantes em rela¸c˜ao `as transforma¸c˜oes do grupo.
Defini¸c˜ao 4 (Covariˆancia) Diz-se que uma equa¸c˜ao ´e covariante em rela¸c˜ao a um dado grupo de transforma¸c˜oes de coordenadas se a forma dessa equa¸c˜ao ´e mantida inalterada por esse grupo de transforma¸c˜oes.
´
E claro que se os dois membros de uma equa¸c˜ao forem tensores do mesmo tipo, a equa¸c˜ao ´e manifestamente covariante. Mas as equa¸c˜oes de Maxwell, por exemplo, s˜ao covariantes em rela¸c˜ao ao grupo de Lorentz mesmo quando n˜ao est˜ao escritas numa forma tensorial. A escrita tensorial torna, simplesmente, essa covariˆancia manifesta.
1.4
Objectos geom´
etricos
Pretendemos definir os vectores como objectos geom´etricos que n˜ao dependem de um sistema de coordenadas particular. Em geral, todas as grandezas f´ısicas dever˜ao ser formuladas em termos de objectos geom´etricos bem comportados (isto ´e, com propri-edades de diferenciabilidade conhecidas) de modo a assegurar que tais leis s˜ao verda-deiras para todos os observadores e em todos os sistemas de coordenadas. Se ent˜ao seleccionarmos um sistema de coordenadas, podemos expressar os vectores ou quais-quer outros objectos geom´etricos em termos das suas componentes nesse sistema de coordenadas. Mudando de sistemas de coordenadas, estas componentes mudar˜ao de acordo com regras precisas, mas a natureza geom´etrica e independente do observador dos objectos geom´etricos utilizados assegurar´a que as leis f´ısicas no seu conjunto s˜ao invariantes relativamente a uma transforma¸c˜ao do grupo de transforma¸c˜oes da teoria (grupo de simetria da variedade base). No ˆambito da RR o grupo de transforma¸c˜oes ´e o grupo de Lorentz n˜ao homog´eneo ou grupo de Poincar´e.
No espa¸co Euclidiano 3-dimensional S ⊂ R3, qualquer par de pontos (a, b) define um
vector −→ab que os une. O vector−→ab depende somente da diferen¸ca das coordenadas dos pontos a e b, e assim um dado vector pode ser representado de muitas formas: a pode ser escolhido arbitrariamente e ent˜ao o vector −→ab determina o outro ponto b = a +−→ab. Podemos transportar esta ideia para o espa¸co-tempo de Minkowski M4
0. Associaremos
um vector a cada par de acontecimentos. E dois pares de acontecimentos (A, B) e (A0, B0) ser˜ao chamados equivalentes–(A, B) ∼ (A0, B0)–se as diferen¸cas das suas
coor-denadas s˜ao iguais
Xa(B) − Xa(A) = Xa(B0) − Xa(A0),
para um dado sistema de coordenadas inerciais xa, e portanto para qualquer sistema
inercial de coordenadas, atendendo `a linearidade das transforma¸c˜oes de Lorentz. A rela¸c˜ao ∼ ´e uma rela¸c˜ao de equivalˆencia.
Defini¸c˜ao 5 Um vector do espa¸co-tempo de Minkowski ´e uma classe de equivalˆencia de pares de acontecimentos f´ısicos (A, B), · · · , (A0, B0) para a rela¸c˜ao de equivalˆencia
definida por Xa(B) − Xa(A) = · · · = Xa(B0) − Xa(A0).
Por outras palavras, identificamos um dado vector X com a colec¸c˜ao de todos os pares de pontos para os quais a diferen¸ca das coordenadas seja igual `as componentes do
vector. O vector da classe de equivalˆencia a que pertence o par de pontos (A, B) representa-se por X ≡−→AB. Ou seja, o vector que permite associar o ponto B ao ponto A, B := A + X, tem componentes
Xc= Xc(B) − Xc(A)
Fazer uma transforma¸c˜ao de coordenadas corresponde a fazer uma transforma¸c˜ao de Lorentz, pelo que as componentes de X no novo sistema de coordenadas s˜ao dadas por
¯
Xa=X
c
La cXc
onde L representa uma matriz de Lorentz. O conjunto das componentes de um vector num dado sistema de coordenadas caracteriza completamente o vector.
Por raz˜oes que se tornar˜ao ´obvias mais adiante, quando tratarmos com espa¸cos curvos, designaremos o conjunto de todos os vectores por TpM onde p ´e um ponto arbitr´ario
do espa¸co-tempo de Minkowski. Como TpM ≡ TqM, quaisquer que sejam os pontos
p e q de M, escrevemos o espa¸co tangente num ponto do espa¸co-tempo de Minkowski simplesmente como T.M. Trata-se de um espa¸co vectorial, uma vez definidas as
opera¸c˜oes de adi¸c˜ao entre elementos de TpM e multiplica¸c˜ao por um escalar.
Assim, se X e Y s˜ao vectores de T.M, definimos o vector X + Y como aquele cujas
componentes s˜ao Xa + Ya, e de modo semelhante para o produto aX com a ∈ R.
Note-se que embora tenhamos recorrido a coordenadas para definir vectores e adi¸c˜ao de vectores, estas defini¸c˜oes n˜ao dependem de um sistema de coordenadas particular, e s˜ao portanto independentes das coordenadas.
A defini¸c˜ao de vector—segmento orientado que une dois ‘pontos’ da variedade—s´o ´e v´alida num espa¸co-tempo plano. Num tal espa¸co h´a outra maneira equivalente de defi-nir vector, mais adequada `a indispens´avel generaliza¸c˜ao deste conceito a uma variedade curva. Consideremos o segmento de recta
Γ(λ) = A + λ(B − A), λ ∈ [0, 1] ,
com λ = 0 correspondendo `a origem e λ = 1 `a extremidade, isto ´e, Γ(0) = A e Γ(1) = B. Definimos o vector tangente no ponto A de M4
0 como sendo
XA=
d
dλ[A + λ(B − A)] = B − A.
Esta defini¸c˜ao permite-nos substituir a ideia de um vector como um objecto dependendo de dois pontos por um conceito local
XA = Ã d dλΓ(λ) ! λ=0 , (1.36)
o vector tangente `a curva Γ(λ) no ponto A = Γ(λ = 0) ´e a derivada ao longo da curva no ponto A.