Emaranhamento em sistemas de dois qubits

(1)

Emaranhamento em sistemas de dois qubits

B´

arbara Lopes Amaral

(2)

(3)

Emaranhamento em sistemas de dois qubits

B´

arbara Lopes Amaral

Orientador:

Dr. Marcelo Terra Cunha

Disserta¸cão apresentada à UNIVERSIDADE FE-DERAL DE MINAS GERAIS, como requisito par-cial para a obten¸cão do grau de MESTRE EM MATEMÁTICA.

(4)

(5)

(6)

Minha mãe achava estudo a coisa mais fina do mundo. Não é.

A coisa mais fina do mundo ´e o sentimento. Aquele dia de noite, o pai fazendo ser˜ao, ela falou comigo:

“Coitado, at´e essa hora no servi¸co pesado”.

Arrumou pão e café, deixou tacho no fogo com água quente. Não me falou em amor.

Essa palavra de luxo.

(7)

Agradecimentos

Aos meu pais, ˆAngela e Geraldo, por todo amor, carinho e apoio incondicional. S´o eles sabem o sacrif´ıcio que fizeram para que eu pudesse chegar onde cheguei.

`

A minha irmã Luana, Átila e Diógenes. A toda minha fam´ılia querida, epecialmente aqueles que estiveram mais próximos: tio Tõe, tia Lila, Pet e Gui, tia Arlete, tio João, tia Rossana, Rai, tia Terezinha, Mari, tia Áurea, tio Rômulo, Amanda, Adan, Gi, os “agregados”, vovós e vovôs.

Ao meu querido mestre e amigo Marcelo, que me ensinou muito mais que f´ısica e ma-temática. Pelas horas de dedica¸cão e trabalho, pelo incentivo e apoio, e também pelas horas de diversão.

A todos os meus amigos da gradua¸cão, Rudnan, Pri, Luiz, Kaká, Rosa, Josi e especialmente aos que estiveram mais próximos, em casa ou no trabalho: Romero, que esteve ao meu lado e foi um grande amigo e companheiro durante muitos anos, Diogão e Camila , Samuca, que sempre cuidou de mim tão bem, Marquinhos, Breno e Ana, Dudu, E(d)milson e Ísis, Rafael. Vivemos juntos momentos inesquec´ıveis. Pe¸co desculpas àqueles que magoei com as minhas mancadas.

Ao Thales, por estar ao meu lado nesses sofridos ´ultimos momentos, por ser companheiro e amigo e por me levar no Mineir˜ao em todos os jogos do Cruzeiro.

Aos meu amigos do Enlight: Fran¸ca, grande professor e amigo, Duty, Pierre, pelos choco-lates e abra¸cos nos momentos de desespero, Eliza, Pablo, J´ulia e todos os outros. Em especial ao Leo por ser um encosto na minha vida e ter me apresentado tanta gente chata.

Aos meus companheiros da matem´atica, Eliza, Eliane, Sieiro, Adriana e todos os outros que estiveram comigo na correria das aula e provas e exame de qualifica¸c˜ao.

A todos os meus professores da f´ısica e da matemática, especialmente ao Israel e ao Bernardo pelo incentivo, e aos funcionários dos dois departamentos especialmente ao pessoal da secretaria da pós da matemática e da biblioteca da f´ısica.

Aos professores Roberto, Sacha e Bernardo por aceitarem nosso convite. Aos Malfeit˜oes e aos Diagonais, pela alegria que trouxeram `a minha vida.

`

A Ju e ao Robson por mesmo distantes estarem sempre comigo. `

A L´ıvia e `a Bob por me aceitarem em sua humilde residˆencia. `

A Heben, por me ensinar a cuidar da minha sa´ude em primeiro lugar.

A todos que me deram chocolate de presente, o que muito contribuiu para minha vida acadˆemica.

Enfim a todas as pessoas maravilhosas que conheci durante esse tempo e que me apoiaram na realiza¸c˜ao desse trabalho.

(8)

(9)

Conte´

udo

1 Preliminares 3

1.1 Espa¸cos vetoriais. . . 3

1.1.1 Produto tensorial . . . 8

1.2 Grupos de Lie . . . 11

1.2.1 Algebra de Lie´ . . . 13

1.2.2 Alguns homomorfismos importantes . . . 14

1.3 Convexidade . . . 16

1.3.1 Probabilidades . . . 17

2 Os qubits 21 2.1 Os qubits e a Fibra¸c˜ao de Hopf . . . 21

2.1.1 Fibrados . . . 22

2.1.2 Estados mistos de um qubit. . . 23

2.1.3 Dois qubits . . . 24

2.2 Opera¸c˜oes de filtragem em sistemas de dois qubits . . . 26

3 Quantificadores de Emaranhamento bipartite 35 3.1 Estados puros . . . 35

3.2 Emaranhamento para estados mistos . . . 39

3.3 Emaranhamento Destil´avel e Custo de Emaranhamento . . . 40

3.4 Quantificadores baseados em distˆancia . . . 41

3.5 Fecho convexo e Emaranhamento de Forma¸c˜ao . . . 43

3.6 Concorrˆencia . . . 43

3.6.1 Concorrˆencia para estados puros . . . 44

3.6.2 Concorrˆencia para estados mistos . . . 45

3.7 Negatividade . . . 50

3.7.1 Compara¸c˜ao entre negatividade e concorrˆencia. . . 54

(10)

(11)

Introdu¸

c˜

ao

Nesse trabalho demonstramos uma série de resultados para sistemas quânticos de di-mensão finita. O tema central são os qubits, sistema que se tornou muito importante com o surgimento da computa¸cão quântica.

O principal objetivo é estudar dois quantificadores de emaranhamento para o sistema de dois qubits, chamados Negatividade e Concorrência. O emaranhamento é uma propriedade muito interessante de sistemas quânticos compostos, que não aparece em mecânica clássica. Ele está por trás de vários resultados surpreendentes como a teleporta¸cão de estados quânticos e o algoritmo de Shor, capaz de fatorar números inteiros em tempo polinomial, entre vários outros. Ainda não se sabe precisamente, mas acredita-se que os sitemas quânticos permitem realizar computa¸cão de maneira mais eficiente que os sistemas clássicos e a presen¸ca de emaranhamento pode ser um recurso valioso.

A motiva¸cão inicial para esse trabalho foi o artigo [1], que faz uma compara¸cão entre a Negatividade e a Concorrência. Essa compara¸cão é o último resultado apresentado na disserta¸cão, no fim do cap´ıtulo 3. A demonstra¸cão é simples, uma vez conhecidas algumas propriedades desses quantificadores e dos estados de dois qubits.

Por esse motivo, dedicamos o cap´ıtulo 2 a um estudo detalhado dos sistemas de um e dois qubits. Em especial, estudamos o efeito das chamadas opera¸cões SLOCC (Stochastic Local Operations and Classical Comunication) sobre os estados de dois qubits. Como uma consequência desse resultado obtemos a propriedade necessária para comparar negatividade e concorrência: a transposta parcial de uma matriz densidade de dois qubits possui no máximo um autovalor negativo. Esse é um resultado bem conhecido e utilizado.

Antes de comparar negatividade e concorrência devemos entender porque eles são de fato bons quantificadores de emaranhamento. Apresentamos no cap´ıtulo 3 em detalhe as demons-tra¸cões, que são baseadas nos trabalhos [2, 3]. Citamos também alguns outros quantificadores importantes, como o Emaranhamento de Forma¸cão, que está intimamente relacionado à Con-corrência, o Emaranhamento Destilável, Robustez, entre outros.

No cap´ıtulo ??_{, enunciamos os postulados da mecˆanica quˆantica. Eles nos dizem que}

objetos matemáticos representam os estados de um sistema quântico e as grandezas f´ısicas relacionadas. Veremos que os espa¸cos de Hilbert e os operadores agindo neles serão nossas ferramentas principais. Veremos também como se dá a evolu¸cão de um estado, o que nos leva à defini¸cão de mapas completamente positivos. Por último, estudamos como encontrar o espa¸co de estados de um sistema composto a partir dos espa¸cos de estados dos subsistemas. Essa constru¸cão faz uso do produto tensorial de espa¸cos vetoriais e é dessa estrutura tensorial que surge o conceito de emaranhamento.

(12)

(13)

CAP´

ITULO

1

Preliminares

Nesse cap´ıtulo vamos apresentar os principais resultados que usaremos ao longo do texto. A inten¸cão aqui é apenas enunciar os resultados e fixar a nota¸cão. A primeira se¸cão trata de espa¸cos vetoriais, que são os objetos principais para a mecânica quântica [4, 5, 6, 7, 8]. O objetivo maior dessa se¸cão é apresentar a nota¸cão de Dirac, muito usada pelos f´ısicos, mas pouco conhecida pelos matemáticos. A segunda se¸cão trata dos grupos de Lie [9, 10], e os resultados mais importantes são o homomorfismo entre SL(2,C₎ _{e o grupo de Lorentz e o}

isomorfismo entre SL(2,C₎_⊗_SL(2,C₎ _e _SO(4,C_{), que ser˜ao utilizados para estudarmos a}

a¸cão de alguns mapas quânticos sobre estados de dois qubits e obter resultados importantes. Por último, estudamos os conjuntos convexos e distribui¸cões de probabilidade discretas [11]. O principal resultado é o teorema HLP, que depois será apresentado em sua versão quântica e que é usado para obtermos condi¸cões de convertibilidade de estados por opera¸cões locais e comunica¸cão clássica.

1.1 _Espa¸

_{cos vetoriais}

Nessa se¸cão veremos alguns conceitos básicos sobre espa¸cos vetoriais. Os resultados que apresentaremos e muitos outros podem ser encontrados em [7, 8, 12, 13], sendo que a última referência utiliza também a nota¸cão de Dirac.

Um espa¸co vetorial sobre um corpo K_{´e um conjunto}_V _{no qual est˜ao definidas a soma}

entre dois elementos deV e o produto por elementos de K_{. Um elemento de} _V _{ser´a denotado}

por um ket:

|u_{i ∈ V}. As seguintes propriedades devem ser satisfeitas

1. (Associatividade da soma) (_|u_i+_|v_i) +_|w_i = _|u_i+ (_|v_i +_|w_i) para _|u_i,_|v_i e _|w_i elementos deV;

2. (Elemento neutro para a soma) H´a um elemento 0 _{∈ V}, tal que, para cada _|v_{i ∈}

V, _|v_i+ 0 = 0 +_|v_i=_|v_i;

(14)

4. (Comutatividade da soma) Para cada|vi, |ui ∈ V, |ui+|vi=|vi+|ui;

5. (Associatividade do produto) Para cadaa, b∈K_{e cada}_|_v_{i ∈ V}_{, a.(b.}_|_v_i_{) = (a.b).}_|_v_i_;

6. (Elemento neutro para o produto) Se 1 ´e a unidade de K_{, ent˜ao, para cada} _|_v_{i ∈}

V, 1._|v_i=_|v_i;

7. (Distributividade) Para cada a∈K_{e cada} _|_v_i_,_|_u_{i ∈ V}_{, a.(}_|_v_i₊_|_u_i_{) =}_a._|_v_i₊_a._|_u_i_;

8. (Distributividade) Para cada a, b∈K_{e cada} _|_v_{i ∈ V}_, _(a₊_b)._|_v_i₌_a._|_v_i₊_b._|_v_i_.

Nos preocuparemos apenas com os casos K₌R_e K₌C_.

Defini¸c˜ao1. _{Um conjunto de vetores}_{|_v₁_i_{, . . .}_|_v_n_i}_{´e dito linearmente dependente se algum}

dos |vii pode ser escrito como combina¸c˜ao linear dos demais, isto ´e, existem coeficientes cj,

j₆=i, tais que:

Caso contrário, os vetores são chamados linearmente independentes. Uma base para o espa¸co vetorial _V é um conjunto linearmente independente _{|v1i, . . . ,|vni} que gera o espa¸co todo,

isto ´e, tal que todo vetor de V possa ser escrito como combina¸c˜ao linear dos|vii.Toda base

tem o mesmo número de vetores, que é chamado de dimensão de _V.

Consideraremos aqui apenas espa¸cos vetoriais de dimens˜ao finita.

Defini¸cão 2. _{Um funcional linear em} _V _{é uma aplica¸cão linear de} _V _em K_. _{Os funcionais}

lineares ser˜ao denotados por um bra:

hχ_|:_{V −→}K_.

O conjunto de todos os funcionais lineares em _V tamb´em forma um espa¸co vetorial sobre K_,

que ´e chamado espa¸co dual de_V e ´e denotado por_V∗_.

Dados dois espa¸cos vetoriais sobre o mesmo corpo,V e U, o conjunto de todas as trans-forma¸cões lineares T :V → U será denotado por L(V,U). Em especial, chamamos as trans-forma¸cões lineares O : _{V → V} de operadores e denotamos _L(_V) = _L(_V,_V). O conjunto

L(V,U) tamb´em ´e um espa¸co vetorial sobre K_e_L₍_V_,K_{) =}_V∗_.

Suponhamos que _V tenha dimens˜ao finita e que dim_V = n. Fixada uma base, todo operador linear em _L(_V) pode ser representado por uma matriz n_×n. O conjunto de todas essas matrizes ser´a denotado porM(V).

Defini¸c˜ao3. _{Dizemos que um vetor}_|_v_{i 6}_{= 0}_{´e um autovetor de um operador} _O_{∈ L}₍_V₎ _com

autovalor λse

O|vi=λ|vi.

Defini¸cão4. _{Um produto interno em}_V _{é uma fun¸cão} ₍_·_,_·_{) :}_{V × V −→}K_{que satisfaz}

1. (_|u_i,_|v_i) = (_|v_i,_|u_i)∗_{, em que}_∗ _{denota conjuga¸c˜ao complexa;}

(15)

1.1. Espa¸cos vetoriais

3. (|ui, a|vi) =a(|ui,|vi), a∈K_;

4. Para todo _|u_{i 6}= 0 vale(_|u_i,_|u_i)_∈R_e ₍_|_u_i_,_|_u_i₎_>_0.

Fixado um vetor_|v_i a fun¸c˜ao

φv:V −→K

|u_{i 7−→}(_|v_i,_|u_i)

´e um funcional linear, que denotaremos por_hv_|. Assim usaremos a nota¸c˜ao (|vi,|ui) =hv|ui.

Vale a propriedadeφv+u=hv|+hu|.

Um vetor é chamado unitário sehv|vi = 1. A proje¸cão de um vetor |ui na dire¸cão de um vetor unitário|vié o vetorhu|vi |vi. Dois vetores são chamados ortogonais se o produto interno entre eles é igual a zero. Um conjunto de vetores é chamado ortonormal se os vetores são unitários e ortogonais entre si.

Dados dois vetores |ui,|vi ∈ V podemos definir um operador O : V → V da seguinte forma:

O_|w_i=_|u_{i h}v_|w_i.

Esse operador ser´a denotado por|ui hv|.Em particular, dado um vetor unit´ario|vi, o operador

|v_{i h}v_|leva cada vetor_|u_i em sua proje¸cão na dire¸cão de_|v_i e por isso é chamado de projetor na dire¸cão de _|v_i.

Dado um operador O :V → V definimos o operador conjugado hermitiano de O como sendo o operador O†_:_{V → V} _{tal que}

(|vi, O|ui) = (O†|vi,|ui).

Dizemos que um operador é hermitiano ou autoadjunto se O = O†. Os autovalores de um operador hermitiano são todos reais, e autovetores com autovalores distintos são ortogonais.

Se um operador O é hermitiano, então (|vi, O|ui) = (O|vi,|ui). Nos aproveitamos desse fato para usar a nota¸cão

(_|v_i, O_|u_i) =_hv_|O_|v_i.

Fixada uma base ortonormal, se o operador O é representado pela matriz M, então O† é representado pela matriz M† _{= (M}T₎∗_{, em que} _∗ _{representa conjuga¸cão complexa e} _T

representa a transposi¸c˜ao. Uma matriz ´e dita hermitiana seM†₌_M_.

Um resultado importante para operadores hermitianos ´e o teorema espectral.

Teorema 1 _{(Teorema Espectral)}. _Seja_O _:_{V → V} _{um operador hermitiano sobre um espa¸co}

vetorial _V real ou complexo de dimens˜ao finita. Ent˜ao existe uma base ortonormal para _V formada por autovetores deO.

Teorema 2 _{(Decomposi¸c˜ao Espectral)}. _Seja _M _{uma matriz hermitiana e} _{|_v_i_i} _{uma base}

formada por autovetores deM, com autovalores reais correspondentes λi. Ent˜ao

M =X

i

(16)

Outro resultado importante ´e a decomposi¸c˜ao em valor singular

Teorema 3. _{Dada uma matriz} _M_{, existem matrizes unit´arias} _U _e _V _{e uma matriz diagonal}

Σ com entradas n˜ao-negativas tais que

U M V = Σ.

Os elementos da diagonal deΣ s˜ao chamados valores singulares deM. Um operador O ´e chamado positivo definido se

hv_|O_|v_i>0 _{∀ |}v_{i 6}= 0_{∈ V} e positivo semi-definido se

hv|O|vi ≥0 ∀ |vi 6= 0∈ V.

Todo operador positivo definido é um operador hermitiano tal que todos os autovalores são positivos e um operador positivo semi-definido é um operador hermitiano tal que todos os autovalores são não-negativos.

Defini¸cão5. _{Uma norma em}_V _{é uma fun¸cão} _{k · k}_:_{V →}R_{que satisfaz}

1. _k|u_ik= 0_{⇔ |}u_i= 0; 2. _kλ_|u_ik=_|λ_{| k|}u_ik, λ_∈K_;

3. (Desigualdade triangular) _k|u_i+_|v_{ik ≤ k|}u_ik+_k|v_ik.

Quando podemos definir uma norma em _V dizemos que_V ´e um espa¸co vetorial normado.

Dado um produto interno, a fun¸cão _|v_{i 7→ h}v_|v_i1/2 é uma norma em _|v_i. Esse fato é uma consequência da desigualdade de Cauchy-Schwartz:

k hu|vi k2 ≤ hu|ui hv|vi.

Logo todo espa¸co com produto interno é também um espa¸co normado. Toda norma, por sua vez, gera uma distância em V.

Defini¸cão 6. _{Uma distância em} _V _{é uma fun¸cão} _D_:_{V × V →} R _{que obedece às seguintes}

condi¸c˜oes:

1. D(|ui,|vi)≥0 e D(|ui,|vi) = 0⇔ |ui=|vi; 2. D(|ui,|vi) =D(|vi,|ui);

3. (Desigualdade triangular) D(|vi,|ui)≤D(|ui,|wi) +D(|wi,|vi).

(17)

Dada uma normak·k, a fun¸cão|ui,|vi 7→ k|ui − |vikdefine uma distância em V. Logo todo espa¸co normado é também um espa¸co métrico.

Dada uma distância D em _V, dizemos que a sequência (_|uni) é convergente, e que

converge para o valor |vi ∈ V, se lim

n→∞ |uni=|vi. Isso quer dizer que:

∀ ǫ >0 _∃ n0 ∈N : n > n0 ⇒D(|uni,|vi)< ǫ.

Uma sequência em_V é chamada de sequência de Cauchy se

∀ ǫ >0 _∃ n0∈N : m, n > n0 ⇒D(|umi,|uni)< ǫ.

Não é dif´ıcil mostrar que toda sequência convergente em_V é uma sequência de Cauchy. No entanto, nem sempre uma sequência de Cauchy é convergente. Se toda seqüência de Cauchy emV é uma sequência convergente, dizemos queV é umespa¸co métrico completo.

Defini¸cão 7. _{Dizemos que um espa¸co vetorial} _V _{é um espa¸co de Hilbert se é um espa¸co}

vetorial com produto interno, completo com a norma gerada por ele.

Espa¸cos de Hilbert ser˜ao denotados por _H. Podemos caracterizar os espa¸cos duais de espa¸cos de Hilbert usando o

Teorema 4 _{(Representa¸c˜ao de Riez)}. _Seja _H _{um espa¸co de Hilbert. Dado} _h_χ_{| ∈ H}∗ _existe

um ´unico _|v_{i ∈ H} tal que

hχ|=hv|,

ou seja, todo funcional linear ´e dado por produto interno com um vetor fixo.

Podemos caracterizar os autovalores m´aximo e m´ınimo de um operador hermitiano em espa¸cos de Hilbert de dimens˜ao finita1 _{utilizando o produto interno.}

Teorema 5. _Seja_H _{um espa¸co de Hilbert e} _O _{um operador hermitiano em} _H_{. Sejam}_λ_O _e

ΛO o menor e o maior autovalor deO. Ent˜ao temos

λO = inf

hv|vi=1hv|O|vi, ΛO = sup_h_v_|_v_i₌₁hv|O|vi.

Corol´ario 1. _Se_M ₌_M₁₊_M₂ _ent˜ao

λM ≥λM1+λM2, ΛM ≤ΛM1 + ΛM2.

Para demonstra¸c˜ao dos resultados a respeito de espa¸cos de Hilbert, veja [4].

Nossa preocupa¸cão é com espa¸cos de Hilbert de dimensão finita. Se dimH = N, denotaremos por

{|0_i,_|1_i, . . . ,_|N ₋1_i} uma base ortonormal para_H, isto ´e, uma base tal que

hi|ji=δij, i, j= 0,1, . . . , N−1.

1

(18)

1.1.1 _{Produto tensorial}

Dados dois espa¸cos vetoriais_VA e VB de dimens˜oes nAe nB respectivamente, podemos

construir um espa¸co vetorial de dimens˜aonAnB atrav´es do produto tensorial [8, 14, 13]. Para

construirmos2 esse novo espa¸co, que denotaremos por_VA⊗ VB, tomamos bases|iAipara VA

e _|jBi para VB e declaramos que os nAnB elementos da forma

|iAi ⊗ |jBi, iA= 0,1, . . . , nA, jB = 0,1, . . . , nB

formam uma base para _VA⊗ VB. As seguintes condi¸c˜oes s˜ao impostas

1. Para um escalar arbitr´arioa∈K_{e elementos} _|_v_A_i_de _V_A_e _|_v_B_i _de_V_B_,

a(_|vAi ⊗ |vBi) = (a|vAi)⊗ |vBi=|vAi ⊗(a|vBi);

2. Para_|vAi e |uAi arbitr´arios em VAe |vBi em VB,

(_|vAi+|uAi)⊗ |vBi=|vAi ⊗ |vBi+|uAi ⊗ |vBi;

3. Para_|vAi arbitr´ario em V e |uBi e |vBi em VB,

|vAi ⊗(|uBi+|vBi) =|vAi ⊗ |uBi+|vAi ⊗ |vBi.

A constru¸c˜ao ´e independente das escolhas de base para _VA eVB.

Defini¸cão8. _{Dizemos que um vetor}_|_v_{i ∈ V}_A_⊗V_B_{é decompon´ıvel se é da forma}_|_v_A_i⊗|_v_B_i_.

´

E comum usarmos a nota¸c˜ao |vAi ⊗ |vBi=|vAvBi.

Se _VA e VB s˜ao espa¸cos vetoriais com produto interno, podemos definir um produto

interno em _VA⊗ VB da seguinte maneira: para vetores decompon´ıveis fazemos

hvAvB |uAuBi=hvA|uAi hvB |uBi,

e em seguida estendemos aos outros vetores:

Teorema 6. _Se _V_A_e _V_B _{são espa¸cos de Hilbert,}_V_A_{⊗ V}_B _{também é.}

Os conjuntosM(VA)e M(VB)são também espa¸cos vetorias sobreKe por isso também

podemos definir o produto tensorial M(_VA)⊗M(VB). Podemos ent˜ao definir uma a¸c˜ao de

M(VA)⊗M(VB) emVA⊗ VB da seguinte forma: para vetores decompon´ıveis fazemos

MA⊗MB(|vAi ⊗ |vBi) =MA|vAi ⊗MB|vBi,

e em seguida estendemos por linearidade aos outros vetores. Essa a¸c˜ao define um mapa de M(_VA)⊗M(VB) emM(VA⊗ VB), que ´e um isomorfismo de espa¸cos vetoriais.

2

(19)

Defini¸c˜ao 9. _{Definimos o tra¸co parcial em rela¸c˜ao a} _V_A _{de uma matriz} _M_A_⊗ _M_B _em

M(VA)⊗M(VB)por

T rA(MA⊗MB) =T r(MA)MB,

e estendemos por linearidade às matrizes não decompon´ıveis. De maneira análoga definimos o tra¸co parcial em rela¸cão a_VB.

Defini¸c˜ao 10. _{Definimos a transposta parcial em rela¸c˜ao a} _V_A_{de uma matriz}_M_A_⊗_M_B _em

M(VA)⊗M(VB)por

(MA⊗MB)TA = (MA)T ⊗MB,

e estendemos por linearidade às matrizes não decompon´ıveis. De maneira análoga definimos a transposta parcial em rela¸cão a_VB.

Proposi¸cão 1. _{Se uma matriz} _M _{é positiva, então} _{T r}_A_(M₎ _e_{T r}_B_(M) _{também o são.}

Demonstra¸c˜ao. Suponhamos que M = P

iMAi ⊗MBi. Seja {|ji}, j = 1, . . . ,dimVB uma

base ortonormal para _VB.Ent˜ao

T rB(M) =

X

i,j

M_Ai _hj_|M_Bi _|j_i

hv|T rB(M)|vi=

X

i,j

hv|M_Ai |vi hj|M_Bi |ji=X

i,j

hv| hj|M_Ai ⊗M_Bi |ji |vi=

X

j

hv_{| h}j_|X

i

M_Ai _⊗M_Bi _|j_{i |}v_i=X

j

hv_{| h}j_|M_|j_{i |}v_{i ≥}0

sendo que a última desiguladade é válida pelo fato de queMé positiva e portanto cada termo na última soma é positivo. Segue então queT rB(M) também é uma matriz positiva.

De maneira an´aloga provamos queT rA(M)´e positiva.

Um resultado extremamente útil é a decomposi¸cão de Schmidt para espa¸cos vetorias com estrutura de produto tensorial.

Proposi¸cão 2 _{(Decomposi¸cão de Schmidt)}. _{Dado um vetor} _|_Ψ_{i ∈ V}_A _{⊗ V}_B_{, é poss´ıvel}

encontrar bases ortonormais {|ψ_Ani}paraVA e {|φmBi}para VB tais que

|Ψi=

d

X

i=1

αi

ψ_Ai φi_B

,

em que d= min(dim_VA,dimVB),e α1 ≥α2 ≥. . .≥αd. Os coeficientes αi s˜ao chamados

coeficientes de Schmidt.

Demonstra¸c˜ao. Suponhamos d = dim_VA. Seja ρA = T rB(|Ψi hΨ|). A matriz |Ψi hΨ|´e o

projetor na dire¸cão de_|Ψ_ie portanto é uma matriz positiva. Assim,ρAtambém é uma matriz

positiva, e portanto seus autovetores|ψn_Aiformam uma base paraVA. Desse modo, dada uma

base ortonormal qualquer _|mBi para VB, podemos escrever

|Ψ_i=X

n,m

(20)

uma vez que o conjunto{|ψn_Ai |mBi}forma uma base paraVA⊗ VB. Sejaα2n o autovalor de

ρAassociado ao autovetor |ψAni.Definimos ent˜ao

|φn_B_i=X

m

cnm

αn |

mBi,

de modo que

|Ψ_i=

d

X

i=1

αi

ψ_Ai φi_B ,

Resta mostrar que o conjunto{|φm_Bi}pode ser estendido a uma base ortonormal. Para isso, devemos verificar que esse ´e um conjunto ortonormal. De fato

hφn_B _|φm_B_i=Xk, lc∗nkcml αnαm h

kB |lBi

=X

k

c∗_nkcmk

αnαm

= 1 αnαm

X

k

hΨ_{| |}ψn_A_{i |}kBi hψAm| hkB| |Ψi

= 1 αnαm

X

k

hψ_Am|ρA|ψnAi=

αnαmδnm

αnαm

=δnm.

O ordenamento n˜ao-crescente dos coeficientes pode ser feito reordenando os vetores da base.

Os coeficientes de Schmidt s˜ao os autovalores das matrizes densidade reduzidas ρA =

T rB(|Ψi hΨ|) e ρB = T rA(|Ψi hΨ|). Por esse motivo o n´umero de coeficientes n˜ao nulos

(chamado número de Schmidt) e também os seus valores são os mesmos para toda decom-posi¸cão. Além disso, se

|Ψ_i=X

i

ai|iiA|iiB,

|Ψ_i=X

i ai i′ A i′ B

são duas decomposi¸cões distintas, as aplica¸cões linearesUA e UB definidas nas bases por

|iiA7→

i′

A, |iiB7→

i′

B

são aplica¸cões unitárias tais que

UA⊗UB(|Ψi) =|Ψi.

Desse modo, duas decomposi¸cões de Schmidt distintas estão relacionadas por unitárias locais que fixam |Ψi.

(21)

1.2. Grupos de Lie

1.2 _{Grupos de Lie}

Nessa se¸cão veremos os grupos de Lie e alguns resultados relevantes que utilizaremos no Cap´ıtulo 2. Como referências sugerimos [9, 10]. Vamos utilizar aqui alguns resultados bem conhecidos, mas não triviais de topologia [16].

Defini¸c˜ao 11. _{Um grupo de Lie sobre um corpo} K ₌ R_,C _{´e um grupo} _G _{munido de uma}

estrutura de variedade diferenci´avel sobreK_{tal que o mapa}

µ:G×G −→ G (x, y) _7−→ xy ´e diferenci´avel.

Teorema 7. _Dado _p_∈_{G, o mapa}

µp :G −→ G

x 7−→ px

´e um difeomorfismo de variedades deG emG.

Proposi¸c˜ao 3. _{O mapa}

ν:G −→ G x 7−→ x−1

´e um difeomorfismo de variedades deG emG.

Demonstra¸cão. Dado x_∈G, o inversoν(x) =x−1 _{é definido pela equa¸cão}

µ(x, ν(x)) =e.

A derivada parcial deµem rela¸cão à segunda variável é a derivada deµx, que é um isomorfismo,

já queµxé um difeomorfismo. Desse modo, podemos utilizar o teorema da aplica¸cão impl´ıcita

para concluir que ν é uma fun¸cão diferenciável. Como sua inversa é ela própria, ν é um difeomorfismo.

Exemplos:

1. O grupo aditivoK_.

2. O grupo multiplicativo K∗_.

3. O grupo GL(n,K₎ _{de matrizes invert´ıveis} _n_×_{n. Identificando}_M_{(n), o conjunto das}

matrizes n_×ncom entradas em K_{, a}Kn2_{, fica claro que a multiplica¸c˜ao de matrizes}

é diferenciável, uma vez que as entradas do produto AB são fun¸cões polinomiais das entradas deAeB. GL(n,K₎_{é uma variedade porque é o subconjunto de}_M_(n)_definido

pela equa¸cãodet(A)₆= 0. Como o determinante é uma equa¸cão polinomial nas entradas deA, o conjunto das matrizes que satisfazem essa equa¸cão formam um aberto de Kn2_,

(22)

4. O grupo SL(n,K_{), formado pelas matrizes} _n_×_n _{de determinante igual a um. Pelo}

teorema da aplica¸c˜ao impl´ıcita,SL(n,K₎_{´e uma variedade de}Kn2_,_{e portanto um grupo}

de Lie.

5. O grupo O(n,K₎ _{das matrizes ortogonais}_n_×_{n. Esse conjunto ´e definido pela equa¸c˜ao}

AAT =I, que é um sistema de equa¸cões polinomiais nas entradas deA. Podemos usar o teorema da aplica¸cão impl´ıcita para mostrar que o conjunto formado pelas matrizes que satisfazem essa equa¸cão também é uma variedade deKn2_._{Também é uma variedade}

o grupo SO(n,K_{) =}_O(n,K₎_∩_SL(n,K_).

6. De maneira semelhante mostramos queU(n), o conjunto das matrizes complexas unitárias n×n, definidas pela equa¸cãoU U† = I, é um grupo de Lie. Também é um grupo de Lie SU(n) =SL(n,C₎_∩_U_{(n), o conjunto das matrizes unitárias especiais.}

7. O grupo de Lorentz, formado pelas matrizes 4_×4 que satisfazem a equa¸c˜ao

AM AT =M M = 

  

1 0 0 0

0 ₋1 0 0 0 0 −1 0 0 0 0 ₋1



   .

Para ver que esse grupo ´e uma variedade em Kn2_, _{podemos usar mais uma vez o}

teo-rema da aplica¸cão impl´ıcita, já que a equa¸cão acima é polinomial nas entradas de A. Um subgrupo importante do grupo de Lorentz consiste das transforma¸cões de Lorentz próprias e ortócronas, que é chamado de grupo de Lorentz restrito e que será denotado porL. Uma transforma¸cão de Lorentz é ditaprópriase possuir determinante igual a um e ortócronase possuir a entrada 11maior que zero.

Defini¸cão 12. _{Um subgrupo} _H _{do grupo} _G _{é dito um subgrupo de Lie de} _G _se _H _{é uma}

subvariedade de G.

Exemplos:

1. SL(n),O(n),SO(n),U(n) eSU(n)s˜ao subgrupos de Lie de GL(n).

2. O grupo das transforma¸cões de Lorentz próprias e ortócronas é um subgrupo de Lie do grupo de Lorentz.

Como um subgrupo de LieHé uma subvariedade, é aberto em seu fechoH, que também é um subgrupo, já que a multiplica¸cão em G é uma aplica¸cão cont´ınua. Como µp é um

difeomorfismo para todo p∈G, cada classe lateral de H em H também é um aberto em H. Como H é o complementar da união de suas classes laterais, exceto o próprio H, segue que H é fechado em H e por consequência também é fechado em G. Logo todo subgrupo de Lie aberto é união de componentes conexas de G.

Corol´ario 2. _{Todo subgrupo de Lie aberto cont´em a componente conexa da identidade} _G0_.

Proposi¸cão 4. _{A componente conexa} _G0 _de _G _{que contém a identidade é um subgrupo de}

(23)

1.2. Grupos de Lie

Demonstra¸c˜ao. Primeiro vamos mostrar queG0 ´e um grupo. Sejam h1, h2 ∈G0. Devemos

mostrar que h1h2 e h−11 ∈ G0. Sabemos que µh1 : G → G ´e um difeomorfismo e por isso

deve levarG0 em alguma componente conexa deG. Como e∈G0, essa componente conexa

deve ser G0, uma vez queh1 ∈G0. Desse modo, µh1 ´e uma bije¸c˜ao entre G

0 _{e ele mesmo e}

h1h2 ∈G0.

Como o mapa ν que leva cada elemento em seu inverso é um difeomorfismo, também deve levar G0 em alguma componente conexa. Como ν(e) = e, essa componente deve ser o próprio G0 _{de modo que} _h−1

1 ∈G0.

Agora devemos mostrar que G0 é normal, ou seja, que as classes laterias à direita e à esquerda são iguais. Como a multiplica¸cão à esquerda e à direita são difeomorfismos, pG0 _e

G0_p _{s˜ao componentes conexas de} _{G. Como} _e_∈_G0_,_p _∈_pG0 _e _p_∈_G0_{p, o que implica que}

pG0 =G0p para todop∈G.

Resta mostrar que as outras componentes conexas s˜ao classes laterais de G0_{. Seja} _H

uma componente conexa deGeh∈H. Ent˜aohG0 =H poishG0´e uma componente conexa deg e he=h.

Corol´ario 3. _{O subgrupo gerado por qualquer vizinhan¸ca da identidade ´e}_G0_.

Demonstra¸cão. Seja V uma vizinhan¸ca da identidade e h ∈ V. Como a multiplica¸cão à esquerda é um difeomorfismo,hV é um aberto que contémh, uma vez quee_∈V, e que está contido no subgrupo gerado por V. Logo esse subgrupo é aberto e portanto é um subgrupo de Lie, de modo que deve conter G0. Como G0 é um subgrupo que contém V, o subgrupo gerado por V é igual aG0.

1.2.1 _{Algebra de Lie}´

Defini¸cão 13. _{A álgebra de Lie} _g _{de um grupo de Lie} _G _{é o espa¸co tangente de} _G _na

identidade do grupoe.

Muitas informa¸cões sobreGpodem ser obtidas a partir deg. Veremos na se¸cão seguinte comog pode ser útil para provar resultados a respeito deG.

O espa¸co tangente de uma variedade pode ser mapeado na variedade através de uma aplica¸cão, chamada aplica¸cão exponencial. Restrita à vizinhan¸cas adequadas, chamadas vizi-nhan¸cas normais, a exponencial é um difeomorfismo entre o espa¸co tangente e a variedade. No caso dos grupos de Lie matriciais, a aplica¸cão exponencial que leva a álgebra de Lie ao grupo coincide com a exponencial matricial, dada pela expressão

eA_≡I+A+A

2

2 + A3

3! +. . .+ An

n! +. . .

Em uma vizinhan¸ca normal da identidade esse mapa ´e um difeomorfismo, e o difeomorfismo inverso ´e chamado de logaritmo.

Teorema 8. _{Se a ´algebra de Lie de um grupo matricial} _G _{´e gerada pelos elementos} _g_i _{e a}

álgebra de Lie de um grupo matricial H é gerada por elementoshj então a álgebra de Lie de

(24)

1.2.2 _{Alguns homomorfismos importantes}

Alguns dos grupos dos quais falamos na se¸cão anterior estão relacionadas através de dois homomorfismos que serão muito úteis para aplica¸cões que mostraremos no Cap´ıtulo 2. O primeiro deles relaciona SL(2,C₎ _e _L _{e o segundo relaciona o produto tensorial} _SL(2,C₎_⊗

SL(2,C₎ _e _SO(4,C_{). As demonstra¸cões são baseadas nas demonstra¸cões apresentadas em}

[2].

Vamos precisar de algumas propriedades desses grupos de Lie.

Lema 1. _SL(2,C₎ _{é um grupo de Lie conexo, cuja álgebra de Lie é o conjunto das matrizes}

complexas2_×2de tra¸co nulo.

Lema 2. _SO(4,C₎_{é um grupo de Lie conexo, cuja álgebra de Lie é o conjunto das matrizes}

complexas4_×4antissim´etricas.

Lema 3. _{O grupo de Lorentz restrito é um grupo conexo, cuja álgebra de Lie tem dimensão}

6.

Proposi¸c˜ao5. _Seja_B_{= 1/2}



  

1 0 0 1 0 i i 0 0 −1 1 0 i 0 0 −i



  

e

Φ :SL(2,C₎_⊗_SL(2,C₎ _−→ _SO(4,C₎

A1⊗A2 7−→ B(A1⊗A2)B†.

Ent˜ao Φ´e um isomorfismo de grupos de Lie.

Demonstra¸cão. Não é dif´ıcil mostrar que se A1, A2 ∈ SL(2,C) então B(A1 ⊗A2)B† ∈

SO(4,C_{). De fato,}

(B(A1⊗A2)B†)(B(A1⊗A2)B†)T = B(A1⊗A2)B†B∗(AT1 ⊗AT2)BT

=B(A1⊗A2)(σ2⊗σ2)(AT1 ⊗AT2)BT = det(A1) det(A2)B(σ2⊗σ2)BT =I.

em que

σ2 =

0 i

−i 0

.

Além disso, Φé injetiva poisB é uma matriz invert´ıvel.

Resta mostrar a sobrejetividade. A ´algebra de Liesl(2)´e gerada pelas matrizes: h=

1 0 0 ₋1

, e=

0 1 0 0

, f =

0 0 1 0

.

Por esse motivo, a ´algebra de Lie deSL(2)⊗SL(2), que denotaremos poral(SL(2,C₎_⊗

SL(2,C_{)), ´e gerada pelas matrizes}_A₁ ₌_I_⊗_{h, A}₂ ₌_I_⊗_{e, A}₃₌ _I_⊗_{f, A}₄ ₌_h_⊗_{I, A}₅₌

e⊗I, A6 =f ⊗I.

Calculando BAiB†, obtemos seis matrizes antissim´etricas e linearmente independentes,

(25)

1.2. Grupos de Lie

6, essas matrizes geram esse espa¸co, que ´e justamente a ´algebra de Lie de SO(4,C_{). Logo o}

mapa

φ:al(SL(2,C₎_⊗_SL(2,C₎₎ _−→ _so_(4,C₎

A _7−→ BAB†

é um isomorfismo de álgebras de Lie. Como exp(BAB†) = Bexp(A)B†, uma vez que B†B = I, temos que exp_◦ φ_◦log = Φ. Seja V uma vizinhan¸ca normal da identidade em SL(2,C₎_⊗_SL(2,C₎_{cuja imagem seja também uma vizinhan¸ca normal. Então, restrita a essas}

vizinhan¸cas, Φ´e um difeomorfismo. Logo existe uma vizinhan¸ca da identidade em SO(4,C₎

em que todas as matrizes podem ser escritas na forma BA1⊗A2B†,Ai ∈SL(2,C). Como

B†_B ₌_I_{, toda matriz no subgrupo gerado por essa vizinhan¸ca pode ser escrita nessa forma.}

Mas o subgrupo gerado por qualquer vizinhan¸ca da identidade emSO(4,C₎ _{´e o grupo todo,}

pois SO(4,C₎ _{´e conexo. Assim mostramos que}_Φ_{´e sobrejetivo.}

Proposi¸c˜ao 6. _Seja_T ₌ 1

2



  

1 0 0 1

0 1 1 0

0 i −i 0 1 0 0 −1



   e

Φ :SL(2,C₎ _−→ _L

A 7−→ T(A⊗A∗)T†. Então Φé uma aplica¸cão sobrejetiva e Φ(A) = Φ(B)_⇔B=_±A.

Demonstra¸c˜ao. Definimos um mapa induzido por Φnas ´algebras de Lie da seguinte forma: φ:sl(2,C₎ _−→ _L

X _7−→ T(X_⊗I+I_⊗X∗)T†.

Restringindo-nos a vizinhan¸cas da identidade adequadas, de modo que o logaritmo esteja bem definido, temos que, como Φ(A) =T(A⊗A∗)T†:

log(Φ(exp(X))) = log(T(exp(X)_⊗exp(X)∗)T†) =

T(log(exp(X)_⊗exp(X)∗))T†=T(log((exp(X)_⊗I)(I_⊗exp(X)∗)))T†= T(log(exp(X)_⊗I) + log(I_⊗exp(X)∗))T†=T(X_⊗I+I_⊗X∗)T†. Desse modo, φ(X) = log(Φ(exp(X))),eΦ = exp◦φ◦log.

Considerandosl(2,C₎ _{uma ´algebra de Lie sobre} R_{, seus geradores s˜ao} _{h, e, f, ih, ie, if.}

As imagens dessas matrizes por φsão matrizes linearmente independentes, e por isso o mapa φé um isomorfismo entre as álgebras de Lie. Desse modo, obtemos um difeomorfismo entre vizinhan¸cas da identidade. Pelo fato de L ser conexo, essa vizinhan¸ca gera o grupo inteiro. Como produto de elementos da imagem pertence à imagem, uma vez que T†_T ₌_{I, o mapa}

Φ´e sobrejetivo.

ComoT ´e uma matriz invert´ıvel,φ(A) =φ(B)_⇔A_⊗A∗ =B_⊗B∗, o que acontece se e somente se A=_±B. De fato, se

A=

a b c d

B =

x y w z,

(26)

ent˜ao



  

aa∗ _ab∗ _ba∗ _bb∗

ac∗ ad∗ bc∗ bd∗ ca∗ cb∗ da∗ db∗ cc∗ _cd∗ _dc∗ _dd∗

    =    

xx∗ _xy∗ _yx∗ _yy∗

xw∗ xz∗ yw∗ yz∗ wx∗ wy∗ zx∗ zy∗ ww∗ _wz∗ _zw∗ _zz∗



  

e ent˜ao temos:

|a_|2 =_|x_|2, _|b_|2 =_|y_|2, _|c_|2 =_|w_|2, _|d_|2 =_|z_|2 ac∗ =xw∗, ab∗ =xy∗, bd∗ =yz∗, cd∗=wz∗ Escrevendo

a=r1eiα1, b=r2eiα2, c=r3eiα3, d=r4eiα4

x=r₁′eiα′1, y =r′

2eiα

′

2, w=r′

3eiα

′

3, z=r′

4eiα

′

4,

obtemos as seguintes rela¸c˜oes:

ri =ri′ ∀ i, αi−α′i=β ∀ i,

o que implica que B =eiβ_{A. Como} _{det(A) = det(B}_{) = 1}_ent˜ao _eiβ ₌_±_{1, como quer´ıamos}

mostrar.

1.3 _Convexidade

Convexidade é uma restri¸cão importante para que um conjunto possa servir como o conjunto de estados poss´ıveis de um sistema f´ısico. Essa restri¸cão vem do fato de que queremos formar “misturas”de dois estados, que geometricamente seriam representadas por pontos no segmento de reta que liga os estados que queremos misturar. Nessa se¸cão vamos apresentar as principais propriedades de conjuntos convexos e vetores de probabilidade [11].

Defini¸c˜ao 14. _{Um conjunto} _C _{em um espa¸co vetorial} _V _{´e chamado convexo se dados dois}

vetoresv, u∈C os pontos da forma

λv+ (1−λ)u , λ∈[0,1], tamb´em pertencem a C.

Alguns conjuntos convexos possuem pontos especiais que não podem ser escritos como soma convexa de outros pontos, chamados pontos extremais. Por exemplo, os vértices são pontos extremais do quadrado, do cubo e do triângulo, e os pontos na esfera de raio um são os pontos extremais da bola de raio um. O quadrante em Rn _{formado por todos os pontos}

cujas coordenadas s˜ao positivas ´e um exemplo de um conjunto convexo sem pontos extremais.

Defini¸c˜ao 15. _{O fecho convexo de um conjunto} _A _em _V _{´e o menor conjunto convexo que}

cont´em A.

O fecho convexo de um conjunto de p+ 1 pontos, tais que eles não perten¸cam todos a um subespa¸co afim de dimensão p₋1, é chamado de p-simplexo.

(27)

1.3. Convexidade

Teorema 9 _{(Hahn-Banach vers˜ao geom´etrica)}. _Seja_V _{um espa¸co vetorial normado e sejam}

A, B ⊂ V conjuntos convexos, n˜ao-vazios, disjuntos, A fechado e B compacto. Ent˜ao existe um funcional linear f :_{V →}K_{e uma constante} _c_{tais que}

f(a)> c ∀ a∈A, f(b)< c ∀ b∈B.

1.3.1 _{Probabilidades}

Queremos agora estudar um conjunto convexo especial em RN_{: o conjunto de todas as}

distribui¸cões de probabilidade para uma variável aleatóriaX.

Uma variável aleatória pode ser considerada como o resultado numérico de fazer uma experiência não determin´ıstica para gerar resultados aleatórios, como por exemplo jogar uma moeda, um dado, ou realizar a medi¸cão de uma grandeza f´ısica. Vamos considerar o caso em que o conjunto dos poss´ıveis resultados, ou seja, o espa¸co amostral, possuaN elementos. Representaremos resultados poss´ıveis porxi e a probabilidade de cada resultado ser obtido por

P(X =xi) =pi.Como representam as probabilidades de uma vari´avel aleat´oria, cadapi≥0

e P

ipi = 1.

O conjunto de todas as distribui¸cões de probabilidades poss´ıveis paraX é o conjunto de todos os vetores em RN _{com coordenadas não-negativas e que somam um. Esse conjunto é}

um (N-1)-simplexo em RN_{, fecho convexo de seus pontos extremais que s˜ao as distribui¸c˜oes}

tais que um dospi é igual a um e os outros são zero, e será denotado por ∆.

Vamos agora definir um conceito que, de certa forma, torna mais precisa a no¸c˜ao de que um vetor de probabilidade pode ser mais “uniforme”que outro.

Defini¸c˜ao 16. _{Consideremos dois vetores}_{x, y}_∈_{∆. Sejam}_x↓ _e _y↓ _{os vetores obtidos de} _x _e

y colocando suas coordenadas em ordem n˜ao-crescente. Dizemos quex´e majorado por y, ou que y majora xse para todo k= 1, . . . , N vale

k

X

i=1

x↓_i _≤

k

X

i=1

y_i↓.

Se y majora x, denotamosx≺y ouy ≻x.

´

E claro que vale a reflexividade, ou seja,x≺xe também a transitividade, ou seja, sex≺y ey _≺zentão, x_≺z. No entantox_≺y e y_≺xnão implica x=y pois as coordenadas dey podem ser uma permuta¸cão das coordenadas de x. No entanto, se considerarmos o conjunto das classes de equivalência tais que dois vetores estão relacionados se as coordenadas de um são permuta¸cão das coordenadas do outro, entãox_≺y e y_≺ximplica x=y. Desse modo, a majora¸cão impõe uma ordem parcial em ∆, com a rela¸cão de equivalência explicada. A ordem é apenas parcial pois existem vetores tais que nenhum deles majora o outro. Existem um menor e um maior elemento para essa ordem parcial:

xN ≡

₁

N N1 . . . N1

≺x≺

1 0 . . . 0

≡x1.

(28)

Defini¸cão17. _{Uma matriz estocástica} _B _{agindo em}_∆_{é uma matriz com}_N _{colunas tal que}

Bij ≥0, N

X

i=1

Bij = 1.

Uma matriz biestocástica é uma matriz estocástica quadrada que também satisfaz

N

X

j=1

Bij = 1.

Uma matriz estocástica é uma matriz que leva uma distribui¸cão de probabilidade em outra, não necessariamente com o mesmo número de coordenadas. Uma matriz biestocática é uma matriz que leva uma distribui¸cão de probabilidade em outra com o mesmo número de coordenadas e além disso preserva o menor elemento xN. Um resultado importante é o

seguinte

Teorema 10 _{(Hardy, Littlewood e P´olya (HLP))}. _{Dados dois vetores} _{x, y} _∈_∆, _x _≺_y _{se, e}

somente se, existe uma matriz biestoc´astica tal que x=By.

Esse resultado nos permite interpretar a a¸cão de uma matriz biestocástica em ∆ como uma contra¸cão do simplexo em dire¸cão ao seu centro xN, uma vez que essa a¸cão torna as

distribui¸cões mais próximas da distribui¸cão uniforme.

Teorema 11. _Se _y _majora _{x, ent˜ao} _x _{pertence ao fecho convexo do conjunto de vetores}

formados por todas as permuta¸c˜oes das coordenadas de y.

Defini¸cão18. _{Dizemos que uma fun¸cão}_f _:_S _→R_{é convexa de Schur se}

y_≻x=_⇒f(y)_≥f(x). Dizemos que f ´e cˆoncava de Schur se

y_≻x=_⇒f(y)_≤f(x).

Motivado pela melhoria na transmissão de informa¸cão através de canais como cabos telefônicos, Shannon desenvolveu a primeira teoria de informa¸cão bem sucedida, dando uma defini¸cão matemática para o conceito de informa¸cão.

Defini¸c˜ao 19. _{Dada uma vari´avel aleat´}_oria_X _{com resultados poss´ıveis} _x_i _{que ocorrem com}

probabilidade pi, a informa¸c˜ao do evento X =xi ´e dada por

I(X =xi) =−log(pi).

A fun¸cãologé escolhida pelo fato de ser a única que satisfaz três propriedades desejáveis para uma fun¸cão que representeinforma¸cão: depender apenas da probabilidadepi, ser cont´ınua

(29)

1.3. Convexidade

Defini¸c˜ao 20. _{A entropia de Shannon de}_X _{´e a esperan¸ca de I em}_X

S(X) =X

i

piI(X=xi) =−

X

i

pilog(pi).

Usamos a conven¸c˜ao 0 log 0 = 0.

A entropia de Shannon quantifica a “incerteza”da variável aleatória X. Se não há in-certeza nenhuma, ou seja, se pi = 1 para algum i, S(X) = 0. Se a incerteza é “máxima”,

ou seja, se a distribui¸cão de probabilidade de X é uniforme, então S(X) assume seu valor máximo.

Teorema 12. _{A entropia de Shannon é uma fun¸cão côncava de Schur.}

Uma maneira de generalizarmos as distribui¸cões de probabilidade em ∆ é através das matrizes positivas de tra¸co um, que chamaremos matrizes densidade. Elas representam uma versão quântica dos vetores de probabilidade clássicos. O vetor formado pelos autovalores de uma matriz densidade é um vetor em∆.

Assim como ∆, o conjunto de todas as matrizes densidade de uma dada dimensão é um conjunto convexo e muitas das defini¸cões e resultados válidos para vetores em ∆podem ser generalizado para matrizes densidade, como por exemplo o conceito de majora¸cão e o lema HLP, que veremos no cap´ıtulo 3. Podemos também definir o análogo da entropia de Shannon, a entropia de von Neumann.

Defini¸c˜ao 21. _{A entropia de von Neumann de uma matriz densidade}_ρ _{´e definida como}

S(ρ) =₋T r(ρlogρ), (1.1)

e ´e igual `a entropia de Shannon do vetor formado pelos autovalores deρ.

(30)

(31)

CAP´

ITULO

2

Os qubits

Nesse cap´ıtulo vamos estudar o sistema quântico mais simples e melhor entendido: o qubit. Ele também é o sistema quântico mais importante para as áreas de computa¸cão e informa¸cão quânticas, pois ele é o portador da informa¸cão, o análogo quântico dobit.

O qubit é a representa¸cão matemática de vários sistema f´ısicos, às vezes depois de uma drástica simplifica¸cão. Exemplos são os graus de liberdade de polariza¸cão de um fóton e de spin de uma part´ıcula de spin 1/2. Um átomo ou uma mólecula também podem ser modelados através de um qubit, desde que apenas dois n´ıveis de energia estejam acess´ıveis ao sistema.

Veremos também o sistema de dois qubits, o sistema mais simples que pode apresentar emaranhamento. Queremos estudar o efeito das chamadas opera¸cões de filtragem sobre os estados desse sistema e para isso os resultados sobre grupos de Lie serão utilizados. Como uma consequência, vamos demonstrar um resultado muito útil: a transposta parcial de uma matriz densidade de dois qubits tem no máximo um autovalor negativo. Apesar de simples, esse é um resultado não trivial. Não há nada que nos garanta a princ´ıpio que os casos com dois ou três autovalores negativos não sejam poss´ıveis, mas veremos que de fato não são.

2.1 _{Os qubits e a Fibra¸}

_c˜

_{ao de Hopf}

Umqubité um sistema quântico ao qual está associado um espa¸co de Hilbert de dimensão dois, comumente chamado de sistema quântico de dois n´ıveis. O nome vem da analogia com o sistema clássico de dois n´ıveis, que em computa¸cão clássica é chamado de bit. A mesma analogia justifica a nota¸cão utilizada para os vetores de uma base ortonormal do espa¸co de Hilbert do sistema: |0i e|1i. Um vetor qualquer em Hpode ser escrito na forma

|ψi=α|0i+β|1i, α, β∈C_.

Se considerarmosαeβ como dois vetores emR2_{, os estados puros de um qubit podem ser}

vistos como pontos em R4_{. Como esses vetores possuem norma um, eles pertencem `a esfera}

S3 ⊂R4_{. No entanto, muitos vetores diferentes em} _S3 _{representam o mesmo estado f´ısico,}

(32)

um único ponto do conjunto. Para isso, vamos cobrir S3 com c´ırculosS1, que são os loci dos pontos da forma eiφ|ψi, com |ψi fixo. Para fazer essa cobertura, podemos usar a fibra¸cão de Hopf.

2.1.1 _Fibrados

Umafibra¸cãoé definida por um mapahque leva um espa¸coEem um espa¸coB, chamado espa¸co base. Um conjuntoF _⊂Eé chamadofibrase corresponde ah−1_(p)_{para algum}_p_∈_B_.

Um exemplo trivial ´e a proje¸c˜ao

h:R3 _−→R2

h

a b c =

a b . As fibras s˜ao retas paralelas ao eixo z.

No caso da fibra¸cão de Hopf,E =S3,B =S2 eF =S1. O mapa hé a composi¸cão de dois mapash1 e h2 definidos da seguinte forma

h1 :S3−→R2+{∞}

α β

7−→C=αβ¯−1_,

h2 :C∪ {∞} −→S2

C _7−→Π−_E1(C),

em que ΠE :S2 →C∪ {∞} denota a proje¸c˜ao estereogr´afica

ΠE

a b c

= _a

1−c 1−bc

.

Geometricamente, a proje¸c˜ao estereogr´afica tem um significado bem interessante. Toma-mos um ponto na esfera S2 _q₌

a b c

e constru´ımos a reta que liga esse ponto ao polo norte p=

0 0 1

ta tb t(c₋1) + 1

, t_∈R_.

A proje¸cão estereográfica leva q na interse¸cão dessa reta com o plano z = 0. O polo norte é levado ao ponto no infinito.

Temos ent˜ao h2

x y

=h _x2₊2_yx2₊₁

2y x2₊_y2₊₁

x2

+y2

−1 x2₊_y2₊₁

i .

Escrevendo α=r1eiφ1 e β =r2eiφ2,temos

C=h1 α β = r1

r2

cos(φ2−φ1) sen(φ2−φ1) .

Assim

h(_|ψ_i) =h2(C) =

h

2r1r2cos(φ2−φ1)

r2 1+r

2 2

2r1r2sen(φ2−φ1)

r2 1+r

2 2

r2 1+r

2 2

r2 1+r

2 2

i

=

2Re αβ¯

2Im αβ¯

|α|2_{− |}_β_|2 =

(33)

2.1. Os qubits e a Fibra¸c˜ao de Hopf

em que

σ1=

0 1 1 0

, σ2 =

0 ₋i

i 0

, σ3 =

1 0 0 −1

,

s˜ao chamados operadores de Pauli.

As fibras do mapa h são as fibras do mapa h1 pois h2 é bijetivo. Essas fibras são as

classes de equivalência {eiφ|ψi}e aplicando o mapa de Hopf h a redundância na fase global é eliminada, como desejávamos. Assim podemos tomar a esferaS2_{, que chamamos de} _esfera

de Bloch, como sendo o conjunto de estados puros do sistema quˆantico de um qubit.

Figura 2.1: Esfera de Bloch e representa¸c˜ao de um estado de um qubit.

A fibra¸cão de Hopf e a esfera de Bloch estão relacionadas à representa¸cão de estados puros através de espa¸cos projetivos. Toda a mecânica quântica pode ser formulada nessa versão projetiva como pode ser visto em [18]. Para mais detalhes sobre a fibra¸cão de Hopf e a esfera de Bloch, veja [11, 19, 20, 21].

2.1.2 _{Estados mistos de um qubit}

Um estado geral de um qubit é representado por uma matriz densidade2_×2. O conjunto das matrizes hermitianas é um espa¸co vetorial real e uma base para esse espa¸co é formado pelas matrizes de Pauli juntamente com a matriz identidade I. Desse modo, uma matriz densidade de um qubit pode ser sempre escrita na forma

ρ= 1

2(I+aσ1+bσ2+cσ3).

O coeficiente deI deve ser1/2 porque ela é a única matriz da base que tem tra¸co não nulo, igual a dois, e T r(ρ) = 1. Agora devemos impor condi¸cões ao vetor

(34)

que a matriz seja positiva. Em forma matricial temos

ρ= 1 2

1 +c a₋ib a+ib 1₋c

.

Para que ρ seja uma matriz positiva é necessário e suficiente que det(ρ) ≥0, uma vez que T r(ρ)_≥0.Essa condi¸cão é equivalente a

a2+b2+c2_≤1.

Logo podemos fazer uma associa¸c˜ao bijetiva entre matrizes densidade de um qubit e pontos na bola de raio um em R3_{. Os pontos na esfera} _S2 _{correspondem `as matrizes que possuem}

determinante igual a zero, que nesse caso são exatamente os estados puros. Essa associa¸cão coincide com a que fizemos na se¸cão anterior utilizando a fibra¸cão de Hopf.

2.1.3 _{Dois qubits}

O sistema de dois qubits é o sistema mais simples que apresenta emaranhamento. O espa¸co de estados do sistema é C2 _⊗C2 _{e as matrizes densidade são matrizes positivas de}

tra¸co um que pertencem a M(C2₎_⊗_M₍C2_{). Como as matrizes de Pauli formam uma base}

para o espa¸co vetorial formado pelas matrizes hermitianas 2×2, uma base para o espa¸co vetorial formado pelas matrizes hermitianas4_×4´e o conjunto formado pelas matrizes1 I, I_⊗ σi, σi⊗I, σi⊗σj, de modo que uma matriz densidade de dois qubits pode ser escrita na forma

ρ= 1 4



I+X

i

R0iI⊗σi+

X

i

Ri0σi⊗I +

X

ij

Rijσi⊗σj





Rij =T r(σi⊗σjρ).

Assim, podemos representar uma matriz densidade de dois qubits também através da matriz R cujas entradas são os coeficientes Rij que aparecem na igualdade anterior, com

R00= 1/4.

Realizando o tra¸co parcial em rela¸c˜ao ao primeiro subsistema, vemos que o vetor

R01 R02 R03

é o vetor de Bloch da matriz densidade reduzida do segundo subsistema. Já se fizermos o tra¸co parcial em rela¸cão ao segundo subsistema, veremos que o vetor

R10 R20 R30

´e o vetor de Bloch da matriz densidade reduzida do primeiro subsistema.

Infelizmente, as condi¸cões que devemos impor aos outros coeficientes para que a matriz seja positiva não são tão facilmente encontradas, a não ser se estudarmos casos especiais como por exemplo o conjunto dos chamados estados T [22].

1

(35)

2.1. Os qubits e a Fibra¸c˜ao de Hopf

SejaDo conjunto das matrizes

1 4



I+X

i

R0iI ⊗σi+

X

i

Ri0σi⊗I+

X

ij

Rijσi⊗σj





tais que a matrizRij,i, j= 1, . . .3 seja diagonal.

Proposi¸cão 7. _Se _M _∈_D _então _M† ₌_M _e _{T r(M) = 1. Se além disso ela é uma matriz}

densidade de dois qubits, ent˜ao o vetorr=

R11 R22 R33 pertence ao tetraedoT cujos

v´ertices s˜ao os pontos

−1 ₋1 ₋1 ,

−1 1 1

,

1 ₋1 1

,

1 1 ₋1 .

Demonstra¸cão. Se a matriz é positiva, então T r(M P) ≥0 para todo projetor P. Tomando os projetores na dire¸cão dos quatro vetores chamados estados de Bell

|Φ_±_i = |00i ± |√ 11i

2 , (2.1)

|Ψ_±i = |01i ± |√ 10i

2 , (2.2)

obtemos as quatro equa¸c˜oes

1₋R11−R22−R33≥0,

1₋R11+R22+R33≥0,

1 +R11−R22+R33≥0,

1 +R11+R22−R33≥0,

que definem justamente o tetraedro T.

Se além das restri¸cões já impostas também exigirmos que os vetores v1= R10 R20 R30 , v2 = R01 R02 R03

sejam nulos, ou seja, que ambas as matrizes densidade reduzidas sejam a identidade, então a condi¸cão acima além de necessária é suficiente. Estados com essa propriedade são chamados estados T.

Proposi¸c˜ao8. _{Uma matriz}_M _em_D_com_v₁_e_v₂_{nulos ´e uma matriz densidade de dois qubits}

se, e somente se, o vetor r pertence ao tetraedroT.

Demonstra¸cão. Já sabemos que a condi¸cão é necessária. Para vermos que é suficiente, basta notarmos que toda matriz dessa forma é uma combina¸cão convexa das quatro matrizes comv1

ev2nulos e cujos vetoresrsão os vértices do tetraedro. Essas quatro matrizes são exatamente

as matrizes densidade dos estados de Bell, de modo queM é combina¸cão convexa de matrizes densidade e portanto também é uma matriz densidade.

(36)

Figura 2.2: Tetraedro T.

Proposi¸cão 9. _{Se uma matriz} _M _em _D _{é uma matriz densidade separável, então o vetor}_r

deve pertencer ao octaedroO cujos v´ertices s˜ao os pontos

±1 0 0

,

0 ±1 0

,

0 0 ±1 .

Demonstra¸cão. O efeito da transposi¸cão parcial da matriz densidade sobre o vetorr é trocar o sinal da coordenada R22. Desse modo, o vetor r da transposta parcial deve pertencer ao

tetraedro T′ _{cujos v´ertices s˜ao}

−1 1 ₋1 ,

−1 ₋1 1 ,

1 1 1 ,

1 ₋1 ₋1 .

Para que a transposta parcial seja positiva, esse vetor deve pertencer a T também. Logo, se M é separável, seu vetorr pertence aT_∩T′_{, que é justamente o octaedro}_O _{(vide fig. 2.1.3).}

Como consequˆencia da proposi¸c˜ao anterior, vale o seguinte resultado para estados T:

Proposi¸cão10. _{Um estado T é separável se, e somente se, seu vetor}_r _{pertence ao octaedro}

O.

Daqui em diante, nossa aten¸c˜ao se voltar´a principalmente para o sistema de dois qubits.

2.2 _Opera¸

_c˜

_{oes de filtragem em sistemas de dois qubits}

Nessa se¸cão, vamos estudar as chamadas opera¸cões de filtragem ou opera¸cões locais estocásticas com comunica¸cão clássica, SLOCC2. Nosso intuito é encontrar um conjunto pe-queno deformas normaispara a matriz densidade utilizando essas opera¸cões, ou seja, queremos encontrar formas simples de matrizes densidades tais que qualquer matriz densidade pode ser levada a uma delas através de opera¸cões SLOCC [2, 23].

2

(37)

2.2. Opera¸c˜oes de filtragem em sistemas de dois qubits

Figura 2.3: A esquerda: o tetraedro T’. `` A direita: a interse¸c˜ao dos tetraedros T e T’, que resulta no octaedro O.

Defini¸cão 22. _{As opera¸cões SLOCC são opera¸cões da forma:}

ρ′ = (A⊗B)ρ(A⊗B)†

T r[(A_⊗B)ρ(A_⊗B)†_] (2.3)

em queA e B satisfazem as seguintes condi¸c˜oes3_:

• A†_A_≤_I _e_B†_B _≤_I;

• detA6= 0 edetB 6= 0.

3

(38)

A primeira exigência está relacionada ao fato de que queremos enxergar essas opera¸cões como um resultado poss´ıvel de um POVM. Por isso o termo stochastic, pois a opera¸cão não é feita deterministicamente, mas sim com alguma probabilidade dada porT r[(A_⊗B)ρ(A_⊗B)†_].

Não vamos nos preocupar aqui com as probabilidades, mas apenas com o efeito da opera¸cão sobre a matriz densidade. Por isso, essa restri¸cão é menos importante uma vez que estamos dividindo pelo termo T r[(A_⊗B)ρ(A_⊗B)†_]_{e não vamos nos preocupar muito com ela. A}

segunda restri¸cão é apenas uma questão de conveniência. Para nossos propósitos é interessante e também suficiente considerarmos apenas matrizes com determinante não nulo.

Nossa primeira preocupa¸cão é entender qual transforma¸cão sofre a matriz R quando aplicamos uma opera¸cão do tipo 2.3 à matriz ρ.

Teorema 13. _{A matriz}_R_{= (R}_ij₎_{se transforma sob a a¸c˜ao de transforma¸c˜}_{oes do tipo 2.3 da}

seguinte maneira, a menos de normaliza¸c˜ao:

R′ =LARLTB

em que

LA =

T(A_⊗A∗)T†

|detA_| ,

LB =

T(B⊗B∗)T†

|detB_| ,

T = 1

2 

  

1 0 0 1

0 1 1 0

0 i ₋i 0 1 0 0 ₋1



   .

Além disso, LA eLB são tansforma¸cões de Lorentz próprias ortócronas.

Demonstra¸c˜ao. A demonstra¸c˜ao pode ser dividida em quatro partes.

• 1◦passo: Mostrar queR= 4TρT˜ T, em queρ˜´e obtida escrevendo-se os´ındices deρ, que podemos pensar como variando de 0 a 3, em base bin´aria e definindo-seρ˜kl,k′_l′ =ρ_kk′_,ll′.

Desse modo temos:

ρ= 

  

ρ00 ρ01 ρ02 ρ03

ρ10 ρ11 ρ12 ρ13

ρ20 ρ21 ρ22 ρ23

ρ30 ρ31 ρ32 ρ33

    =    

ρ00,00 ρ00,01 ρ00,10 ρ00,11

ρ01,00 ρ01,01 ρ01,10 ρ01,11

ρ10,00 ρ10,01 ρ10,10 ρ10,11

ρ11,00 ρ11,01 ρ11,10 ρ11,11

    . E, portanto, ˜ ρ=    

ρ00,00 ρ00,01 ρ01,00 ρ01,01

ρ00,10 ρ00,11 ρ01,10 ρ01,11

ρ10,00 ρ10,01 ρ11,00 ρ11,01

ρ10,10 ρ10,11 ρ11,10 ρ11,11

    =    

ρ00 ρ01 ρ10 ρ11

ρ02 ρ03 ρ12 ρ13

ρ20 ρ21 ρ30 ρ31

ρ22 ρ23 ρ32 ρ33



   .

O c´alculo deTρT˜ T fornece:

" _ρ₀₀₊_ρ₁₁₊_ρ₂₂₊_ρ₃₃ _ρ₀₁₊_ρ₂₃₊_ρ₁₀₊_ρ₃₂ _i(ρ₀₁₊_ρ₂₃

−ρ10₋ρ32) ρ00₋ρ11+ρ22₋ρ33

ρ02+ρ20+ρ13+ρ31 ρ03+ρ21+ρ12+ρ30 i(ρ03+ρ21₋ρ12₋ρ30) ρ02+ρ20₋ρ13₋ρ31

i(ρ02+ρ13₋ρ20₋ρ31) i(ρ03₋ρ21+ρ12₋ρ30) ₋ρ03+ρ21+ρ12₋ρ30 i(ρ02₋ρ20₋ρ13+ρ31)

ρ00+ρ11₋ρ22₋ρ33 ρ01₋ρ23+ρ10₋ρ32 i(ρ01₋ρ23₋ρ10+ρ32) ρ00₋ρ11₋ρ22+ρ33 #