ALEXANDRE DE SOUZA FERNANDES
UM A RELAÇAO ENTRE EXPOENTES
DE LYAPUNOV E ENTROPIA
U N IV E R S ID A D E F E D E R A L D E U B E R L A
n
D IA
F A C U L D A D E D E M A T E M A
t
IC A
ALEXANDRE DE SOUZA FERNANDES
UM A RELACAO ENTRE EXPOENTES
DE LYAPUNOV E ENTROPIA
D issertação apresentada ao Programa de Pós-
Graduação em Matematica da Universidade Federal de
Uberlândia, como parte dos requisitos para obtençao do
título de M E S T R E E M M A T E M Á T IC A .
*
Á rea de C on cen tração: Matematica.
Linha de Pesquisa: Sistemas Dinâmicos.
O rien tador: Prof. Dr. Thiago Aparecido Catalan.
U B E R L A
n
D IA - M G
F363r
2017
Dados Internacionais de Catalogaçao na Publicaçao (CPI)
Sistema de Bibliotecas da UFU, MG, Brasil.
Fernandes, Alexandre de Souza, 1990
-Uma relaçao entre expoentes de Lyapunov e entropia / Alexandre
de Souza Fernandes. - 2017
68 f. : il.
Orientador: Thiago Aparecido Catalan.
Dissertaçao (mestrado) - Universidade Federal de Uberlândia. Pro
grama de Pós-Graduacao em Matematica.
Inclui bibliografia.
1. Matematica - Teses. 2. Entropia - Teses. 3. Teoria ergodica -
Teses. 4. Lyapunov, Funcoes de - Teses. I. Catalan, Thiago Aparecido.
II. Universidade Federal de Uberlandia. Programa de Pós-Graduacao
em Matemótica. III. Título.
UNIVERSIDADE FEDERAL DE UBERLÂNDIA
f a c u l d a d e
d e
m a t e m á t ic a
PROGRAMA DE PÓS-GRADUAçÃO EM MATEMÁTICA
Av. João Naves de Ávila, 2121, Bloco 1F, Sala 1F 152
Campus Santa Mônica, Uberlândia - MG, CEP 38400-902
ALUNO: Alexandre de Souza Fernandes.
NÚMERO DE MATRÍCULA:
11512MAT001.
ÁREA DE CONCENTRAÇÃO: Matemática.
LINHA DE PESQUISA: Sistemas Dinâmicos.
PÓS-GRADUAÇÃO EM MATEMÁTICA:
Nível Mestrado.
TITULO DA DISSERTAÇÃO:
Uma relação entre expoentes de Lyapunov e entropia.
ORIENTADOR:
Prof. Dr. Thiago Aparecido Catalan.
Esta dissertação foi
APROVADA
em reunião pública realizada na Sala 1F119, Bloco
1F, Campus Santa Mônica, em 24 de março de 2017, às 13h30min, pela seguinte Banca
Examinadora:
Prof. Dr. Alexander Eduardo Arbieto Mendoza
UFIU - Universidade Federal do Rio de Janeiro
; , • 1
Prof. Dr. Jean Venato Santos
UFU - Universidade Federal de Uberlândia
Dedicatória
Agradecimentos
Meus agradecimentos serao específicos, porém objetivos:
Agradeço a minha primeira família, “a grande farofa”. Aquela que me transborda.
Aquela que viu meu preludio, meu meio, e estarão comigo ate meu desfecho.
Agradeço ao meu pai, Jose Rubens, por nunca desistir de mim, agradeco minha mae,
Maria Cristina, por mostrar o exemplo mais intenso, mais simples e mais absurdo possível
de amor e carinho que ja presenciei. Agradeco a minha irma, Aliucha, por ser um exemplo
de forca e companheirismo, mais ainda, mostrar que apesar das diferencas (e brigas) entre
irmaos, sempre poderão se amar, se respeitar e cuidar um do outro.
Agradeco minha segunda família, os “brabos” , meus amigos/irmãos Agostinho, Lucas,
Gian, Felipe, Rafael, Fernando, ítalo, Valdecir. Por toda nossa historia. Por todas as
aventuras e desventuras que passamos juntos.
Agradeco aos meus amigos que fiz em Uberlandia, em especial dois grandes, Douglas
e Ueslei, um sendo meu conterrâneo e outro um “verdadeiro” exemplo de mineiro. Sao
grandes amigos pois ambos me ensinaram as maiores lições de vida, a de sempre prezar
pelos outros nao esperando absolutamente nada em troca e, de ser autentico, a de nao ser
um total “cliche”.
Agradeco aos meus professores e amigos que fiz na graduacão e mestrado em ma
temática da Universidade Federal de Uberlandia. Aos meus amigos de Augusto, Danilo,
Suelen, Wagner, Guilherme, Jose Lucas, Edmilson, Magna, Davidson, Javier, Julian,
Aloísio, Paulo Victor e Ana Maria pelos momentos de assistencia e auxílio nos estudos
e pelos momentos de alegria e descontraçcãao. Aos professores, por todos os ensinamentos
academicos e sociais, alem de apresentarem a maior das ciencias, a do conhecimento. Em
particular, agradeço ao meu orientador Thiago Aparecido Catalan pela conclusao deste
trabalho.
Agradeco a Capes pelo auxílio financeiro durante todo o curso de mestrado.
FERNANDES, A. S.
Uma relação entre expoentes de Lyapunov e entropia.
2016. - 66p.
Dissertação de Mestrado, Universidade Federal de Uberlândia, Uberlândia-MG.
R esu m o
Nesta dissertaçao, vamos estabelecer uma relaçao entre os expoentes de Lyapunov, da
dos pelo teorema Ergodico Multiplicativo de Oseledets, e a entropia metrica, dada pela
definição de Komolgorov-Sinai. Para tal utilizaremos como ferramentas o estudo de te
oria ergódica. Pelo meio, buscamos analisar e demonstrar o teorema multiplicativo de
Oseledets, tendo em vista caracterizar os expoentes de Lyapunov em uma variedade Ri-
emmaniana compacta e por fim, apresentaremos a desigualdade de Ruelle, resultado final
que faz esta relacão entre os expoentes positivos e a entropia metrica de um sistema
ergodico.
FERNANDES, A. S.
A relation between Lyapunov exponents and entropy.
2016. - 66p.
M. Sc. Dissertation, Federal University of Uberlandia, Uberlandia-MG.
A b stra ct
In this dissertation, we are going to stabilish a relation between Lyapunov exponents, given
by Oseledets Multiplicative Ergodic Theorem, and metric entropy, owing to the definition
given by Komolgorov-Sinai. For this, we are going to use as tools the study of ergodic’s
theory. By the middle, we want to analise and demonstrate the Oseledets multiplicative
theorem, that categoryzes the Lyapunov’s expoents of a compact Rimmenian manyfold
and finally, introduce the Ruelle’s inequallity, the final result that stabilished the relation
between the positive expoents and the metric entropy of a ergodic sistem.
SUMÁRIO
R esu m o
vii
A b stra ct
viii
In trod u çã o
1
1 T eoria ergod ica
3
1.1 Medida Invariante e o teorema ergódico de B ir k h o ff...
3
1.2 E n trop ia ...
8
1.2.1 Entropia M e t r ic a ...
8
1.2.2 Medida e Entropia C o n d icio n a l... 12
1.2.3 Particao Geradora ... 20
1.2.4 Entropia de uma funcao com respeito a uma medida invariante . . . 21
1.2.5 Equivaiencia E r g o d ic a ... 26
1.2.6 A entropia como um invariante
... 27
2 E x p oen tes de L yapu n ov e o T eorem a de O seledets
29
2.1 Pontos regulares e o expoente de Lyapunov... 29
2.2 Demonstracao do Teorema de Oseledets para c o c ic lo s ... 31
2.2.1 Demonstraçao da primeira etapa: Medida Total... 32
2.2.2 Demonstraçao da segunda etapa: Mensurabilidade... 36
2.2.3 Demonstraçao do Lema 2 .1 0 ... 44
2.2.4 Demonstracao do Lema 2 .1 1 ... 56
3 A desigualdade de R u elle
61
INTRODUÇÃO
Com seus estudos sobre estabilidade de soluções de equações diferenciais em sistemas
dinâmicos, a parte fundamental do trabalho do matematico russo Aleksandr Mikhailovich
Lyapunov (1857-1918) foi desenvolver um metodo que estuda o comportamento assintotico
da contraçao ou expansao de um ponto ao longo de sua orbita. O expoente de Lyapunov
(caso nao for nulo) visa estabelecer uma previsibilidade deste comportamento assintotico.
Sobre os trabalhos envolvendo leis da termodinamica, a conservacao de energia e entro
pia, o matematico russo Yakov Sinai, observou que os sistemas conservativos da mecanica
classica verificam a lei da conservacao da energia e estão ligados a hipótese da ergodici-
dade. Mais ainda, notou que a divergencia exponencial de orbitas originada em pontos
proximos esta relacionada a entropia positiva nos sistemas dinamicos. Foi daí então que
Valery Oseledets, aluno de pos-graduaçao orientando de Sinai, se interessou pelo problema
de divergâencia exponencial.
Aqui, propomos em primeiro lugar medir a complexidade de um sistema, a saber cal
cular sua
entropia,
onde utilizamos a definRao dada pelos matematicos sovieticos Andrey
Komolgorov e Sinai que buscavam definir de maneira adequada o calculo da entropia de
um sistema na Teoria Ergodica. Uma outra boa forma de medir a complexidade de um
sistema e atraves dos expoentes de Lyapunov. Assim sendo, e natural buscar uma relacao
entre expoentes de Lyapunov e entropia.
CAPÍTULO 1
TEORIA ERGODICA
Neste capítulo vamos relembrar algumas definições e resultados da teoria ergódica,
necessárias para introduzir de maneira mais apropriada os resultados principais da dis-
sertaçao. Tais definicoes e resultados podem ser vistas na referencia bibliográfica [7].
1.1 Medida invariante e o teorema ergódico de Birkhoff
Apresentaremos nesta secão, definicoes e resultados importantes necessarias para o
conceito de ergodicidade. Será considerado no espaco mensurável X, medidas boreleanas
p que no nosso caso seráo medidas de probabilidade, isto e, p(X) = 1.
D efin ição 1.1.
Seja
(X,
A,
p)
um espaço de medida. Dizemos que uma medida
p
e
invariante por uma função
f : X — > X
se
p(E) = p (f-1 (E)),
para todo conjunto mensurável
E C X.
Dizemos também que
f
p reserva
p
e, em particular, que o subconjunto mensuravel
E C X
e invariante por
f
(ou
f
-invariante) com respeito a medida
p.
D efin içao 1.2.
Seja
(X, A , p)
um espaco de medida. Considerando
f : X — > X
uma
funcao mensuravel e
E
um conjunto mensuravel de X, definimos pot
Tn(E,x) = - # { j e { 0 , 1 , . . . , n — 1}; f ’ (x) 6 E}
n
1 n—1
Tn(E,x) = - y X í ( f (x)),
n j=0
sendo
x E
a função característica em
E.
Dizemos que o tem po m édio de perm an ên cia
da orbita de
x
em
E
e dado por
t
(E,
x
)
nlim Tn(E,x).
---- »TO
D efin ição 1.3.
Uma funcao
p : X
— >
R
é dita invariante por uma função
f : X
— >
X
com respeito a uma medida
p
(ou simplesmente f-in va rian te)se para p-quase todo ponto
x
G X
vale
p ( f ( x ) ) = p (x ).
Al ém disso, dizemos que um conjunto mensurável
E C X e
invariante se sua funcão caracteréstica
x E
é uma funcão invariante.
T eorem a 1.4.
[Birkhoff] Seja
f : X — > X
uma função mensuravel e
p
uma medida de
probabilidade invariante por f
. Dada qualquer funçao integravel
(p : X — > R
o limite
1 n—1
<p(x) = lim — V" cp(E(x))
n—
n í —
j=0
existe para
p
-quase todo ponto
x
G X.
Além disso, funcão
p
definida desta forma é
integravel e
p (x)dp(x)
p(x)dp(x).
C orolã rio 1.5.
Seja
f : X
— >
X
uma função mensuravel e
p
uma medida de probabilidade
invariante por f. Dada qualquer funcao integravel
(p : X — > R,
temos que
P (
x
) = cp (f(x))
para p-q.t.p.
x
G X.
Antes de demonstrar o corolário, precisamos do seguinte lema:
Lem a 1.6.
Seja
f : X — > X
uma aplicacao mensuravel e considere o espaço de probabili
dade
(X, A , p)
com
p
invariante sobre f. Considerando a função
C : X — > R
uma funcao
mensuravel tal que
C o f — C
é p-integravel. Entao
lim — C o f n = 0,
para p-q.t.p
x G X.
n—
n
Demonstraçao:
Como C o f — C e p-integrável por hipótese, o limite dado no Teorema
1.4 definido pela funçpo p : X — > R
n—1
cp(x) = lim — V" (C o f — C)(T(x))
n—
n
'
existe para p-q.t.p. x
G
X. Assim,
n —1
cp(x) = lim -
( C o f - C ) ( f ’ (x))
n — í+ro n '
j=0 n —1
lim - V ( C ( fj+1( x ) ) - C ( C ( x ) )
n — í+ro n '
j=0
' n —2 n —1
= um - y q e w D + q r w i - r q f w i
n — í+ro n ' ^ *J = 0 n—2
j=0 n —1
= lim - 5 ~ C ( f i +lM ) ) + C ( f " M ) - y C ( f i ( x ) ) - C ( x )
n — í+ro n ' ^--- *---J = 0
n—1
j=1 n—1
= lim - y C(fJ(x))) + C(fn(x)) —
y~
C(fJ(x)) — C(x)
n — í+ro n ' ^---
*---J=1 j=1
= lim —C(fn( x ) ) — lim — C(x)
n — í+ro n n — í+ro n
= lim — ( C o f n)(x).
n — í+ro n
Agora para cada 5
>
0, e olhando para o conjunto
\
x
G
X; — |C
o
fn(x)| > õ f , obte
mos
p (
{
x
G
X; — |C o fn(x)| > õ j j = p í j x
G
X; —C
o
fn(x) > 5 ou —C o fn(x) < —õ
n
n
n n
= p ({x
G
X; C
o
fn(x)
>
nõ ou C
o
fn(x)
<
—nõ})
= p ( { x
G
X; C
o
fn(x)
G
(—n õ , n õ ) C}
= p f n
o
C 1 (—nõ, n õ )C
= p (C —1 (—nõ, n õ ) C).
Assim, fazendo n tender à infinito, temos que p (C —1 (—nõ, n õ ) C) tendera a zero. Como
õ > 0 foi tomado de modo arbitrario, podemos concluir que (C
o
fn) /n converge para zero
(em medida), quando n tender a infinito.
Como o limite ((C
o
fn) ( x ) ) /n existe para p-q.t.p. x
G
X, temos que este limite devera
ser zero. Isto e,
lim — C o f n = 0,
n — í+ro n
Demonstração (Corolário 1.5):
Por definição,
1 n
cp(f(x )) = lim -
Y
cp(P(x))
n j=i
i n—1
i
= lim — y cp(p(x)) + - [cp(fn(x)) - cp(x)]
j=0
= p(x) + lim — [cp(fn(x)) — cp(x)].
n—
n
Pelo Lema 1.6, tomando C = p , temos que ( p ( f n(x)) — p ( x ) ) / n tende à 0, quando n
tende a infinito, para p-q.t.p. x G X. Isto encerra a demonstraçào. ■
D efin ição 1.7.
Seja
(X, A , p)
um espaço de probabilidade. A medida de probabilidade
p
diz-se ergodica para a funçao
f : X — > X
(ou que
f
diz-se ergodica relativamente a
p,
ou
que o sistema
(f, p)
é ergodico) se as médias temporais dadas pelo Teorema de Birkhoff
coincidem em quase todo ponto com as medias espaciais, isto e,
P (x)
lim —
n—
n
n—1
Y
p (f
j(x))
j=0p d p
para toda funcão integmvel
p : X
— >
R
em p-q.t.p.
x G X.
Veremos a seguir um importante resultado que nos diz um pouco mais sobre ergodici-
dade, tanto nas varias maneiras equivalentes que podemos defini-la quanto a entender o
seu significado.
P ro p o siçã o 1.8.
Seja
p
uma probabilidade invariante de uma aplicação
f : X — > X
mensumvel As seguintes condicoes sao equivalentes:
(1) Para todo conjunto mensumvel
E C X
tem se
t
(E,
x
)
= p(B)
para p-q.t.p
x G X.
(2) Para todo conjunto mensumvel
E C
X, a função
t
(E, ■)
é constante para p-q.t.p.
x G X.
(3) Para toda funcao integmvel
p : X — > R
tem-se
p (x) =
p d p
para p-q.t.p.
x G X.
(4) Para toda função integrável
p : X — > R,
a media temporal
p : X — > R
e constante
para
p -
q.t.p.
x G X.
(5) Toda funcao integmvel
f
-invariante
^ : X — > R
tem-se
^ (x ) =
x G X.
(
6
) Toda função integrável
f
-invariante
^ : X — > R é
constante em
(a-
q.t.p.
x G X.
(7) Para todo subconjunto invariante
A
de
X
tem se que
p(A) = 0
ou
p(A) = 1.
Demonstração
•• (1) ^ (2) Imediato!
(2)
(3 ) Teorema 1.4.
(3) ^ (4 ) Consequência do Teorema 1.4.
(4) ^ (5 ) Como ^ e integravel em particular, temos da hipótese em (4 ) que
4 (x)
n—1
lim — V" r))(T(x))
—
n
j=04 d p ,
(1.1)
em p-q.t.p. x
G
X. Pela invariância de ^ por f, obtemos ^ ( f j(x)) = ^ (x ) em p-q.t.p.
x
G
X, para todo j
G
N. Assim, da equação (1.2) temos que
1 n—1 i n—1 i
iH x) =
n — »ro nhm — V" r))(P(x))
‘ n — »ro n=
‘lim — y
n — »ro n\|>(x) = lim — (ru|>(x)) = 4>(x),
j=0 j=0
concluindo que
4 (x )
4 d p
(1.2)
em p-q.t.p. x
G
X.
(5) =A (6 ) Imediato!
(6) =A (7) Considere x A a funçao característica no subconjunto invariante A de X,
isto e, x A(x) = 1 se x
G
A, ou x A(x) = 0 se x / A, e p ( f -1(A)) = p(A) para p-q.t.p.
x
G
X.
Em particular, considerando que ^ = x A, temos da hipotese em (6) que x A e invariante
por f, e integravel e x A e constante em p-q.t.p. x
G
X. Mais ainda, temos que
t
(A,
■
) e
constante em p-q.t.p. x
G
X, isto e, p(A) = 0 ou p(A) = 1.
( 7 H (5) Seja ^ : X — > R uma funcao integravel e f-invariante. Considere todo
conjunto
Ec = {x G X; 4 ( x ) < c}.
(1.3)
Temos que
E ce um conjunto invariante. Logo, a hipotese implica que
p ( E c)G
{
0 , 1} para
todo
cG
R. Como a funcão
c p ( E c)e nao-decrescente, isto e, existe
c'G
R tal que
p ( E c/) = 0
, para todo
c < c'e
p ( E c) = 1para todo
c>
c'.
Então
^ = c'em
p-q.t.p.
( 5 H (3 ) Como temos que a media temporal e invariante por f (Corolário 1.5), a
implicação segue de imediato aplicando o Teorema 1.4.
(3) tó (1) A media de visita e uma media temporal (da função característica em E),
provando assim a implicacao.
Como (7) implica (5), (5) implica (3) e (3 ) implica (1), temos que (7) implica (1),
finalizando a demonstracao. ■
A proposiçao que apresentaremos a seguir e uma consequencia do Teorema 1.4 que
garantira um resultado importante, necessario para o teorema de Oseledets que veremos
no próximo capítulo.
1.2 Entropia
1.2.1 Entropia Métrica
Nesta seçao, vamos introduzir o conceito de en trop ia m étrica (com respeito a uma
medida p invariante) de uma função mensuravel f : X — > X, a qual sera denotada por
M f ) .
Antes disto, vamos introduzir o espaco das sequencias de d símbolos. Alguns sistemas
modelam sequencias de experimentos aleatórios em que o resultado de cada experimento e
independente dos demais. Supoe-se que em cada experimento ha um numero finito de re
sultados possíveis, designados por 1 ,2 , . . . , d, com probabilidades p(1 ), p(2), . . . , p(d)
de ocorrerem, sendo
p(1) + p(2) +---+ p(d) = 1.
Consideremos
Ld
o conjunto das sequências
ot
= (<xn)neg, onde cada
otn
G
[1, 2 , . . . , d].
Definiremos a seguir subconjuntos particulares de Ed, assim como uma importante função
nesse conjunto, a famosa funçao
shift.
D efin ição 1.9.
Seja Ld o conjunto das sequências oç
= (cxn)nez
com
d
símbolos. Será
chamado de
cilindro
o subconjunto
[k, . . . , l; ak, . . . , cq] = {a; a k = ak, . . . , oq = a j ,
onde
k, l
G
Z, com
k
<
l,
e cada
an
G
[ 1 , 2 , . . . , d].
Definimos a seguinte medida sobre cilindros:
sendo ai
G
[ 1 , 2 , . . . , d], para todo i
=
k , . . . , l. Heurísticamente, a probabilidade de um
evento composto
a k = ak; a k+1 = ak+1 , . .. , a l = al
e o produto das probabilidades de cada um deles. Em outras palavras, os resultados
sucessivos independem entre si.
Vamos considerar agora em Ed, a a-algebra B gerada pelos cilindros. A família B0 das
unioes disjuntas finitas dos cilindros e uma algebra.
D efin ição 1.10.
Seja
E G B0
uma união disjunta finita de cilindros
C1, . . . , CN,
definimos
p(E) = b ( Ci) + ■ ■ ■ + p( CN ) •
Assim temos uma medida de probabilidade na a-algebra B gerada por B
0
que é uma
extensao de
p-
Chamaremos
p
a
medida de Bernoulli
, definida por
p(1), . . . ,
p(d)-D efin ição 1.11.
Seja Ld o conjunto das sequências oç
= (<xn)neg
com
d
símbolos. A
aplicacão
v : I d — > I d
dada por
v ( ( a n)nGZ) — (a n+1)nsZ
é chamada de
deslocamento
(ou ’’shift”)
a esquerda
, que corresponde à translação no
tempo-Alem da família dos cilindros gerar a a-algebra B, note que a pré-imagem de um
cilindro ainda e um cilindro. De fato, se C = [k, . . . , l; ak, . . . , al], entao
“v-1 (C) = [k + 1, . . . , l + 1; ak, . . . , av] = {a; a k+1 = ak, . . . , oq+1 = a j.
Assim, temos
p (v 1 (C)) = p ( a k) ...p(aO = p(C).
Pela igualdade acima, junto com o fato da medida de Bernoulli em
B
ser única, a-
aditiva em
B0
e, como definimos p, pelo lema a seguir teremos que ela e invariante para
v.
L em a 1.12.
Seja
f : X — > X
uma transformação mensurável e
p
uma medida finita em
X.
Suponha que exista uma sub-aigebra geradora I da a-aigebra de
X
tal que para todo
E
G l
,
temos
p(E) = p (f-1(E)).
Entao o mesmo vale para todo conjunto mensumvel
E,
Agora daremos um pequeno exemplo que motivará a definição de entropia métrica.
M otiva çã o: Representando o lançamento de uma moeda, podemos considerar v e Z
2
tal que v : I 2 — > I 2, com
{
0, se o lançamento der cara.
1, se o lançamento der coroa.
Desta forma, consideremos:
n = numero de lançamentos.
p = possibilidade de sair cara.
1-p = possibilidade de sair coroa.
Constatamos que p .n e (1 -p ).n representa a media de caras e coroas em n lancamentos,
respectivamente. Assim a sequencia típica de caras e coroas de cada termo e
(pp'n.(1 — p ) (1-p)'n) = e(p'log PC1-?) logO-p))-™.
Assim, o numero p logp + (1 — p) log(1 — p) representa a taxa exp on en cia l desta
sequencia típica com respeito à n.
D efin içao 1.13.
Seja
A
um conjunto não vazio. Uma
partição
de um conjunto
A e
qualquer colecão
P
de subconjuntos não vazios de
A
dotada da seguinte propriedade: todo
elemento de
A
pertence a um e apenas um dos elementos de
P.
Assim uma colecão de conjuntos
P = A 1, A 2, . . . , A n
e uma
partição
(finita) do
conjunto
A
, se as seguintes condiçães forem simultaneamente satisfeitas:
(
1
)
At =
0
, para
i
= 1 , 2 , .. ., n;
(2)
A t C A,
para
i = 1 , 2 , .. . , n
(
3
)
A = A
1
U A
2
U ■ ■ ■ U An;
(4)
A 1, A 2, . . . , A n
são mutuamente disjuntos, isto e,
A t fl Aj =
0, para
i =
j
, com
i, j = 1, 2, . . . , n
.
D efin içao 1.14.
Seja
(X, A , p)
um espaço de probabilidade e
f : X — > X
uma
trans-formacao que preserva a medida de probabilidade
p
no espaço mensurável
X
. Tomando
P
H
,( P ) = - ^ p(C) log(p(C))
eePE xem p lo: (Shift de B ern ou lli) Considere o espaço de símbolos Z
de a partição P
npor cilindros de tamanho n, ou seja, se C
GP
n, então
C = [0, . . . , n - 1; a
o, . . a
n -|].
Consideremos p a medida de Bernoulli para o vetor de possibilidades p = (p
i, . . . , p
d).
Mostremos a seguir que
H
p(P
n) = —n.
p
ilogp
iAntes de tudo, dada uma partiçao P = {C
1, . . . , C
d} de um conjunto X, vamos mostrar
que H
p(P)
<log d. Melhor dizendo, a entropia de P assumira valor máximo quando ela
for perfeita, isto e, p(C
i) = 1/d, para todo i = 1 , . . . , d.
P ro p o siçã o 1.15. H
p(P)
assume valor máximo quando
P
é perfeita, isto e,
P = { C b . . . , C d}
com
p ( Q ) =
d
para todo
i = 1 , . . . , d.
Demonstração:
Seja ^ : [0, oo) — > R tal que
Í
x log x, se x > 0
0, se x = 0
d
x = (x
1, . . . , x
d) e ^ x
i= 1.
i=1 i=1
Vamos encontrar o mínimo da função f. Defina g : R
d— > R com
dg(x
1, .. . ,x
d) = 1
— Y _
x
i= 0.
i=1Pelo Teorema do Multiplicador de Lagrange, existe À
GR tal que
V
f(x
p. . . , x
d) = À
Vg(x
1, . . . , x
d).
Desta forma,
isto e
logxi + 1 = —À, então xi = e x p ( - 1 — À),
d
para todo i
=
1 , . . . , d. Substituindo o valor de xi em
xi = 1, temos
i=1
d
y~
exp(—1 — À)
i=1
1 rá exp (—1 — À)
1
d
—À
l o g , d
+ 1
xi
exp log
1
d
+ 1 — 1
1
d ’
d
para todo i = 1 , . . . , d. Então, a funçao — f(xp . . . , x d) = —
^ (x i) assumirá valor
i=1
maximo quando xi = 1/d, para todo i = 1 , . . . , d.
Em outras palavras, a entropia de P assumirá valor máximo quando P for perfeita. ■
1.2.2 Medida e Entropia Condicional
Nesta parte, trabalharemos com medida e entropia de duas partições mensuráveis
de um espaço X, tal que seus elementos se relacionam do ponto de vista de conjuntos.
Desta forma, podemos definir o conceito de medida e entropia condicional, que relaciona
uma particao com a outra. Tambem definiremos uma outra particao que refinara ambas,
facilitando o cálculo da entropia de uma particão relacionada com a outra.
No mais, isso ajudará definirmos entropia metrica de uma funçao que preserva uma
medida invariante. Em vista disto, introduziremos a definicao da
função informação
de
uma partiçao de X, que dependera de uma medida invariante p. Isso nos dará uma outra
definiçao de entropia de uma particao sobre esta funçao, alem do que, outra importante
finalidade da funçao informacao e de poder relacionar uma particão a outra, facilitando
na definiçao de entropia condicional.
D efin icao 1.16.
Seja
I
e
J
conjuntos finitos, consideremos duas partições do espaço X,
P = (C
a
; a
G
I}
e
Q = (D
p
; p
G
J}.
Dizemos que a partiçõo Q refina P (ou que
P e
denotada por
p(A|B), e
dada por
p(A|B)
p (A n B)
M-(B)
Seja (X, A , p) um espaço de probabilidade e P = (C a; a G I} e Q = (Dp; p G J} duas
partições mensuraveis de X. Denotaremos a partição P V Q por
P V Q = {C a fl Dp; para todo a G I e |3 G J}.
Note que a partiçao P V Q refina ambas as partiçoes P e Q.
D efin ição 1.18. (a)
A função
IP : X — > R
dada por
Ip (x) = - log(p(Ca(x)));
é chamada fu n çã o in form a çã o da partição
P
de X, com
Ca(x)
sendo o elemento
da partição
P = (C a; a G I}
que contem x.
(b )
A função
I
p
,
q
: X — > R
definida por
I
p
,
q
(x) = - log(p (C a(x)|Dp(x))),
e chamada fu n çã o in form a çã o da partição
P|Q
de X, onde
Ca(x)
e
Dp(x)
são
os elementos das particoes
P = (C a; a G I}
e
Q = (Dp; p G J},
os quais contém x.
Atraves da função informação IP de uma partição P de X, definimos
Em vista disto, definimos
H ^P)
IPdp.
X
H,(P|Q)
IP,Qd P)
X
como sendo a en trop ia con d icion a l da partiçao P com respeito à Q. Notemos que se
considerarmos a partiçao Q = {X}, entao H
p(P|Q) = H
p(P).
Seja P
dp
= (C
an D
p; a G I} a partiççaão de um çonjunto D
pG Q e p
pa medida
çondiçional de P em relaçao à D
p, isto e, p
p(C
a) = p (C
a|D
p), çom a G I.
Se x G D
p, entao x G C
an D
ppara algum a G I. Assim,
H^ ( P
Dp ) = - X P|
3(C
a) log (P|
3(C
a)) =
— ^ _
P(C
a|D
p) log(P(C
a|D
p))
e pela definição de Hp(P|Q), temos
2 > ( D 6) H„6 (pD„ ) = - £ p(Dß) ^ p ( C jD ß ) log(p (C a|Dß)) = Hp(P|Q),
ßeJ
ßeJ
aei
concluindo que
H , ( P | Q ) = X d(Dß)H^ß(P
dp
).
ßeJ
D efin ição 1.19.
Dizemos que duas partições
P
e
Q
são indepen den tes se
p (C a n Dß) = p(Ca).p(Dß),
para todo
Ca G P
e
Dß G Q.
P ro p o siçã o 1.20.
Seja
(X, A , p)
um espaço de probabilidade. Seja
P = {C a; a G I},
Q = {Dß; ß G J} e R = {Ey;
y
G K}
partiçães finitas e ‘mensuraveis de X. Então
(ã) 0 < - log ^ sup { p(Ca) } j < Hp(P) < log(#P).
Além disso,
Hp(P) = log(#P)
se,
e somente se,
P é
perfeita, ou seja,
p (C a/) = p (C a),
para todo a,
a
' G I.
(b) P e Q
sao independentes se, e somente se,
0 < Hp(P|Q) < Hp(P).
(ç) Hp(P|Q) = 0
se, e somente se,
P < Q.
(d )
Se
Q < R,
então
Hp (P|R) < Hp(P|Q).
(e) Hp(P V Q|R) = Hp(P|R)+ Hp(Q|P V R).
Em particular, se
R = {X},
então
Hp(P V Q) = Hp(P) + Hp(Q|P).
(f) Hp(P V Q|R) < Hp(P|R)+ Hp(Q|R).
Em particular, se
R = {X},
então
Hp(P V Q) < Hp(P) + Hp(Q).
(g) Hp(P|R) < Hp(P|Q) + Hp(Q|R).
(h )
Seja
À
uma outra medida de X, então para toda partição mensurável
P
de
X
em
relação a
p
e À, e para todo
p G [0,1],
temos
Demonstração:
(a) Se Hp(P) = 0, entao P = {X} (mod 0) e nada temos o que fazer.
Portanto, suponhamos que Hp(P) > 0, então existem a, a
'
G I tais que p (C a), p (C a/) G
(0,1).
Mostremos primeiramente que
Da definição de IP, temos
log sup { p(Ca) }
asl
< H ( P ) .
inf I
P= inf {I
P(x); x G X}
= inf { - log p (C
a); a G I }
= - sup { - ( - log p (C
a) ); a G I }
= - log (sup { p (C
a) }
J.
Assim,
H
p
(P) =
IPdp >
inf IPdp = inf IP.
dp = inf I
P.p(X) = - log ( sup { p (C
a) }
V aeI(1.4)
Para mostrar que H
p
(P)
<
log(#P), lembramos que a entropia assume valor máximo
quando P e perfeita (Proposiçao 1.15). Seja P
'
= {C
1, . . . , C
k
} uma partição perfeita, isto
e, quando p ( Q ) = p(C
j
), para todo i, j = 1 , . . . , k , tal que log(#P) = lo g (# P '). Assim,
H
p(P) < H
p(P') = lo g ( # P ') = log(#P),
(1.5)
para toda partiçao P de X.
Segue de (1.4) e (1.5) que
0 < - log ^sup { p(Ca) } j < Hp(P) < log(#P).
(b) Antes de demonstrarmos este item, precisamos de dois resultados:
P ro p o siçã o 1.21.
Seja
(a.j)jgN, (bj)jgN C R
duas sequências tais que
0 < bj < aj
e
oo oo
L a = L bj,
então
aj = bj,
para todo
j G N.
j=i
j=i
Demonstração:
Suponha que exista j0 G N tal que bj0 < aj0, então
£
aj =
(X
j + aj0 >
(X
j + b j0 >
(X
j + bj0 =
X
b j ,
j=1
\j=jo /
\j=jo /
\j=jo /
j=1
o que e absurdo! Logo,
a
j =
b
j, para todo
j
G N. ■
P ro p o siçã o 1.22.
Seja
aj > 0,
com
j = 1, . . . , n
tal que
aj = 1
e
* : (0, oo)
j=i
uma funcao estritamente convexa. Se
R
(
ni
n* I ^ a
jX
ji = ^ a
j^ (x
j),
então
x
1= x
2= ■ ■ ■ = x
n.
V j = i / j=iDemonstração:
Demonstremos por induçao.
(k = 2) Suponha que exista x 1 e x2 com x 1 = x2. Como a2 = 1 — a1 e por * ser
estritamente convexa, temos
* ( a ^ + a2x2) = * ( a ^ + (1 — a1)x2)
< a ^ ( x 1 ) + (1 — a 1 ) ( * f o ) )
= a 1 * f a ) + a 2 * f e )
o que contradiz a hipótese. Logo x 1 = x2.
(k = n + 1) Suponha a hipotese seja valida para k = n, então:
4» (
Y
OjXj) = 4> f(l - an_i)
( Y -
— ---- Xj) + an+1xn+1
'.
1=
1)
V
I
jC a
n+
1)
I
i .
Tome y = ^ ^ ( a
j/ (1 — a
n+ 1 ))x
j. Se y = x
n + 1, entao pela convexidade de * , temos
j=1'n+1
* ( L
a ix i j=1* ((1 — an
+1
)y + an+
1
xn+
1
) < (1 — an+
1
) * ( y ) + an+
1
xn
+1
contradizendo a hipotese. Se y = xn+1, entao pela hipotese de induçao para y , temos que
x 1 = ■ ■ ■ = xn = y = xn+1, como queríamos demonstrar. ■
Voltando a demonstração de (b), e utilizando a funcao * : (0, oo)
1.22, temos
R da Proposiçao
0 < H^PIQ) =
—Y _
k ( D
p) ^ * ( P ( C
a|D
p))
PeJ aei<
-■ y
^ I y ^ ( c
a nD
p)
œei VpeJ= - Y _
MP-(C
a))
aGi= H ^P ).
Pela Proposição 1.21, temos
L L
P-(D
p)^ ( p ( C j D
p)) =
L
*
I
L p ( D
p)p (C
a|D
p)
ae
i pe
J ae
iV
pe
Jse, e somente se,
y
p (D
p)^ (p (C
j
D
p)) = ^
I
y_
p ( D
p)p (C
a|D
p)
I
,
peJ V PeJ J
para todo a
GI. Agora pela Proposição 1.22, a igualdade acima e verdadeira se, e somente
se,
p ( C jD
p) = p (C
a|D
p /),
para todo P, P
' GJ. Isto implica que
p (C
a|D
p/)
=y _
p (D
p) p ( C j D
p) = p (C
a),
Pejisto e,
p (C
a nD
p /) = p (C
a) .p ( D
p/),
para todo p
' G
J.
(c) Como
<£(x)
<0, para todo x
GX e pela injetividade da função log, temos
^ ^ ( C j D
p)) = 0
&
log(^(C
a nD
p)) = log(b(D
p))
&
b (C
a nD
p) =
f i( D
p)
P
<Q (mod 0).
(d )
Como Q
<R, temos que R V Q = R, assim para concluirmos o resultado basta
mostrar que H
b(P|Q V R)
<H
b(P|Q). Agora, observe que
H
^(P|Q) = ^ q (D
p)H ^ (P)
PeJcom H^p(P) = - ^ pp(Ca) log(pp(Ca)) =
p (C a|Dp) log(p (C a|Dp)). Alem disso,
ael
ael
h
„8 (P|R)
< H^p (P), pela primeira parte deste item, o resultado segue da seguinte afirmaçao.
A firm ação: H (P|Q V R)
= y _
b(Dp)H^p (P|R).
PeJ
Demonstração:
Temos que
^ p (D p )H ^ (P | R ) = ^ p(Dp)
PeJ
PeJ
£ ^p(Ey)H(86,Y (P)
.YeK
y
^ ( D
p^
b
p(E
y)Y _
P(
P)T (C
a) log(p(
p)y (C
a))
Pe
J ye
K ae
ly
^(
D
p
^
b
P(E
y) ^ P
P(C
a|E
y) log(p
P(C
a|E
y))
PeJ YeK ae
lX
^(
D pÍ
M
Ey)Y _
bp(Ca n Ey) ^
í
pp(Ca n Ey)
PeJ YeK a
e
l^
P( D
P ^ ^P
p(E
y)Y _
b
p (E
Y )bp(Ca El Ey) ^
b
P(E
y
)
)
/ b ( C
an D
pn
E
y
) \
PeJ YeK a
e
l^
p(E
y)
M-(Pp)
p
(E
y
n Dp)
V
b(Dp)
X b ( D p ) X
PeJ
ael YeKp (C a n Dp n Ey)
/ p (C a n Dp n
e
y)\
0gV
^ y C D p )
)
b(Ca n Dp n
E
y
)'
b(Dp)
b(Ca n Dp n
E
y
)
L
p (E y n D y ) ----
rcn
T( C
_ fr
an D
Pn E
/ log 1
yC / b ( C
an D
P1
n E
y"
ael PeJ YeK
P(E
y
n Dp)
b(Dp n
E
y
)
■
y _
p
(E
y
n
D
y
^ ^
b (C
a|E
Yn D
p) log (b (C
a|E
yn D
p))
PeJ= H^(P|Q V R).
(e) Por definição,
H|j.(P V Q|R)
= ~ Y _
dCE
YW ^ ( C
an D
p|E
y))
aeIPeJ yeK
■ X ^ Í C
an D
pn E
y) log
aeIPeJ yeK
^ ^ ( C
an D
pn E
y) log
aeIPeJ yeK
> ( c a n Dp n
e
y )\
.
p
W
)
V ( c a n Dp n Ey) i
4
C a n E y) '
(J.(Ey)
(J.(Ca nEy)
^ ^ ( C
an D
pn E
y) log
^ ^ ( C
an D
pn E
y) log
aeIPeJ yeK
M.(CanD«nEy )
IK C E d Ë
— J ~ 2 _
" L^p I I QyjaeI
PeJ
yeK
M-fCoíflEy)
n ( E Y )Y_
p(Cq n Dp)4>([i(Dp|ca
v
Ey)) -
Y_
p(Ca n
e
y) iog
0 ^
aeI PeJ yeK
aeI yeK
=
H^(Q|P V R) + H^(P|R).
(f) Como P V R refina R (R < P V R), temos por (b ) e (e) que
H|
x(Q|P V R) < H
^(Q|R)
e
H^(P V Q|R) = H (Q |P V R) + H^(P|R),
respectivamente. Desta forma, temos
H|j.(P V Q|R) = H^(Q|P V R) + H^(P|R) < H^(Q|R) + H^(P|R).
(g) Pelos itens (e) e (f), temos que
Em vista disto
Hp(P|Q) + Hp(Q|R) = (Hp(P V Q) - Hp(Q)) + (Hp(Q V R) - Hp(R))
= Hp(P V Q) + Hp(R|Q) — Hp(R)
= Hp(P V Q V R) — Hp(R|P V Q )) + Hp(R|Q) — Hp(R)
> Hp(P V Q V R) — Hp(R)
> Hp(P V R) — Hp(R)
= Hp(P|R).
(h ) Pela convexidade da função
temos
pHp(P) + (1 — p)H A(P) = —p
I
^ ^ ( p ( C a))
I
— (1 — p)
I
^ ^(A(Ca))
V asi
/
\
aSl
<
—Y _
^ ( ( p p + (1 — P)A)(Ca))
aSl
Hpp+(1—p)A(P)-Isto termina a demonstraçao da Proposição 1.20. ■
1.2.3 Partição Geradora
D efin ição 1.23.
Dada uma função
f : X — > X
e uma partição
P
de
X.
(a)
Denotemos por
n
—1
(
n
—1
Pn
= \/
f
—1 (P) = i p| f
—^(C);
para todo
C G P
i
=0
^ i
=0
(b)
Uma partiçao
P é
dita uma partição geradora se \J
f i (P)
gera a o-álgebra de
i
= —TOA, com
(X,
A,
p)
um espaço de medida e
f
uma função invertével. Caso,
f
não seja
invertével, entao pede-se que
\Jf
—i (P)
gere a o-algebra.
i
=0
E x em p lo 1.24.
Considere o espaço
I d
das sequências de
d
símbolos,
v+
a função des
locamento a direita (isto é,
v + (a n) = a n—i,
para todo
n G Z )
e
P = {C1, . . . , Cd}
a
partiçao dos cilindros de tamanho
1.
A partição
P é
geradora, pois dado um cilindro
C
f - i (Ck); k
G
(1, . . . , d } j .
Então, temos que
C
G
Pn
e todo cilindro de tamanho
n
e exatamente n-interseções
finitas de cilindros de tamanho
1
, isto e, P é geradora.
1.2.4 Entropia de uma função com respeito a uma medida inva
riante
Aqui nesta seção, relembremos o conceito de uma medida invariante por uma função
mensur avel f em X. Uma medida de probabilidade p e invariante por f se para todo
conjunto mensuravel E de X, temos
n —1
C = [ 0 ,..., n — 1; a
o, . . a
n—i] = <j
f]
i=0p(E) = p (f—'(E)).
Denotemos por M ( f ) o conjunto das medidas (de probabilidade) invariantes pela
transformacao f.
Na sessao anterior, definimos entropia de uma particao mensuravel P. Se p for inva
riante para f, não e difícil notar que
H
p(P) = H
p(f-
1(P)).
Antes de definirmos entropia de uma partiçao P com respeito à uma função f e, entropia
de f com relaçao à uma medida invariante p, precisamos provar um importante resultado.
P ro p o siçã o 1.25.
Sejam
{X, A , p}
um espaço de probabilidade e
P
uma partição
X.
Temos que o limite
lim
n
œ
H p ( P n )
n
existe.
Para demonstrarmos a proposicão, provaremos que a sequencia (an/ n ) ngN e conver
gente, se (an)neN e subaditiva (isto e, dados m ,n
G
N entao am+n
<
am + an). Em
seguida, mostraremos que a sequencia (Hp(Pn))ngN ser a tambem subaditiva, concluindo
assim a demonstracao da Proposiçao 1.25.
Lem a 1.26.
Toda
( — )
é
convergente, se
(an)nSN
é subaditiva.
V n ZneN
a
n= a
m .q+r< a
q.m+ a
r< q.a
m+ a
r.
Assim,
a
na
maT
— < ---bn 1n
qn
Fixando m , temos
lim
sup — <
lim
sup
H---= lim
sup
,
n— soo TX n — soo — Tl n — soo —
q q
pois r tambem esta fixado. Note que quando n — > + o o , então q — > + o o , então
de modo que
Conclui-se então que
e, em particular,
..
n
m .q + r
lim — = lim --- = m ,
n — iœ
q
q— iœq
a m a m
lim sup —— = — .
n — soo — TU
a n a m
lim sup — < —
n — iœ n "m
a
na
mlim sup — < lim ml — .
n — iœ
n
m—
iœm
Por definicao, temos que (an/ n ) ngN e convergente.
Demonstracao
(P ro p o siçã o 1 .2 5 ): Pelo lema anterior, basta provarmos que a sequencia
(H|
x(P
n))
ngN e subaditiva.
A firm ação: A sequenciã (H
^(P
n))
ngN é subaditiva.
Por definiçao de funcao invariante e pelo item (f) da Proposição 1.20, temos
H|j.(Pm+n)
/m + n —1 \
H ^ / f
- i(P)J
(
m— 1 n+m —1 \V f
- i(p) v v f
—1(
p
)
=
V f - i (P) V f -m ( V
= H
p(P
mV f -
m(P
n))
< H
p(P
m) + H
p(f—
m(P
n))
= H
p(P
m) + H
p(P
n). ■
Agora faz sentido definirmos a entropia de uma partiçao P finita com respeito a f e, a
entropia de uma funçao f em relaçao a uma medida invariante p.
D efin ição 1.27.
A entropia de uma função f com respeito à partição
P
finita e uma
medida
p e
M f . P ) = i - K
n —n
D efin ição 1.28.
A entropia de uma funçao f com respeito a uma medida
p e
h
p(f) = sup h
p(f,P),
p
com
P
uma partição finita de
X.
A seguir, veremos exemplos de como calcular esta entropia, a de uma funçao com
respeito a uma particão e de uma funcao com respeito a uma medida invariante.
E x em p lo 1.29.
Neste exemplo vamos fixar
p
a medida de Bernoulli com respeito ao vetor
de probabilidade
(p
i, . . . , p
d),
considerando
I
do espacos das sequências com
d
símbolos,
v+
a função deslocamento à direita e
P
a partição dos cilindros
C
de tamanho 1. Observe
que este exemplo esta atrelado a se provar um resultado anterior.
Como ja foi visto,
n —1 f n—1 yn \ / x—if
Pn = V f —i(P) = J p| f(C); C £ P
i=0
i=0
í
uma particao por cilindros de tamanho
n
e (como já calculamos anteriormente)
Hp(Pn) = —n. ^ pi log pi.
i=1
Dessa maneira,
M f , P ) = lim Ü A d = Um - n L f - . P . i o S P .
n—
n
n—
n
^ P i log Pi = Hp(P).
E x em p lo 1.30.
Seja
Ra : S1
— >
S1
a rotação de ângulo a e
p
a medida de Lebesgue em
S1.
Repare que a medida de Lebesgue e invariante sobre a rotação
Ra
e que uma partição
P
do círculo com
k
elementos é determinada por uma sequência
pi, . . . , p k
de pontos de
S1.
Em vista disto, note tambem que se denotarmos por
p j = R —j ( p 0então a partição
P édeterminada pelo conjunto de pontos
C n = | ( p i ) G S 1; i = 1 , . . . , ke
j = 0 , . . . , n — 1Note que a interseção entre
C ne
C n—1pode ser não vazia. Então
# C n < k + # C n—1 < ■ ■ ■ < n . k .
Pela continuidade da funçao
lo g(e pelo item
( a )da Proposicão 1.20), temos
h p ( f , P ) = lim H p ( P n ) 1 1
n < li m — l o g ( # P n ) < li m — l o g ( k .n ) = 0 .n — n n — n
Logo, a entropia de
fem relacão a medida de Lebesgue
ésempre nula, pois
P éar
bitraria.
O bservação:
N o t e q u e a ig u a ld a d e h p ( f , P ) = H p ( P ) , o b t i d a n o e x e m p lo(1)
n a o e u m c a s o p a r t ic u la r . D e f a t o , s e m p r e q u e a p a r t iç a o fo r g e r a d o r a t a l f a t o a c o n te c e .V e r e m o s a fr e n te a lg u n s r e s u lt a d o s e p r o p r ie d a d e s b o a s s o b r e e n t r o p ia q u e , p o r e x e m p lo , c o m p le t a r a o o c á lc u lo d a e n t r o p ia d o s d e s lo c a m e n t o s d e B e r n o u lli. E m p a r t ic u la r , s e r ã o n e c e s s a r io s n a d e m o n s t r a c a o d a d e s ig u a ld a d e d e R u e lle , r e s u lt a d o q u e v e r e m o s n o te r c e ir o e u lt i m o c a p ít u lo d e s t a d is s e r t a c a o .
P ro p o siçã o 1.31.
Para todo
k G N ,temos
H p ( f k) = k h p ( f ) .Caso
ffor invertével, temos
h p ( f k ) = |k|hp ( f ) ,para todo
k G Z .A n t e s d e d e m o n s t r a r a p r o p o s ic a o , p r o v e m o s u m le m a i m p o r t a n t e q u e p o s s u i b o a s p r o p r ie d a d e s .
L em a 1.32.
Sejam
Puma particao finita de
X , f : X — > Xuma funçao e
p G M ( f ) .Entãao,
h p ( f , P ) = li m H p ( P | V f —i ( P ) ) .^ n — ^ v i=1
n—1
O bservação:
C a s o f : X — > X fo r in v e rtá v e l e c o n s id e r a n d o P ± n = \J f —j ( P ) , i = —nDemonstração:
Usando o item (e) da Proposição 1.20 junto com o fato de p ser
invariante, temos
/n —1 n—1 n -1
H ,
(
P n) =
H pv
f —1(
p
) +
h
J
p
\
v
f —'(
pn =
H ,(
P n—1) +
h
J
p
\ y
f —1(
p
)
vi=1
i=1
i=1
para todo n
GN. Desta forma, repetindo o processo anterior indutivamente, temos
Hp(Pn) = Hp(P) + ^
h
J
p
| V (P)
k=1
'
i=1
Por consequência,
n—1
M f » P ) = lim -H^(Pn) = Hm —Hp(P) H
y~
Hp ( P | V f_i(P) ) •
n — >œ n n — n n f— r \ i= 1 !k=1
Pelo item (d ) da Proposição 1.20, a sequência Hp P
\ y
f i (P) I I
ê decrescente,
i=1
n€N
e portanto, lim H
p( P
\ y
f
i(P) 1 existe.
i=1
Isto garante que a media dos termos an = Hp P
\ y
f l ( P n tambem converge a este
limite quando n — > + o o . Portanto, temos
1
n -1 / ki=1
M f . p) =
„
ü s l
- L
a . ( p I V f J (p)J = , M m 3 (p I y fú P )j •
k=1
i=1
Demonstração
(P ro p o siçã o 1 .3 1 ): Tomemos g = f k e seja P uma partiçao finita de
X. Temos que
k n -1 n -1 /k —1 \ n -1