• Nenhum resultado encontrado

Modelação estatística das co-infecções da SIDA em países da União Europeia

N/A
N/A
Protected

Academic year: 2021

Share "Modelação estatística das co-infecções da SIDA em países da União Europeia"

Copied!
110
0
0

Texto

(1)

Inˆ

es Jorge da Silva Sequeira

Modelac

¸˜

ao Estat´ıstica das Co-Infecc

¸˜

oes da SIDA

em Pa´ıses da Uni˜

ao Europeia

Disserta¸c˜ao apresentada para obten¸c˜ao do Grau de Doutor em Matem´atica, es-pecialidade de Estat´ıstica, pela Univer-sidade Nova de Lisboa, Faculdade de Ciˆencias e Tecnologia

Lisboa 2009

(2)
(3)

Agradecimentos

Obrigado...!

Obrigado n˜ao chega decerteza para expressar neste texto a gratid˜ao e a responsabilidade que sinto por estar nesta fase da minha vida.

´

E ao meu Professor Jo˜ao Tiago Mexia a quem devo o maior agradecimento, pela ori-enta¸c˜ao cientifica desta tese, que sem ele n˜ao teria sido poss´ıvel, pela confian¸ca que sempre depositou em mim, pela sua amizade, pela for¸ca que nele sempre encontrei para continuar, pela sua disponibilidade para trabalhar comigo, pelas oportunidades que me deu e pelo seu empenho pessoal neste trabalho.

Agrade¸co aos meus colegas do Departamento de Matem´atica pelo seu exemplo e pela ajuda que me deram sempre que lhes pedi.

Ao Professor Christoph Minder, ao Professor Stanislaw Mejza e `a Professora Aldina Br´as pelo interesse demonstrado neste trabalho, pelas suas ideias e sugest˜oes.

`

A Sandra Nunes, pelo apoio na revis˜ao do texto, bem como as valiosas cr´ıticas e sugest˜oes que fez a alguns aspectos do trabalho.

Ao Agnelo por ter estado sempre ao meu lado, pelo seu humor e por muitas vezes me ter convidado a dar uma volta ao quarteir˜ao. `A Maria, nossa filha obrigada pelo colo que me pediu que muitas vezes me tranquilizou.

`

A minha M˜ae e ao meu Pai, obrigado por todos os ensinamentos que me tˆem transmitido. Finalmente, quero deixar registada a minha gratid˜ao `a Funda¸c˜ao para a Ciˆencia e a Tecnologia (FCT) pelo apoio a este projecto concedido atrav´es da Bolsa de Doutoramento (SFRH/BD/41243/2007), ao Centro de Matem´atica e Aplica¸c˜oes (CMA) da FCT/UNL pelo apoio na participa¸c˜ao em alguns congressos e ao Departamento de Matem´atica da FCT/UNL, por me ter concedido a dispensa de servi¸co docente para a realiza¸c˜ao deste projecto.

(4)
(5)

Resumo

Neste trabalho utilizam-se dados da WHO relativos a 12 pa´ıses da UE (os ´unicos para os quais se conhece a informa¸c˜ao suficiente) para estudar nos mesmos as co-infec¸c˜oes da SIDA. Concretizando, pretendia-se testar a hip´otese de que as co-infec¸c˜oes relevantes eram a Hepatite B, Hepatite C e a Tuberculose e ordenar os pa´ıses.

Para realizar estes objectivos come¸cou por se ajustar modelos logit `as incidˆencias das v´arias doen¸cas. Seguidamente de modo a relacionar a incidˆencia da SIDA com a das co-infec¸c˜oes utilizou-se uma variante adequada da Partial Least Squares (PLS), a retro-PLS.

Quer esta variante, quer parte das t´ecnicas para ajustamento dos modelos logit foram desenvolvidas especificamente para este trabalho.

A retro-PLS foi aplicada separadamente em quatro cen´arios que consideravam diferentes co-infec¸c˜oes:

Cen´ario I: Hepatite B, Hepatite C, Tuberculose;

Cen´ario II: Hepatite A, Hepatite B, Hepatite C, Tuberculose; Cen´ario III: Hepatite B, Hepatite C, Salmonellosis, Tuberculose;

Cen´ario IV: Hepatite A, Hepatite B, Hepatite C, Salmonellosis, Tuberculose.

Uma vez aplicada a retro-PLS utilizou-se a An´alise de Componentes Principais (ACP) para condensar a informa¸c˜ao. Ordenou-se os pa´ıses a partir dos valores da primeira compo-nente.

Finalmente utilizou-se o ´ındice de concordˆancia de Kendall para mostrar que as or-dena¸c˜oes obtidas para os quatro cen´arios eram concordantes.

As principais conclus˜oes que se obteve foram: 1) as co-infec¸c˜oes relevantes s˜ao a Hepatite B, Hepatite C e a Tuberculose; 2) os pa´ıses do Sul da Europa (It´alia, Gr´ecia, Portugal) situam-se em posi¸c˜ao oposta aos do Norte da Europa (Finlˆandia, Su´ecia).

(6)
(7)

Abstract

We used the WHO data on 12 countries from EU (the only ones for which there was enough information) to study, for those countries, the AIDS co-infection. We intended to show that the relevant co-infection were Hepatitis B, Hepatitis C and Tuberculosis and to order the countries.

To do this we adjusted logit models to the diseases incidences. Next we applied a con-venient version of Partial Least Squares (PLS) to the incidence rates. Since we had only a controlled variable, the AIDS incidence, and several dependent variables, the co-infection incidences, we named this technique as retro-PLS.

Both retro-PLS and some results on logit models adjustment were developed for the purpose of this study.

Retro-PLS was applied in four scenarios defined by the co-infection that were considered. Thus we had:

Scenario I: Hepatitis B, Hepatitis C, Tuberculosis;

Scenario II: Hepatitis A, Hepatitis B, Hepatitis C, Tuberculosis; Scenario III: Hepatitis B, Hepatitis C, Salmonellosis, Tuberculosis;

Scenario IV: Hepatitis A, Hepatitis B, Hepatitis C, Salmonellosis, Tuberculosis. Once retro-PLS was applied we used Principal Components Analysis (PCA) to condense the information. We then ordered the countries according to the values of the first principal component.

Lastly we used the Kendall coefficient of concordance to assess the agreement between the ordinances we had for the different scenarios. This agreement was very highly significant, leading to the following conclusions: 1) the relevant co-infection are Hepatitis B, Hepatitis C and Tuberculosis; 2) the countries of the South of Europe (Italy, Greece, Portugal) are in opposite position to those of the North of Europe (Finland, Sweden).

(8)
(9)

Lista de s´ımbolos e abreviaturas

Xm×n ou X matriz com m linhas e n colunas,

as matrizes s˜ao representadas a ”bold” por letras mai´usculas;

In matriz identidade de ordem n;

ym ou y vector (coluna) com m componentes,

os vectores s˜ao, em geral, representados a ”bold” por letras min´usculas; xij elemento gen´erico da matriz X que se encontra na linha i, coluna j;

Xt transposta da matriz X;

X−1 matriz inversa da matriz X;

D = diag(an) matriz diagonal cujos elementos da diagonal principal s˜ao as componentes

do vector an;

tr(A) tra¸co da matriz A;

car(A) caracter´ıstica da matriz A;

∇ sub-espa¸co;

∇⊥ complemento ortogonal do sub-espa¸co ∇;

k.k norma euclidiana de um vector ou de Hilbert-Schmidt para matrizes; Σ(.) matriz de covariˆancia;

ˆ

θ estimador do parˆametro θ;

˜

θ estimativa do parˆametro θ;

N(µ, σ2) distribui¸c˜ao normal com valor m´edio µ e variˆancia σ2;

χ2

k distribui¸c˜ao qui-quadrado central com k graus de liberdade;

(10)

˙

∼ aproximadamente distribu´ıdo;

R2 coeficiente de determina¸c˜ao;

≈ aproximadamente igual a;

ln logaritmo neperiano;

WHO World Health Organization;

SIDA S´ındrome da Imunodeficiˆencia Adquirida;

UE Uni˜ao Europeia;

PLS Partial Least Squares;

ACP An´alise de Componentes Principais;

HAV Hepatite A;

HBV Hepatite B;

HCV Hepatite C;

(11)

Conte´

udo

1 Introdu¸c˜ao 1 2 Componentes Principais 5 2.1 Aspectos num´ericos . . . 5 2.2 Ordena¸c˜oes . . . 6 3 Modelos Log´ısticos 9 3.1 Considera¸c˜oes gerais . . . 9

3.2 Estimadores de m´ınimos quadrados generalizados . . . 11

3.3 Valida¸c˜ao do modelo . . . 14 3.3.1 Valida¸c˜ao estat´ıstica . . . 14 3.3.2 Valida¸c˜ao num´erica . . . 16 3.4 Modelos Simples . . . 17 3.4.1 Ajustamento e valida¸c˜ao . . . 17 3.4.2 Dados . . . 18 3.4.3 Aplica¸c˜ao . . . 19 3.4.4 Valida¸c˜ao . . . 21

3.5 Modelos com dois factores aditivos . . . 23

3.5.1 Ajustamento por ZigZag . . . 24

3.5.2 Ajustamento por dupla minimiza¸c˜ao . . . 27

3.5.3 Compara¸c˜ao entre os dois algoritmos e valida¸c˜ao num´erica . . . 31

3.5.4 Aplica¸c˜ao . . . 34 4 Retro PLS 37 4.1 Generalidades . . . 37 4.2 Ajustamento . . . 37 4.3 Aplica¸c˜ao . . . 40 4.3.1 Cen´ario I . . . 40 4.3.2 Cen´ario II . . . 47

(12)

4.3.3 Cen´ario III . . . 53 4.3.4 Cen´ario IV . . . 60 5 Ordena¸c˜oes 67 5.1 Cen´ario I . . . 67 5.2 Cen´ario II . . . 69 5.3 Cen´ario III . . . 71 5.4 Cen´ario IV . . . 73 5.5 Concordˆancia . . . 75

6 Observa¸c˜oes finais, conclus˜oes e trabalhos futuros 77 A Dados 79 B Regress˜ao PLS 85 B.1 Modelo base . . . 85

B.2 Valida¸c˜ao cruzada . . . 86

B.3 Importˆancia relativa das vari´aveis controladas . . . 87

(13)

Lista de Figuras

3.1 Estimativas para o factor de localiza¸c˜ao - TB. . . 32 3.2 Estimativas para o factor de localiza¸c˜ao - SIDA. . . 34 4.1 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 1 ano. . . 42 4.2 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 2 anos. . . 44 4.3 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 3 anos. . . 45 4.4 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 4 anos. . . 47 4.5 Cen´ario II - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 1 ano. . . 48 4.6 Cen´ario II - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 2 anos. . . 50 4.7 Cen´ario II - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 3 anos. . . 51 4.8 Cen´ario II - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 4 anos. . . 53 4.9 Cen´ario III - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 1 ano. . . 55 4.10 Cen´ario III - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 2 anos. . . 56 4.11 Cen´ario III - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 3 anos. . . 58 4.12 Cen´ario III - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 4 anos. . . 59 4.13 Cen´ario IV - representa¸c˜ao das duas primeiras componentes principais obtidas

(14)

4.14 Cen´ario IV - representa¸c˜ao das duas primeiras componentes principais obtidas a partir de ˜γ para desfazamento de 2 anos. . . 62 4.15 Cen´ario IV - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 3 anos. . . 64 4.16 Cen´ario IV - representa¸c˜ao das duas primeiras componentes principais obtidas

(15)

Lista de Tabelas

3.1 Anos considerados por pa´ıs. . . 19

3.2 Modelo Simples - estimativas do parˆametro α. . . 19

3.3 Modelo Simples - estimativas do parˆametro β. . . 20

3.4 Modelo Simples - coeficiente de determina¸c˜ao R2. . . . 20

3.5 Modelo Simples - estat´ıstica do teste e intervalo de aceita¸c˜ao. . . 22

3.6 Compara¸c˜ao entre os dois algoritmos - TB. . . 32

3.7 TB - coeficiente de determina¸c˜ao R2. . . . 33

3.8 Compara¸c˜ao entre os dois algoritmos - SIDA. . . 33

3.9 SIDA - coeficiente de determina¸c˜ao R2. . . . 34

3.10 Modelo Aditivo - estimativas para os parˆametros α e β. . . 35

3.11 Modelo Aditivo - estimativas para o factor de localiza¸c˜ao. . . 35

3.12 Modelo Aditivo - coeficiente de determina¸c˜ao R2. . . . 35

4.1 Cen´ario I - estimativas para os coeficientes γ para desfazamento de 1 ano. . 41

4.2 Cen´ario I - correla¸c˜oes obtidas com 1 ano de desfazamento. . . 41

4.3 Cen´ario I - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. . . . 42

4.4 Cen´ario I - estimativas para os coeficientes γ para desfazamento de 2 anos. . 43

4.5 Cen´ario I - correla¸c˜oes obtidas com 2 anos de desfazamento. . . 43

4.6 Cen´ario I - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. . . 43

4.7 Cen´ario I - estimativas para os coeficientes γ para desfazamento de 3 anos. . 44

4.8 Cen´ario I - correla¸c˜oes obtidas com 3 anos de desfazamento. . . 45

4.9 Cen´ario I - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. . . 45

4.10 Cen´ario I - estimativas para os coeficientes γ para desfazamento de 4 anos. . 46

4.11 Cen´ario I - correla¸c˜oes obtidas com 4 anos de desfazamento. . . 46

4.12 Cen´ario I - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. . . 46

(16)

4.13 Cen´ario II - estimativas para os coeficientes γ para desfazamento de 1 ano. . 47 4.14 Cen´ario II - correla¸c˜oes obtidas com 1 ano de desfazamento. . . 48 4.15 Cen´ario II - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. 48 4.16 Cen´ario II - estimativas para os coeficientes γ para desfazamento de 2 anos. 49 4.17 Cen´ario II - correla¸c˜oes obtidas com 2 anos de desfazamento. . . 49 4.18 Cen´ario II - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. 49 4.19 Cen´ario II - estimativas para os coeficientes γ para desfazamento de 3 anos. 50 4.20 Cen´ario II - correla¸c˜oes obtidas com 3 anos de desfazamento. . . 51 4.21 Cen´ario II - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. 51 4.22 Cen´ario II - estimativas para os coeficientes γ para desfazamento de 4 anos. 52 4.23 Cen´ario II - correla¸c˜oes obtidas com 4 anos de desfazamento. . . 52 4.24 Cen´ario II - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. 52 4.25 Cen´ario III - estimativas para os coeficientes γ para desfazamento de 1 ano. . 54 4.26 Cen´ario III - correla¸c˜oes obtidas com 1 ano de desfazamento. . . 54 4.27 Cen´ario III - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. 54 4.28 Cen´ario III - estimativas para os coeficientes γ para desfazamento de 2 anos. 55 4.29 Cen´ario III - correla¸c˜oes obtidas com 2 anos de desfazamento. . . 56 4.30 Cen´ario III - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. 56 4.31 Cen´ario III - estimativas para os coeficientes γ para desfazamento de 3 anos. 57 4.32 Cen´ario III - correla¸c˜oes obtidas com 3 anos de desfazamento. . . 57 4.33 Cen´ario III - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. 57 4.34 Cen´ario III - estimativas para os coeficientes γ para desfazamento de 4 anos. 58 4.35 Cen´ario III - correla¸c˜oes obtidas com 4 anos de desfazamento. . . 59 4.36 Cen´ario III - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. 59 4.37 Cen´ario IV - estimativas para os coeficientes γ para desfazamento de 1 ano. . 60 4.38 Cen´ario IV - correla¸c˜oes obtidas com 1 ano de desfazamento. . . 60 4.39 Cen´ario IV - valores pr´oprios e percentagem de variˆancia correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. 61 4.40 Cen´ario IV - estimativas para os coeficientes γ para desfazamento de 2 anos. 61

(17)

4.41 Cen´ario IV - correla¸c˜oes obtidas com 2 anos de desfazamento. . . 62

4.42 Cen´ario IV - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. 62 4.43 Cen´ario IV - estimativas para os coeficientes γ para desfazamento de 3 anos. 63 4.44 Cen´ario IV - correla¸c˜oes obtidas com 3 anos de desfazamento. . . 63

4.45 Cen´ario IV - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. 63 4.46 Cen´ario IV - estimativas para os coeficientes γ para desfazamento de 4 anos. 64 4.47 Cen´ario IV - correla¸c˜oes obtidas com 4 anos de desfazamento. . . 65

4.48 Cen´ario IV - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. 65 4.49 Percentagem da informa¸c˜ao contida na primeira componente por cen´ario e desfazamento. . . 66

5.1 Cen´ario I - Estimativas do factor de localiza¸c˜ao SIDA 1997 a 2004. . . 68

5.2 Cen´ario I - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal. . . 68

5.3 Cen´ario I - Valores da primeira e segunda componente principal. . . 69

5.4 Cen´ario I - Componentes do 1o vector pr´oprio. . . . 69

5.5 Cen´ario II - Estimativas do factor de localiza¸c˜ao SIDA 1995 a 2002. . . 70

5.6 Cen´ario II - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal. . . 70

5.7 Cen´ario II - Valores da primeira e segunda componente principal. . . 71

5.8 Cen´ario II - Componentes do 1o vector pr´oprio. . . . 71

5.9 Cen´ario III - Estimativas do factor de localiza¸c˜ao SIDA 1994 a 2001. . . 72

5.10 Cen´ario III - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal. . . 72

5.11 Cen´ario III - Valores da primeira e segunda componente principal. . . 73

5.12 Cen´ario III - Componentes do 1o vector pr´oprio. . . . 73

5.13 Cen´ario IV - valores pr´oprios e percentagem de variˆancia correspondente a cada componente principal. . . 74

5.14 Cen´ario IV - Valores da primeira e segunda componente principal. . . 74

5.15 Cen´ario IV - Componentes do 1o vector pr´oprio. . . . 75

5.16 Ordena¸c˜ao dos pa´ıses . . . 75

(18)
(19)

Cap´ıtulo 1

Introdu¸c˜

ao

Entre os temas quentes da sa´ude publica a SIDA e respectivas co-infec¸c˜oes ocupam uma posi¸c˜ao central. O problema ´e complexo e todo o esfor¸co para compreender a respectiva dinˆamica pode vir a ser muito ´util.

O presente trabalho pretende ser uma contribui¸c˜ao para o estudo desse problema. A realiza¸c˜ao do mesmo revelou-se dif´ıcil dado a escassez de dados dispon´ıveis. Devido ao ”segredo estat´ıstico” tivemos de utilizar os dados do Eurostat e WHO. Esses dados s˜ao ap-resentados na sec¸c˜ao 3.4.2 e, mais detalhadamente, em apˆendice (A). Basicamente obtivemos para 12 pa´ıses europeus: Austria, B´elgica, Dinamarca, Finlˆandia, Alemanha, Gr´ecia, It´alia, Luxemburgo, Holanda, Portugal, Su´ecia e Inglaterra e para um conjunto suficientemente longo de anos as incidˆencias da SIDA e das seguintes co-infec¸c˜oes: Hepatite A (HAV), Hep-atite B (HBV), HepHep-atite C (HCV), Salmonellosis e Tuberculose (TB).

Atendendo aos dados dispon´ıveis procurou-se:

• seriar os pa´ıses. Como veremos chegou-se a uma varia¸c˜ao concordante com o conheci-mento que se tem sobre o problema;

• testar a hip´otese de que as co-infec¸c˜oes mais relevantes s˜ao a HBV, a HCV e a TB. Para realizar estes objectivos houve que come¸car por obter a partir dos dados os valores de vari´aveis que medissem a dinˆamica quer das doen¸cas individuais quer da sua rela¸c˜ao com a SIDA. Para o efeito foram ajustados modelos logit para as incidˆencias. Estes modelos foram de dois tipos:

• modelos simples: Y = α + β × t com t a vari´avel tempo. Foi ajustado um modelo destes para cada pa´ıs e doen¸ca;

• modelos com dois factores aditivos: Y = α + β(f + g) onde f e g s˜ao os valores dos efeitos pa´ıs e tempo, respectivamente.

(20)

Para estudar a rela¸c˜ao das co-infec¸c˜oes com a SIDA utilizamos uma variante do Partial Least Squares (PLS). Assim, obtivemos os coeficientes das combina¸c˜oes lineares das incidˆencias das co-infec¸c˜oes com correla¸c˜ao m´axima com a incidˆencia da SIDA. Dado haver uma ´unica vari´avel controlada, a incidˆencia da SIDA, e v´arias vari´aveis dependentes, as incidˆencias das co-infec¸c˜oes, situa¸c˜ao esta contr´aria `a usual, chamamos a esta variante retro-PLS. Em apˆendice (B) apresentamos uma descri¸c˜ao sum´aria da PLS de forma a facilitar a compreens˜ao da retro-PLS.

Para podermos realizar o nosso segundo objectivo esta t´ecnica foi aplicada em quatro cen´arios. De cen´ario para cen´ario varia o conjunto das co-infec¸c˜oes que se considera.

Assim temos:

Cen´ario I: HBV, HCV e TB;

Cen´ario II: HAV, HBV, HCV e TB;

Cen´ario III: HBV, HCV, Salmonellosis e TB; Cen´ario IV: HAV, HBV, HCV, Salmonellosis e TB.

A escolha destes quatro cen´arios corresponde a um delineamento 22. Os tratamentos

deste ”delineamento”correspondem a considerarem-se ou n˜ao a HAV e a Salmonellosis. A retro-PLS foi aplicada em cada cen´ario, para cada pa´ıs, fazendo variar o desfazamento entre a incidˆencia da SIDA e as das co-infec¸c˜oes, para atender ao per´ıodo de incuba¸c˜ao da SIDA. Assim, obteve-se para cada pa´ıs o vector dos coeficientes da combina¸c˜ao linear das incidˆencias das co-infec¸c˜oes com correla¸c˜ao m´axima com a incidˆencia da SIDA. Den-tro de cada cen´ario este estudo foi realizado para cada um dos desfazamentos previstos. Para escolher, para cada cen´ario, o desfazamento a considerar trataram-se os coeficientes da combina¸c˜ao linear como vari´aveis `as quais se aplicou a An´alise de Componentes Principais (ACP). Optou-se pelo desfazamento em que a por¸c˜ao de informa¸c˜ao total correspondente `a primeira componente principal ´e m´axima. Com efeito, est´a-se a maximizar a possibilidade de condensar informa¸c˜ao atrav´es da ACP.

Observe-se que o conjunto das co-infec¸c˜oes variou de cen´ario para cen´ario. Assim, para cada um deles temos, para cada pa´ıs:

• os coeficientes ˜β ajustados dos modelos logit simples;

• os efeitos ˜f estimados para os modelos logit com dois factores; • os coeficientes ˜γ ajustados dados pela retro-PLS.

(21)

Estes valores encontram-se ajustados para cada uma das co-infec¸c˜oes que se consideraram para o cen´ario. N˜ao inclu´ımos na lista os coeficientes ˜αajustados dos modelos logit simples por estes dependerem da origem dos tempos e consequentemente do desfazamento.

Realizamos ent˜ao, para cada um dos cen´arios, uma nova aplica¸c˜ao da ACP entrando agora com todas as novas vari´aveis (˜β, ˜f, ˜γ). Os pa´ıses foram de seguida ordenados de acordo com os valores da primeira componente principal. Como veremos as ordena¸c˜oes obtidas s˜ao f´aceis de interpretar `a luz do que se sabe sobre as co-infec¸c˜oes da SIDA.

Observe-se agora que se se verificar a hip´otese feita quanto `a relevˆancia das co-infec¸c˜oes as ordena¸c˜oes obtidas nos quatro cen´arios devem ser coincidentes.

Assim calculou-se o ´ındice de concordˆancia de Kendall para as quatro ordena¸c˜oes. O valor obtido de 0.9886, praticamente igual ao m´aximo te´orico (1), confirma a suposi¸c˜ao feita.

Quanto `a articula¸c˜ao da disserta¸c˜ao temos em primeiro lugar um cap´ıtulo sobre ACP em que se discute os aspectos num´ericos da teoria e a ordena¸c˜ao a partir dos valores das primeiras componentes principais.

Seguindo-se um cap´ıtulo sobre os modelos logit, primeiro os simples e depois com dois factores aditivos. Do ponto de vista te´orico pode-se destacar as t´ecnicas para o ajustamento dos segundos modelos. O algoritmo em geral utilizado para ajustar esses modelos ´e o al-goritmo ZigZag, ver Nunes et al. (2004A e 2004B), que se comporta bem mas que carece duma prova de convergˆencia. ´E introduzido o algoritmo de dupla minimiza¸c˜ao que se mostra convergente. Nos casos estudados os dois algoritmos conduzem a resultados (praticamente) idˆenticos.

Ap´os os modelos logit ´e estudada a retro-PLS podendo considerar-se que se trata duma variante da PLS constru´ıda para o estudo deste problema.

Conclu´ıdos estes cap´ıtulos tem-se os valores das mesmas vari´aveis para os quatro cen´arios. Na parte final da disserta¸c˜ao esses valores s˜ao utilizados para seriar os pa´ıses e testar a hip´otese sobre a relevˆancia das co-infec¸c˜oes.

A concluir esta introdu¸c˜ao conv´em-nos referir que foram especificamente desenvolvidas para este trabalho as t´ecnicas:

• ajustamento por dupla minimiza¸c˜ao dos modelos logit com dois factores aditivos; • a retro-PLS.

No entanto devemos salientar que o que nos parece mais significativo no nosso trabalho foi o termos definido vari´aveis caracterizadoras da dinˆamica do problema e a partir da´ı, ter atingido os objectivos fixados. Por detr´as do nosso trabalho est´a a vis˜ao da Estat´ıstica como ”Arte de extrair dos dados a informa¸c˜ao neles contida”.

(22)
(23)

Cap´ıtulo 2

Componentes Principais

Neste cap´ıtulo vamos considerar v´arios aspectos que interessam `a aplica¸c˜ao da An´alise de Componentes Principais (ACP) numa abordagem tipo An´alise de Dados.

2.1

Aspectos num´

ericos

Algebricamente a ACP assenta na an´alise espectral da matriz de covariˆancia ou da matriz de correla¸c˜ao no caso de ACP estandardizada. Estas matrizes s˜ao semi-definidas positivas.

Ora, ver Schott (1997, pgs 108 e 109) sendo A uma matriz sim´etrica m × m com valores pr´oprios λ1 ≥ . . . ≥ λm a que correspondem os vectores pr´oprios α1, . . . , αm, mutuamente

ortogonais com norma 1, sendo ∇h e ∆h os espa¸cos gerados por α1, . . . , αh e por αh, . . . , αm

respectivamente, h = 1, . . . , m ent˜ao λh = min x∈∇h xtAx kxk2 = min x∈∆⊥h+1 xtAx kxk2 , h = 1, . . . , m λh = max x∈∆h xtAx kxk2 = max x∈∇⊥h−1 xtAx kxk2 , h = 1, . . . , m com ∆⊥

h e ∇⊥h os complementos ortogonais de ∆h e ∇h, sendo ainda ∆⊥m+1 o sub-espa¸co que

se reduz ao vector nulo. Observe-se que x ∈ ∇h[∆h] se e s´o se x for ortogonal a αh+1, . . . , αm

[α1, . . . , αh−1].

Tem-se ainda

λh = αthAαh, h = 1, . . . , m

Assim podem-se utilizar as primeiras componentes principais para condensar a in-forma¸c˜ao.

(24)

com v e u vectores de coeficientes das combina¸c˜oes lineares vty e uty tem-se,

(

vtAv = V ar(vty); vtAu = Cov(vty; uty)

e, se kvk = 1, λh ser´a o m´ınimo [m´aximo] de V ar(vty) caso v ∈ ∇h[∆h] ou v ∈ ∆⊥h+1[∇⊥h−1].

Tem-se ainda v ∈ ∇h [∆h] se e s´o se Cov(vty; αtjy) = 0, j = h + 1, . . . , m [1, . . . , h − 1].

Por outro lado as componentes principais correspondentes a A ser˜ao as componentes de αt

jy, j = 1, . . . , m.

Como, com A = [σij], se tem m X j=1 λj = tr(A) = m X j=1 σj,j

com σj,j = V ar(yj), j = 1, . . . , m. A frac¸c˜ao da informa¸c˜ao total transportada pelas v´arias

componentes principais ser´a medida pelos coeficientes cj =

λj

tr(A), j = 1, . . . , m.

Quando c1 ≈ 1 a primeira componente principal ser´a dominante. Nestes casos pode-se

condensar na mesma a informa¸c˜ao transportada pelas vari´aveis originais.

Como veremos, encontraremos repetidamente primeiras componentes dominantes. Quando A ´e matriz de correla¸c˜ao as covariˆancias s˜ao substitu´ıdas por correla¸c˜oes.

Observe-se que, as componentes principais ser˜ao n˜ao correlacionadas.

Dado interessar-nos sobretudo pelas potencialidades desta t´ecnica como processo de con-densa¸c˜ao da informa¸c˜ao limita-mo-nos a referir que existe uma teoria bastante desenvolvida, ver por exemplo Flury (1988) ou, Jackson (2003) e Jolliffe (2002), para a inferˆencia estat´ıstica respectiva.

2.2

Ordena¸c˜

oes

Suponhamos que se aplicou a ACP ao mesmo conjunto de vari´aveis obtidas em diferentes cen´arios. Pode-se utilizar os valores da primeira componente principal para ordenar os objectos, no nosso caso pa´ıses, para os diferentes cen´arios.

Para pˆor em evidˆencia a concordˆancia nas ordena¸c˜oes correspondentes aos diferentes cen´arios pode-se utilizar o ´ındice de concordˆancia de Kendall, ver Siegel (1988). Se este ´ındice for altamente significativo, pode-se admitir que n˜ao h´a diferen¸ca entre os cen´arios no

(25)

A concordˆancia que encontramos leva-nos a concluir que por n˜ao haver diferen¸cas signi-ficativas quanto `a ordena¸c˜ao dos pa´ıses para os diferentes conjuntos de co-infec¸c˜oes, que as doen¸cas comuns aos quatro cen´arios aparecem como as co-infec¸c˜oes relevantes.

(26)
(27)

Cap´ıtulo 3

Modelos Log´ısticos

3.1

Considera¸c˜

oes gerais

O modelo log´ıstico permite uma extens˜ao f´acil de aplica¸c˜ao da an´alise de regress˜ao a vari´aveis dependentes bin´arias.

No entanto, as primeiras aplica¸c˜oes foram ao estudo da dimens˜ao de popula¸c˜oes humanas. Assim, Malthus (1798) admitia que o crescimento era exponencial, sendo

W (t) = Aeβt

a dimens˜ao da popula¸c˜ao, com A e β constantes. A constante β representa a taxa de crescimento. Com ˙W (t) = (dW (t))/dt, ter-se-´a

˙

W (t) = βW (t).

No entanto este modelo ´e pouco realista visto n˜ao atender `as limita¸c˜oes quanto `a capaci-dade do meio ambiente para sustentar uma popula¸c˜ao em crescimento exponencial. Assim Verhulst (1838), (1845) e (1847), seguindo ideias de Qu´etelet, admitiu que

˙ W (t) = βW (t)  1 − W (t) K 

onde K representa a capacidade de carga, isto ´e, o n´umero m´aximo de indiv´ıduos que o ambiente suporta.

Integrando esta equa¸c˜ao diferencial obt´em-se W (t) = K e

α+βt

(28)

com valor limite K. Refira-se que Verhulst aplicou os seus resultados `a popula¸c˜ao belga, tendo no entanto obtido um valor limite K inferior ao que j´a ent˜ao se tinha. Este facto explica a pouca aceita¸c˜ao que este modelo teve.

O mesmo foi redescoberto por Pearl & Reed (1920) que o aplicaram `a popula¸c˜ao dos Estados Unidos. No entanto, tamb´em neste caso, obteve-se um valor limite K inferior ao da popula¸c˜ao real. Assim as aplica¸c˜oes do modelo log´ıstico `a demografia n˜ao justificariam a importˆancia que o mesmo tem. Podem-se referir aplica¸c˜oes relevantes destes modelos nos seguintes campos:

• no ”bio-assay”, ver por exemplo Finney (1971) e Berkson (1944)(1951);

• na epidemiologia, ver por exemplo Hosmer & Lemeshow (2000) e Breslow (1996); • na econometria, ver por exemplo Amemya (1981)(1985), Maddala (1983), Gourieroux

(2000) e Cramer (2003);

• nas ciˆencias sociais, ver por exemplo Menard (1995); • no marketing, ver por exemplo Franses & Paap (2001).

Quando se quer aplicar modelos log´ısticos a vari´aveis bin´arias modela-se a probabilidade p da vari´avel tomar uma das suas determina¸c˜oes poss´ıveis. Assim tem-se

p = e

α+βx

1 + eα+βx

ou, equivalentemente, seguindo Berkson (1944) logit(p) = ln  p 1 − p  = α + βx.

No que segue consideraremos dois tipos de modelos log´ısticos. Os modelos simples, em que

x = t

e em que se acompanha a evolu¸c˜ao da taxa de incidˆencia duma dada doen¸ca num certo pa´ıs ao longo do tempo, e os modelos com aditividade cruzada em que se considera a ac¸c˜ao de dois factores: pa´ıs e ano, tomando-se

xij = fi+ gj

com fi o efeito do i-´esimo pa´ıs e gj o efeito do j-´esimo ano. Como se admite a aditividade

(29)

A concluir esta sec¸c˜ao introdut´oria referimos o excelente trabalho de Cramer (2002) sobre a hist´oria destes modelos.

3.2

Estimadores de m´ınimos quadrados generalizados

Embora em geral o ajustamento de modelos logit seja feito utilizando estimadores de m´axima verosimilhan¸ca utilizaremos o m´etodo dos m´ınimos quadrados generalizados. Com efeito, ver Kariya e Kurata (2004, pgs 39 e 40), em modelos normais com vectores m´edios Xβ, os estimadores de m´axima verosimilhan¸ca de β s˜ao estimadores de m´ınimos quadrados gen-eralizados. Ora, dado trabalharmos com amostras grandes podemos pensar em utilizar a normalidade assimpt´otica dos modelos logit.

Para considerarmos os estimadores de m´ınimos quadrados generalizados conv´em come¸car pelos estimadores de m´ınimos quadrados usuais.

Se y tem valor m´edio Xβ e matriz de covariˆancia V, o teorema de Gauss-Markov, ver Kariya e Kurata (2004, pg 34) diz-nos que o BLUE (”best linear unbiased estimator”) de β ´e

ˆ

β(V) = XtV−1X−1XtV−1y

desde que V seja definida positiva e os vectores coluna de X sejam linearmente indepen-dentes.

A matriz de covariˆancia deste estimador ser´a, com ˆβ = ˆβ(V)

Σ( ˆβ) = XtV−1X−1XtV−1(V)h XtV−1X−1XtV−1it = XtV−1X−1. Observe-se ainda que ˆβ ´e o m´ınimo da fun¸c˜ao objectivo,

S (β) = (y − Xβ)tV−1(y − Xβ) e que

S( ˆβ) = ytV−1y − ytV−1X ˆβ.

O Teorema de Fisher diz-nos que, ver Mexia (1990), sendo y normal, com valor m´edio Xβ e matriz de covariˆancia V, escreve-se y ∼ N (Xβ, V), se tem ˆβ∼ Nβ, (XtV−1X)−1

independente de S( ˆβ), que ´e um qui-quadrado central com n − car(X) graus de liberdade. Uma generaliza¸c˜ao deste resultado, ver Mexia (1990), diz que, com M† a inversa de

Moore-Penrose de M, se ψ = Aβ for vector estim´avel, o respectivo BLUE ´e ˆ

(30)

isto ´e, sendo ψ∗ outro estimador centrado de ψ, Σ(ψ∗) − Σ( ˆψ(V)) ´e semi-definida positiva. Ali´as, ver ainda Mexia (1990), ψ ´e estim´avel, se e s´o se, com R(M) o espa¸co imagem de M, se tiver R(At) ⊆ R(Xt).

No entanto muitas vezes tem-se V = V(θ) com θ um parˆametro desconhecido. Se na express˜ao de ˆβ(V), V for substitu´ıda por um estimador V∗ tem-se, ver Kariya e Kurata

(2004, pg 35), o estimador de m´ınimos quadrados generalizados ˆ

β(V∗) = XtV∗−1X−1XtV∗−1y

desde que os vectores coluna de X sejam linearmente independentes e V∗ seja regular.

Pode utilizar-se a express˜ao de Σ(ˆβ) do caso dos m´ınimos quadrados usuais para obter o estimador

Σ( ˆβ)∗ = XtV∗−1X−1 da matriz de covariˆancia de ˆβ = ˆβ(V∗). Obtendo-se ainda

S( ˆβ|V∗) = ytV∗−1y − ytV∗−1X ˆβ.

Neste caso pode-se admitir que, com ˙∼ indicando aproximadamente distribu´ıdo, ˆ

β ∼ N˙ β, XtV∗−1X−1

independente de S( ˆβ|V∗) que se distribui aproximadamente como um qui-quadrado com

n − car(X) graus de liberdade.

Observe-se que, para V∗ dada, ˆβ(V) ser´a o m´ınimo de

S (β|V∗) = (y − Xβ)tV∗−1(y − Xβ)

podendo considerar-se S(β|V∗) como uma fun¸c˜ao objectivo a minimizar.

No entanto, por vezes tem-se X = X(λ) com λ desconhecido. Ter-se-´a ent˜ao de minimizar S(β, λ|V∗) = (y − X(λ|β))t

V∗−1(y − X(λ|β)) .

As colunas de X correspondem a vari´aveis controladas ou regressoras. Quando se tiver X = X(λ) com λ desconhecido, os valores de todos ou de parte dos regressores n˜ao ser˜ao observ´aveis. Adiante encontraremos uma situa¸c˜ao destas.

Vejamos como aplicar estes resultados no caso dos modelos logit. Sendo N′ o n´umero

(31)

ser´a

Y (N′) = ln N′

N − N′

onde, com ∼ indicando distribu´ıdo como,

N′ ∼ B(N, p)

tendo pois valor m´edio Np e variˆancia Np(1 − p). Por outro lado,

dY dN′ = 1 N′ + 1 N − N′

vindo, quando p ´e pequeno  dY dN′  E(N′) = 1 Np + 1 N(1 − p) = 1 Np(1 − p) ≈ 1 Np e como (Lagrange)

Y (N′) ≈ Y (E(N′)) + Y′(E(N′))(N′ − E(N′)) vem, caso p seja pequeno,

     E(Y (N′)) ≈ ln p 1−p ≈ ln p V ar(Y (N′)) ≈ 1 N2p2V ar(N ′) ≈ N p(1−p) N2p2 ≈ 1 N p.

A segunda destas express˜oes tem uma consequˆencia importante visto sugerir que se uti-lizem os estimadores

V ar(Y (N′))= 1

N′.

Suponhamos agora que se tem

p = e

Pk

j=1βjxj

1 + ePkj=1βjxj,

pelo que se ter´a

E(Y (N′)) =

k

X

j=1

βjxj.

(32)

Tendo-se os pares (Ni, Ni′), i = 1, . . . , n, teremos os logit Yi = ln N′ i Ni − Ni′ , i = 1, . . . , n com valores m´edios

E(Yi) = k

X

j=1

βjxi,j, i = 1, . . . , n

e estimadores para as variˆancias,

V ar(Yi)∗ =

1 N′

i

, i = 1, . . . , n obtendo-se assim a fun¸c˜ao objectivo

S(β|V∗) = n X i=1 Ni′ yi− k X j=1 βjxi,j ! = (y − Xβ)tD (N1′ . . . Nn′) (y − Xβ) na qual os inversos N′

i das variˆancias estimadas figuram como pesos.

Havendo regressores n˜ao observ´aveis a fun¸c˜ao objectivo ser´a

S(β, λ|V∗) = (y − X(λ|β))tD (N1′. . . Nn′) (y − X(λ|β)) .

3.3

Valida¸c˜

ao do modelo

3.3.1

Valida¸c˜

ao estat´ıstica

Admitamos que se pode assumir a normalidade do vector y dos logits. No nosso caso este pressuposto resultaria da normalidade assimpt´otica dado que trabalhamos com amostras grandes.

Observe-se que o estar a admitir que X(η) e V(η) dependem do parˆametro (vectorial) η inclui o caso usual em que X(η) = X e V(η) = V. Em todos os casos que consideramos os elementos de X(η) e V(η) s˜ao fun¸c˜oes cont´ınuas de η.

Assim, quando ˆη ≈ η ter-se-´a X(ˆη) ≈ X(η) = X e V(ˆη) ≈ V(η) = V. Teremos ent˜ao, y − X(ˆη) ˆβ ≈ y − X(η)eβ

com

e

(33)

vindo, o vector dos res´ıduos

r = y − X(ˆη) ˆβ ≈ ˙r = y − Xeβ. Ora,

˙r =hI − X XtV−1X−1XtV−1iy ∼ N0, V − X XtV−1X−1Xt j´a que o vector m´edio de ˙r ´e



I − X(XtV−1X)−1XtV−1Xβ = Xβ − Xβ = 0 e a sua matriz de covariˆancia,



I − X(XtV−1X)−1XtV−1VI − V−1X(XtV−1X)−1Xt= V − X(XtV−1X)−1Xt. Assim, quando ˆη ≈ η, podemos admitir que

r ∼ N (0, W (ˆ˙ η)) com

W(ˆη) = V(ˆη) − X(ˆη) X(ˆη)tV(ˆη)−1X(ˆη)−1X(ˆη)t visto que se ter´a

W(ˆη) ≈ W(η) = V − X(XtV−1X)−1Xt.

Ora a matriz W(ˆη) ´e semi-definida positiva com caracter´ıstica g. Ter´a ent˜ao os valores pr´oprios positivos v1 ≥ . . . ≥ vg > 0 a que correspondem os vectores pr´oprios mutuamente

ortogonais α1, . . . , αg tendo-se, ver Schott (1997, pg 98)

W(ˆη) = g X j=1 vjαjαtj. ´

E agora f´acil de se verificar que com

Gt= [v1−1/2α1. . . vg−1/2αg]

se tem

(34)

A matriz Ig ser´a ent˜ao a matriz de covariˆancia do vector

Z = Gr e como o vector m´edio de Z ´e G0 = 0, ter-se-´a,

Z ∼ N(0, I˙ g).

Assim, do pressuposto da bondade do ajustamento de η e da adequa¸c˜ao das express˜oes das matrizes X(η) e V (η) resulta uma consequˆencia test´avel que pode ser formulada com a hip´otese

H0 : Z1, . . . , Zg i.i.d. ∼ N(0, 1).

Para testar esta hip´otese podemos, por exemplo, utilizar o teste de Shapiro and Wilks, ver Christensen (1987), ou, em alternativa o teste introduzido por Mexia (1989).

Na nossa formula¸c˜ao utilizamos um ´unico parˆametro η al´em do vector dos coeficientes β. Poder´a ter-se η= " λ θ #

com X(λ) e V(θ), isto ´e, ser˜ao distintos os parˆametros que intervˆem nas duas matrizes. ´E esta a situa¸c˜ao que temos nos modelos que utilizamos em que trabalhamos com

V∗ = D  1 N′ 1 , . . . , 1 N′ n  .

No entanto a t´ecnica geral atr´as apresentada aplica-se directamente a este caso.

3.3.2

Valida¸c˜

ao num´

erica

Uma outra abordagem `a valida¸c˜ao dum modelo ´e a que se tem quando se disp˜oe de v´arios m´etodos de ajustamento. Se os resultados obtidos por dois ou mais m´etodos forem pratica-mente coincidentes h´a que concluir:

• que o modelo ´e adequado;

• que os m´etodos conduziram a ajustamentos t˜ao bons quanto poss´ıvel.

Com efeito, se os m´etodos n˜ao conduzissem a ajustamentos ”´optimos”ou ”sub-´optimos”era natural que os resultados obtidos com eles diferissem. Por outro lado, a existˆencia de con-cordˆancia nos ajustamentos indica que os v´arios m´etodos ao ajustarem modelos praticamente coincidentes ajustaram o modelo correcto.

(35)

A valida¸c˜ao num´erica ´e particularmente fi´avel quando est´a estabelecida a convergˆencia de um dos m´etodos utilizados. Nesse caso a convergˆencia do ou dos restantes m´etodos passa tamb´em a ser estabelecida.

As raz˜oes apontadas para aceitar a valida¸c˜ao num´erica aplicam-se mesmo que n˜ao se tenha podido realizar a valida¸c˜ao estat´ıstica. Ent˜ao n˜ao se poder´a assumir a normalidade e dever-se-´a utilizar inferˆencia n˜ao param´etrica.

3.4

Modelos Simples

3.4.1

Ajustamento e valida¸c˜

ao

Os modelos que agora consideramos, para os logit, s˜ao da forma E(Yi) = α + βti, i = 1, . . . , n

com dois regressores, um constantemente igual a 1 e o outro que toma os valores observ´aveis t1, . . . , tn. Neste caso estamos a admitir que a vari´avel dependente e os regressores s˜ao

observ´aveis. Teremos X =     1 t1 .. . ... 1 tn     vindo XtD (N1′. . . Nn′) X =    Pn i=1N ′ i Pn i=1tiN ′ i Pn i=1tiNi′ Pn i=1t2iNi′    = s0 s1 s1 s2 !

com sr=Pni=1triNi′; r = 0, 1, 2 pelo que,

XtD (N′ 1. . . Nn′) X −1 = 1 s0s2− s21 s2 −s1 −s1 s0 ! e como, XtD (N′ 1. . . Nn′) y =    Pn i=1yiN ′ i Pn i=1yitiN ′ i    = s0,y s1,y ! com sr,y = n X i=1 yitriNi′ ; r = 0, 1

(36)

tem-se os estimadores,       ˆ α = s2s0,y−s1s1,y s0s2−s21 ˆ β = s0s1,y−s1s0,y s0s2−s21 .

Para validar estes modelos seguimos a teoria atr´as descrita come¸cando por obter a matriz W , cujos elementos s˜ao da forma

       wi,i = N1′ i − 1 d(s2− 2s1ti+ s0t 2 i) wi,j = −1d(s2− s1(ti + tj) + s0titj) ; i 6= j

com d = s0s2 − s21. Pˆode, em seguida, aplicar-se a valida¸c˜ao estat´ıstica.

3.4.2

Dados

O presente trabalho foi realizado com base nos dados do Eurostat e de duas bases de dados da World Health Organization (WHO): CISID (Centralized information system for infectious diseases) e HFA-DB (European health for all database).

Mais concretamente, dependendo dos dados dispon´ıveis recolhemos para 12 pa´ıses1 da

Uni˜ao Europeia:

Eurostat : N´umero de novos casos de Salmonellosis CISID/WHO : N´umero de novos casos de SIDA

HFA-DB/WHO : N´umero de novos casos de Hepatite A : N´umero de novos casos de Hepatite B : N´umero de novos casos de Hepatite C : N´umero de novos casos de Tuberculose

Embora a TB extrapulmonar ocorra menos frequentemente (30%) do que a TB pulmonar (70%), crian¸cas e pessoas com imunodeficiˆencias, como a infec¸c˜ao pelo VIH, apresentam um risco mais elevado de contrair TB extrapulmonar. Assim, os dados correspondentes `a incidˆencia de TB comportam todos os tipos de TB. Contudo, ´e a TB pulmonar o tipo mais comum em todo o mundo, mesmo nestes grupos mais suscept´ıveis.

As estimativas da popula¸c˜ao residente em cada um dos pa´ıses em estudo foram obtidas da base de dados HFA-DB.

1

Austria, B´elgica, Dinamarca, Finlˆandia, Alemanha, Gr´ecia, It´alia, Luxemburgo, Holanda, Portugal, Su´ecia e Inglaterra. ´E importante referir que pretend´ıamos integrar, nesta aplica¸c˜ao, os primeiros 15 pa´ıses da UE mas, devido `a falta de dados da incidˆencia de HCV, n˜ao foi poss´ıvel incluir Fran¸ca, Irlanda e Espanha.

(37)

Os dados foram recolhidos em Novembro de 2007 e est˜ao apresentados em apˆendice. O per´ıodo de tempo considerado variou de pa´ıs para pa´ıs, consoante os dados dispon´ıveis (Tabela 3.1).

Tabela 3.1: Anos considerados por pa´ıs.

Pa´ıs Anos n Austria 1993 a 2005 13 B´elgica 1996 a 2005 10 Dinamarca 1991 a 2006 16 Finlˆandia 1995 a 2005 11 Alemanha 1997 a 2005 9 Gr´ecia 1996 a 2005 10 It´alia 1991 a 2005 15 Luxemburgo 1997 a 2006 10 Holanda 1998 a 2006 9 Portugal 1993 a 2006 14 Su´ecia 1993 a 2006 14 Inglaterra 1988 a 2005 18

3.4.3

Aplica¸c˜

ao

Nesta sec¸c˜ao apresentamos os resultados do ajustamento dos modelos simples. Foi ajustado um modelo simples por pa´ıs e doen¸ca.

Come¸camos por apresentar na Tabela 3.2 as estimativas para o parˆametro α. Tabela 3.2: Modelo Simples - estimativas do parˆametro α.

˜

α SIDA HAV HBV HCV Salmonellosis TB

Austria -10.409 -9.627 -10.743 -11.154 -6.914 -8.587 B´elgica -11.007 -9.878 -10.723 -10.913 -6.408 -8.994 Dinamarca -9.699 -10.206 -10.619 -11.071 -7.014 -9.315 Finlˆandia -12.132 -10.454 -9.523 -7.886 -7.311 -8.853 Alemanha -11.258 -9.598 -9.180 -9.491 -6.565 -8.797 Gr´ecia -10.804 -10.746 -10.748 -11.167 -11.180 -9.595 It´alia -9.063 -8.945 -9.479 -10.089 -7.770 -9.321 Luxemburgo -10.849 -7.628 -8.383 -8.412 -7.313 -9.393 Holanda -11.132 -9.400 -11.144 -10.199 -8.855 -9.307 Portugal -9.315 -9.675 -8.622 -9.551 -10.757 -7.373 Su´ecia -10.617 -9.383 -10.615 -7.720 -7.530 -9.673 Inglaterra -10.437 -8.693 -11.251 -14.398 -7.374 -9.209

(38)

Segue-se a Tabela 3.3 com as estimativas do parˆametro β. Este parˆametro representa a taxa de varia¸c˜ao do logit da incidˆencia de determinada doen¸ca com o tempo.

No Cap´ıtulo 5 iremos trabalhar com as estimativas do parˆametro β correspondentes `as doen¸cas de cada cen´ario.

Tabela 3.3: Modelo Simples - estimativas do parˆametro β.

˜

β SIDA HAV HBV HCV Salmonellosis TB

Austria -0.118 -0.103 0.085 0.175 -0.018 -0.0399 B´elgica -0.033 -0.0365 0.118 0.195 -0.063 -0.007 Dinamarca -0.138 -0.052 -0.073 0.086 -0.057 -0.006 Finlˆandia -0.035 0.034 -0.124 -0.039 -0.038 -0.070 Alemanha -0.067 -0.188 -0.232 0.029973 -0.087 -0.091 Gr´ecia -0.1075 -0.027 -0.02859 -0.089 0.265 0.039 It´alia -0.09982 -0.08251 -0.117 -0.129 -0.06553 -0.017 Luxemburgo -0.003262 -0.308 -0.174 -0.187 0.012 0.014 Holanda 0.017 -0.194 0.029 -0.106 -0.033 -0.02259 Portugal -0.00357 -0.131 -0.223 -0.119 0.075 -0.046 Su´ecia -0.126 -0.150 0.013 -0.022 -0.017 -0.022 Inglaterra -0.039 -0.145 0.008 0.306 -0.051 0.008

Quanto ao ajustamento do modelo podemos observar na Tabela 3.4 os valores do coefi-ciente de determina¸c˜ao R2.

Tabela 3.4: Modelo Simples - coeficiente de determina¸c˜ao R2. R2

SIDA HAV HBV HCV Salmonellosis TB

Austria 0.859 0.758 0.597 0.899 0.458 0.778 B´elgica 0.189 0.240 0.456 0.797 0.517 0.055 Dinamarca 0.871 0.500 0.563 0.798 0.527 0.018 Finlˆandia 0.023 0.169 0.527 0.511 0.734 0.921 Alemanha 0.894 0.959 0.909 0.435 0.987 0.940 Gr´ecia 0.781 0.135 0.044 0.054 0.588 0.0004 It´alia 0.805 0.352 0.916 0.787 0.878 0.159 Luxemburgo 0.001 0.834 0.625 0.558 0.294 0.016 Holanda 0.036 0.872 0.240 0.626 0.405 0.615 Portugal 0.00005 0.544 0.974 0.733 0.646 0.892 Su´ecia 0.741 0.711 0.050 0.286 0.251 0.388 Inglaterra 0.355 0.784 0.024 0.722 0.750 0.052

Os valores de R2 variam muito, realmente os resultados deste modelo s´o ajudar˜ao no

estudo do problema quando forem considerados em conjunto com os do outro modelo logit e com os da retro-PLS como veremos.

(39)

3.4.4

Valida¸c˜

ao

Utilizando a teoria descrita na sec¸c˜ao 3.3.1 obteve-se o vector Z com componentes Z1, . . . , Zg.

A partir destas componentes seguimos o teste desenvolvido por Mexia (1989), para validar o modelo.

Quando o modelo se verifica, verifica-se a hip´otese

H0 : Z1, . . . , Zg i.i.d. ∼ N(0, 1) pelo que, Z0 = 1 g g X i=1 Zi ∼ N(0, 1/g) independente de S = g X i=1 Zi2− gZ02 ∼ χ2g−1 pelo que F= (g − 1) gZ 2 0 Pg i=1Zi2− gZ02

ter´a, quando H0 se verifica, distribui¸c˜ao F central com 1 e g − 1 graus de liberdade.

As alternativas a H0 correspondem a vari´aveis Z1, . . . , Zg normais, independentes com

variˆancia 1 e valores m´edios η1, . . . , ηg. Ent˜ao

Z0 ∼ N(η0, 1/g)

com η0 = 1gPgi=1ηi, independente de

S ∼ χ2g−1,δ2 com δ2 = 1 σ2 g X i=1 η2i − gη02 ! . Como se ter´a Z02 ∼ 1 gχ 2 1,δ1 com δ1 = gη02,

F ter´a distribui¸c˜ao F com 1 e g − 1 graus de liberdade e parˆametros de n˜ao centralidade δ1

e δ2. Haver´a alternativas em que δ1 predomina sobre δ2 [δ2 predomina sobre δ1] e em que F

(40)

de normalidade, tomamos a regi˜ao de aceita¸c˜ao [f1,g−1,q/2; f1,g−1,1−q/2], com fr,s,p o quantil

para a probabilidade p da distribui¸c˜ao F central com r e s graus de liberdade.

Na Tabela 3.5 apresentamos o valor da estat´ıstica do teste e a regi˜ao de aceita¸c˜ao. Tabela 3.5: Modelo Simples - estat´ıstica do teste e intervalo de aceita¸c˜ao.

Pa´ıs FSIDA FHAV FHBV FHCV FSalm FT B [f1,g−1,0.025; f1,g−1,0.975]

Austria 0.45104 1.11058 0.03511 2.31194 0.98928 3.38073 [0.144, 968.627] B´elgica 1.34997 1.33908 0.03549 1.5604 1.18668 0.12964 [0.124, 948.217] Dinamarca 1.35718 0.01858 0.02459 0.02606 1.59127 1.51337 [0.156, 979.837] Finlˆandia 0.36232 1.62144 7.80174 0.09215 2.57755 0.51335 [0.132, 956.656] Alemanha 1.33588 1.07512 0.91846 0.00533 0.03204 0.04902 [0.113, 937.111] Gr´ecia 1.48394 9.98099 0.00819 1.55028 1.31851 2.97572 [0.124, 948.217] It´alia 0.17694 0.08214 0.00428 0.98856 0.03088 2.30872 [0.153, 976.708] Luxemburgo 0.56052 0.08238 0.08691 0.01241 0.14405 0.06155 [0.124, 948.217] Holanda 1.34123 0.32512 0.06083 5.14666 0.29557 0.20988 [0.113, 937.111] Portugal 1.41597 0.48309 2.15395 1.45633 1.1089 0.13867 [0.149, 973.025] Su´ecia 1.53486 0.56649 0.08279 2.86087 0.57971 0.00033 [0.149, 973.025] Inglaterra 0.02003 0.30739 0.72849 1.05301 0.07791 0.1748 [0.161, 984.867]

Os valores a vermelho correspondem a rejei¸c˜oes ao n´ıvel de 5%. Observe-se que as mesmas correspondem a valores pequenos da estat´ıstica, os quais poder˜ao, pelo menos em parte, ser explicados por grandes desvios. Esta foi uma das raz˜oes que nos levou a utilizar t´ecnicas n˜ao param´etricas na an´alise dos nossos dados.

(41)

3.5

Modelos com dois factores aditivos

Vamos agora considerar modelos log´ısticos com regressores n˜ao observ´aveis. A fun¸c˜ao objectivo para estes modelos ´e, como viram,

S(β, λ|V∗) = (y − X(λ|β))tD (N1′. . . Nn′) (y − X(λ|β)) .

Para ajustar estes modelos pode-se utilizar o algoritmo ZigZag, ver por exemplo Nunes et al. (2004A e 2004B), em que se minimiza a fun¸c˜ao objectivo alternadamente em ordem a β e a λ. Assim, pode-se come¸car por um ”valor inicial”λ0 para λ calcula-se ent˜ao

ˆ β1 = X(λ0)tD (N1′. . . Nn′) X(λ0) −1 X(λ0)tD (N1′. . . Nn′) y em seguida minimiza-se S(λ| ˆβ1, V∗) = S(λ, ˆβ 1|V∗)

para obter ˆλ1 e assim sucessivamente de forma a obter sucessivos estimadores ˆβi, ˆλi, i = 1, . . .

No fim de cada itera¸c˜ao calcula-se a soma dos quadrados dos res´ıduos Si = S( ˆβi, ˆλi|V∗) = ytD (N1′. . . Nn′) y − ytD (N1′. . . Nn′) X( ˆλi) ˆβi

e repete-se o processo at´e os valores de Si, i = 1, . . . estabilizarem.

Quando X(λ) ´e linear em λ, isto ´e quando

X(a1 + bλ) = aX(1) + bX(λ)

pode-se, no fim de cada itera¸c˜ao, estandardizar o vector λ mantendo invariantes a menor e a maior das componentes respectivas.

Nos casos que adiante consideramos trabalhamos com pares (pa´ıs, ano) dando o ´ındice i a pa´ıses e o ´ındice j a anos. Teremos ent˜ao

λ= "

f g

#

com f e g os vectores de efeitos associados a pa´ıses e anos, respectivamente.

Admitindo-se a aditividade dos dois factores (pa´ıs e ano) ter-se-´a a fun¸c˜ao objectivo S(α, β, f, g|V∗) = m X i=1 n X j=1 Nij′ (yij − α − β(fi+ gj))2.

(42)

Nas duas sub-al´ıneas que se seguem consideraremos: 1. o algoritmo ZigZag para estes modelos;

2. um algoritmo alternativo para os mesmos.

Com efeito n˜ao se conseguiu ainda estabelecer a convergˆencia dos algoritmos ZigZag. Assim somos levados a considerar tamb´em algoritmos mais pesados para os quais se pˆode estabelecer a convergˆencia.

3.5.1

Ajustamento por ZigZag

Nesta sec¸c˜ao seguimos os trabalhos de Nunes et al.(2004A e 2004B) para aplicar o algoritmo ZigZag a estes modelos.

O algoritmo ZigZag ´e um algoritmo iterativo que, como o pr´oprio nome indica, com minimiza¸c˜oes alternadas, permite decompor o problema dentro de cada itera¸c˜ao k, k = 1, 2, . . . , em dois problemas de m´ınimos quadrados:

• um problema de m´ınimos quadrados relativamente ao par de parˆametros (α, β), isto ´e, um problema em que se pretende minimizar a fun¸c˜ao objectivo em ordem a α e a β admitindo que se conhecem os valores xij = fi+ gj;

• um outro problema de m´ınimos quadrados relativamente ao par de vectores (f, g), com f = (f1, . . . , fm)t e g = (g1, . . . , gn)t, em que se pretende minimizar a fun¸c˜ao objectivo

admitindo que se conhece (α, β).

Os valores das vari´aveis controladas n˜ao s˜ao conhecidos, o que nos obriga a obter estimativas iniciais,2 x

ij(0), necess´arias para iniciar a primeira itera¸c˜ao do algoritmo.

Assim, toma-se xij(0) = yi•+ y•j− y••, i = 1, . . . , m e j = 1, . . . , n onde yi•= 1 n n X j=1 yij ; y•j = 1 m m X i=1 yij e y•• = 1 m × n m X i=1 n X j=1 yij.

Estamos desta forma a admitir que se conhecem as estimativas xij(k − 1), obtidas na

itera¸c˜ao (k − 1).

2

Esta escolha resulta da pr´atica que se tem tido na aplica¸c˜ao do algoritmo ZigZag, ver Mexia et al. (1999 e 2001).

(43)

A itera¸c˜ao k, k = 1, 2, . . . pode ser definida pelos seguintes passos:

Passo 1 Minimizar a fun¸c˜ao objectivo, S, em ordem aos parˆametros α e β, usando as estimativas iniciais xij(k − 1). Desta minimiza¸c˜ao resultam as seguintes estimativas:

˜ α(k) = yo− ˜β(k)xo(k) e β(k) =˜ sxy(k) sxx(k) onde             yo = Pm i=1 Pn j=1qijyij q+ xo(k) = Pm i=1 Pn j=1qijxij(k − 1) q+ com qij = Nij′ e q+ = m X i=1 n X j=1 qij e               sxx(k) = m X i=1 n X j=1 qij(xij(k − 1) − xo(k))2 sxy(k) = m X i=1 n X j=1 qij(xij(k − 1) − xo(k))(yij − yo).

Passo 2 Conhecendo as estimativas ˜α(k) e ˜β(k) obtidas no passo 1, minimizar a fun¸c˜ao objectivo Sf g = m X i=1 n X j=1 qij  yij − ˜α(k) − ˜β(k) (fi+ gj) 2

em ordem aos vectores f e g, obtendo-se o sistema    D1 | Q − − − | − − − Qt | D 2       f − − − g    = v(k) onde Q = [qij]

(44)

´e uma matriz de dimens˜ao (m × n),                  D1 = diag n X j=1 q1j, . . . , n X j=1 qmj ! D2 = diag m X i=1 qi1, . . . , m X i=1 qin !

e as componentes do vector v(k) = (v1(k), . . . , vm+n(k))t s˜ao dadas por:

           vi(k) = 1 ˜ β(k) n X j=1 qij(yij − ˜α(k)); i = 1, . . . , m vm+j(k) = 1 ˜ β(k) m X i=1 qij(yij − ˜α(k)); j = 1, . . . , n.

A solu¸c˜ao deste sistema produz as estimativas para os coeficientes fi e gj dadas por:

˜

fi(k), i = 1, . . . , m e ˜gj(k), j = 1, . . . , n

e, consequentemente,

˜

xij(k) = ˜fi(k) + ˜gj(k).

Passo 3 Tendo-se obtido nos dois passos anteriores as estimativas ˜α(k), ˜β(k), ˜fi(k), i =

1, . . . , m e ˜gj(k), j = 1, . . . , n estamos em condi¸c˜oes de calcular o valor estimado para

a fun¸c˜ao objectivo e S(k) = m X i=1 n X j=1 qij  yij − ˜α(k) − ˜β(k)  ˜ fi(k) + ˜gj(k) 2 .

Passo 4 Proceder `a estandardiza¸c˜ao das estimativas de xij, de modo que o seu m´ınimo e

m´aximo se mantenham inalterados. Considerando,            a = min{xij(0)} b = max{xij(0)} a(k) = min{˜xij(k)} b(k) = max{˜xij(k)}

(45)

com i = 1, . . . , m e j = 1, . . . , n, calcula-se ˜

wij(k) =

b − a

b(k) − a(k) × (˜xij(k) − a(k)) + a.

Os valores obtidos nesta estandardiza¸c˜ao s˜ao utilizados no in´ıcio da itera¸c˜ao seguinte, caso o valor da fun¸c˜ao objectivo, eS(k), n˜ao tenha estabilizado, isto ´e, xij(k) = ˜wij(k).

Ver Mexia et al. (1999).

3.5.2

Ajustamento por dupla minimiza¸c˜

ao

Nesta sec¸c˜ao desenvolvemos um algoritmo alternativo ao algoritmo ZigZag para minimizar a fun¸c˜ao objectivo S.

Come¸camos por reparametrizar a fun¸c˜ao objectivo, S, considerando: (

αj = α + βgj; j = 1, . . . , n

xi = fi i = 1, . . . , m.

Assim, pretende-se minimizar S = m X i=1 n X j=1 qij(yij− αj− βxi)2 (3.1)

em ordem aos parˆametros α = (α1, . . . , αn), β e ao vector x = (x1, . . . , xm).

Procedemos por duas fases come¸cando por obter o m´ınimo s(x) de S, para x conhecido, e, em seguida, minimizando s(x), como o pr´oprio nome indica procedemos a uma dupla minimiza¸c˜ao.

Fase 1 Repare-se que S pode ser escrita na forma S = m X i=1 n X j=1 qijyij2 + n X j=1 m X i=1 qij ! α2j + m X i=1 n X j=1 qijx2i ! β2− 2 n X j=1 m X i=1 qijyij ! αj −2 m X i=1 n X j=1 qijxiyij ! β + 2 n X j=1 m X i=1 qijxi ! αjβ vindo, δS δαj = 2 m X i=1 qij ! αj− 2 m X i=1 qijyij + 2 m X i=1 qijxi ! β ; j = 1, . . . , n.

(46)

Anulando δS δαj ; j = 1, . . . , n obtemos αj• = y•j− βx•j ; j = 1, . . . , n (3.2) com y•j = Pm i=1qijyij Pm i=1qij e x•j = Pm i=1qijxi Pm i=1qij ; j = 1, . . . , n.

Tem-se ainda, por substitui¸c˜ao, caso αj = αj•

δS δβ = 2β m X i=1 n X j=1 qijx2i − 2 m X i=1 n X j=1 qijxiyij + 2 n X j=1 m X i=1 qijxi ! αj• = 2 " β m X i=1 n X j=1 qijx2i − m X i=1 n X j=1 qijxiyij + n X j=1 m X i=1 qijxi ! Pm i=1qijyij − β Pm i=1qijxi Pm i=1qij # = 2 " β n X j=1 m X i=1 qijx2i − n X j=1 (Pmi=1qijxi)2 Pm i=1qij ! − − n X j=1 m X i=1 qijxiyij − (Pmi=1qijxi) (Pmi=1qijyij) Pm i=1qij !# . Repare-se que, m X i=1 qij(xi− x•j)2 = m X i=1 qij(x2i − 2xix•j+ x2•j) = m X i=1 qijx2i − 2x•j m X i=1 qijxi+ x2•j m X i=1 qij = m X i=1 qijx2i − 2x2•j m X i=1 qij + x2•j m X i=1 qij = m X i=1 qijx2i − x2•j m X i=1 qij = m X i=1 qijx2i − (Pmi=1qijxi)2 Pm i=1qij ; j = 1, . . . , n e, analogamente que m X i=1 qij(xi− x•j)(yij − y•j) = m X i=1 qijxiyij − (Pmi=1qijxi) (Pmi=1qijyij) Pm i=1qij

(47)

vindo δS δβ = 2β n X j=1 m X i=1 qij(xi− x•j)2− 2 n X j=1 m X i=1 qij(xi− x•j)(yij − y•j). Anulando δS δβ obt´em-se, β• = Pn j=1 Pm i=1qij(xi− x•j)(yij − y•j) Pn j=1 Pm i=1qij(xi− x•j) 2 . (3.3) Atendendo a (3.2) e a (3.3), tem-se s(x) = m X i=1 n X j=1 qij(yij − αj•− β•xi)2 = m X i=1 n X j=1 qij[(yij − y•j) − β•(xi− x•j)]2 = m X i=1 n X j=1 qij(yij − y•j)2− 2β• m X i=1 n X j=1 qij(yij − y•j)(xi− x•j) + β•2 m X i=1 n X j=1 qij(xi− x•j)2 = m X i=1 n X j=1 qij(yij − y•j)2− Pm i=1 Pn j=1qij(yij − y•j)(xi− x•j) 2 Pm i=1 Pn j=1qij(xi − x•j)2 . Como m X i=1 n X j=1 qij(yij − y•j)(xi− x•j) !2 = " m X i=1 n X j=1 qij(yij − y•j)xi− n X j=1 qij(yij − y•j)x•j !#2 = m X i=1 aixi !2 com ai = n X j=1 qij(yij − y•j), vem s(x) = m X i=1 n X j=1 qij(yij − y•j)2− (Pmi=1aixi)2 Pm i=1 Pn j=1qij(xi − x•j)2 .

(48)

s(x) ´e equivalente a maximizar (Pmi=1aixi)2 Pm i=1 Pn j=1qij(xi− x•j)2

ou ainda, a minimizar o seu inverso.

Se multiplicarmos cada xi; i = 1, . . . , m por uma constante c n˜ao nula tanto o

nu-merador como o denominador viriam multiplicados por c2, o que, permite introduzir a

seguinte restri¸c˜ao: m X i=1 aixi !2 = 1 que ´e equivalente a,

m X i=1 aixi = 1 ou m X i=1 aixi = −1. (3.4) Seja, g(x) = m X i=1 n X j=1 qij(xi− x•j)2.

Sendo g(x) uma fun¸c˜ao par, isto ´e, g(x) = g(−x) podemos escolher uma das condi¸c˜oes (3.4).

Pretendemos ent˜ao minimizar g(x) sujeita `a restri¸c˜aoPmi=1aixi = 1. Para resolver este

problema de minimiza¸c˜ao foi necess´ario primeiro reescrever a fun¸c˜ao g(x) na forma quadr´atica e depois incorporar a restri¸c˜ao. Obtemos,

g(x) = m X i=1 n X j=1  qij − q2 ij pj ! x2i − m X i=1 m X l=1 i6=l n X j=1 qijqlj pj ! xixl onde pj = m X i=1 qij ; j = 1, . . . , n. Fazendo, li = n X j=1 qij; i = 1, . . . , m e cil = n X j=1 qijqlj pj ; i, l = 1, . . . , m podemos escrever g(x) = m X i=1 lix2i − m X i=1 m X l=1 cilxixl.

Isolando xm, com vista a incorporar a condi¸c˜ao tem-se que, sendo xm =

1 −Pm−1l=1 alxl

am

(49)

minimizar a nova fun¸c˜ao, g∗(x) = m−1 X i=1  li + lm a2 i a2 m − cii− cmm a2 i a2 m + 2cim ai am  x2i + + m−1X i=1 m−1X l=1 i6=l  lm aial a2 m − cil+ 2cim al am − cmm aial a2 m  xixl− − m−1 X i=1  2lm ai a2 m + 2cim am − 2cmm ai a2 m  xi+ +lm− cmm a2 m .

Estamos agora em condi¸c˜oes de poder usar, por exemplo o software Mathematica para minimizar a fun¸c˜ao g∗(x). Obt´em-se assim a solu¸c˜ao ´unica do nosso problema.

3.5.3

Compara¸c˜

ao entre os dois algoritmos e valida¸c˜

ao num´

erica

Nesta sec¸c˜ao aplicamos o algoritmo ZigZag e o da dupla minimiza¸c˜ao para ajustar o modelo logit, com uma estrutura aditiva de dois factores, e comparamos os resultados obtidos com vista `a valida¸c˜ao num´erica.

Apresentamos dois exemplos, um aplicado aos dados da incidˆencia de Tuberculose e outro aplicado aos dados da incidˆencia de SIDA, em treze pa´ıses3 (m = 13) da Uni˜ao Europeia

num per´ıodo de sete anos (n = 7), de 1997 a 2003. Os dados das incidˆencias e as estimativas da popula¸c˜ao residente em cada um dos pa´ıses em estudo foram tamb´em recolhidos das bases de dados da WHO.

Exemplo 1 - Incidˆencia de Tuberculose

Come¸camos por apresentar na Tabela 3.6 as estimativas de yij obtidas pelo algoritmo

ZigZag e pelo algoritmo da dupla minimiza¸c˜ao. Para n˜ao tornar a apresenta¸c˜ao dos resulta-dos demasiado exaustiva apresentamos, nesta tabela, apenas os resultaresulta-dos do primeiro e do ´

ultimo ano em estudo.

Como se pode observar os resultados das estimativas s˜ao os mesmos e isso verifica-se em todo o per´ıodo.

Na Figura 3.1 apresentamos um gr´afico com as estimativas obtidas para o factor de localiza¸c˜ao, fi, i = 1, . . . , m por ambos os algoritmos.

3

Austria, B´elgica, Dinamarca, Finlˆandia, Alemanha, Gr´ecia, Irlanda, It´alia, Luxemburgo, Portugal, Es-panha, Su´ecia e Inglaterra

(50)

Tabela 3.6: Compara¸c˜ao entre os dois algoritmos - TB.

1997 2003

Pa´ıs ZigZag Dupla minimiza¸c˜ao ZigZag Dupla minimiza¸c˜ao

α+ β(xij) αj+ β(xi) α+ β(xij) αj+ β(xi) Austria -8.74355 -8.74355 -9.02797 -9.02797 B´elgica -8.8901 -8.8901 -9.17453 -9.17453 Dinamarca -9.1191 -9.1191 -9.40352 -9.40352 Finlˆandia -9.08677 -9.08677 -9.37119 -9.37119 Alemanha -8.99053 -8.99053 -9.27495 -9.27495 Gr´ecia -9.43489 -9.43489 -9.71932 -9.71932 Irlanda -9.0098 -9.0098 -9.29423 -9.29423 It´alia -9.33389 -9.33389 -9.61831 -9.61831 Luxemburgo -9.15778 -9.15778 -9.4422 -9.4422 Portugal -7.55597 -7.55597 -7.84039 -7.84039 Espanha -8.36333 -8.36333 -8.64775 -8.64775 Su´ecia -9.78557 -9.78557 -10.07 -10.07 Inglaterra -9.02907 -9.02907 -9.3135 -9.3135 -3.5 -3 -2.5 -2 ZigZag 0.128005 0.12801 0.128015 0.12802 0.128025 Dupla Minimização

Figura 3.1: Estimativas para o factor de localiza¸c˜ao - TB.

Este gr´afico sugere uma rela¸c˜ao linear entre os factores de localiza¸c˜ao ajustados por ambos os algoritmos. Representando por f e ˙f os factores de localiza¸c˜ao obtidos pelo algoritmo ZigZag e pelo algoritmo da dupla minimiza¸c˜ao respectivamente, ajustamos, pelo m´etodo dos m´ınimos quadrados, a regress˜ao linear

˙

f = 0.128 + 0.000013f

com o coeficiente de determina¸c˜ao, R2 = 0.99831, o que valida fortemente a existˆencia da

assumida rela¸c˜ao linear. Esta ´e uma raz˜ao adicional para aceitar que, neste caso, ambos os algoritmos conduzem a resultados equivalentes.

Quanto ao ajustamento do modelo podemos comprovar, observando na Tabela 3.7 os valores do coeficiente de determina¸c˜ao, que ambos os algoritmos permitiram ajustar com precis˜ao

(51)

um modelo log´ıstico a partir de dados apenas sobre a incidˆencia da doen¸ca. A estimativa para Tabela 3.7: TB - coeficiente de determina¸c˜ao R2.

ZigZag Dupla minimiza¸c˜ao R2

0.944008 0.944008

o valor da fun¸c˜ao objectivo, ˆS = 3440.38 tamb´em foi a mesma para ambos os algoritmos.

Exemplo 2 - Incidˆencia de SIDA

No caso da incidˆencia de SIDA utilizamos as mesmas compara¸c˜oes.

Mostramos na Tabela 3.8 as estimativas de yij e como se pode verificar os resultados

obtidos por ambos os algoritmos foram os mesmos.

Tabela 3.8: Compara¸c˜ao entre os dois algoritmos - SIDA.

1997 2003

Pa´ıs ZigZag Dupla minimiza¸c˜ao ZigZag Dupla minimiza¸c˜ao

α+ β(xij) αj+ β(xi) α+ β(xij) αj+ β(xi) Austria -11.1303 -11.1303 -11.9147 -11.9147 B´elgica -10.9573 -10.9573 -11.7417 -11.7417 Dinamarca -10.8563 -10.8563 -11.6407 -11.6407 Finlˆandia -12.0946 -12.0946 -12.879 -12.879 Alemanha -11.1801 -11.1801 -11.9645 -11.9645 Gr´ecia -11.0507 -11.0507 -11.8351 -11.8351 Irlanda -11.5759 -11.5759 -12.3603 -12.3603 It´alia -9.77023 -9.77023 -10.5546 -10.5546 Luxemburgo -10.5483 -10.5483 -11.3327 -11.3327 Portugal -8.85771 -8.85771 -9.64211 -9.64211 Espanha -9.12689 -9.12689 -9.91129 -9.91129 Su´ecia -11.4857 -11.4857 -12.2701 -12.2701 Inglaterra -10.732 -10.732 -11.5164 -11.5164

Assim como no caso da Tuberculose, temos uma rela¸c˜ao linear bem definida entre as estimativas dos factores de localiza¸c˜ao obtidas por ambos os algoritmos, como podemos ver no gr´afico da Figura 3.2.

Obtivemos a regress˜ao linear ˙

f = 0.158 + 0.0000279f

com R2 = 0.999854, o que valida a forte rela¸c˜ao linear entre f e ˙f .

Mais uma vez, no caso da SIDA, o ajustamento do modelo logit por ambos os algoritmos foi muito bom, ver Tabela 3.9.

(52)

-4.5 -4 -3.5 -3 -2.5 -2 ZigZag 0.15836 0.15838 0.15842 0.15844 Dupla Minimização

Figura 3.2: Estimativas para o factor de localiza¸c˜ao - SIDA.

E, a estimativa para o valor da fun¸c˜ao objectivo, ˆS = 1172.45 tamb´em foi a mesma para Tabela 3.9: SIDA - coeficiente de determina¸c˜ao R2.

ZigZag Dupla minimiza¸c˜ao R2

0.90416 0.90416

ambos os algoritmos.

A concordˆancia entre os resultados obtidos pelos dois algoritmos ´e um bom exemplo de valida¸c˜ao num´erica dos ajustamentos.

Pode-se pois concluir que se realizou a valida¸c˜ao num´erica dos ajustamentos.

3.5.4

Aplica¸c˜

ao

Nesta sec¸c˜ao apresentamos os resultados do ajustamento do modelo logit com uma estrutura aditiva de factores, para todas as doen¸cas (SIDA e co-infec¸c˜oes). Ajustamos um modelo por doen¸ca.

Tanto os dados de incidˆencia de SIDA como os dados de incidˆencia das co-infec¸c˜oes referem-se a um per´ıodo de 8 anos4 (n = 8), de 1998 a 2005.

Temos:

• fi - o coeficiente do factor de localiza¸c˜ao do pa´ıs i, i = 1, . . . , 12;

• gj - o coeficiente do factor temporal do ano j, j = 1, . . . , 8.

Optamos por usar o algoritmo ZigZag para proceder ao ajustamento. Para todas as doen¸cas, as estimativas foram obtidas na segunda itera¸c˜ao do algoritmo.

4

(53)

Come¸camos por apresentar na Tabela 3.10 as estimativas para os parˆametros α e β. Tabela 3.10: Modelo Aditivo - estimativas para os parˆametros α e β.

Parˆametro SIDA HAV HBV HCV Salmonellosis TB

α -0.0177169 3.13737 4.84792 -0.365823 0.922862 0.182335

β 0.992527 1.20605 1.40093 0.928718 1.10502 1.0149

Observe-se que, para todas as doen¸cas, a estimativa do parˆametro β ´e aproximadamente igual a 1.

Na Tabela 3.11 apresentamos as estimativas obtidas para o factor de localiza¸c˜ao. Tabela 3.11: Modelo Aditivo - estimativas para o factor de localiza¸c˜ao.

Pa´ıs SIDA HAV HBV HCV Salmonellosis TB

Austria -4.80733 -4.64534 -3.87971 -3.65776 -2.42387 -3.47616 B´elgica -4.557 -4.23972 -3.8231 -3.75919 -2.14634 -3.55191 Dinamarca -4.72607 -4.79687 -5.13056 -4.33118 -2.97082 -3.84732 Finlˆandia -5.78437 -4.32808 -4.32727 -2.32015 -2.88059 -3.84349 Alemanha -4.94105 -4.58701 -4.25351 -3.60259 -2.3782 -3.75944 Gr´ecia -4.83928 -4.85505 -4.67622 -5.91357 -4.04731 -3.86986 It´alia -3.6334 -4.46061 -4.63012 -6.00439 -3.729 -4.01767 Luxemburgo -4.2032 -3.08103 -3.47581 -3.38499 -2.48584 -3.80288 Holanda -4.30469 -4.30513 -4.72009 -4.85862 -4.1676 -3.89966 Portugal -2.58591 -5.12657 -4.48853 -4.64674 -4.98828 -2.30919 Su´ecia -5.24885 -4.97757 -4.33338 -2.05629 -2.94572 -4.40937 Inglaterra -4.4704 -4.82324 -4.87407 -3.80811 -3.45834 -3.61461

Como veremos, o valor das estimativas do factor de localiza¸c˜ao dos pa´ıses, obtido para cada co-infec¸c˜ao vai ser utilizado no Cap´ıtulo 5.

Podemos observar na Tabela 3.12 a precis˜ao dos ajustamentos.

Tabela 3.12: Modelo Aditivo - coeficiente de determina¸c˜ao R2.

SIDA HAV HBV HCV Salmonellosis TB

R2 0.87583 0.161935 0.193766 0.621948 0.798539 0.878595

Os maus ajustamentos obtidos para HAV e HBV foram outra das raz˜oes que nos levaram a utilizar m´etodos n˜ao param´etricos.

(54)

Imagem

Tabela 3.5: Modelo Simples - estat´ıstica do teste e intervalo de aceita¸c˜ao.
Tabela 4.1: Cen´ario I - estimativas para os coeficientes γ para desfazamento de 1 ano.
Figura 4.1: Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas a partir de ˜ γ para desfazamento de 1 ano.
Tabela 4.4: Cen´ario I - estimativas para os coeficientes γ para desfazamento de 2 anos.
+7

Referências

Documentos relacionados