Modelação estatística das co-infecções da SIDA em países da União Europeia

(1)

Inˆ

es Jorge da Silva Sequeira

Modelac

¸˜

ao Estat´ıstica das Co-Infecc

¸˜

oes da SIDA

em Pa´ıses da Uni˜

ao Europeia

Disserta¸cão apresentada para obten¸cão do Grau de Doutor em Matemática, es-pecialidade de Estat´ıstica, pela Univer-sidade Nova de Lisboa, Faculdade de Ciências e Tecnologia

Lisboa 2009

(2)

(3)

Agradecimentos

Obrigado...!

Obrigado n˜ao chega decerteza para expressar neste texto a gratid˜ao e a responsabilidade que sinto por estar nesta fase da minha vida.

´

E ao meu Professor João Tiago Mexia a quem devo o maior agradecimento, pela ori-enta¸cão cientifica desta tese, que sem ele não teria sido poss´ıvel, pela confian¸ca que sempre depositou em mim, pela sua amizade, pela for¸ca que nele sempre encontrei para continuar, pela sua disponibilidade para trabalhar comigo, pelas oportunidades que me deu e pelo seu empenho pessoal neste trabalho.

Agrade¸co aos meus colegas do Departamento de Matem´atica pelo seu exemplo e pela ajuda que me deram sempre que lhes pedi.

Ao Professor Christoph Minder, ao Professor Stanislaw Mejza e à Professora Aldina Brás pelo interesse demonstrado neste trabalho, pelas suas ideias e sugestões.

`

A Sandra Nunes, pelo apoio na revis˜ao do texto, bem como as valiosas cr´ıticas e sugest˜oes que fez a alguns aspectos do trabalho.

Ao Agnelo por ter estado sempre ao meu lado, pelo seu humor e por muitas vezes me ter convidado a dar uma volta ao quarteir˜ao. `A Maria, nossa filha obrigada pelo colo que me pediu que muitas vezes me tranquilizou.

`

A minha Mãe e ao meu Pai, obrigado por todos os ensinamentos que me têm transmitido. Finalmente, quero deixar registada a minha gratidão à Funda¸cão para a Ciência e a Tecnologia (FCT) pelo apoio a este projecto concedido através da Bolsa de Doutoramento (SFRH/BD/41243/2007), ao Centro de Matemática e Aplica¸cões (CMA) da FCT/UNL pelo apoio na participa¸cão em alguns congressos e ao Departamento de Matemática da FCT/UNL, por me ter concedido a dispensa de servi¸co docente para a realiza¸cão deste projecto.

(4)

(5)

Resumo

Neste trabalho utilizam-se dados da WHO relativos a 12 pa´ıses da UE (os únicos para os quais se conhece a informa¸cão suficiente) para estudar nos mesmos as co-infeçcões da SIDA. Concretizando, pretendia-se testar a hipótese de que as co-infeçcões relevantes eram a Hepatite B, Hepatite C e a Tuberculose e ordenar os pa´ıses.

Para realizar estes objectivos come¸cou por se ajustar modelos logit às incidências das várias doen¸cas. Seguidamente de modo a relacionar a incidência da SIDA com a das co-infeçcões utilizou-se uma variante adequada da Partial Least Squares (PLS), a retro-PLS.

Quer esta variante, quer parte das t´ecnicas para ajustamento dos modelos logit foram desenvolvidas especificamente para este trabalho.

A retro-PLS foi aplicada separadamente em quatro cenários que consideravam diferentes co-infeçcões:

Cen´ario I: Hepatite B, Hepatite C, Tuberculose;

Cen´ario II: Hepatite A, Hepatite B, Hepatite C, Tuberculose; Cen´ario III: Hepatite B, Hepatite C, Salmonellosis, Tuberculose;

Cen´ario IV: Hepatite A, Hepatite B, Hepatite C, Salmonellosis, Tuberculose.

Uma vez aplicada a retro-PLS utilizou-se a An´alise de Componentes Principais (ACP) para condensar a informa¸c˜ao. Ordenou-se os pa´ıses a partir dos valores da primeira compo-nente.

Finalmente utilizou-se o ´ındice de concordância de Kendall para mostrar que as or-dena¸cões obtidas para os quatro cenários eram concordantes.

As principais conclusões que se obteve foram: 1) as co-infeçcões relevantes são a Hepatite B, Hepatite C e a Tuberculose; 2) os pa´ıses do Sul da Europa (Itália, Grécia, Portugal) situam-se em posi¸cão oposta aos do Norte da Europa (Finlândia, Suécia).

(6)

(7)

Abstract

We used the WHO data on 12 countries from EU (the only ones for which there was enough information) to study, for those countries, the AIDS co-infection. We intended to show that the relevant co-infection were Hepatitis B, Hepatitis C and Tuberculosis and to order the countries.

To do this we adjusted logit models to the diseases incidences. Next we applied a con-venient version of Partial Least Squares (PLS) to the incidence rates. Since we had only a controlled variable, the AIDS incidence, and several dependent variables, the co-infection incidences, we named this technique as retro-PLS.

Both retro-PLS and some results on logit models adjustment were developed for the purpose of this study.

Retro-PLS was applied in four scenarios defined by the co-infection that were considered. Thus we had:

Scenario I: Hepatitis B, Hepatitis C, Tuberculosis;

Scenario II: Hepatitis A, Hepatitis B, Hepatitis C, Tuberculosis; Scenario III: Hepatitis B, Hepatitis C, Salmonellosis, Tuberculosis;

Scenario IV: Hepatitis A, Hepatitis B, Hepatitis C, Salmonellosis, Tuberculosis. Once retro-PLS was applied we used Principal Components Analysis (PCA) to condense the information. We then ordered the countries according to the values of the first principal component.

Lastly we used the Kendall coefficient of concordance to assess the agreement between the ordinances we had for the different scenarios. This agreement was very highly significant, leading to the following conclusions: 1) the relevant co-infection are Hepatitis B, Hepatitis C and Tuberculosis; 2) the countries of the South of Europe (Italy, Greece, Portugal) are in opposite position to those of the North of Europe (Finland, Sweden).

(8)

(9)

Lista de s´ımbolos e abreviaturas

Xm×n ou X matriz com m linhas e n colunas,

as matrizes s˜ao representadas a ”bold” por letras mai´usculas;

In matriz identidade de ordem n;

ym _{ou y} _{vector (coluna) com m componentes,}

os vectores são, em geral, representados a ”bold” por letras minúsculas; xij elemento genérico da matriz X que se encontra na linha i, coluna j;

Xt _{transposta da matriz X;}

X−1 _{matriz inversa da matriz X;}

D = diag(an_{) matriz diagonal cujos elementos da diagonal principal s˜ao as componentes}

do vector an_;

tr(A) tra¸co da matriz A;

car(A) caracter´ıstica da matriz A;

∇ sub-espa¸co;

∇⊥ _{complemento ortogonal do sub-espa¸co ∇;}

k.k norma euclidiana de um vector ou de Hilbert-Schmidt para matrizes; Σ(.) matriz de covariˆancia;

ˆ

θ estimador do parˆametro θ;

˜

θ estimativa do parˆametro θ;

N(µ, σ2₎ _{distribui¸cão normal com valor médio µ e variância σ}2_;

χ2

k distribui¸c˜ao qui-quadrado central com k graus de liberdade;

(10)

˙

∼ aproximadamente distribu´ıdo;

R2 _{coeficiente de determina¸c˜ao;}

≈ aproximadamente igual a;

ln logaritmo neperiano;

WHO World Health Organization;

SIDA S´ındrome da Imunodeficiˆencia Adquirida;

UE Uni˜ao Europeia;

PLS Partial Least Squares;

ACP An´alise de Componentes Principais;

HAV Hepatite A;

HBV Hepatite B;

HCV Hepatite C;

(11)

Conte´

udo

1 Introdu¸cão 1 2 Componentes Principais 5 2.1 Aspectos numéricos . . . 5 2.2 Ordena¸cões . . . 6 3 Modelos Log´ısticos 9 3.1 Considera¸cões gerais . . . 9

3.2 Estimadores de m´ınimos quadrados generalizados . . . 11

3.3 Valida¸cão do modelo . . . 14 3.3.1 Valida¸cão estat´ıstica . . . 14 3.3.2 Valida¸cão numérica . . . 16 3.4 Modelos Simples . . . 17 3.4.1 Ajustamento e valida¸cão . . . 17 3.4.2 Dados . . . 18 3.4.3 Aplica¸cão . . . 19 3.4.4 Valida¸cão . . . 21

3.5 Modelos com dois factores aditivos . . . 23

3.5.1 Ajustamento por ZigZag . . . 24

3.5.2 Ajustamento por dupla minimiza¸c˜ao . . . 27

3.5.3 Compara¸cão entre os dois algoritmos e valida¸cão numérica . . . 31

3.5.4 Aplica¸cão . . . 34 4 Retro PLS 37 4.1 Generalidades . . . 37 4.2 Ajustamento . . . 37 4.3 Aplica¸cão . . . 40 4.3.1 Cenário I . . . 40 4.3.2 Cenário II . . . 47

(12)

4.3.3 Cenário III . . . 53 4.3.4 Cenário IV . . . 60 5 Ordena¸cões 67 5.1 Cenário I . . . 67 5.2 Cenário II . . . 69 5.3 Cenário III . . . 71 5.4 Cenário IV . . . 73 5.5 Concordância . . . 75

6 Observa¸cões finais, conclusões e trabalhos futuros 77 A Dados 79 B Regressão PLS 85 B.1 Modelo base . . . 85

B.2 Valida¸c˜ao cruzada . . . 86

B.3 Importˆancia relativa das vari´aveis controladas . . . 87

(13)

Lista de Figuras

3.1 Estimativas para o factor de localiza¸cão - TB. . . 32 3.2 Estimativas para o factor de localiza¸cão - SIDA. . . 34 4.1 Cenário I - representa¸cão das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 1 ano. . . 42 4.2 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 2 anos. . . 44 4.3 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 3 anos. . . 45 4.4 Cen´ario I - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 4 anos. . . 47 4.5 Cen´ario II - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 1 ano. . . 48 4.6 Cen´ario II - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 4 anos. . . 53 4.9 Cen´ario III - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 1 ano. . . 55 4.10 Cen´ario III - representa¸c˜ao das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 4 anos. . . 59 4.13 Cen´ario IV - representa¸c˜ao das duas primeiras componentes principais obtidas

(14)

4.14 Cenário IV - representa¸cão das duas primeiras componentes principais obtidas a partir de ˜γ para desfazamento de 2 anos. . . 62 4.15 Cenário IV - representa¸cão das duas primeiras componentes principais obtidas

a partir de ˜γ para desfazamento de 3 anos. . . 64 4.16 Cen´ario IV - representa¸c˜ao das duas primeiras componentes principais obtidas

(15)

Lista de Tabelas

3.1 Anos considerados por pa´ıs. . . 19

3.2 Modelo Simples - estimativas do parˆametro α. . . 19

3.3 Modelo Simples - estimativas do parˆametro β. . . 20

3.4 Modelo Simples - coeficiente de determina¸c˜ao R2_{. . . .} ₂₀

3.5 Modelo Simples - estat´ıstica do teste e intervalo de aceita¸c˜ao. . . 22

3.6 Compara¸c˜ao entre os dois algoritmos - TB. . . 32

3.7 TB - coeficiente de determina¸c˜ao R2_{. . . .} ₃₃

3.8 Compara¸c˜ao entre os dois algoritmos - SIDA. . . 33

3.9 SIDA - coeficiente de determina¸c˜ao R2_{. . . .} ₃₄

3.10 Modelo Aditivo - estimativas para os parˆametros α e β. . . 35

3.11 Modelo Aditivo - estimativas para o factor de localiza¸c˜ao. . . 35

3.12 Modelo Aditivo - coeficiente de determina¸c˜ao R2_{. . . .} ₃₅

4.1 Cen´ario I - estimativas para os coeficientes γ para desfazamento de 1 ano. . 41

4.2 Cen´ario I - correla¸c˜oes obtidas com 1 ano de desfazamento. . . 41

4.3 Cenário I - valores próprios e percentagem de variância correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. . . . 42

4.4 Cen´ario I - estimativas para os coeficientes γ para desfazamento de 2 anos. . 43

4.5 Cen´ario I - correla¸c˜oes obtidas com 2 anos de desfazamento. . . 43

4.6 Cenário I - valores próprios e percentagem de variância correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. . . 43

(16)

4.13 Cenário II - estimativas para os coeficientes γ para desfazamento de 1 ano. . 47 4.14 Cenário II - correla¸cões obtidas com 1 ano de desfazamento. . . 48 4.15 Cenário II - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. 48 4.16 Cenário II - estimativas para os coeficientes γ para desfazamento de 2 anos. 49 4.17 Cenário II - correla¸cões obtidas com 2 anos de desfazamento. . . 49 4.18 Cenário II - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. 49 4.19 Cenário II - estimativas para os coeficientes γ para desfazamento de 3 anos. 50 4.20 Cenário II - correla¸cões obtidas com 3 anos de desfazamento. . . 51 4.21 Cenário II - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. 51 4.22 Cenário II - estimativas para os coeficientes γ para desfazamento de 4 anos. 52 4.23 Cenário II - correla¸cões obtidas com 4 anos de desfazamento. . . 52 4.24 Cenário II - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. 52 4.25 Cenário III - estimativas para os coeficientes γ para desfazamento de 1 ano. . 54 4.26 Cenário III - correla¸cões obtidas com 1 ano de desfazamento. . . 54 4.27 Cenário III - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. 54 4.28 Cenário III - estimativas para os coeficientes γ para desfazamento de 2 anos. 55 4.29 Cenário III - correla¸cões obtidas com 2 anos de desfazamento. . . 56 4.30 Cenário III - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. 56 4.31 Cenário III - estimativas para os coeficientes γ para desfazamento de 3 anos. 57 4.32 Cenário III - correla¸cões obtidas com 3 anos de desfazamento. . . 57 4.33 Cenário III - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. 57 4.34 Cenário III - estimativas para os coeficientes γ para desfazamento de 4 anos. 58 4.35 Cenário III - correla¸cões obtidas com 4 anos de desfazamento. . . 59 4.36 Cenário III - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. 59 4.37 Cenário IV - estimativas para os coeficientes γ para desfazamento de 1 ano. . 60 4.38 Cenário IV - correla¸cões obtidas com 1 ano de desfazamento. . . 60 4.39 Cenário IV - valores próprios e percentagem de variância correspondente a

cada componente principal obtida a partir de ˜γ para desfazamento de 1 ano. 61 4.40 Cen´ario IV - estimativas para os coeficientes γ para desfazamento de 2 anos. 61

(17)

4.41 Cen´ario IV - correla¸c˜oes obtidas com 2 anos de desfazamento. . . 62

4.42 Cenário IV - valores próprios e percentagem de variância correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 2 anos. 62 4.43 Cenário IV - estimativas para os coeficientes γ para desfazamento de 3 anos. 63 4.44 Cenário IV - correla¸cões obtidas com 3 anos de desfazamento. . . 63

4.45 Cenário IV - valores próprios e percentagem de variância correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 3 anos. 63 4.46 Cenário IV - estimativas para os coeficientes γ para desfazamento de 4 anos. 64 4.47 Cenário IV - correla¸cões obtidas com 4 anos de desfazamento. . . 65

4.48 Cenário IV - valores próprios e percentagem de variância correspondente a cada componente principal obtida a partir de ˜γ para desfazamento de 4 anos. 65 4.49 Percentagem da informa¸cão contida na primeira componente por cenário e desfazamento. . . 66

5.1 Cen´ario I - Estimativas do factor de localiza¸c˜ao SIDA 1997 a 2004. . . 68

5.2 Cenário I - valores próprios e percentagem de variância correspondente a cada componente principal. . . 68

5.3 Cen´ario I - Valores da primeira e segunda componente principal. . . 69

5.4 Cen´ario I - Componentes do 1o _{vector pr´oprio. . . .} ₆₉

5.5 Cen´ario II - Estimativas do factor de localiza¸c˜ao SIDA 1995 a 2002. . . 70

5.6 Cenário II - valores próprios e percentagem de variância correspondente a cada componente principal. . . 70

5.7 Cen´ario II - Valores da primeira e segunda componente principal. . . 71

5.8 Cen´ario II - Componentes do 1o _{vector pr´oprio. . . .} ₇₁

5.9 Cen´ario III - Estimativas do factor de localiza¸c˜ao SIDA 1994 a 2001. . . 72

5.10 Cenário III - valores próprios e percentagem de variância correspondente a cada componente principal. . . 72

5.11 Cen´ario III - Valores da primeira e segunda componente principal. . . 73

5.12 Cen´ario III - Componentes do 1o _{vector pr´oprio. . . .} ₇₃

5.13 Cenário IV - valores próprios e percentagem de variância correspondente a cada componente principal. . . 74

5.14 Cen´ario IV - Valores da primeira e segunda componente principal. . . 74

5.15 Cen´ario IV - Componentes do 1o _{vector pr´oprio. . . .} ₇₅

5.16 Ordena¸c˜ao dos pa´ıses . . . 75

(18)

(19)

Cap´ıtulo 1

Introdu¸c˜

ao

Entre os temas quentes da saúde publica a SIDA e respectivas co-infeçcões ocupam uma posi¸cão central. O problema é complexo e todo o esfor¸co para compreender a respectiva dinâmica pode vir a ser muito útil.

O presente trabalho pretende ser uma contribui¸cão para o estudo desse problema. A realiza¸cão do mesmo revelou-se dif´ıcil dado a escassez de dados dispon´ıveis. Devido ao ”segredo estat´ıstico” tivemos de utilizar os dados do Eurostat e WHO. Esses dados são ap-resentados na seçcão 3.4.2 e, mais detalhadamente, em apêndice (A). Basicamente obtivemos para 12 pa´ıses europeus: Austria, Bélgica, Dinamarca, Finlândia, Alemanha, Grécia, Itália, Luxemburgo, Holanda, Portugal, Suécia e Inglaterra e para um conjunto suficientemente longo de anos as incidências da SIDA e das seguintes co-infeçcões: Hepatite A (HAV), Hep-atite B (HBV), HepHep-atite C (HCV), Salmonellosis e Tuberculose (TB).

Atendendo aos dados dispon´ıveis procurou-se:

• seriar os pa´ıses. Como veremos chegou-se a uma varia¸c˜ao concordante com o conheci-mento que se tem sobre o problema;

• testar a hipótese de que as co-infeçcões mais relevantes são a HBV, a HCV e a TB. Para realizar estes objectivos houve que come¸car por obter a partir dos dados os valores de variáveis que medissem a dinâmica quer das doen¸cas individuais quer da sua rela¸cão com a SIDA. Para o efeito foram ajustados modelos logit para as incidências. Estes modelos foram de dois tipos:

• modelos simples: Y = α + β × t com t a vari´avel tempo. Foi ajustado um modelo destes para cada pa´ıs e doen¸ca;

• modelos com dois factores aditivos: Y = α + β(f + g) onde f e g s˜ao os valores dos efeitos pa´ıs e tempo, respectivamente.

(20)

Para estudar a rela¸cão das co-infeçcões com a SIDA utilizamos uma variante do Partial Least Squares (PLS). Assim, obtivemos os coeficientes das combina¸cões lineares das incidências das co-infeçcões com correla¸cão máxima com a incidência da SIDA. Dado haver uma única variável controlada, a incidência da SIDA, e várias variáveis dependentes, as incidências das co-infeçcões, situa¸cão esta contrária à usual, chamamos a esta variante retro-PLS. Em apêndice (B) apresentamos uma descri¸cão sumária da PLS de forma a facilitar a compreensão da retro-PLS.

Para podermos realizar o nosso segundo objectivo esta técnica foi aplicada em quatro cenários. De cenário para cenário varia o conjunto das co-infeçcões que se considera.

Assim temos:

Cen´ario I: HBV, HCV e TB;

Cen´ario II: HAV, HBV, HCV e TB;

Cen´ario III: HBV, HCV, Salmonellosis e TB; Cen´ario IV: HAV, HBV, HCV, Salmonellosis e TB.

A escolha destes quatro cen´arios corresponde a um delineamento 22_{. Os tratamentos}

deste ”delineamento”correspondem a considerarem-se ou não a HAV e a Salmonellosis. A retro-PLS foi aplicada em cada cenário, para cada pa´ıs, fazendo variar o desfazamento entre a incidência da SIDA e as das co-infeçcões, para atender ao per´ıodo de incuba¸cão da SIDA. Assim, obteve-se para cada pa´ıs o vector dos coeficientes da combina¸cão linear das incidências das co-infeçcões com correla¸cão máxima com a incidência da SIDA. Den-tro de cada cenário este estudo foi realizado para cada um dos desfazamentos previstos. Para escolher, para cada cenário, o desfazamento a considerar trataram-se os coeficientes da combina¸cão linear como variáveis às quais se aplicou a Análise de Componentes Principais (ACP). Optou-se pelo desfazamento em que a por¸cão de informa¸cão total correspondente à primeira componente principal é máxima. Com efeito, está-se a maximizar a possibilidade de condensar informa¸cão através da ACP.

Observe-se que o conjunto das co-infeçcões variou de cenário para cenário. Assim, para cada um deles temos, para cada pa´ıs:

• os coeficientes ˜β ajustados dos modelos logit simples;

• os efeitos ˜f estimados para os modelos logit com dois factores; • os coeficientes ˜γ ajustados dados pela retro-PLS.

(21)

Estes valores encontram-se ajustados para cada uma das co-infeçcões que se consideraram para o cenário. Não inclu´ımos na lista os coeficientes ˜αajustados dos modelos logit simples por estes dependerem da origem dos tempos e consequentemente do desfazamento.

Realizamos então, para cada um dos cenários, uma nova aplica¸cão da ACP entrando agora com todas as novas variáveis (˜β, ˜f, ˜γ). Os pa´ıses foram de seguida ordenados de acordo com os valores da primeira componente principal. Como veremos as ordena¸cões obtidas são fáceis de interpretar à luz do que se sabe sobre as co-infeçcões da SIDA.

Observe-se agora que se se verificar a hipótese feita quanto à relevância das co-infeçcões as ordena¸cões obtidas nos quatro cenários devem ser coincidentes.

Assim calculou-se o ´ındice de concordância de Kendall para as quatro ordena¸cões. O valor obtido de 0.9886, praticamente igual ao máximo teórico (1), confirma a suposi¸cão feita.

Quanto à articula¸cão da disserta¸cão temos em primeiro lugar um cap´ıtulo sobre ACP em que se discute os aspectos numéricos da teoria e a ordena¸cão a partir dos valores das primeiras componentes principais.

Seguindo-se um cap´ıtulo sobre os modelos logit, primeiro os simples e depois com dois factores aditivos. Do ponto de vista teórico pode-se destacar as técnicas para o ajustamento dos segundos modelos. O algoritmo em geral utilizado para ajustar esses modelos é o al-goritmo ZigZag, ver Nunes et al. (2004A e 2004B), que se comporta bem mas que carece duma prova de convergência. É introduzido o algoritmo de dupla minimiza¸cão que se mostra convergente. Nos casos estudados os dois algoritmos conduzem a resultados (praticamente) idênticos.

Ap´os os modelos logit ´e estudada a retro-PLS podendo considerar-se que se trata duma variante da PLS constru´ıda para o estudo deste problema.

Conclu´ıdos estes cap´ıtulos tem-se os valores das mesmas variáveis para os quatro cenários. Na parte final da disserta¸cão esses valores são utilizados para seriar os pa´ıses e testar a hipótese sobre a relevância das co-infeçcões.

A concluir esta introdu¸cão convém-nos referir que foram especificamente desenvolvidas para este trabalho as técnicas:

• ajustamento por dupla minimiza¸c˜ao dos modelos logit com dois factores aditivos; • a retro-PLS.

No entanto devemos salientar que o que nos parece mais significativo no nosso trabalho foi o termos definido variáveis caracterizadoras da dinâmica do problema e a partir da´ı, ter atingido os objectivos fixados. Por detrás do nosso trabalho está a visão da Estat´ıstica como ”Arte de extrair dos dados a informa¸cão neles contida”.

(22)

(23)

Cap´ıtulo 2

Componentes Principais

Neste cap´ıtulo vamos considerar vários aspectos que interessam à aplica¸cão da Análise de Componentes Principais (ACP) numa abordagem tipo Análise de Dados.

2.1 Aspectos num´

ericos

Algebricamente a ACP assenta na análise espectral da matriz de covariância ou da matriz de correla¸cão no caso de ACP estandardizada. Estas matrizes são semi-definidas positivas.

Ora, ver Schott (1997, pgs 108 e 109) sendo A uma matriz simétrica m × m com valores próprios λ1 ≥ . . . ≥ λm a que correspondem os vectores próprios α1, . . . , αm, mutuamente

ortogonais com norma 1, sendo ∇h e ∆h os espa¸cos gerados por α1, . . . , αh e por αh, . . . , αm

respectivamente, h = 1, . . . , m ent˜ao λh = min x∈∇h xt_Ax kxk2 = min x∈∆⊥_h+1 xt_Ax kxk2 , h = 1, . . . , m λh = max x∈∆h xt_Ax kxk2 = max x∈∇⊥_h−1 xt_Ax kxk2 , h = 1, . . . , m com ∆⊥

h e ∇⊥h os complementos ortogonais de ∆h e ∇h, sendo ainda ∆⊥m+1 o sub-espa¸co que

se reduz ao vector nulo. Observe-se que x ∈ ∇h[∆h] se e s´o se x for ortogonal a αh+1, . . . , αm

[α1, . . . , αh−1].

Tem-se ainda

λh = αthAαh, h = 1, . . . , m

Assim podem-se utilizar as primeiras componentes principais para condensar a in-forma¸c˜ao.

(24)

com v e u vectores de coeficientes das combina¸c˜oes lineares vt_{y e u}t_{y tem-se,}

(

vtAv = V ar(vty); vt_{Au = Cov(v}t_{y; u}t_y)

e, se kvk = 1, λh ser´a o m´ınimo [m´aximo] de V ar(vty) caso v ∈ ∇h[∆h] ou v ∈ ∆⊥h+1[∇⊥h−1].

Tem-se ainda v ∈ ∇h [∆h] se e s´o se Cov(vty; αtjy) = 0, j = h + 1, . . . , m [1, . . . , h − 1].

Por outro lado as componentes principais correspondentes a A ser˜ao as componentes de αt

jy, j = 1, . . . , m.

Como, com A = [σij], se tem m X j=1 λj = tr(A) = m X j=1 σj,j

com σj,j = V ar(yj), j = 1, . . . , m. A fraçcão da informa¸cão total transportada pelas várias

componentes principais ser´a medida pelos coeficientes cj =

λj

tr(A), j = 1, . . . , m.

Quando c1 ≈ 1 a primeira componente principal ser´a dominante. Nestes casos pode-se

condensar na mesma a informa¸c˜ao transportada pelas vari´aveis originais.

Como veremos, encontraremos repetidamente primeiras componentes dominantes. Quando A é matriz de correla¸cão as covariâncias são substitu´ıdas por correla¸cões.

Observe-se que, as componentes principais ser˜ao n˜ao correlacionadas.

Dado interessar-nos sobretudo pelas potencialidades desta técnica como processo de con-densa¸cão da informa¸cão limita-mo-nos a referir que existe uma teoria bastante desenvolvida, ver por exemplo Flury (1988) ou, Jackson (2003) e Jolliffe (2002), para a inferência estat´ıstica respectiva.

2.2 Ordena¸c˜

oes

Suponhamos que se aplicou a ACP ao mesmo conjunto de variáveis obtidas em diferentes cenários. Pode-se utilizar os valores da primeira componente principal para ordenar os objectos, no nosso caso pa´ıses, para os diferentes cenários.

Para pôr em evidência a concordância nas ordena¸cões correspondentes aos diferentes cenários pode-se utilizar o ´ındice de concordância de Kendall, ver Siegel (1988). Se este ´ındice for altamente significativo, pode-se admitir que não há diferen¸ca entre os cenários no

(25)

A concordância que encontramos leva-nos a concluir que por não haver diferen¸cas signi-ficativas quanto à ordena¸cão dos pa´ıses para os diferentes conjuntos de co-infeçcões, que as doen¸cas comuns aos quatro cenários aparecem como as co-infeçcões relevantes.

(26)

(27)

Cap´ıtulo 3

Modelos Log´ısticos

3.1 Considera¸c˜

oes gerais

O modelo log´ıstico permite uma extensão fácil de aplica¸cão da análise de regressão a variáveis dependentes binárias.

No entanto, as primeiras aplica¸cões foram ao estudo da dimensão de popula¸cões humanas. Assim, Malthus (1798) admitia que o crescimento era exponencial, sendo

W (t) = Aeβt

a dimensão da popula¸cão, com A e β constantes. A constante β representa a taxa de crescimento. Com ˙W (t) = (dW (t))/dt, ter-se-á

˙

W (t) = βW (t).

No entanto este modelo é pouco realista visto não atender às limita¸cões quanto à capaci-dade do meio ambiente para sustentar uma popula¸cão em crescimento exponencial. Assim Verhulst (1838), (1845) e (1847), seguindo ideias de Quételet, admitiu que

˙ W (t) = βW (t) 1 − W (t) K

onde K representa a capacidade de carga, isto é, o número máximo de indiv´ıduos que o ambiente suporta.

Integrando esta equa¸c˜ao diferencial obt´em-se W (t) = K e

α+βt

(28)

com valor limite K. Refira-se que Verhulst aplicou os seus resultados à popula¸cão belga, tendo no entanto obtido um valor limite K inferior ao que já então se tinha. Este facto explica a pouca aceita¸cão que este modelo teve.

O mesmo foi redescoberto por Pearl & Reed (1920) que o aplicaram à popula¸cão dos Estados Unidos. No entanto, também neste caso, obteve-se um valor limite K inferior ao da popula¸cão real. Assim as aplica¸cões do modelo log´ıstico à demografia não justificariam a importância que o mesmo tem. Podem-se referir aplica¸cões relevantes destes modelos nos seguintes campos:

• no ”bio-assay”, ver por exemplo Finney (1971) e Berkson (1944)(1951);

• na epidemiologia, ver por exemplo Hosmer & Lemeshow (2000) e Breslow (1996); • na econometria, ver por exemplo Amemya (1981)(1985), Maddala (1983), Gourieroux

(2000) e Cramer (2003);

• nas ciˆencias sociais, ver por exemplo Menard (1995); • no marketing, ver por exemplo Franses & Paap (2001).

Quando se quer aplicar modelos log´ısticos a variáveis binárias modela-se a probabilidade p da variável tomar uma das suas determina¸cões poss´ıveis. Assim tem-se

p = e

α+βx

1 + eα+βx

ou, equivalentemente, seguindo Berkson (1944) logit(p) = ln p 1 − p = α + βx.

No que segue consideraremos dois tipos de modelos log´ısticos. Os modelos simples, em que

x = t

e em que se acompanha a evolu¸cão da taxa de incidência duma dada doen¸ca num certo pa´ıs ao longo do tempo, e os modelos com aditividade cruzada em que se considera a açcão de dois factores: pa´ıs e ano, tomando-se

xij = fi+ gj

com fi o efeito do i-´esimo pa´ıs e gj o efeito do j-´esimo ano. Como se admite a aditividade

(29)

A concluir esta seçcão introdutória referimos o excelente trabalho de Cramer (2002) sobre a história destes modelos.

3.2 Estimadores de m´ınimos quadrados generalizados

Embora em geral o ajustamento de modelos logit seja feito utilizando estimadores de máxima verosimilhan¸ca utilizaremos o método dos m´ınimos quadrados generalizados. Com efeito, ver Kariya e Kurata (2004, pgs 39 e 40), em modelos normais com vectores médios Xβ, os estimadores de máxima verosimilhan¸ca de β são estimadores de m´ınimos quadrados gen-eralizados. Ora, dado trabalharmos com amostras grandes podemos pensar em utilizar a normalidade assimptótica dos modelos logit.

Para considerarmos os estimadores de m´ınimos quadrados generalizados conv´em come¸car pelos estimadores de m´ınimos quadrados usuais.

Se y tem valor médio Xβ e matriz de covariância V, o teorema de Gauss-Markov, ver Kariya e Kurata (2004, pg 34) diz-nos que o BLUE (”best linear unbiased estimator”) de β é

ˆ

β(V) = XtV−1X−1XtV−1y

desde que V seja definida positiva e os vectores coluna de X sejam linearmente indepen-dentes.

A matriz de covariˆancia deste estimador ser´a, com ˆβ = ˆβ(V)

Σ( ˆβ) = XtV−1X−1XtV−1(V)h XtV−1X−1XtV−1it = XtV−1X−1. Observe-se ainda que ˆβ ´e o m´ınimo da fun¸c˜ao objectivo,

S (β) = (y − Xβ)tV−1(y − Xβ) e que

S( ˆβ) = ytV−1y − ytV−1X ˆβ.

O Teorema de Fisher diz-nos que, ver Mexia (1990), sendo y normal, com valor m´edio Xβ e matriz de covariˆancia V, escreve-se y ∼ N (Xβ, V), se tem ˆβ∼ Nβ, (Xt_V−1_X)−1

independente de S( ˆβ), que ´e um qui-quadrado central com n − car(X) graus de liberdade. Uma generaliza¸c˜ao deste resultado, ver Mexia (1990), diz que, com M† _{a inversa de}

Moore-Penrose de M, se ψ = Aβ for vector estim´avel, o respectivo BLUE ´e ˆ

(30)

isto é, sendo ψ∗ outro estimador centrado de ψ, Σ(ψ∗) − Σ( ˆψ(V)) é semi-definida positiva. Aliás, ver ainda Mexia (1990), ψ é estimável, se e só se, com R(M) o espa¸co imagem de M, se tiver R(At_{) ⊆ R(X}t_).

No entanto muitas vezes tem-se V = V(θ) com θ um parˆametro desconhecido. Se na express˜ao de ˆβ(V), V for substitu´ıda por um estimador V∗ _{tem-se, ver Kariya e Kurata}

(2004, pg 35), o estimador de m´ınimos quadrados generalizados ˆ

β(V∗) = XtV∗−1X−1XtV∗−1y

desde que os vectores coluna de X sejam linearmente independentes e V∗ _{seja regular.}

Pode utilizar-se a express˜ao de Σ(ˆβ) do caso dos m´ınimos quadrados usuais para obter o estimador

Σ( ˆβ)∗ = XtV∗−1X−1 da matriz de covariˆancia de ˆβ = ˆβ(V∗_{). Obtendo-se ainda}

S( ˆβ|V∗) = ytV∗−1y − ytV∗−1X ˆβ.

Neste caso pode-se admitir que, com ˙∼ indicando aproximadamente distribu´ıdo, ˆ

β ∼ N˙ β, XtV∗−1X−1

independente de S( ˆβ|V∗_{) que se distribui aproximadamente como um qui-quadrado com}

n − car(X) graus de liberdade.

Observe-se que, para V∗ _{dada, ˆ}_β(V∗_{) ser´a o m´ınimo de}

S (β|V∗) = (y − Xβ)tV∗−1(y − Xβ)

podendo considerar-se S(β|V∗_{) como uma fun¸c˜ao objectivo a minimizar.}

No entanto, por vezes tem-se X = X(λ) com λ desconhecido. Ter-se-´a ent˜ao de minimizar S(β, λ|V∗_{) = (y − X(λ|β))}t

V∗−1_{(y − X(λ|β)) .}

As colunas de X correspondem a variáveis controladas ou regressoras. Quando se tiver X = X(λ) com λ desconhecido, os valores de todos ou de parte dos regressores não serão observáveis. Adiante encontraremos uma situa¸cão destas.

Vejamos como aplicar estes resultados no caso dos modelos logit. Sendo N′ _{o n´}_umero

(31)

ser´a

Y (N′_{) = ln} N′

N − N′

onde, com ∼ indicando distribu´ıdo como,

N′ _{∼ B(N, p)}

tendo pois valor m´edio Np e variˆancia Np(1 − p). Por outro lado,

dY dN′ = 1 N′ + 1 N − N′

vindo, quando p ´e pequeno dY dN′ E(N′₎ = 1 Np + 1 N(1 − p) = 1 Np(1 − p) ≈ 1 Np e como (Lagrange)

Y (N′) ≈ Y (E(N′)) + Y′(E(N′))(N′ − E(N′)) vem, caso p seja pequeno,

     E(Y (N′_{)) ≈ ln} p 1−p ≈ ln p V ar(Y (N′_{)) ≈} 1 N2_p2V ar(N ′_{) ≈} N p(1−p) N2_p2 ≈ 1 N p.

A segunda destas express˜oes tem uma consequˆencia importante visto sugerir que se uti-lizem os estimadores

V ar(Y (N′₎₎∗ ₌ 1

N′.

Suponhamos agora que se tem

p = e

Pk

j=1βjxj

1 + ePkj=1βjxj,

pelo que se ter´a

E(Y (N′)) =

k

X

j=1

βjxj.

(32)

Tendo-se os pares (Ni, Ni′), i = 1, . . . , n, teremos os logit Yi = ln N′ i Ni − Ni′ , i = 1, . . . , n com valores m´edios

E(Yi) = k

X

j=1

βjxi,j, i = 1, . . . , n

e estimadores para as variˆancias,

V ar(Yi)∗ =

1 N′

i

, i = 1, . . . , n obtendo-se assim a fun¸c˜ao objectivo

S(β|V∗) = n X i=1 N_i′ yi− k X j=1 βjxi,j ! = (y − Xβ)tD (N₁′ . . . N_n′) (y − Xβ) na qual os inversos N′

i das variˆancias estimadas figuram como pesos.

Havendo regressores não observáveis a fun¸cão objectivo será

S(β, λ|V∗) = (y − X(λ|β))tD (N₁′. . . N_n′) (y − X(λ|β)) .

3.3 Valida¸c˜

ao do modelo

3.3.1 Valida¸c˜

ao estat´ıstica

Admitamos que se pode assumir a normalidade do vector y dos logits. No nosso caso este pressuposto resultaria da normalidade assimpt´otica dado que trabalhamos com amostras grandes.

Observe-se que o estar a admitir que X(η) e V(η) dependem do parâmetro (vectorial) η inclui o caso usual em que X(η) = X e V(η) = V. Em todos os casos que consideramos os elementos de X(η) e V(η) são fun¸cões cont´ınuas de η.

Assim, quando ˆη ≈ η ter-se-´a X(ˆη) ≈ X(η) = X e V(ˆη) ≈ V(η) = V. Teremos ent˜ao, y − X(ˆη) ˆβ ≈ y − X(η)eβ

com

e

(33)

vindo, o vector dos res´ıduos

r = y − X(ˆη) ˆβ ≈ ˙r = y − Xeβ. Ora,

˙r =hI − X XtV−1X−1XtV−1iy ∼ N0, V − X XtV−1X−1Xt já que o vector médio de ˙r é

I − X(XtV−1X)−1XtV−1Xβ = Xβ − Xβ = 0 e a sua matriz de covariˆancia,

I − X(XtV−1X)−1XtV−1VI − V−1X(XtV−1X)−1Xt= V − X(XtV−1X)−1Xt. Assim, quando ˆη ≈ η, podemos admitir que

r ∼ N (0, W (ˆ˙ η)) com

W(ˆη) = V(ˆη) − X(ˆη) X(ˆη)tV(ˆη)−1X(ˆη)−1X(ˆη)t visto que se ter´a

W(ˆη) ≈ W(η) = V − X(XtV−1X)−1Xt.

Ora a matriz W(ˆη) é semi-definida positiva com caracter´ıstica g. Terá então os valores próprios positivos v1 ≥ . . . ≥ vg > 0 a que correspondem os vectores próprios mutuamente

ortogonais α1, . . . , αg tendo-se, ver Schott (1997, pg 98)

W(ˆη) = g X j=1 vjαjαtj. ´

E agora f´acil de se verificar que com

Gt= [v₁−1/2α1. . . vg−1/2αg]

se tem

(34)

A matriz Ig será então a matriz de covariância do vector

Z = Gr e como o vector médio de Z é G0 = 0, ter-se-á,

Z ∼ N(0, I˙ g).

Assim, do pressuposto da bondade do ajustamento de η e da adequa¸cão das expressões das matrizes X(η) e V (η) resulta uma consequência testável que pode ser formulada com a hipótese

H0 : Z1, . . . , Zg i.i.d. ∼ N(0, 1).

Para testar esta hip´otese podemos, por exemplo, utilizar o teste de Shapiro and Wilks, ver Christensen (1987), ou, em alternativa o teste introduzido por Mexia (1989).

Na nossa formula¸cão utilizamos um único parâmetro η além do vector dos coeficientes β. Poderá ter-se η= " λ θ #

com X(λ) e V(θ), isto é, serão distintos os parâmetros que intervêm nas duas matrizes. É esta a situa¸cão que temos nos modelos que utilizamos em que trabalhamos com

V∗ _{= D} 1 N′ 1 , . . . , 1 N′ n .

No entanto a t´ecnica geral atr´as apresentada aplica-se directamente a este caso.

3.3.2 Valida¸c˜

ao num´

erica

Uma outra abordagem à valida¸cão dum modelo é a que se tem quando se dispõe de vários métodos de ajustamento. Se os resultados obtidos por dois ou mais métodos forem pratica-mente coincidentes há que concluir:

• que o modelo ´e adequado;

• que os m´etodos conduziram a ajustamentos t˜ao bons quanto poss´ıvel.

Com efeito, se os métodos não conduzissem a ajustamentos ”óptimos”ou ”sub-óptimos”era natural que os resultados obtidos com eles diferissem. Por outro lado, a existência de con-cordância nos ajustamentos indica que os vários métodos ao ajustarem modelos praticamente coincidentes ajustaram o modelo correcto.

(35)

A valida¸cão numérica é particularmente fiável quando está estabelecida a convergência de um dos métodos utilizados. Nesse caso a convergência do ou dos restantes métodos passa também a ser estabelecida.

As razões apontadas para aceitar a valida¸cão numérica aplicam-se mesmo que não se tenha podido realizar a valida¸cão estat´ıstica. Então não se poderá assumir a normalidade e dever-se-á utilizar inferência não paramétrica.

3.4 Modelos Simples

3.4.1 Ajustamento e valida¸c˜

ao

Os modelos que agora consideramos, para os logit, s˜ao da forma E(Yi) = α + βti, i = 1, . . . , n

com dois regressores, um constantemente igual a 1 e o outro que toma os valores observáveis t1, . . . , tn. Neste caso estamos a admitir que a variável dependente e os regressores são

observ´aveis. Teremos X =     1 t1 .. . ... 1 tn     vindo XtD (N₁′. . . N_n′) X =    Pn i=1N ′ i Pn i=1tiN ′ i Pn i=1tiNi′ Pn i=1t2iNi′    = s0 s1 s1 s2 !

com sr=Pn_i=1triNi′; r = 0, 1, 2 pelo que,

Xt_{D (N}′ 1. . . Nn′) X −1 = 1 s0s2− s21 s2 −s1 −s1 s0 ! e como, XtD (N′ 1. . . Nn′) y =    Pn i=1yiN ′ i Pn i=1yitiN ′ i    = s0,y s1,y ! com sr,y = n X i=1 yitriNi′ ; r = 0, 1

(36)

tem-se os estimadores, _       ˆ α = s2s0,y−s1s1,y s0s2−s2₁ ˆ β = s0s1,y−s1s0,y s0s2−s2₁ .

Para validar estes modelos seguimos a teoria atr´as descrita come¸cando por obter a matriz W , cujos elementos s˜ao da forma

       wi,i = _N1′ i − 1 d(s2− 2s1ti+ s0t 2 i) wi,j = −1_d(s2− s1(ti + tj) + s0titj) ; i 6= j

com d = s0s2 − s21. Pˆode, em seguida, aplicar-se a valida¸c˜ao estat´ıstica.

3.4.2 Dados

O presente trabalho foi realizado com base nos dados do Eurostat e de duas bases de dados da World Health Organization (WHO): CISID (Centralized information system for infectious diseases) e HFA-DB (European health for all database).

Mais concretamente, dependendo dos dados dispon´ıveis recolhemos para 12 pa´ıses1 _da

Uni˜ao Europeia:

Eurostat : N´umero de novos casos de Salmonellosis CISID/WHO : N´umero de novos casos de SIDA

HFA-DB/WHO : Número de novos casos de Hepatite A : Número de novos casos de Hepatite B : Número de novos casos de Hepatite C : Número de novos casos de Tuberculose

Embora a TB extrapulmonar ocorra menos frequentemente (30%) do que a TB pulmonar (70%), crian¸cas e pessoas com imunodeficiências, como a infeçcão pelo VIH, apresentam um risco mais elevado de contrair TB extrapulmonar. Assim, os dados correspondentes à incidência de TB comportam todos os tipos de TB. Contudo, é a TB pulmonar o tipo mais comum em todo o mundo, mesmo nestes grupos mais suscept´ıveis.

As estimativas da popula¸c˜ao residente em cada um dos pa´ıses em estudo foram obtidas da base de dados HFA-DB.

1

Austria, Bélgica, Dinamarca, Finlândia, Alemanha, Grécia, Itália, Luxemburgo, Holanda, Portugal, Suécia e Inglaterra. É importante referir que pretend´ıamos integrar, nesta aplica¸cão, os primeiros 15 pa´ıses da UE mas, devido à falta de dados da incidência de HCV, não foi poss´ıvel incluir Fran¸ca, Irlanda e Espanha.

(37)

Os dados foram recolhidos em Novembro de 2007 e est˜ao apresentados em apˆendice. O per´ıodo de tempo considerado variou de pa´ıs para pa´ıs, consoante os dados dispon´ıveis (Tabela 3.1).

Tabela 3.1: Anos considerados por pa´ıs.

Pa´ıs Anos n Austria 1993 a 2005 13 Bélgica 1996 a 2005 10 Dinamarca 1991 a 2006 16 Finlândia 1995 a 2005 11 Alemanha 1997 a 2005 9 Grécia 1996 a 2005 10 Itália 1991 a 2005 15 Luxemburgo 1997 a 2006 10 Holanda 1998 a 2006 9 Portugal 1993 a 2006 14 Suécia 1993 a 2006 14 Inglaterra 1988 a 2005 18

3.4.3 Aplica¸c˜

ao

Nesta sec¸c˜ao apresentamos os resultados do ajustamento dos modelos simples. Foi ajustado um modelo simples por pa´ıs e doen¸ca.

Come¸camos por apresentar na Tabela 3.2 as estimativas para o parˆametro α. Tabela 3.2: Modelo Simples - estimativas do parˆametro α.

˜

α SIDA HAV HBV HCV Salmonellosis TB

Austria -10.409 -9.627 -10.743 -11.154 -6.914 -8.587 Bélgica -11.007 -9.878 -10.723 -10.913 -6.408 -8.994 Dinamarca -9.699 -10.206 -10.619 -11.071 -7.014 -9.315 Finlândia -12.132 -10.454 -9.523 -7.886 -7.311 -8.853 Alemanha -11.258 -9.598 -9.180 -9.491 -6.565 -8.797 Grécia -10.804 -10.746 -10.748 -11.167 -11.180 -9.595 Itália -9.063 -8.945 -9.479 -10.089 -7.770 -9.321 Luxemburgo -10.849 -7.628 -8.383 -8.412 -7.313 -9.393 Holanda -11.132 -9.400 -11.144 -10.199 -8.855 -9.307 Portugal -9.315 -9.675 -8.622 -9.551 -10.757 -7.373 Suécia -10.617 -9.383 -10.615 -7.720 -7.530 -9.673 Inglaterra -10.437 -8.693 -11.251 -14.398 -7.374 -9.209

(38)

Segue-se a Tabela 3.3 com as estimativas do parâmetro β. Este parâmetro representa a taxa de varia¸cão do logit da incidência de determinada doen¸ca com o tempo.

No Cap´ıtulo 5 iremos trabalhar com as estimativas do parâmetro β correspondentes às doen¸cas de cada cenário.

Tabela 3.3: Modelo Simples - estimativas do parˆametro β.

˜

β SIDA HAV HBV HCV Salmonellosis TB

Austria -0.118 -0.103 0.085 0.175 -0.018 -0.0399 Bélgica -0.033 -0.0365 0.118 0.195 -0.063 -0.007 Dinamarca -0.138 -0.052 -0.073 0.086 -0.057 -0.006 Finlândia -0.035 0.034 -0.124 -0.039 -0.038 -0.070 Alemanha -0.067 -0.188 -0.232 0.029973 -0.087 -0.091 Grécia -0.1075 -0.027 -0.02859 -0.089 0.265 0.039 Itália -0.09982 -0.08251 -0.117 -0.129 -0.06553 -0.017 Luxemburgo -0.003262 -0.308 -0.174 -0.187 0.012 0.014 Holanda 0.017 -0.194 0.029 -0.106 -0.033 -0.02259 Portugal -0.00357 -0.131 -0.223 -0.119 0.075 -0.046 Suécia -0.126 -0.150 0.013 -0.022 -0.017 -0.022 Inglaterra -0.039 -0.145 0.008 0.306 -0.051 0.008

Quanto ao ajustamento do modelo podemos observar na Tabela 3.4 os valores do coefi-ciente de determina¸c˜ao R2_.

Tabela 3.4: Modelo Simples - coeficiente de determina¸c˜ao R2_. R2

SIDA HAV HBV HCV Salmonellosis TB

Austria 0.859 0.758 0.597 0.899 0.458 0.778 Bélgica 0.189 0.240 0.456 0.797 0.517 0.055 Dinamarca 0.871 0.500 0.563 0.798 0.527 0.018 Finlândia 0.023 0.169 0.527 0.511 0.734 0.921 Alemanha 0.894 0.959 0.909 0.435 0.987 0.940 Grécia 0.781 0.135 0.044 0.054 0.588 0.0004 Itália 0.805 0.352 0.916 0.787 0.878 0.159 Luxemburgo 0.001 0.834 0.625 0.558 0.294 0.016 Holanda 0.036 0.872 0.240 0.626 0.405 0.615 Portugal 0.00005 0.544 0.974 0.733 0.646 0.892 Suécia 0.741 0.711 0.050 0.286 0.251 0.388 Inglaterra 0.355 0.784 0.024 0.722 0.750 0.052

Os valores de R2 _{variam muito, realmente os resultados deste modelo s´o ajudar˜ao no}

estudo do problema quando forem considerados em conjunto com os do outro modelo logit e com os da retro-PLS como veremos.

(39)

3.4.4 Valida¸c˜

ao

Utilizando a teoria descrita na sec¸c˜ao 3.3.1 obteve-se o vector Z com componentes Z1, . . . , Zg.

A partir destas componentes seguimos o teste desenvolvido por Mexia (1989), para validar o modelo.

Quando o modelo se verifica, verifica-se a hip´otese

H0 : Z1, . . . , Zg i.i.d. ∼ N(0, 1) pelo que, Z0 = 1 g g X i=1 Zi ∼ N(0, 1/g) independente de S = g X i=1 Z_i2− gZ₀2 ∼ χ2_g−1 pelo que F= (g − 1) gZ 2 0 Pg i=1Zi2− gZ02

ter´a, quando H0 se verifica, distribui¸c˜ao F central com 1 e g − 1 graus de liberdade.

As alternativas a H0 correspondem a vari´aveis Z1, . . . , Zg normais, independentes com

variância 1 e valores médios η1, . . . , ηg. Então

Z0 ∼ N(η0, 1/g)

com η0 = 1_gPgi=1ηi, independente de

S ∼ χ2_g−1,δ2 com δ2 = 1 σ2 g X i=1 η2_i − gη₀2 ! . Como se ter´a Z₀2 ∼ 1 gχ 2 1,δ1 com δ1 = gη02,

F terá distribui¸cão F com 1 e g − 1 graus de liberdade e parâmetros de não centralidade δ1

e δ2. Haver´a alternativas em que δ1 predomina sobre δ2 [δ2 predomina sobre δ1] e em que F

(40)

de normalidade, tomamos a regi˜ao de aceita¸c˜ao [f1,g−1,q/2; f1,g−1,1−q/2], com fr,s,p o quantil

para a probabilidade p da distribui¸c˜ao F central com r e s graus de liberdade.

Na Tabela 3.5 apresentamos o valor da estat´ıstica do teste e a região de aceita¸cão. Tabela 3.5: Modelo Simples - estat´ıstica do teste e intervalo de aceita¸cão.

Pa´ıs FSIDA FHAV FHBV FHCV FSalm FT B [f1_,g−1,0.025; f1_,g−1,0.975]

Austria 0.45104 1.11058 0.03511 2.31194 0.98928 3.38073 [0.144, 968.627] Bélgica 1.34997 1.33908 0.03549 1.5604 1.18668 0.12964 [0.124, 948.217] Dinamarca 1.35718 0.01858 0.02459 0.02606 1.59127 1.51337 [0.156, 979.837] Finlândia 0.36232 1.62144 7.80174 0.09215 2.57755 0.51335 [0.132, 956.656] Alemanha 1.33588 1.07512 0.91846 0.00533 0.03204 0.04902 [0.113, 937.111] Grécia 1.48394 9.98099 0.00819 1.55028 1.31851 2.97572 [0.124, 948.217] Itália 0.17694 0.08214 0.00428 0.98856 0.03088 2.30872 [0.153, 976.708] Luxemburgo 0.56052 0.08238 0.08691 0.01241 0.14405 0.06155 [0.124, 948.217] Holanda 1.34123 0.32512 0.06083 5.14666 0.29557 0.20988 [0.113, 937.111] Portugal 1.41597 0.48309 2.15395 1.45633 1.1089 0.13867 [0.149, 973.025] Suécia 1.53486 0.56649 0.08279 2.86087 0.57971 0.00033 [0.149, 973.025] Inglaterra 0.02003 0.30739 0.72849 1.05301 0.07791 0.1748 [0.161, 984.867]

Os valores a vermelho correspondem a rejei¸cões ao n´ıvel de 5%. Observe-se que as mesmas correspondem a valores pequenos da estat´ıstica, os quais poderão, pelo menos em parte, ser explicados por grandes desvios. Esta foi uma das razões que nos levou a utilizar técnicas não paramétricas na análise dos nossos dados.

(41)

3.5 Modelos com dois factores aditivos

Vamos agora considerar modelos log´ısticos com regressores não observáveis. A fun¸cão objectivo para estes modelos é, como viram,

S(β, λ|V∗) = (y − X(λ|β))tD (N₁′. . . N_n′) (y − X(λ|β)) .

Para ajustar estes modelos pode-se utilizar o algoritmo ZigZag, ver por exemplo Nunes et al. (2004A e 2004B), em que se minimiza a fun¸c˜ao objectivo alternadamente em ordem a β e a λ. Assim, pode-se come¸car por um ”valor inicial”λ0 para λ calcula-se ent˜ao

ˆ β₁ = X(λ0)tD (N1′. . . Nn′) X(λ0) −1 X(λ0)tD (N1′. . . Nn′) y em seguida minimiza-se S(λ| ˆβ₁, V∗_{) = S(λ, ˆ}_β 1|V∗)

para obter ˆλ1 e assim sucessivamente de forma a obter sucessivos estimadores ˆβi, ˆλi, i = 1, . . .

No fim de cada itera¸c˜ao calcula-se a soma dos quadrados dos res´ıduos Si = S( ˆβi, ˆλi|V∗) = ytD (N1′. . . Nn′) y − ytD (N1′. . . Nn′) X( ˆλi) ˆβi

e repete-se o processo at´e os valores de Si, i = 1, . . . estabilizarem.

Quando X(λ) ´e linear em λ, isto ´e quando

X(a1 + bλ) = aX(1) + bX(λ)

pode-se, no fim de cada itera¸c˜ao, estandardizar o vector λ mantendo invariantes a menor e a maior das componentes respectivas.

Nos casos que adiante consideramos trabalhamos com pares (pa´ıs, ano) dando o ´ındice i a pa´ıses e o ´ındice j a anos. Teremos ent˜ao

λ= "

f g

#

com f e g os vectores de efeitos associados a pa´ıses e anos, respectivamente.

Admitindo-se a aditividade dos dois factores (pa´ıs e ano) ter-se-´a a fun¸c˜ao objectivo S(α, β, f, g|V∗) = m X i=1 n X j=1 N_ij′ (yij − α − β(fi+ gj))2.

(42)

Nas duas sub-al´ıneas que se seguem consideraremos: 1. o algoritmo ZigZag para estes modelos;

2. um algoritmo alternativo para os mesmos.

Com efeito não se conseguiu ainda estabelecer a convergência dos algoritmos ZigZag. Assim somos levados a considerar também algoritmos mais pesados para os quais se pôde estabelecer a convergência.

3.5.1 Ajustamento por ZigZag

Nesta sec¸c˜ao seguimos os trabalhos de Nunes et al.(2004A e 2004B) para aplicar o algoritmo ZigZag a estes modelos.

O algoritmo ZigZag é um algoritmo iterativo que, como o próprio nome indica, com minimiza¸cões alternadas, permite decompor o problema dentro de cada itera¸cão k, k = 1, 2, . . . , em dois problemas de m´ınimos quadrados:

• um problema de m´ınimos quadrados relativamente ao par de parâmetros (α, β), isto é, um problema em que se pretende minimizar a fun¸cão objectivo em ordem a α e a β admitindo que se conhecem os valores xij = fi+ gj;

• um outro problema de m´ınimos quadrados relativamente ao par de vectores (f, g), com f = (f1, . . . , fm)t e g = (g1, . . . , gn)t, em que se pretende minimizar a fun¸c˜ao objectivo

admitindo que se conhece (α, β).

Os valores das variáveis controladas não são conhecidos, o que nos obriga a obter estimativas iniciais,2 _x

ij(0), necess´arias para iniciar a primeira itera¸c˜ao do algoritmo.

Assim, toma-se xij(0) = yi•+ y•j− y••, i = 1, . . . , m e j = 1, . . . , n onde yi•= 1 n n X j=1 yij ; y•j = 1 m m X i=1 yij e y•• = 1 m × n m X i=1 n X j=1 yij.

Estamos desta forma a admitir que se conhecem as estimativas xij(k − 1), obtidas na

itera¸c˜ao (k − 1).

2

Esta escolha resulta da pr´atica que se tem tido na aplica¸c˜ao do algoritmo ZigZag, ver Mexia et al. (1999 e 2001).

(43)

A itera¸c˜ao k, k = 1, 2, . . . pode ser definida pelos seguintes passos:

Passo 1 Minimizar a fun¸cão objectivo, S, em ordem aos parâmetros α e β, usando as estimativas iniciais xij(k − 1). Desta minimiza¸cão resultam as seguintes estimativas:

˜ α(k) = yo− ˜β(k)xo(k) e β(k) =˜ sxy(k) sxx(k) onde _             yo = Pm i=1 Pn j=1qijyij q+ xo(k) = Pm i=1 Pn j=1qijxij(k − 1) q+ com qij = Nij′ e q+ = m X i=1 n X j=1 qij e _               sxx(k) = m X i=1 n X j=1 qij(xij(k − 1) − xo(k))2 sxy(k) = m X i=1 n X j=1 qij(xij(k − 1) − xo(k))(yij − yo).

Passo 2 Conhecendo as estimativas ˜α(k) e ˜β(k) obtidas no passo 1, minimizar a fun¸c˜ao objectivo Sf g = m X i=1 n X j=1 qij yij − ˜α(k) − ˜β(k) (fi+ gj) 2

em ordem aos vectores f e g, obtendo-se o sistema    D1 | Q − − − | − − − Qt _| _D 2       f − − − g    = v(k) onde Q = [qij]

(44)

´e uma matriz de dimens˜ao (m × n),                  D1 = diag n X j=1 q1j, . . . , n X j=1 qmj ! D2 = diag m X i=1 qi1, . . . , m X i=1 qin !

e as componentes do vector v(k) = (v1(k), . . . , vm+n(k))t s˜ao dadas por:

           vi(k) = 1 ˜ β(k) n X j=1 qij(yij − ˜α(k)); i = 1, . . . , m vm+j(k) = 1 ˜ β(k) m X i=1 qij(yij − ˜α(k)); j = 1, . . . , n.

A solu¸c˜ao deste sistema produz as estimativas para os coeficientes fi e gj dadas por:

˜

fi(k), i = 1, . . . , m e ˜gj(k), j = 1, . . . , n

e, consequentemente,

˜

xij(k) = ˜fi(k) + ˜gj(k).

Passo 3 Tendo-se obtido nos dois passos anteriores as estimativas ˜α(k), ˜β(k), ˜fi(k), i =

1, . . . , m e ˜gj(k), j = 1, . . . , n estamos em condi¸c˜oes de calcular o valor estimado para

a fun¸c˜ao objectivo e S(k) = m X i=1 n X j=1 qij yij − ˜α(k) − ˜β(k) ˜ fi(k) + ˜gj(k) 2 .

Passo 4 Proceder `a estandardiza¸c˜ao das estimativas de xij, de modo que o seu m´ınimo e

m´aximo se mantenham inalterados. Considerando,            a = min{xij(0)} b = max{xij(0)} a(k) = min{˜xij(k)} b(k) = max{˜xij(k)}

(45)

com i = 1, . . . , m e j = 1, . . . , n, calcula-se ˜

wij(k) =

b − a

b(k) − a(k) × (˜xij(k) − a(k)) + a.

Os valores obtidos nesta estandardiza¸cão são utilizados no in´ıcio da itera¸cão seguinte, caso o valor da fun¸cão objectivo, eS(k), não tenha estabilizado, isto é, xij(k) = ˜wij(k).

Ver Mexia et al. (1999).

3.5.2 Ajustamento por dupla minimiza¸c˜

ao

Nesta seçcão desenvolvemos um algoritmo alternativo ao algoritmo ZigZag para minimizar a fun¸cão objectivo S.

Come¸camos por reparametrizar a fun¸c˜ao objectivo, S, considerando: (

αj = α + βgj; j = 1, . . . , n

xi = fi i = 1, . . . , m.

Assim, pretende-se minimizar S = m X i=1 n X j=1 qij(yij− αj− βxi)2 (3.1)

em ordem aos parˆametros α = (α1, . . . , αn), β e ao vector x = (x1, . . . , xm).

Procedemos por duas fases come¸cando por obter o m´ınimo s(x) de S, para x conhecido, e, em seguida, minimizando s(x), como o pr´oprio nome indica procedemos a uma dupla minimiza¸c˜ao.

Fase 1 Repare-se que S pode ser escrita na forma S = m X i=1 n X j=1 qijyij2 + n X j=1 m X i=1 qij ! α2_j + m X i=1 n X j=1 qijx2i ! β2− 2 n X j=1 m X i=1 qijyij ! αj −2 m X i=1 n X j=1 qijxiyij ! β + 2 n X j=1 m X i=1 qijxi ! αjβ vindo, δS δαj = 2 m X i=1 qij ! αj− 2 m X i=1 qijyij + 2 m X i=1 qijxi ! β ; j = 1, . . . , n.

(46)

Anulando δS δαj ; j = 1, . . . , n obtemos αj• = y•j− βx•j ; j = 1, . . . , n (3.2) com y•j = Pm i=1qijyij Pm i=1qij e x•j = Pm i=1qijxi Pm i=1qij ; j = 1, . . . , n.

Tem-se ainda, por substitui¸c˜ao, caso αj = αj•

δS δβ = 2β m X i=1 n X j=1 qijx2i − 2 m X i=1 n X j=1 qijxiyij + 2 n X j=1 m X i=1 qijxi ! αj• = 2 " β m X i=1 n X j=1 qijx2i − m X i=1 n X j=1 qijxiyij + n X j=1 m X i=1 qijxi ! Pm i=1qijyij − β Pm i=1qijxi Pm i=1qij # = 2 " β n X j=1 m X i=1 qijx2i − n X j=1 (Pm_i=1qijxi)2 Pm i=1qij ! − − n X j=1 m X i=1 qijxiyij − (Pm_i=1qijxi) (Pmi=1qijyij) Pm i=1qij !# . Repare-se que, m X i=1 qij(xi− x•j)2 = m X i=1 qij(x2i − 2xix•j+ x2•j) = m X i=1 qijx2i − 2x•j m X i=1 qijxi+ x2•j m X i=1 qij = m X i=1 qijx2i − 2x2•j m X i=1 qij + x2•j m X i=1 qij = m X i=1 qijx2i − x2•j m X i=1 qij = m X i=1 qijx2i − (Pm_i=1qijxi)2 Pm i=1qij ; j = 1, . . . , n e, analogamente que m X i=1 qij(xi− x•j)(yij − y•j) = m X i=1 qijxiyij − (Pm_i=1qijxi) (Pm_i=1qijyij) Pm i=1qij

(47)

vindo δS δβ = 2β n X j=1 m X i=1 qij(xi− x•j)2− 2 n X j=1 m X i=1 qij(xi− x•j)(yij − y•j). Anulando δS δβ obt´em-se, β• = Pn j=1 Pm i=1qij(xi− x•j)(yij − y•j) Pn j=1 Pm i=1qij(xi− x•j) 2 . (3.3) Atendendo a (3.2) e a (3.3), tem-se s(x) = m X i=1 n X j=1 qij(yij − αj•− β•xi)2 = m X i=1 n X j=1 qij[(yij − y•j) − β•(xi− x•j)]2 = m X i=1 n X j=1 qij(yij − y•j)2− 2β• m X i=1 n X j=1 qij(yij − y•j)(xi− x•j) + β•2 m X i=1 n X j=1 qij(xi− x•j)2 = m X i=1 n X j=1 qij(yij − y•j)2− Pm i=1 Pn j=1qij(yij − y•j)(xi− x•j) 2 Pm i=1 Pn j=1qij(xi − x•j)2 . Como m X i=1 n X j=1 qij(yij − y•j)(xi− x•j) !2 = " _m X i=1 n X j=1 qij(yij − y•j)xi− n X j=1 qij(yij − y•j)x•j !#2 = m X i=1 aixi !2 com ai = n X j=1 qij(yij − y•j), vem s(x) = m X i=1 n X j=1 qij(yij − y•j)2− (Pm_i=1aixi)2 Pm i=1 Pn j=1qij(xi − x•j)2 .

(48)

s(x) ´e equivalente a maximizar (Pm_i=1aixi)2 Pm i=1 Pn j=1qij(xi− x•j)2

ou ainda, a minimizar o seu inverso.

Se multiplicarmos cada xi; i = 1, . . . , m por uma constante c n˜ao nula tanto o

nu-merador como o denominador viriam multiplicados por c2_{, o que, permite introduzir a}

seguinte restri¸c˜ao: m X i=1 aixi !2 = 1 que ´e equivalente a,

m X i=1 aixi = 1 ou m X i=1 aixi = −1. (3.4) Seja, g(x) = m X i=1 n X j=1 qij(xi− x•j)2.

Sendo g(x) uma fun¸cão par, isto é, g(x) = g(−x) podemos escolher uma das condi¸cões (3.4).

Pretendemos então minimizar g(x) sujeita à restri¸cãoPm_i=1aixi = 1. Para resolver este

problema de minimiza¸cão foi necessário primeiro reescrever a fun¸cão g(x) na forma quadrática e depois incorporar a restri¸cão. Obtemos,

g(x) = m X i=1 n X j=1 qij − q2 ij pj ! x2_i − m X i=1 m X l=1 i6=l n X j=1 qijqlj pj ! xixl onde pj = m X i=1 qij ; j = 1, . . . , n. Fazendo, li = n X j=1 qij; i = 1, . . . , m e cil = n X j=1 qijqlj pj ; i, l = 1, . . . , m podemos escrever g(x) = m X i=1 lix2i − m X i=1 m X l=1 cilxixl.

Isolando xm, com vista a incorporar a condi¸c˜ao tem-se que, sendo xm =

1 −Pm−1_l=1 alxl

am

(49)

minimizar a nova fun¸c˜ao, g∗(x) = m−1 X i=1 li + lm a2 i a2 m − cii− cmm a2 i a2 m + 2cim ai am x2_i + + m−1_X i=1 m−1_X l=1 i6=l lm aial a2 m − cil+ 2cim al am − cmm aial a2 m xixl− − m−1 X i=1 2lm ai a2 m + 2cim am − 2cmm ai a2 m xi+ +lm− cmm a2 m .

Estamos agora em condi¸cões de poder usar, por exemplo o software Mathematica para minimizar a fun¸cão g∗_{(x). Obtém-se assim a solu¸cão ´}_{unica do nosso problema.}

3.5.3 Compara¸c˜

ao entre os dois algoritmos e valida¸c˜

ao num´

erica

Nesta seçcão aplicamos o algoritmo ZigZag e o da dupla minimiza¸cão para ajustar o modelo logit, com uma estrutura aditiva de dois factores, e comparamos os resultados obtidos com vista à valida¸cão numérica.

Apresentamos dois exemplos, um aplicado aos dados da incidência de Tuberculose e outro aplicado aos dados da incidência de SIDA, em treze pa´ıses3 _{(m = 13) da União Europeia}

num per´ıodo de sete anos (n = 7), de 1997 a 2003. Os dados das incidências e as estimativas da popula¸cão residente em cada um dos pa´ıses em estudo foram também recolhidos das bases de dados da WHO.

Exemplo 1 - Incidˆencia de Tuberculose

Come¸camos por apresentar na Tabela 3.6 as estimativas de yij obtidas pelo algoritmo

ZigZag e pelo algoritmo da dupla minimiza¸cão. Para não tornar a apresenta¸cão dos resulta-dos demasiado exaustiva apresentamos, nesta tabela, apenas os resultaresulta-dos do primeiro e do ´

ultimo ano em estudo.

Como se pode observar os resultados das estimativas s˜ao os mesmos e isso verifica-se em todo o per´ıodo.

Na Figura 3.1 apresentamos um gr´afico com as estimativas obtidas para o factor de localiza¸c˜ao, fi, i = 1, . . . , m por ambos os algoritmos.

3

Austria, Bélgica, Dinamarca, Finlândia, Alemanha, Grécia, Irlanda, Itália, Luxemburgo, Portugal, Es-panha, Suécia e Inglaterra

(50)

Tabela 3.6: Compara¸c˜ao entre os dois algoritmos - TB.

1997 2003

Pa´ıs ZigZag Dupla minimiza¸c˜ao ZigZag Dupla minimiza¸c˜ao

α+ β(xij) αj+ β(xi) α+ β(xij) αj+ β(xi) Austria -8.74355 -8.74355 -9.02797 -9.02797 Bélgica -8.8901 -8.8901 -9.17453 -9.17453 Dinamarca -9.1191 -9.1191 -9.40352 -9.40352 Finlândia -9.08677 -9.08677 -9.37119 -9.37119 Alemanha -8.99053 -8.99053 -9.27495 -9.27495 Grécia -9.43489 -9.43489 -9.71932 -9.71932 Irlanda -9.0098 -9.0098 -9.29423 -9.29423 Itália -9.33389 -9.33389 -9.61831 -9.61831 Luxemburgo -9.15778 -9.15778 -9.4422 -9.4422 Portugal -7.55597 -7.55597 -7.84039 -7.84039 Espanha -8.36333 -8.36333 -8.64775 -8.64775 Suécia -9.78557 -9.78557 -10.07 -10.07 Inglaterra -9.02907 -9.02907 -9.3135 -9.3135 -3.5 -3 -2.5 -2 ZigZag 0.128005 0.12801 0.128015 0.12802 0.128025 Dupla Minimização

Figura 3.1: Estimativas para o factor de localiza¸c˜ao - TB.

Este gráfico sugere uma rela¸cão linear entre os factores de localiza¸cão ajustados por ambos os algoritmos. Representando por f e ˙f os factores de localiza¸cão obtidos pelo algoritmo ZigZag e pelo algoritmo da dupla minimiza¸cão respectivamente, ajustamos, pelo método dos m´ınimos quadrados, a regressão linear

˙

f = 0.128 + 0.000013f

com o coeficiente de determina¸c˜ao, R2 _{= 0.99831, o que valida fortemente a existˆencia da}

assumida rela¸cão linear. Esta é uma razão adicional para aceitar que, neste caso, ambos os algoritmos conduzem a resultados equivalentes.

Quanto ao ajustamento do modelo podemos comprovar, observando na Tabela 3.7 os valores do coeficiente de determina¸c˜ao, que ambos os algoritmos permitiram ajustar com precis˜ao

(51)

um modelo log´ıstico a partir de dados apenas sobre a incidˆencia da doen¸ca. A estimativa para Tabela 3.7: TB - coeficiente de determina¸c˜ao R2_.

ZigZag Dupla minimiza¸c˜ao R2

0.944008 0.944008

o valor da fun¸c˜ao objectivo, ˆS = 3440.38 tamb´em foi a mesma para ambos os algoritmos.

Exemplo 2 - Incidˆencia de SIDA

No caso da incidˆencia de SIDA utilizamos as mesmas compara¸c˜oes.

Mostramos na Tabela 3.8 as estimativas de yij e como se pode verificar os resultados

obtidos por ambos os algoritmos foram os mesmos.

Tabela 3.8: Compara¸c˜ao entre os dois algoritmos - SIDA.

1997 2003

Pa´ıs ZigZag Dupla minimiza¸c˜ao ZigZag Dupla minimiza¸c˜ao

α+ β(xij) αj+ β(xi) α+ β(xij) αj+ β(xi) Austria -11.1303 -11.1303 -11.9147 -11.9147 Bélgica -10.9573 -10.9573 -11.7417 -11.7417 Dinamarca -10.8563 -10.8563 -11.6407 -11.6407 Finlândia -12.0946 -12.0946 -12.879 -12.879 Alemanha -11.1801 -11.1801 -11.9645 -11.9645 Grécia -11.0507 -11.0507 -11.8351 -11.8351 Irlanda -11.5759 -11.5759 -12.3603 -12.3603 Itália -9.77023 -9.77023 -10.5546 -10.5546 Luxemburgo -10.5483 -10.5483 -11.3327 -11.3327 Portugal -8.85771 -8.85771 -9.64211 -9.64211 Espanha -9.12689 -9.12689 -9.91129 -9.91129 Suécia -11.4857 -11.4857 -12.2701 -12.2701 Inglaterra -10.732 -10.732 -11.5164 -11.5164

Assim como no caso da Tuberculose, temos uma rela¸cão linear bem definida entre as estimativas dos factores de localiza¸cão obtidas por ambos os algoritmos, como podemos ver no gráfico da Figura 3.2.

Obtivemos a regress˜ao linear ˙

f = 0.158 + 0.0000279f

com R2 _{= 0.999854, o que valida a forte rela¸c˜ao linear entre f e ˙}_{f .}

Mais uma vez, no caso da SIDA, o ajustamento do modelo logit por ambos os algoritmos foi muito bom, ver Tabela 3.9.

(52)

-4.5 -4 -3.5 -3 -2.5 -2 ZigZag 0.15836 0.15838 0.15842 0.15844 Dupla Minimização

Figura 3.2: Estimativas para o factor de localiza¸c˜ao - SIDA.

E, a estimativa para o valor da fun¸cão objectivo, ˆS = 1172.45 também foi a mesma para Tabela 3.9: SIDA - coeficiente de determina¸cão R2_.

ZigZag Dupla minimiza¸c˜ao R2

0.90416 0.90416

ambos os algoritmos.

A concordância entre os resultados obtidos pelos dois algoritmos é um bom exemplo de valida¸cão numérica dos ajustamentos.

Pode-se pois concluir que se realizou a valida¸c˜ao num´erica dos ajustamentos.

3.5.4 Aplica¸c˜

ao

Nesta seçcão apresentamos os resultados do ajustamento do modelo logit com uma estrutura aditiva de factores, para todas as doen¸cas (SIDA e co-infeçcões). Ajustamos um modelo por doen¸ca.

Tanto os dados de incidência de SIDA como os dados de incidência das co-infeçcões referem-se a um per´ıodo de 8 anos4 _{(n = 8), de 1998 a 2005.}

Temos:

• fi - o coeficiente do factor de localiza¸c˜ao do pa´ıs i, i = 1, . . . , 12;

• gj - o coeficiente do factor temporal do ano j, j = 1, . . . , 8.

Optamos por usar o algoritmo ZigZag para proceder ao ajustamento. Para todas as doen¸cas, as estimativas foram obtidas na segunda itera¸c˜ao do algoritmo.

4

(53)

Come¸camos por apresentar na Tabela 3.10 as estimativas para os parˆametros α e β. Tabela 3.10: Modelo Aditivo - estimativas para os parˆametros α e β.

Parˆametro SIDA HAV HBV HCV Salmonellosis TB

α -0.0177169 3.13737 4.84792 -0.365823 0.922862 0.182335

β 0.992527 1.20605 1.40093 0.928718 1.10502 1.0149

Observe-se que, para todas as doen¸cas, a estimativa do parˆametro β ´e aproximadamente igual a 1.

Na Tabela 3.11 apresentamos as estimativas obtidas para o factor de localiza¸c˜ao. Tabela 3.11: Modelo Aditivo - estimativas para o factor de localiza¸c˜ao.

Pa´ıs SIDA HAV HBV HCV Salmonellosis TB

Austria -4.80733 -4.64534 -3.87971 -3.65776 -2.42387 -3.47616 Bélgica -4.557 -4.23972 -3.8231 -3.75919 -2.14634 -3.55191 Dinamarca -4.72607 -4.79687 -5.13056 -4.33118 -2.97082 -3.84732 Finlândia -5.78437 -4.32808 -4.32727 -2.32015 -2.88059 -3.84349 Alemanha -4.94105 -4.58701 -4.25351 -3.60259 -2.3782 -3.75944 Grécia -4.83928 -4.85505 -4.67622 -5.91357 -4.04731 -3.86986 Itália -3.6334 -4.46061 -4.63012 -6.00439 -3.729 -4.01767 Luxemburgo -4.2032 -3.08103 -3.47581 -3.38499 -2.48584 -3.80288 Holanda -4.30469 -4.30513 -4.72009 -4.85862 -4.1676 -3.89966 Portugal -2.58591 -5.12657 -4.48853 -4.64674 -4.98828 -2.30919 Suécia -5.24885 -4.97757 -4.33338 -2.05629 -2.94572 -4.40937 Inglaterra -4.4704 -4.82324 -4.87407 -3.80811 -3.45834 -3.61461

Como veremos, o valor das estimativas do factor de localiza¸cão dos pa´ıses, obtido para cada co-infeçcão vai ser utilizado no Cap´ıtulo 5.

Podemos observar na Tabela 3.12 a precis˜ao dos ajustamentos.

Tabela 3.12: Modelo Aditivo - coeficiente de determina¸c˜ao R2_.

SIDA HAV HBV HCV Salmonellosis TB

R2 _0.87583 _0.161935 _0.193766 _0.621948 _0.798539 _0.878595

Os maus ajustamentos obtidos para HAV e HBV foram outra das razões que nos levaram a utilizar métodos não paramétricos.

(54)