Programas de Pós
Graduação em
Economia e
Administração da
PUC-SP
BOLETIM DE ANÁLISES ESTATÍSTICO
BASTA 201
8
Vol.
1
RESILIÊNCIA
DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS DA PESQUISA
EMPÍRICA PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA
Kallita Ester Magalhães
São Paulo – SP
201
8
ANÁLISE DOS PAÍSES DA REGIÃO IBERO-AMERICANA (AIBER)
PROJETO ORIBER
Sumário
1. Introdução ... 3
2. Entendendo Os Dados ... 3
2.1 Sobre Projeto Milênio – Observatório Riber - Oriber ... 3
2.2 Os Indivíduos ... 3
2.3 As variáveis do tema Biodiversidade - Capital Natural e Social ... 3
2.4 Países analisados ... 6
3. Tratamento Dos Dados, Agrupamentos E Relacionamentos ... 7
3.1 Análises de agrupamentos (clusters) ... 7
3.2 Análise de variância - ANOVA ... 10
3.3 Análise de Componentes Principais (PC) ... 14
3.4 Novo índice de performance ... 16
3.5 Criando indicadores a partir dos PC1, PC2 ... 28
3.6 Ranking de Resiliência ... 29
1. Introdução
Este trabalho tem por objetivo realizar análises dos países da região
Ibero-Americana (AIBER). Para tanto serão efetuadas análises de correspondência, para obter
graficamente a distribuição dos resultados das variáveis do eixo temático Resiliência e
analisar o grau de relacionamento entre as variáveis de interesse. Análises de variância
(ANOVA), regressões, de agrupamentos (clusters) e de componentes principais também
serão efetuadas. E por fim, ao se identificar as variáveis de maior relevância na
composição do modelo, será criado um indicador de performance, através do qual os países
serão agrupados e ordenados. E um mapa indicando suas posições no ranking através das
cores para destaque.
Os dados são compilados pelo Banco Mundial. O software estatístico utilizado neste
estudo é o Minitab.
2. Entendendo Os Dados
Os dados desta análise compreende os 19 países pertencentes à região
Ibero-Americana (AIBER). Estes dados são representados pelos indicadores sintéticos e
analíticos de maior relevância para permitir análises e conclusões sobre o tema Resiliência
e auxiliar os envolvidos no Projeto ORIBER – Observatório RIBER.
2.1 Sobre Projeto Milênio – Observatório Riber - Oriber
A Rede Ibero-americana do Projeto Milênio – RIBER tem como objetivo: promover
o estudo da prospectiva na Iberoamérica através de uma comunidade com competências,
conceitos, métodos e práticas prospectivas, que permita analisar e intercambiar
informações sobre os diferentes países da região e contribuir na aprendizagem coletiva dos
atores regionais para o desenvolvimento de competências em prospectiva, fornecendo
referências das melhores práticas existentes na região e no mundo como um todo. Fonte:
Guia GPS – Gestão Pública Sustentável
2.2 Os Indivíduos
Os indivíduos desta análise são países que constam na base de dados do Banco
Mundial. Os conceitos que compõem o tema Reisliência, foram extraídos do material
fornecido em aula, do guia Programa Países Sustentáveis - Guia GPS – Gestão Pública
Sustentável, uma publicação do Núcleo de Estudos do Futuro da PUC-SP e do site do
Banco Mundial.
2.3 As variáveis do tema Biodiversidade - Capital Natural e Social
Este tema da pesquisa apresenta 18 (dezoito) variáveis, sendo três categóricas –
Country, Country Code e Região descritas abaixo no Quadro 1. Estas ainda podem ser
divididas em: índices sintéticos e variáveis-componentes ou indicadores, a saber:
Índices sintéticos | São 11 (onze): Social Progress Index, The World Risk Index,
IDH, Governance, EPI Score, The Happy Planet Index, Gini, Democracy, Economic Score,
Supply Chain Score, Risk Quality Score.
Indicadores ou variáveis components | São 7 (sete): Tolerance and Inclusion,
Exposure, Susceptibility, Vulnerability, Lack of coping capacities, Lack of adaptive
capacities, Inherent Cyber Risk.
Quadro 1. As variáveis do eixo temático: Resiliência
Variável Significado Tipo Unidade de Medida
Social Progress Index O índice de progresso social é um índice que agrega indicadores sociais e ambientais em três dimensões do progresso social: (1) necessidades básicas humanas, (2) bem-estar, (3) oportunidades. O índice de progresso social de 2017 inclui dados de 128 países em 50 indicadores.
Quantitativa Percentual
Tolerance and Inclusion O índice de tolerância e inclusão é composto por cinco indicadores são eles: (1) tolerância para com os imigrantes, (2) para com os homossexuais, (3) discriminação e violência contra as minorias, (4) tolerância religiosa e (5) rede de segurança comunitária.
Quantitativa Percentual
The World Risk Index O Índice de Risco Mundial consiste em quatro componentes: (1) exposição para os perigos naturais, (2) a suscetibilidade, (3) falta de capacidades de enfrentamento e (4) à falta capacidades adaptativas. O Índice é calculado a partir de 28 indicadores que utilizam dados disponibilizados pelos países e acessíveis a todos.
Quantitativa Percentual
The World Risk Index- Exposure
A exposição refere-se à população, condições de áreas construídas, componentes de infraestrutura e ambiental expostos aos impactos de um ou mais riscos naturais, tais como: terremotos, ciclones, secas, inundações e elevação do nível do mar etc.
Quantitativa Percentual
The World Risk Index - Susceptibility
Susceptibilidade refere-se à probabilidade de sofrer perda, dano ou interrupção face a eventos extremos ou de desastres naturais. Assim, a susceptibilidade descreve as características estruturais e condições-quadro de uma sociedade sendo elas: (1) infraestrutura pública com a parte da população sem acesso a um saneamento e fonte de água melhorados, (2) condições de habitação com a parte da população que vive em comunidades; proporção de moradias semissólidas e frágeis, (3) nutrição com a percentagem das pessoas subnutridas da população, (4)pobreza e relação de dependência com a população de extrema pobreza vivendo com US1,25 por dia ou menos (paridade de poder de compra), (5) capacidade econômica e distribuição de renda com o produto interno bruto per capta (paridade de compra) e índice de Gini.
Quantitativa Percentual
The World Risk Index- Vulnerability
Compreende à suscetibilidade, associadas a falta de capacidade de resposta e de adaptação da sociedade, à fatores sociais, físicos, econômicos e ambientais que os tornam suscetíveis aos impactos dos riscos de desastres naturais, aos efeitos adversos das alterações climáticas ou de processos de transformação. Demonstra também a capacidade da sociedade, país em enfrentar e adaptar-se aos impactos negativos dos
desastres naturais.
The World Risk Index – Lack of coping capacities
É a habilidade da sociedade em minimizar os impactos negativos oriundos de desastres naturais, às alterações climáticas via ação direta e da disponibilidade de recursos para redução de danos e prejuízos na ocorrência destes eventos.
Quantitativa Percentual
The World Risk Index – Lack of adaptive capacities
Adaptação, ao contrário da capacidade de enfrentar e sobreviver, é entendida como um processo de longo prazo que inclui mudanças estruturais. Concentra-se em medidas e estratégias que abordam os impactos negativos dos desastres naturais e das mudanças climáticas em longo prazo.
Quantitativa Percentual
IDH O índice de desenvolvimento humano mede o progresso de um país por indicadores de qualidade de vida sendo os principais: (1) renda nacional bruta per capta, (2) saúde com a avaliação da expectativa de vida, e (3) educação com os anos de escolaridade para adultos com idade de 25 anos e crianças.
Quantitativa Indicador nominal que
varia de 0 a 1
Governance O indicador de governança mede a capacidade de um país de eleger, monitorar e substituir seus governantes eleitos. Mede também nível de estabilidade política, medidas contra corrupção, entre outros. É baseado em mais de 30 fontes de dados que relatam as percepções de governança de um grande número de inquiridos e avaliações especializadas em todo o mundo.
Quantitativa Percentual
EPI Score O índice de desempenho ambiental mede como dimensões: (1) proteção da saúde frente a riscos ambientais e (2) proteção dos ecossistemas.
Quantitativa Percentual
The Happy Planet Index
O índice do planeta feliz mede o bem-estar sustentável. Nos dizendo o quão bem as nações estão fazendo em alcançar vidas longas, felizes e sustentáveis.
Quantitativa Percentual
GINI Index O índice de Gini mede até que ponto a distribuição de renda (ou, em alguns casos, as despesas de consumo) entre indivíduos ou famílias dentro de uma economia se desvia de uma distribuição perfeitamente igual. Onde um índice 0 representa a desigualdade perfeita, enquanto um índice de 1 implica uma perfeita igualdade.
Quantitativa Indicador nominal que
varia de 0 a 1
Economic Score Esse fator representa influências políticas e macroeconômicas na resiliência. Combinando para formar este fator estão quatro fatores: produtividade, risco político, intensidade de óleo e taxa de urbanização. Descobriu-se que o terrorismo está altamente correlacionado com a instabilidade política, então essas duas
variáveis são combinadas em um único driver: risco político.
Supply Chain Score Esse fator está relacionado à própria cadeia de suprimentos e compreende quatro fatores: controle da corrupção, qualidade da
infraestrutura, qualidade do fornecedor local e visibilidade da cadeia de suprimentos.
Quantitativa Percentual
Risk Quality Score Este indicador compreende como aspectos: exposição a riscos naturais, qualidade de risco natural e qualidade de risco de incêndio. Um quarto driver adicional é incluído para capturar o risco cibernético inerente de um país.
Quantitativa Percentual
Inherent Cyber Risk O risco cibernético inerente refere-se à vulnerabilidade a um ataque cibernético combinado igualmente com a capacidade de recuperação do país: capturado pela penetração na Internet (a porcentagem de indivíduos em um país que tem acesso à internet) e as liberdades civis. (Dado baseado no UM ad Freedom House).
Quantitativa Percentual
Democracy Index O índice de democracia avalia 165 países em cinco categorias: processo eleitoral e pluralismo; liberdades civis; o funcionamento do governo; participação política; e cultura política. Classificando-os em quatro tipos de regime: "democracia plena"; "democracia defeituosa"; "regime híbrido"; e "regime autoritário".
Quantitativa Indicador nominal que
varia de 0 a 10
Country Nome do país Categórica N/A
Região Região do país Categórica N/A
Country Code Código do país Categórica N/A
Fonte: O autor a partir dos dados da planilha estatística, do GPS p.16 e do site do Banco Mundial. A pontuação foi padronizada para uma escala de 0 a 100 e as variáveis foram positivadas.
2.4 Países analisados
Este trabalho consiste em fazer análises com os indicadores mencionados na sessão
anterior abrangendo os 19 países da região Ibero-Americana, conforme o Quadro 2.
Quadro 2. Países contemplados neste estudo
Ord. Country Região
Country Code
1 Argentina AIBER ARG
2 Bolivia AIBER BOL
3 Brazil AIBER BRA
4 Chile AIBER CHL
5 Colombia AIBER COL
6 Costa Rica AIBER CRI
7 Dominican Republic AIBER DOM
8 Ecuador AIBER ECU
9 El Salvador AIBER SLV
11 Honduras AIBER HND
12 Mexico AIBER MEX
13 Nicaragua AIBER NIC
14 Panama AIBER PAN
15 Paraguay AIBER PRY
16 Peru AIBER PER
17 Portugal AIBER PRT
18 Spain AIBER ESP
19 Uruguay AIBER URY
3. Tratamento Dos Dados, Agrupamentos E Relacionamentos
Nesta sessão serão realizadas análises de agrupamentos (clusters), regressões,
análise da variância (ANOVA) e de componentes principais.
Tomando como base os resultados das componentes principais, será criado um
indicador com as variáveis de maior poder de explicação do modelo e uma tabela de
ranking, ordenando os países pela sua performance e um mapa para mostrar graficamente
estes resultados.
3.1 Análises de agrupamentos (clusters)
Nesta sessão será efetuada análises de agrupamentos a fim de evidenciar o grau de
relacionamento das variáveis estudadas. Algumas variáveis tiveram seus nomes reduzidos
para melhor acomodação nos gráficos e tabelas.
A saber, a variável Social Progress Index = “SPI”, Tolerance and Inclusion =
“ToIn”, Wolrd Risk Index=”WRI”, Exponsure = “Exp”, “Vulnerability” = “Vul”,
Susceptibility = “Sus”, Governance = “Go”, EPI Score = “EPI”, Happy Planet Index =
“HPI”, Democracy Index = “Dem”, Lack of coping capacities = “ Lack cop cap”, Lack of
adaptive capacities = “Lack adp cap”, Economic Score = “Econ”, Risk Quality Score = “
RQS”, Inherent Cyber Risk = “ICR”, Supply Chain = “SCS”.
Conforme estudos anteriores serão trabalhadas para análise as variáveis SPI, ToIn,
WRI, Exp, Vul, Sus, Go, Dem, Lack cop cap, lack adp cap, ICR totalizando 13 variáveis.
Quanto a quantidade de clusters, foram testadas de 3 a 5 clusters, porém a que
melhor agrupamento formava foi a de 3 clusters, portanto, a que será utilizada no
transcorrer das análises que se seguem.
Abaixo a análise de clusters, utilizando o método completo (complete), medida de
distância pelo sistema Euclidiano, e quantidade de clusters igual a 3 (três).
Análise de Agrupamentos de Observações: SPI n; ToI n; ... m
n; ICR np
Distância Euclideana, Ligação Completa
Passos de Amalgamação
Passo Número de agrupados Nível de similaridade Nível de distância Agrupados reunidos Novo agrupado Número de obs. no novo agrupado 1 18 88,6678 18,323 8 16 8 2 2 17 87,9980 19,406 8 12 8 33 16 87,8103 19,709 17 18 17 2 4 15 85,3125 23,748 5 8 5 4 5 14 84,8538 24,490 2 15 2 2 6 13 84,6919 24,751 3 14 3 2 7 12 82,4356 28,400 11 13 11 2 8 11 79,0976 33,797 9 10 9 2 9 10 78,0226 35,535 5 7 5 5 10 9 77,3321 36,651 17 19 17 3 11 8 75,9754 38,845 4 6 4 2 12 7 75,2399 40,034 1 3 1 3 13 6 68,1712 51,463 2 5 2 7 14 5 67,1894 53,051 9 11 9 4 15 4 52,6495 76,560 1 17 1 6 16 3 43,0978 92,004 2 9 2 11 17 2 39,3045 98,138 1 4 1 8 18 1 0,0000 161,689 1 2 1 19
Partição Final
Número de observações Dentro da soma de quadrados do agrupado Distância média do centróide Distância máxima do centróide Agrupado1 6 6452,7 31,8588 39,1331 Agrupado2 11 14021,5 34,0466 60,2904 Agrupado3 2 754,5 19,4225 19,4225Centróides do grupo
Variável Agrupado1 Agrupado2 Agrupado3 Centróide global SPI n 82,1917 63,2446 85,8739 71,6099 ToI n 73,0381 51,4397 70,7498 60,2929 IDH n 77,5824 57,4844 76,9682 65,8820 WRI n 88,0330 66,6334 49,9834 71,6385 Exp np 83,1087 66,7324 31,6592 68,2119 Vul np 74,9925 48,1825 73,1847 59,2806 Sus np 80,1485 61,6296 80,7169 69,4868 Lack cop cap np 63,4061 27,7365 55,8814 41,9632 Lack adp cap np 75,6925 56,4589 78,5220 64,8551 Gov n 60,0459 36,9786 71,0087 47,8451
GINI n 69,0272 46,5730 65,9514 55,7036 Dem n 71,5651 54,5455 75,9857 62,1769 ICR np 36,2319 37,6747 28,4199 36,2449
Distâncias Entre Centróides do Grupo
Agrupado1 Agrupado2 Agrupado3 Agrupado1 0,0000 77,3793 66,2754 Agrupado2 77,3793 0,0000 84,3753 Agrupado3 66,2754 84,3753 0,0000
Dendrogram
Este dendrograma mostra os agrupamentos feitos pelos países por similaridade. Os
países na cor azul representam os melhores resultados do agrupamento, seguidos pela cor
verde que apresentam um resultado intermediário. Os de cor vermelha apresentam os
resultados mais baixos da análise. Pelas linhas cinzas também é possível identificar um
certo relacionamento entre os países do grupo azul e do grupo verde.
Nica ragu a Hond uras Guat emala El Sa lvad or Dom inica n Re publ ic Mex ico Peru Ecua dor Colo mbia Para guay Boliv ia Costa Rica Chile Urug uay Spain Portu gal Pana ma Braz il Arge ntina 0,00 33,33 66,67 100,00 Observações Si m ila ri da de
Dendrograma
Tabela 1: Descritivo dos agrupamentos da região AIBER: GRUPO PAÍSES 1 Argentina 1 Brazil 1 Panama 1 Portugal 1 Spain 1 Uruguay GRUPO PAÍSES 2 Bolivia 2 Colombia 2 Dominican Republic 2 Ecuador 2 El Salvador 2 Guatemala 2 Honduras 2 Mexico 2 Nicaragua 2 Paraguay 2 Peru GRUPO PAÍSES 3 Chile 3 Costa Rica
3.2 Análise de variância - ANOVA
Com os agrupamentos definidos e estabelecido cada país como membro de seu
respectivo cluster, como próximo passo será executado a ANOVA para entender a
variabilidade entre os grupos e auxiliar na classificação para as análises nas sessões
posteriores.
ANOVA com um fator: GINI n versus Cluster
Método
Hipótese nula Todas as médias são iguais Hipótese alternativa Nem todas as médias são iguais Nível de significância α = 0,05
Assumiu-se igualdade de variâncias para a análise
Informações dos Fatores
Fator Níveis ValoresCluster 3 1; 2; 3
Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Cluster 2 2192 1096,09 12,52 0,001
Erro 16 1401 87,56 Total 18 3593
Sumário do Modelo
S R2 R2(aj) R2(pred) 9,35743 61,01% 56,14% 44,74%Médias
Cluster N Média DesvPad IC de 95% 1 6 69,03 12,29 (60,93; 77,13) 2 11 46,57 7,77 (40,59; 52,55) 3 2 65,95 6,47 (51,92; 79,98)
DesvPad Combinado = 9,35743
Boxplot de GINI n
Na análise acima, vemos o que havia sido descrito na sessão anterior, que o grupo 1,
no gráfico representado pela cor azul, apresenta a maior média entre todos. O grupo 3, com
média 65,95, representado no gráfico da sessão anterior pela cor verde, numa posição
intermediária. E finalmente o grupo 2, com média de 46,57, com os resultados mais baixos
da amostra e representados no gráfico pela cor vermelha.
A coluna de ordenamento ficou com a seguinte característica de grupos:
Cluster 1 para 1
Cluster 2 para 3
Cluster 3 para 2
Feito o ordenamento (cluster members), é executado novamente a ANOVA com os
seguintes resultados:
3 2 1 90 80 70 60 50 40 30 Cluster G IN I nBoxplot de GINI n
ANOVA com um fator: GINI n versus Recodificado Cluster
Método
Hipótese nula Todas as médias são iguais Hipótese alternativa Nem todas as médias são iguais Nível de significância α = 0,05
Assumiu-se igualdade de variâncias para a análise
Informações dos Fatores
Fator Níveis Valores Recodificado Cluster 3 1; 2; 3Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado Cluster 2 2192 1096,09 12,52 0,001 Erro 16 1401 87,56 Total 18 3593
Sumário do Modelo
S R2 R2(aj) R2(pred) 9,35743 61,01% 56,14% 44,74%Médias
RecodificadoCluster N Média DesvPad IC de 95% 1 6 69,03 12,29 (60,93; 77,13) 2 2 65,95 6,47 (51,92; 79,98) 3 11 46,57 7,77 (40,59; 52,55)
DesvPad Combinado = 9,35743
Tabela 2:
GRUPO PAÍSES 1 Argentina 1 Brazil 1 Panama 1 Portugal 1 Spain 1 Uruguay GRUPO PAÍSES 2 Chile 2 Costa Rica GRUPO PAÍSES 3 Bolivia 3 Colombia 3 Dominican Republic 3 Ecuador 3 El Salvador 3 Guatemala 3 Honduras 3 Mexico 3 Nicaragua 3 Paraguay 3 Peru 3 2 1 90 80 70 60 50 40 30 Recodificado Cluster G IN I nBoxplot de GINI n
Seguiremos com os 3 (três) clusters para as análises das próximas sessões, sendo a
classificação:
Cluster 1 para 1 ALTO
Cluster 2 para 3 BAIXO
Cluster 3 para 2 MÉDIO
A nova classificação proposta será utilizada na elaboração do ranking dos países de
AIBER.
3.3 Análise de Componentes Principais (PC)
Com os agrupamentos definidos e estabelecido cada país como membro de seu
respectivo cluster, como próximo passo será executado a ANOVA para entender a
variabilidade entre os grupos e auxiliar na classificação para as análises das sessões
posteriores.
Análise de Componentes Principais: SPI n; ToI n; IDH n;
... em n; ICR np
Autoanálise (Autovalores e Autovetores) da Matriz de Correlação
Autovalor 9,297 2 2,197 9 0,754 1 0,270 4 0,184 6 0,106 2 0,075 3 0,049 3 0,033 5 0,016 0 Proporção 0,715 0,169 0,058 0,021 0,014 0,008 0,006 0,004 0,003 0,001 Acumulad o 0,715 0,884 0,942 0,963 0,977 0,985 0,991 0,995 0,998 0,999 Autovalor 0,0134 0,0022 0,0000 Proporção 0,001 0,000 0,000 Acumulado 1,000 1,000 1,000Autovetores
Variável CP1 CP2 CP3 CP4 CP5 CP6 CP7 CP8 CP9 SPI n 0,321 -0,063 -0,027 0,011 0,003 0,432 0,049 0,090 0,368 ToI n 0,289 -0,002 0,368 -0,121 -0,751 -0,313 -0,024 0,278 0,141 IDH n 0,318 0,026 -0,137 0,211 0,170 0,139 -0,167 0,584 -0,165 WRI n 0,168 0,548 0,292 -0,049 0,112 0,163 0,254 0,052 0,071 Exp np 0,091 0,614 0,331 -0,083 0,213 -0,003 -0,075 -0,123 -0,073 Vul np 0,325 -0,040 -0,030 0,107 0,054 -0,219 -0,008 -0,290 -0,076 Sus np 0,310 -0,040 -0,205 0,010 0,311 -0,540 0,423 -0,040 0,454 Lack cop cap np 0,319 -0,060 0,105 -0,111 0,075 -0,253 -0,454 -0,396 -0,301 Lack adp cap np 0,303 0,005 -0,075 0,612 -0,290 0,251 0,332 -0,339 -0,258 Gov n 0,297 -0,220 0,057 -0,348 0,012 0,433 -0,209 -0,299 0,365 GINI n 0,320 -0,006 -0,068 0,227 0,206 -0,091 -0,404 0,281 -0,005 Dem n 0,299 -0,122 -0,165 -0,580 0,039 0,081 0,398 0,147 -0,544ICR np 0,022 0,498 -0,745 -0,158 -0,339 -0,013 -0,198 -0,088 0,092 Variável CP10 CP11 CP12 CP13 SPI n -0,523 0,534 -0,014 -0,000 ToI n 0,025 -0,014 -0,072 0,000 IDH n -0,266 -0,546 -0,146 -0,000 WRI n 0,071 -0,148 0,667 -0,000 Exp np 0,013 0,112 -0,644 0,000 Vul np -0,122 -0,043 0,053 0,848 Sus np 0,018 -0,096 -0,105 -0,254 Lack cop cap np -0,354 -0,012 0,235 -0,410 Lack adp cap np 0,169 -0,032 -0,113 -0,219 Gov n 0,355 -0,383 -0,111 0,000 GINI n 0,583 0,439 0,126 0,000 Dem n 0,120 0,174 -0,052 0,000 ICR np -0,005 -0,012 0,030 -0,000
Scree Plot - gráfico de perfil de autovalores de SPI n; ...; ICR np
Na análise, vemos que as componentes PC1 e PC2 já explicam 88,4% da
variabilidade dos dados (Progresso Social e Torelancia e Inclusão). O que é percebido
visualmente pelo gráfico acima.
13 12 11 10 9 8 7 6 5 4 3 2 1 9 8 7 6 5 4 3 2 1 0 Número do Componente A ut ov al or
Observa-se uma proximidade das variáveis de susceptibilidade, adaptação e
vulnerabilidade com o IDH. Também verifica-se um descolamento da exposição, cyber
risco e risco de desastres mundiais em relação ao modelo. É interessante também notar a
questão da governança que se desloca para o polo negativo aproximando-se mais da
variável democracia.
3.4 Novo índice de performance
A nova PC1 criada na sessão anterior será utilizada para a criação de um novo
índice de performance.
Para tanto, iniciamos executando a análise de variância ANOVA tomando como
base a PC1 e a coluna Recodificado.
ANOVA com um fator: CP1 versus Recodificado Cluster
Método
Hipótese nula Todas as médias são iguais Hipótese alternativa Nem todas as médias são iguais Nível de significância α = 0,05
Assumiu-se igualdade de variâncias para a análise
Informações dos Fatores
Fator Níveis Valores Recodificado Cluster 3 1; 2; 3Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado Cluster 2 119,68 59,842 20,09 0,000 Erro 16 47,66 2,979 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 0,6 0,5 0,4 0,3 0,2 0,1 0,0 -0,1 -0,2 -0,3 Primeiro Componente Se gu nd o C om po ne nt e ICR np Dem n GINI n Gov n Lack adp cap np
Lack cop cap npSus npVul np Exp np
WRI n
IDH n ToI n
SPI n
Total 18 167,35
Sumário do Modelo
S R2 R2(aj) R2(pred) 1,72599 71,52% 67,96% 60,56%Médias
RecodificadoCluster N Média DesvPad IC de 95% 1 6 3,031 2,166 (1,537; 4,524) 2 2 2,671 1,025 (0,084; 5,258) 3 11 -2,139 1,521 (-3,242; -1,035) DesvPad Combinado = 1,72599 Boxplot de CP1
.
Os resultados acima, mostram pelo gráfico, que manteve-se a mesma disposição da
análise anterior, porém havendo o aumento do coeficiente de determinação (r-quadrado)
para 71,52%.
Para determinar o peso da contribuição das variáveis na PC1, será executada
regressão stepwise utilizando como variável de interesse (response) a PC1 e como
variáveis independentes (predictors), todas as outras variáveis desse estudo.
Análise de Regressão: CP1 versus SPI n; ToI n; IDH n; WRI
... n; ICR np
Seleção Stepwise de Termos
3 2 1 5,0 2,5 0,0 -2,5 -5,0 Recodificado Cluster C P1
Boxplot de CP1
Termos candidatos: SPI n; ToI n; IDH n; WRI n; Exp np; Vul np; Sus np; Lack cop cap np; Lack adp cap np; Gov n; GINI n; Dem n; ICR np
---Passo 1--- ---Passo 2--- ---Passo 3---
Coef P Coef P Coef P
Constante -11,334 -13,613 -14,158 Vul np 0,19120 0,000 0,1314 0,000 0,1226 0,000 SPI n 0,0814 0,004 0,0830 0,000 WRI n 0,01323 0,000 Dem n ToI n GINI n IDH n Gov n
Lack cop cap np
ICR np
Lack adp cap np
Exp np Sus np S 0,415240 0,329145 0,218458 R2 98,25% 98,96% 99,57% R2(aj) 98,15% 98,83% 99,49% R2(pred) 97,82% 98,49% 99,37%
---Passo 4--- ---Passo 5--- ---Passo 6---
Coef P Coef P Coef P
Constante -14,445 -14,577 -14,601 Vul np 0,1154 0,000 0,10887 0,000 0,07931 0,000 SPI n 0,0669 0,000 0,0634 0,000 0,05164 0,000 WRI n 0,01518 0,000 0,01365 0,000 0,01248 0,000 Dem n 0,02783 0,010 0,02742 0,004 0,03362 0,000 ToI n 0,01493 0,020 0,01997 0,000 GINI n 0,03612 0,000 IDH n Gov n
Lack cop cap np
ICR np
Exp np Sus np S 0,177324 0,148142 0,0855902 R2 99,74% 99,83% 99,95% R2(aj) 99,66% 99,76% 99,92% R2(pred) 99,51% 99,66% 99,88%
---Passo 7--- ---Passo 8--- ---Passo 9---
Coef P Coef P Coef P
Constante -14,776 -14,376 -14,4751 Vul np 0,07861 0,000 0,07884 0,000 0,08842 0,000 SPI n 0,04570 0,000 0,03308 0,000 0,02695 0,000 WRI n 0,01141 0,000 0,012905 0,000 0,013614 0,000 Dem n 0,03245 0,000 0,02689 0,000 0,02659 0,000 ToI n 0,02243 0,000 0,02050 0,000 0,02182 0,000 GINI n 0,02459 0,005 0,02108 0,001 0,02340 0,000 IDH n 0,01951 0,022 0,02716 0,000 0,02548 0,000 Gov n 0,01122 0,003 0,01601 0,000
Lack cop cap np -0,00928 0,002
ICR np
Lack adp cap np
Exp np Sus np S 0,0696425 0,0454034 0,0279948 R2 99,97% 99,99% 100,00% R2(aj) 99,95% 99,98% 99,99% R2(pred) 99,89% 99,96% 99,98%
---Passo 10--- ---Passo 11--- ---Passo 12---
Coef P Coef P Coef P
Constante -14,4717 -14,4516 -14,6246 Vul np 0,08759 0,000 0,08378 0,000 0,086249 0,000 SPI n 0,02723 0,000 0,02635 0,000 0,026623 0,000 WRI n 0,012957 0,000 0,013024 0,000 0,008367 0,000 Dem n 0,024423 0,000 0,025613 0,000 0,026336 0,000 ToI n 0,022631 0,000 0,022162 0,000 0,022895 0,000 GINI n 0,02323 0,000 0,02373 0,000 0,022620 0,000
IDH n 0,02450 0,000 0,02405 0,000 0,025461 0,000 Gov n 0,01755 0,000 0,017443 0,000 0,018321 0,000 Lack cop cap np -0,00825 0,000 -0,00652 0,001 -0,009262 0,000 ICR np 0,003207 0,001 0,003104 0,000 0,002592 0,000 Lack adp cap np 0,002421 0,034 0,002727 0,000
Exp np 0,004279 0,000 Sus np S 0,0138612 0,0105290 0,0000220 R2 100,00% 100,00% 100,00% R2(aj) 100,00% 100,00% 100,00% R2(pred) 100,00% 99,99% 100,00% ---Passo 13---- Coef P Constante -14,86 Vul np 0,02057 * SPI n 0,02663 * WRI n 0,008369 * Dem n 0,02633 * ToI n 0,02289 * GINI n 0,02262 * IDH n 0,02546 * Gov n 0,01832 *
Lack cop cap np 0,01608 *
ICR np 0,002592 *
Lack adp cap np 0,02312 *
Exp np 0,004277 * Sus np 0,02509 * S 0 R2 100,00% R2(aj) 100,00% R2(pred) 100,00%
α para entrada = 0,15; α para remoção = 0,15
Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Regressão 13 167,349 12,8730 * *
SPI n 1 0,025 0,0250 * * ToI n 1 0,128 0,1282 * * IDH n 1 0,040 0,0399 * * WRI n 1 0,002 0,0023 * * Exp np 1 0,001 0,0007 * * Vul np 1 0,000 0,0000 * * Sus np 1 0,000 0,0000 * *
Lack cop cap np 1 0,000 0,0000 * * Lack adp cap np 1 0,000 0,0000 * *
Gov n 1 0,029 0,0292 * * GINI n 1 0,039 0,0390 * * Dem n 1 0,091 0,0913 * * ICR np 1 0,003 0,0030 * * Erro 5 0,000 0,0000 Total 18 167,349
Sumário do Modelo
S R2 R2(aj) R2(pred) 0 100,00% 100,00% 100,00%Coeficientes
Termo Coef EP de Coef Valor-T Valor-P VIF
Constante -14,86 0,00 * * SPI n 0,02663 0,00000 * * 74,25 ToI n 0,02289 0,00000 * * 11,70 IDH n 0,02546 0,00000 * * 45,61 WRI n 0,008369 0,000000 * * 220,48 Exp np 0,004277 0,000000 * * 206,89 Vul np 0,02057 0,00000 * * 6,68936E+09 Sus np 0,02509 0,00000 * * 5,97545E+08 Lack cop cap np 0,01608 0,00000 * * 1,56489E+09 Lack adp cap np 0,02312 0,00000 * * 4,44390E+08
Gov n 0,01832 0,00000 * * 54,55
GINI n 0,02262 0,00000 * * 47,19
Dem n 0,02633 0,00000 * * 17,64
ICR np 0,002592 0,000000 * * 2,93
Equação de Regressão
CP1 = -14,86 + 0,02663 SPI n + 0,02289 ToI n + 0,02546 IDH n + 0,008369 WRI n + 0,004277 Exp np + 0,02057 Vul np + 0,02509 Sus np + 0,01608 Lack cop cap np
+ 0,02312 Lack adp cap np + 0,01832 Gov n + 0,02262 GINI n + 0,02633 Dem n + 0,002592 ICR np
Com os resultados desta regressão, nota-se, analisando o coeficiente de
determinação (r-quadrado), que a variável vulnerabilidade já explica 98,25% da PC1 e
somada a progresso social tem-se uma explicação de 98,96%.
Ao executar a análise de regressão do PC1 e com as duas variáveis de maior peso,
descritas acima, temos:
Análise de Regressão: CP1 versus Vul np; SPI n
Seleção Stepwise de Termos
Termos candidatos: SPI n; Vul np---Passo 1--- ---Passo 2--- Coef P Coef P Constante -11,334 -13,613 Vul np 0,19120 0,000 0,1314 0,000 SPI n 0,0814 0,004 S 0,415240 0,329145 R2 98,25% 98,96% R2(aj) 98,15% 98,83% R2(pred) 97,82% 98,49% Cp de Mallows 12,06 3,00
α para entrada = 0,15; α para remoção = 0,15
Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Regressão 2 165,616 82,8078 764,36 0,000 SPI n 1 1,198 1,1978 11,06 0,004 Vul np 1 5,372 5,3717 49,58 0,000 Erro 16 1,733 0,1083 Total 18 167,349
Sumário do Modelo
S R2 R2(aj) R2(pred) 0,329145 98,96% 98,83% 98,49%Coeficientes
Termo Coef EP de Coef Valor-T Valor-P VIF Constante -13,613 0,748 -18,19 0,000 SPI n 0,0814 0,0245 3,33 0,004 14,45 Vul np 0,1314 0,0187 7,04 0,000 14,45
Equação de Regressão
CP1 = -13,613 + 0,0814 SPI n + 0,1314 Vul np
Ajustados e Diagnósticos para Observações Atípicas
Obs. CP1 Ajuste Resíd Resíd Pad6 1,946 2,567 -0,621 -2,11 R 15 -1,839 -2,453 0,613 2,06 R
R Resíduo grande
Que gera a seguinte equação de regressão:
CP1 = -13,613 + 0,0814 SPI n + 0,1314 Vul np
Para determinar o peso da contribuição das variáveis na PC2, será executada
regressão stepwise utilizando como variável de interesse (response) a PC2 e como
variáveis independentes (predictors), todas as outras variáveis desse estudo.
Análise de Regressão: CP2 versus SPI n; ToI n; IDH n; WRI
... n; ICR np
Seleção Stepwise de Termos
Termos candidatos: SPI n; ToI n; IDH n; WRI n; Exp np; Vul np; Sus np; Lack cop cap np; Lack adp cap np; Gov n; GINI n; Dem n; ICR np
---Passo 1--- ---Passo 2--- ---Passo 3---
Coef P Coef P Coef P
Constante -4,341 -5,832 -4,487 Exp np 0,06364 0,000 0,05044 0,000 0,05213 0,000 ICR np 0,0660 0,000 0,05560 0,000 Gov n -0,02265 0,000 WRI n Sus np Dem n Vul np SPI n
Lack adp cap np
IDH n
GINI n
ToI n
Lack cop cap np
R2 82,83% 93,74% 99,61%
R2(aj) 81,82% 92,95% 99,54%
R2(pred) 79,22% 91,38% 99,28%
---Passo 4--- ---Passo 5--- ---Passo 6---
Coef P Coef P Coef P
Constante -4,334 -4,0548 -3,9044 Exp np 0,03471 0,000 0,02889 0,000 0,02762 0,000 ICR np 0,05360 0,000 0,05682 0,000 0,05895 0,000 Gov n -0,02874 0,000 -0,02366 0,000 -0,01899 0,000 WRI n 0,01952 0,005 0,02645 0,000 0,02755 0,000 Sus np -0,01062 0,000 -0,00809 0,000 Dem n -0,00996 0,000 Vul np SPI n
Lack adp cap np
IDH n
GINI n
ToI n
Lack cop cap np
S 0,0778816 0,0471235 0,0285967
R2 99,79% 99,93% 99,98%
R2(aj) 99,72% 99,90% 99,96%
R2(pred) 99,55% 99,75% 99,90%
---Passo 7--- ---Passo 8--- ---Passo 9---
Coef P Coef P Coef P
Constante -4,0097 -4,0375 -3,9438 Exp np 0,027517 0,000 0,02772 0,000 0,02660 0,000 ICR np 0,058741 0,000 0,058624 0,000 0,058878 0,000 Gov n -0,015933 0,000 -0,015432 0,000 -0,014463 0,000 WRI n 0,02843 0,000 0,02833 0,000 0,02968 0,000 Sus np -0,00176 0,155 Dem n -0,011531 0,000 -0,012142 0,000 -0,012423 0,000 Vul np -0,00729 0,000 -0,008669 0,000 -0,007656 0,000 SPI n -0,00297 0,054
Lack adp cap np
GINI n
ToI n
Lack cop cap np
S 0,0133248 0,0140435 0,0122932
R2 100,00% 99,99% 100,00%
R2(aj) 99,99% 99,99% 99,99%
R2(pred) 99,98% 99,98% 99,99%
---Passo 10--- ---Passo 11--- ---Passo 12---
Coef P Coef P Coef P
Constante -4,0170 -4,01859 -4,02324 Exp np 0,028731 0,000 0,028996 0,000 0,029124 0,000 ICR np 0,058514 0,000 0,058266 0,000 0,058258 0,000 Gov n -0,013942 0,000 -0,013558 0,000 -0,013532 0,000 WRI n 0,027463 0,000 0,027188 0,000 0,027041 0,000 Sus np Dem n -0,010756 0,000 -0,010651 0,000 -0,010720 0,000 Vul np -0,009972 0,000 -0,010932 0,000 -0,010731 0,000 SPI n -0,004018 0,001 -0,005261 0,000 -0,005223 0,000 Lack adp cap np 0,002830 0,001 0,002982 0,000 0,002968 0,000
IDH n 0,001875 0,000 0,002202 0,000
GINI n -0,000457 0,001
ToI n
Lack cop cap np
S 0,0069179 0,0015765 0,0008468
R2 100,00% 100,00% 100,00%
R2(aj) 100,00% 100,00% 100,00%
R2(pred) 99,99% 100,00% 100,00%
---Passo 13--- ---Passo 14--- ---Passo 15---
Coef P Coef P Coef P
Constante -4,01993 -4,01158 -3,983 Exp np 0,029092 0,000 0,028953 0,000 0,02895 * ICR np 0,058235 0,000 0,058255 0,000 0,05825 * Gov n -0,013512 0,000 -0,013570 0,000 -0,01357 * WRI n 0,027098 0,000 0,027245 0,000 0,02724 * Sus np -0,000182 0,000 -0,003204 *
Dem n -0,010718 0,000 -0,010718 0,000 -0,01072 * Vul np -0,010678 0,000 -0,010421 0,000 -0,002511 * SPI n -0,005233 0,000 -0,005221 0,000 -0,005222 * Lack adp cap np 0,002978 0,000 0,002870 0,000 0,000414 * IDH n 0,002152 0,000 0,002106 0,000 0,002106 * GINI n -0,000453 0,000 -0,000422 0,000 -0,000422 * ToI n -0,000093 0,005 -0,000133 0,000 -0,000133 *
Lack cop cap np -0,003053 *
S 0,0004912 0,0000026 0
R2 100,00% 100,00% 100,00%
R2(aj) 100,00% 100,00% 100,00%
R2(pred) 100,00% 100,00% 100,00%
α para entrada = 0,15; α para remoção = 0,15
Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Regressão 13 39,5629 3,04330 * * SPI n 1 0,0010 0,00096 * * ToI n 1 0,0000 0,00000 * * IDH n 1 0,0003 0,00027 * * WRI n 1 0,0245 0,02452 * * Exp np 1 0,0328 0,03279 * * Vul np 1 0,0000 0,00000 * * Sus np 1 0,0000 0,00000 * *
Lack cop cap np 1 0,0000 0,00000 * * Lack adp cap np 1 0,0000 0,00000 * *
Gov n 1 0,0160 0,01601 * * GINI n 1 0,0000 0,00001 * * Dem n 1 0,0151 0,01512 * * ICR np 1 1,5219 1,52189 * * Erro 5 0,0000 0,00000 Total 18 39,5629
Sumário do Modelo
S R2 R2(aj) R2(pred) 0 100,00% 100,00% 100,00%Coeficientes
Constante -3,983 0,000 * * SPI n -0,005222 0,000000 * * 74,25 ToI n -0,000133 0,000000 * * 11,70 IDH n 0,002106 0,000000 * * 45,61 WRI n 0,02724 0,00000 * * 220,48 Exp np 0,02895 0,00000 * * 206,89 Vul np -0,002511 0,000000 * * 6,68936E+09 Sus np -0,003204 0,000000 * * 5,97545E+08 Lack cop cap np -0,003053 0,000000 * * 1,56489E+09 Lack adp cap np 0,000414 0,000000 * * 4,44390E+08
Gov n -0,01357 0,00000 * * 54,55
GINI n -0,000422 0,000000 * * 47,19
Dem n -0,01072 0,00000 * * 17,64
ICR np 0,05825 0,00000 * * 2,93
Equação de Regressão
CP2 = -3,983 - 0,005222 SPI n - 0,000133 ToI n + 0,002106 IDH n + 0,02724 WRI n + 0,02895 Exp np - 0,002511 Vul np - 0,003204 Sus np - 0,003053 Lack cop cap np + 0,000414 Lack adp cap np - 0,01357 Gov n - 0,000422 GINI n - 0,01072 Dem n + 0,05825 ICR np
Com os resultados desta regressão, nota-se, analisando o coeficiente de
determinação (r-quadrado), que a variável de exposição já explica 82,83% da PC2 e
somada a risco cybernético tem-se uma explicação de 93,74%.
Ao executar a análise de regressão do PC2 e com as duas variáveis de maior peso,
descritas acima, temos:
Análise de Regressão: CP2 versus Exp np; ICR np
Seleção Stepwise de Termos
Termos candidatos: Exp np; ICR np---Passo 1--- ---Passo 2--- Coef P Coef P Constante -4,341 -5,832 Exp np 0,06364 0,000 0,05044 0,000 ICR np 0,0660 0,000 S 0,632205 0,393562 R2 82,83% 93,74% R2(aj) 81,82% 92,95%
R2(pred) 79,22% 91,38% Cp de Mallows 28,87 3,00
α para entrada = 0,15; α para remoção = 0,15
Análise de Variância
Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Regressão 2 37,085 18,5423 119,71 0,000 Exp np 1 15,517 15,5171 100,18 0,000 ICR np 1 4,316 4,3164 27,87 0,000 Erro 16 2,478 0,1549 Total 18 39,563
Sumário do Modelo
S R2 R2(aj) R2(pred) 0,393562 93,74% 92,95% 91,38%Coeficientes
Termo Coef EP de Coef Valor-T Valor-P VIF Constante -5,832 0,421 -13,86 0,000 Exp np 0,05044 0,00504 10,01 0,000 1,33 ICR np 0,0660 0,0125 5,28 0,000 1,33
Equação de Regressão
CP2 = -5,832 + 0,05044 Exp np + 0,0660 ICR np
Que gera a seguinte equação de regressão:
CP2 = -5,832 + 0,05044 Exp np + 0,0660 ICR np
3.5 Criando indicadores a partir dos PC1, PC2
Aproveitando os resultados da sessão anterior, relacionou-se cada componente
principal (PC), com as variáveis de estudo afim de obter a mais alta correlação com as
variáveis de resposta.
Abaixo, listamos as 2 (duas) variáveis que apresentaram esta correlação prara
criação de um indicador sintético de resiliência para os países da região AIBER.
No caso de CP1
CP1 = SPI + Vul CP1 = -13,613 + 0,0814 SPI n + 0,1314 Vul npNo caso de CP2
CP2 = Exp + ICR CP2 = -5,832 + 0,05044 Exp np + 0,0660 ICR npPensando em um indicador que sintetize CP1, CP2
Resiliência AIBER = (0,715*CP1) +(0,169*CP2)
3.6 Ranking de Resiliência
Através da fórmula sintética (que engloba as variáveis CP1, CP2) foi possível
calcular um Ranking de Resiliência para os países da região AIBER, conforme abaixo:
Tabela 3: Ranking de Resiliência para os países da região AIBER
Classificação Resilience n País
1 100,00 Spain 2 90,59 Portugal 3 80,57 Uruguay 4 76,41 Argentina 5 68,87 Chile 6 56,99 Brazil 7 52,95 Panama 8 51,31 Mexico 9 51,02 Costa Rica 10 48,37 Colombia 11 43,98 Ecuador 12 43,64 Peru 13 38,43 Paraguay 14 38,02 Dominican Republic 15 28,72 Bolivia 16 16,05 El Salvador 17 15,66 Honduras 18 7,31 Nicaragua 19 0,00 Guatemala
Observa-se que de forma geral a disposição dos países se manteve como os
agrupamentos haviam ilustrado: cluster 1 com médias mais elevadas, cluster 2 em posição
intermediária e cluster 3 com médias mais baixas.
É interessante notar que o Chile se destaca apresentando resultado, do indicador sintético
de resiliencia, acima no Brasil e Panamá. Também que o México se destaca do seu grupo
apresentando um resultado na faixa intermediária , é não na escala menor.
3 2 1 100 80 60 40 20 0 Recodificado Cluster R es ili en ce n
Boxplot de Resilience n
Mapa com os países da região Ibero-Americana - AIBER
Legenda:
Laranja escuro = ALTO Laranja médio = MÉDIO Laranja claro = BAIXO