• Nenhum resultado encontrado

Grupo 1

N/A
N/A
Protected

Academic year: 2021

Share "Grupo 1"

Copied!
8
0
0

Texto

(1)

Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística

CONTAGEM DE ÓBITOS POR ACIDENTE DE TRÂNSITO NO ESTADO

DO ESPÍRITO SANTO

Eduardo Yuddi Sato Paulo Augusto Grosso de Souza

Lucka Kiohei Neves Maekawa

(2)

Resumo

Os dados analisados foram obtidos no site DATASUS, do ministério da saúde brasileiro e consiste em informações de 78 cidades do estado do Espírito Santo no ano de 2017, o objetivo da análise foi modelar o número de óbitos em acidentes de trânsitos nessas cidades nesse ano. Para a modelagem ajustou-se o modelo de quase-verossimilhança, o modelo log-linear de Poisson e o modelo com distribuição Binomial Negativa. Dentre os ajustes, o modelo Binomial Negativo apresentou melhor desempenho, tendo o menor AIC e a maioria dos pontos do gráfico Normal de probabilidades dentro do envelope simulado.

(3)

1. Introdução

O presente trabalho tem como objetivo apresentar uma análise estatística, por meio de um modelo linear generalizado para dados de contagem, em dados referentes ao número de óbitos em

acidentes de trânsitos em cidades do estado do Espirito Santo no ano de 2017.

O trabalho contém uma breve análise descritiva (para melhor entender a base de dados), ajuste de um modelo buscando explicar o número de óbitos em função das covariáveis disponíveis, diagnóstico para verificação se o modelo proposto nas circunstâncias se ajusta bem aos dados disponíveis, comparativo entre as distribuições propostas e quais os eventuais problemas dos dados e do método utilizado para a análise.

2. Materiais e métodos

2.1 Material

Conjunto de dados

Os dados utilizados para aplicação do modelo linear generalizado provêm do site DATASUS, do ministério da saúde brasileiro no ano de 2017, e consiste em 78 cidades. A base de dados contém uma série de covariáveis; as quais tiveram sua significância testada no que diz respeito a sua influência no número de óbitos em acidentes de trânsitos causados, são elas:

• Analf: Taxa de analfabetismo na cidade • Pib: PIB médio per capita

• Desemprego: Taxa de desemprego na cidade • Trab_inf: Taxa de trabalho infantil na cidade

• Renda: % da população com renda menor que ½ salário mínimo

Totalizam-se 5 covariáveis com as quais tentou-se explicar o número de óbitos em acidentes de trânsitos nas cidades estudadas. A variável resposta é:

• Óbito: Número de óbitos na cidade por acidente de trânsito

Os dados estão dispostos da seguinte forma:

Tabela 1: Seis Primeiras Linhas da Base de Dados Analisada

Tabela 1 – Seis primeiras linhas da base de dados

obito analf pib desemprego trab_inf renda

21 13.7 486.5 3.78 24.49 41.3 18 19.5 372.3 4.65 12.48 52.0 19 15.0 485.1 3.51 28.64 43.91 26 13.2 648.1 5.44 13.73 32.16 19 6.9 629.4 2.95 14.45 28.6 2 16.6 407.6 6.98 5.48 49.12

(4)

O software R foi utilizado para ajustar os modelos lineares generalizados aos dados descritos. Os pacotes utilizados com este propósito foram: car, statmod, hnp, entre outros.

2.2 Modelo Linear Generalizado

A proposta para modelar o número de óbitos em acidentes de trânsito no ano de 2017 foram os modelos lineares generalizados aditivo com distribuições Quase-Verossimilhança, Poisson e Binomial negativa, tais modelos são amplamente utilizadas quando a variável de resposta é uma contagem.

A variável resposta considerada foi o número de óbitos (óbitos) por município, a qual assume valores no conjunto dos inteiros maiores que zero. Portanto, devido à natureza da variável resposta, a classe de Modelos Lineares Generalizados foi utilizada. Para o componente aleatório do modelo considerou-se a distribuição Binomial Negativa, uma vez que a tradicional distribuição de Poisson não foi suficiente para acomodar a superdispersão dos dados. O componente sistemático foi formulado pela combinação linear das variáveis preditoras, além de uma função logarítmica.

Como alternativa ao modelo apresentado, também foi utilizado um modelo com forma mais geral para variância da distribuição, usando a abordagem de quase verossimilhança, em que a superdispersão dos dados pode ser acomodada pelo parâmetro de dispersão φ multiplicando a variância da média, denominado Quase-Poisson.

2.3 Seleção de Covariáveis

As variáveis foram selecionadas manualmente no site do DATASUS, na categoria de Demográficas e Socioeconômicas, a preferência foi por variáveis que fossem de taxa para evitar multicolinearidade.

2.4 Diagnóstico do Modelo e Análise de Incerteza

O diagnóstico da qualidade do ajuste dos modelos foi baseado no gráfico Half-Normal Plot com envelopes simulados, construído usando a função hnp do pacote hnp, e gráfico de resíduos quantílicos aleatorizados. Por fim, as incertezas referentes a estimação dos parâmetros do modelo de melhor desempenho foram quantificadas por meio do procedimento não-paramétrico bootstrap de reamostragem de dados. Foram simuladas 999 amostras bootstrap e para cada amostra foi obtida a estimativa pontual e o intervalo de confiança do parâmetro com 95% de confiança. As estimativas

bootstrap foram comparadas com aquelas obtidas no procedimento descrito previamente, baseado

em estimativas assintóticas. Toda a análise foi conduzida no software estatístico R.

3 Resultados e Discussão

3.1 Ajuste dos dados

Tanto no ajuste binomial negativo quanto Quase-Poisson, a covariável renda apresentou relação negativa com a variável resposta número de óbitos por acidente de trânsito. Por outro lado, a covariável analf apresentou correlação positiva.

(5)

O parâmetro de dispersão estimado foi 0.78 para o modelo Binomial Negativo, com valor de deviance residual de 81.85 bem próximo aos 72 graus de liberdade do modelo, indicando ajuste satisfatório. No ajuste Quase-Poisson o parâmetro de dispersão estimado foi de 1.04, com deviance residual de 41.02, já com os EP ajustados pelo parâmetro de dispersão, indicativos de bom ajuste.

Tabela 2: Parâmetros estimados, erro padrão e p-valor para cada modelo ajustado

O modelo Binomial Negativo apresentou desempenho aceitável, nota-se que no gráfico

Half-Normal Plot (figura 1) alguns pontos excederam o envelope simulado, indicando um ligeiro desajuste

do modelo. Quanto ao comportamento dos resíduos quantílicos aleatorizados, em ambos os ajustes existe uma leve fuga de normalidade. (figura 2)

Figura 2 – Gráficos dos resíduos quantílicos aleatorizados

Parâmetro Estimativa EP P valor Estimativa EP P valor Binomial Negativa Quase-Poisson

Intercepto 2,95 0,3178 <0,001 2,96 0,4895 <0,001

renda -0,03 0,016 0,073 -0,03 0,0245 0,23

(6)

Figura 1 – Envelopes simulados

É possível, após os ajustes que de fato se tratava de um problema de dispersão, uma vez que os intervalos de confiança para um modelo ajustado com a distribuição Poisson estavam excessivamente precisos (tabela 3) e os EP estavam subestimados (tabela 4), se comparado com o modelo com distribuição Binomial Negativo

Tabela 3 – Intervalos de Confiança

Poisson IC (95%) Bin. Neg IC (95%)

Parâmetro 2,5% 97,5% Parâmetro 2,5% 97,5%

Intercepto 2,64 3,14 Intercepto 2,30 3,60

renda -0,04 -0,01 renda -0,06 0,004

(7)

Tabela 4 – EP estimados

O modelo de melhor desempenho no presente estudo foi Binomial Negativa, pois resultou em estatísticas de ajuste bastante satisfatórias e com medidas de diagnóstico superior. A formulação final do modelo na escala do preditor linear (1) e da variável resposta (2) é dada na sequência:

log(𝜇𝑖) = 2,95 − 0,0288 ∗ 𝑥1+ 0,0598 ∗ 𝑥2 (1) 𝜇_𝑖 = exp (2,95 − 0,0288 ∗ 𝑥1+ 0,0598 ∗ 𝑥2) (2)

3.2 Predição

Foi feita uma predição para 4 perfis de cidades, para saber qual seria o número de acidentes por acidente de carro (tabela5):

Tabela 5 – Predições para novos perfis

Nota-se quanto maior a proporção da população com renda menor que ½ salário mínimo menos o número de óbito por acidente de trânsito, visto que quanto mais pobre a população menor o número de carros, consequentemente menos acidentes, e assim menos óbitos

Poisson EP Bin. Neg EP

Parâmetro Parâmetro

Intercepto 0,1280 Intercepto 0,3180

renda 0,0065 renda 0,0160

analf 0,0145 analf 0,0359

perfil renda analf obito

1 17,3 3,3 14

2 50,2 19,8 15

3 20,9 16,7 28

(8)

4 Conclusão

No presente trabalho desenvolveu-se dois modelos lineares generalizados para estimar o número de óbitos por acidente no estado do Espírito Santo, em 2017. Os modelos desenvolvidos apresentaram estatística de ajuste e medidas de diagnóstico satisfatórias, dadas as condições, mas recomenda-se o modelo Binomial Negativa devido ao desempenho superior. Melhores resultados podem ser obtidos em futuros estudos se considerar a inclusão de outras covariáveis de outras bases de dados, talvez variáveis com mais relação com trânsito. Além disso, considerar uma possível dependência espacial entre os municípios também é importante para adequada avaliação do número de óbitos por acidentes de trânsito.

Referências

Documentos relacionados

Coração que é “raso” demais, ou sem terra boa, ou cercado pelos espinhos da preocupação exagerada e do egoísmo, não são bons solos para a boa nova do Evangelho.. As vezes

Figura 6: Amostras de adultos de Tuta absoluta capturados na armadilha Delta com feromona colocada na cultura do tomateiro na estação experimental do INIDA em S.. Figura

As variáveis peso, estatura e circunferência da cintura apresentaram valores médios superiores aos homens em relação as mulheres, sendo o inverso observado para índice

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Corporate Control and Policies Page 12 UNIVERSIDAD DE PIURA UNIVERSIDAD DEL PACÍFICO UNIVERSIDAD ESAN UNIVERSIDAD NACIONAL AGRARIA LA MOLINA UNIVERSIDAD NACIONAL

Por meio da experiência relatada, tornou-se possível verificar que o movimento imbricado na construção, desconstrução e reconstrução de novas formas de lidar com o

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Nesse aspecto, o presente trabalho apresenta um estudo de caso que tem como objetivo analisar o desempenho de interseções inseridas na Rodovia AL-110, no município de Arapiraca