Grupo 7

(1)

Universidade Federal do Paran´

a

Curso Estat´ıstica

Regress˜

ao para dados bin´

arios:

silhuetas de ve´ıculos

Jos´

e Paulo Miketen Maltaca GRR 20170396

Let´ıcia Vieira da Rocha GRR 20160221

Patr´ıcia Renata Diez GRR 20170392

Novembro de 2019

(2)

Conte´

udo

1 Resumo 2

2 Introdu¸c˜ao 2

3 Material e M´etodos 2

3.1 Dados . . . 2

3.2 An´alise Descritiva . . . 4

3.3 Modelo Linear Generalizado . . . 4

3.4 Sele¸c˜ao de Covari´aveis . . . 5

3.5 Poder Preditivo do Modelo . . . 5

4 Resultados e Discussão 6 4.1 Análise Exploratória . . . 6

4.2 Ajuste do Modelo . . . 6

4.3 Predi¸c˜ao do Modelo . . . 8

5 Conclus˜ao 9

(3)

1 Resumo

Este trabalho almejou a ajustar um modelo para predizer, a partir de silhuetas de ve´ıculos, se eles correspondiam ou não a um ônibus. A base de dados contou com 18 variáveis de 846 observa¸cões, e apresentaram forte colinearidade. Com vistas a tratar do problema, utilizaram-se o método dos compo-nentes principais (Mpca) e um modelo baseado no método stepwise (Mstep). Ambos se adequaram ao diagnóstico de ajuste do modelo linear generalizado (GLM), mas o poder preditivo do primeiro modelo foi maior, não obstante a menor interpretabilidade dos parâmetros. Ambos não apresentaram problemas de diagnóstico de ajuste, mas a variância continuou inflacionada no modelo Mstep. Verificou-se também que alguns dos componentes foram dominados por variáveis que não foram significativas no modelo sa-turado, o que explica a falta de significância do primeiro componente principal. O modelo escolhido para a realiza¸cão das predi¸cões foi o Mpca, o qual apresentou as caracter´ısticas adequadas como preditor.

2 Introdu¸

c˜

ao

O aprendizado de máquina (machine learning) é o processo pelo qual os computadores desenvolvem o reconhecimento de padrões a partir de dados. Esse processo cria uma certa independência para as máquinas, as quais a partir dos dados conseguem automatizar a constru¸cão de modelos anal´ıticos e fazer ajustes sem terem sido explicitamente programadas para tanto. Bastante em voga no momento, o aprendizado de máquina vem sendo aperfei¸coado continuamente.

A base de dados sob análise nesse trabalho foi constru´ıda originalmente por J.P.Siebert entre os anos de 1986 e 1987 e parcialmente financiada pela Barr and Strout Ltd, uma empresa do Reino Unido pioneira na área de engenharia ótica. Intitulada “Vehicle Silhouette” (silhueta de ve´ıculos) essa base de dados usada em aprendizado de máquina teve como principal objetivo estabelecer um método de distin¸cão de objetos 3D a partir de uma imagem 2D. Assim, a partir de imagens 2D dos ve´ıculos algumas medidas caracter´ısticas de suas silhuetas foram armazenadas e então foi constru´ıda uma árvore de decisão por meio da qual o computador pode classificar a imagem em um dos seguintes ve´ıculos: Ônibus Duplo Deck, Van Chevrolet, Saab 9000 e Manta 400.

As caracter´ısticas das silhuetas dos ve´ıculos foram extra´ıdas pelo Sistema de Processamento de Ima-gens Hierárquicas (HIPS) BINATTS capaz de extrair uma combina¸cão de caracter´ısticas independentes de escala, usando medidas baseadas em variância escalada, assimetria, curtose e medidas heur´ısticas, tais como: cavidades, circularidade, “retangularidade” e compacidade.

As imagens foram obtidas por uma câmera olhando para baixo no modelo de ve´ıculo a partir de um ângulo fixo de eleva¸cão (34,2 graus em rela¸cão à horizontal). Os ve´ıculos foram colocados em uma superf´ıcie iluminada difusa (caixa de luz) e pintados de preto fosco para minimizar os destaques. As imagens foram capturadas usando um armazenamento de quadros CRS4000 conectado a um vax 750. Todas as imagens foram capturadas com uma resolu¸cão espacial de 128x128 pixels quantificada para 64 n´ıveis de cinza. Essas imagens foram limiarizadas para produzir silhuetas binárias de ve´ıculos, negadas (para atender aos requisitos de processamento do BINATTS) e, posteriormente, submetidas a módulo HIPS para remover o ru´ıdo da imagem.

O presente trabalho teve como objetivo ajustar um modelo linear generalizado para dados binários capaz de classificar o input das informa¸cões de silhuetas de ve´ıculos como “ Ônibus” ou “Não Ônibus” a partir das covariáveis: compacidade, circularidade, distância de circularidade, razão do raio, razão de aspecto dos eixos principal e menor, máximo comprimento da razão de aspecto dos eixos principal e menor, razão de dispersão, “alongamento”, “retangularidade” dos eixos, máximo comprimento da “retangularidade” , variâncias escaladas dos eixos principal e menor, raio de rota¸cão escalado, curtoses sobre eixos principal e menor, assimetria dos eixos principal e menor e razão de cavidade.

3 Material e M´

etodos

3.1 Dados

Dispon´ıvel para acesso livre, a base de dados Vehicle Silhouette foi retirada do dom´ınio “mldata.io”, site que reúne diferentes bases de dados para aplica¸cões de machine learning. Originalmente a base reúne 846 observa¸cões e 19 variáveis. Para constru¸cão do modelo binário foi adicionada à base a seguinte variável resposta:

(4)

• Bus: variável binária, assume valor 1 se a silhueta do ve´ıculo corresponde à de um ônibus ou 0 caso contrário.

A vari´avel acima foi baseada na seguinte vari´avel presente na base:

• Vehicle class: variável qualitativa categórica de 4 n´ıveis. Realizada a transforma¸cão para torná-la binária “Bus”, direcionada para silhueta tipo Bus, assumindo o valor 1 se o ve´ıculo corresponder à de um ônibus ou 0 caso contrário.

A seguir s˜ao apresentadas as covari´aveis do modelo saturado:

• Compactness: variável cont´ınua, referente à compacidade assume o valor resultante da fórmula (per´ımetro médio )2_/´_area.

• Circularity: variável cont´ınua, referente à circularidade assume o valor resultante da fórmula (raio médio)2_/´_area

• Distance circularity: variável cont´ınua, referente à distância de circularidade assume o valor resul-tante da fórmula área/(distância média da borda)2

• Radius ratio: variável cont´ınua, referente à razão do raio assume o valor resultante da fórmula (raio máximo − raio m´ınimo)/raio médio.

• Pr.axis aspect ratio: variável cont´ınua, referente à razão do aspecto do eixo principal assume o valor resultante da fórmula (eixo menor)/(eixo principal)

• Max.length aspect ratio: variável cont´ınua, referente ao máximo comprimento do raio assume o valor resultante da fórmula (comprimento perpendicular ao máximo comprimento)/(máximo com-primento)

• Scatter ratio: variável cont´ınua, referente razão de dispersão assume o valor resultante da fórmula (inércia sobre o eixo menor)/(inércia sobre o eixo principal)

• Elongatedness: vari´avel cont´ınua, referente ao “alongamento” assume o valor resultante da f´ormula ´

area/(largura “encolhida”)2

• Pr.axis rectangularity: variável cont´ınua, referente à “retangularidade” do eixo principal assume o valor resultante da fórmula área/(comprimento pr.eixo * largura pr.eixo)

• Max length rectangularity: variável cont´ınua, referente à “retangularidade” do comprimento máximo assume o valor resultante da fórmula área / (comprimento máximo*comprimento perpendicular) • Scaled variance along major axis: variável cont´ınua, referente à variância escalada ao longo do eixo

principal assume o valor resultante da fórmula (segundo momento sobre menor eixo)/área. • Scaled variance along minor axis : variável cont´ınua, referente à variância escalada ao longo do

menor eixo assume o valor resultante da fórmula (segundo momento sobre eixo principal)/área. • Scaled radius of gyration: variável cont´ınua, referente ao raio de rota¸cão escalado assume o valor

resultante da f´ormula (mavar+mivar)/´area.

• Skewness about major axis: variável cont´ınua, referente à assimetria o eixo principal assume o valor resultante da fórmula (terceiro momento sobre o eixo principal)/σ3

min.

• Skewness about minor axis: variável cont´ınua, referente à assimetria o menor eixo assume o valor resultante da fórmula (terceiro momento sobre o menor eixo)/σ3

maj.

• Kurtosis about minor axis: variável cont´ınua, referente à curtose do menor eixo assume o valor resultante da fórmula (quarto momento sobro eixo principal)/σ4

min.

• Kurtosis about major axis: variável cont´ınua, referente à curtose do eixo principal assume o valor resultante da fórmula (quarto momento sobre o menor eixo)/σ4

maj.

• Hollows ratio: variável cont´ınua, referente à razão de cavidades assume o valor resultante da fórmula (área das cavidades)/(área delimitada do pol´ıgono).

(5)

3.2 An´

alise Descritiva

Das 846 observa¸cões 628 (74,23 % do total de ve´ıculos) não eram referentes a silhuetas de ônibus (ou seja, eram ou de uma Van Chevrolet, ou de um Saab 9000, ou então de um Monta 400), enquanto que as demais 218 (25,77% do total de ve´ıculos) silhuetas identificavam um ônibus duplo deck. Entre as medidas das covariáveis não há incompatibilidade de escala. A figura 1 mostra o boxplot de cada uma delas, verifica-se que os menores valores observados são das covariáveis “skewness minor axis” e “kurto-sis minor axis” (valor m´ınimo = 0 unidade de medida), e que a maior média (422 unidades de medida) e o maior valor observado (1028 unidades de medida) pertencem à covariável “scaled variance minor axis”, além disso as covariáveis “radius ratio”,”pr axis aspect ratio”,”max length aspect ratio” apresentam três ou mais pontos extremos.

Figura 1: Boxplot das vari´aveis presentes na base

3.3 Modelo Linear Generalizado

Conforme elencado anteriormente, a variável resposta neste estudo foi a Vehicle class “Bus” a qual assume valor binário 1 quando a silhueta do ve´ıculo modelo for “Bus” e 0 quando não. Desta forma, devido à natureza dos dados da variável resposta, o método de Modelos Lineares Generalizados (MLG) fez-se necessário para uma modelagem que descrevesse bem o processo gerador dos valores observados.

Segundo Paula (2013), a ideia básica quanto à utiliza¸cão deste método consiste em ampliar as op¸cões para a distribui¸cão da variável resposta de modo a permitir que ela perten¸ca à fam´ılia exponencial de distribui¸cões e ainda proporcionar maior flexibilidade para a rela¸cão funcional entre a média da variável resposta e o preditor linear η. O modelo proposto considerou a distribui¸cão binomial para a variável resposta, as variáveis explanatórias na forma de uma estrutura linear, e a fun¸cão de liga¸cão do tipo logito ln(µ/(1 − µ)), que une as variáveis, sendo o µ a propor¸cão esperada de sucessos. Assim, a defini¸cão do modelo fica dada por:

Yi/Xi∼ Binomial(µ, πi), i = 1, 2, . . . , n

Onde πi, é a probabilidade de ocorrência (sucesso) de Yi e Xios vetores de covariáveis associados às

observa¸cões. A especifica¸cão do MLG é dada por:

g(πi) = ηi= β0+ β1xi1+ · · · + βpxip

(6)

3.4 Sele¸

c˜

ao de Covari´

aveis

Para realizar a sele¸cão de covariáveis do preditor linear do modelo foram utilizados os Métodos Stepwise combinados com a Regulariza¸cão Lasso, e o modelo baseado em Análise de Componentes Principais, o que resultou em dois diferentes modelos.

O Método Stepwise combina os métodos Backward e Forward : enquanto este inicia com o algoritmo com o modelo restrito e insere as variáveis sequencialmente que melhor se ajustam ao modelo, aquele inicia o modelo com todos os termos e seleciona para exclusão o de menor contribui¸cão para o ajuste proposto. No caso do stepwise, o algoritmo inicia com o modelo saturado e, a cada exclusão, é analisada e verificada a possibilidade de inclusão dos termos exclu´ıdos anteriormente, de modo que realiza todas as poss´ıveis combina¸cões que tornam melhor o ajuste do modelo. Finaliza-se o processo quando não há mais possibilidade de inclusão de termos exclu´ıdos pois nenhum possui for¸ca suficiente para entrar e nenhum outro para sair.

Neste estudo, a sele¸cão de covariáveis pelo stepwise foi baseada no Critério BIC, que penaliza mais fortemente modelos mais complexos, possuindo o modelo final o menor BIC:

BIC = −2 ˆI + ln(n) ∗ p

Onde Î é o valor de log-verossimilhan¸ca maximizado, p é número de parâmetros do modelo e n o número de observa¸cões da amostra.

O Método de Regulariza¸cão Lasso tem por objetivo ajustar o modelo de modo que as estimativas dos parâmetros sejam regularizadas em dire¸cão a zero, ou seja, produz estimativas com menor variância. Também usado quando há problemas de multicolinearidade, este método é baseado em penaliza¸cão de primeira ordem e busca minimizar a seguinte fun¸cão:

−1 n n X i=1 I(yi, β0+ x0iβ) + λ[(1 − α)||β||2+ α||β||1]

Sendo Lasso α = 1, temos a equa¸c˜ao equivalente a:

−1 n n X i=1 I(yi, β0+ x0iβ) + λ p X j=1 |βj|, λ ≥ 0

O parâmetro λ controla a intensidade da penaliza¸cão. Para escolha de λ ótimo foi realizado o processo de valida¸cão cruzada de modo que identificasse o valor que produzisse menor erro quadrático médio. Quando λ = 0, não há efeito o termo de penaliza¸cão, e as estimativas correspondem a máxima verossimilhan¸ca, já quando λ → ∞, o termo será tão forte que as estimativas ficarão próximas de zero.

Além da sele¸cão de covariáveis, o estudo analisou e comparou entre as fun¸cões de liga¸cão Logito, Probito, Cauchy e Complemento Log-Log, a que fosse mais adequada, tendo por base a liga¸cão que oferecesse o menor valor pelo Critério BIC. Para o segundo modelo, foi empregada a Análise de Compo-nentes Principais (PCA), a qual é uma técnica multivariada que tem por objetivo obter um conjunto de novas covariáveis, a partir das variáveis originais, de modo que um reduzido número de novas variáveis possam ter capacidade de explanar a varia¸cão dos dados. Este novo conjunto de variáveis são tais que o primeiro é aquele capaz de explicar a maior parte da varia¸cão, o segundo explica a maior parte não explicada pelo primeiro, e assim sucessivamente.

Por fim, através dos gráficos de res´ıduos quant´ılicos aleatorizados e de Half-Normal Plots com enve-lopes simulados foi verificado o diagnóstico de ajuste dos modelos.

3.5 Poder Preditivo do Modelo

Para a avalia¸cão do poder preditivo dos modelos propostos, foi separada aleatoriamente em duas partes, uma por¸cão dos dados para o ajuste e outra para a valida¸cão. Estes últimos foram usados para avaliar a predi¸cão dos modelos. Para medir essa predi¸cão foi usada a Curva ROC. Ela possibilita que seja analisado o poder preditivo associado a diferentes regras de decisão por valores p0, permitindo ainda

que seja verificado conjuntamente a sensibilidade e especificidade para os valores de p0. Quanto mais

(7)

4 Resultados e Discuss˜

ao

4.1 An´

alise Explorat´

oria

A análise primária da base de dados, que consiste de 18 variáveis, necessitou da redu¸cão de sua dimensão. Após os processos de sele¸cão Stepwise, chegaram-se a dez variáveis, descritas na tabela 1. Na análise dos boxplots (figura 1), pode-se notar uma dispersão acentuada nas variáveis ”skew-ness major axis”, ”pr axis aspect ratio”e ””max length aspect ratio”. Antes da realiza¸cão da análise, foi necessária a conversão da variável denotando os ve´ıculos como um fator de dois n´ıveis. Estes n´ıveis indicavam se o ve´ıculo era um ônibus ou não − escolheu-se o ônibus em rela¸cão aos demais ve´ıculos em fun¸cão de possuir maior frequência dentre os quatro.

4.2 Ajuste do Modelo

Não houve necessidade de transforma¸cão das variáveis, sendo que os resultados do modelo log-linearizado saturado se assemelharam aos resultados do modelo saturado com as variáveis em n´ıvel. Foram testadas combina¸cões quadráticas e elementos de intera¸cão entre as variáveis, e o modelo linear se ajustou melhor em rela¸cão aos demais. O fatores de infla¸cão da variância (VIFs) apontaram forte multicolinearidade. Como tentativa de corre¸cão do problema, foi utilizado o método de regulariza¸cão lasso. A regressão oriunda dos procedimentos resultou em um baixo valor de ˆλ e apontou a retirada de duas variáveis1_{. Os coeficientes associados `}_{as vari´}_{aveis na regress˜}_{ao lasso apresentaram valor similar aos}

apresentados no modelo saturado, o que levou à tentativa de regulariza¸cão e sele¸cão das variáveis por meio do procedimento Stepwise e análise por componentes principais.

Em rela¸cão ao primeiro caso, realizou-se a sele¸cão por meio do algoritmo Step, por meio de duas regressões: forward e backward, utlizando-se o critério Bayesiano de Schwarz (BIC). Dentre os dois modelos, o backward apresentou menor valor de BIC, resultando em um modelo com dez covariáveis. Posteriormente, foi selecionada a fun¸cão de liga¸cão que apresentou menor valor pelo critério de Schwarz, selecionando-se a fun¸cão logito2_{. As vari´}_{aveis selecionadas ainda apresentaram fator de variˆ}_ancia

infla-cionado. A remo¸cão daquelas com maiores VIFs aumentou muito o erro, fazendo com que os pontos denotando os res´ıduos em fun¸cão dos quantis teóricos excedessem demasiadamente os envelopes de con-fian¸ca nos half-normal plots.

A solu¸cão encontrada foi remover as variáveis de maior dispersão, as quais foram skewness major axis, pr axis aspect ratio e max length aspect ratio. A tabela 1 exibe os resultados do modelo de regressão selecionado (Mstep)3_:

Tabela 1: Regress˜ao Mstep

Variável Parâmetro Estimado Erro Padrão p-valor Intercepto 25.741839 7.362029 0.000471*** distance circularity -0.343348 0.034572 2e-16*** radius ratio 0.002959 0.009394 0.752797 elongatedness -0.553669 0.066609 2e-16*** scaled radius gyration 0.044982 0.008819 3.38e-07*** skewness minor axis -0.252943 0.040747 5.38e-10*** kurtosis minor axis 0.019031 0.019243 0.322670 kurtosis major axis 0.718355 0.085416 2e-16*** hollows ratio -0.614777 0.071653 2e-16***

Pode-se notar pelos resultados que as variáveis ”radius ratio” e ”kurtosis minor axis” não foram significativas a 1% de significância. A análise mostrou que distance circularity, elongatedness, skew-ness minor axis e hollows ratio apresentaram resposta negativa em rela¸cão ao fato de a silhueta ser de um ônibus, o que denota que quanto mais ocos a figura tiver, mais assimétrica for no menor eixo, maior

1_{As vari´}_{aveis s˜}_{ao ”max length rectangularity”e ”scatter ratio”}

2_{As fun¸}_c˜_{oes de liga¸}_c˜_{ao logito, probito, cloglog e Cauchy apresentaram valores de 204.74, 207.06, 216.43 e 212.45,}

respectivamente

(8)

a sua circularidade e mais alongada, menor a chance de ser um ônibus. Por outro lado, as variáveis ra-dius ratio, scaled rara-dius gyration e kurtosis major axis apresentaram coeficiente positivo, indicando que quanto maior a razão do raio, maior o raio de rota¸cão escalado e maior a curtose do eixo maior, maior é a probabilidade de a variável resposta ser um ônibus.

Os Half-normal plots evidenciaram que os res´ıduos encontram-se dentro dos envelopes de confian¸ca estipulados, assim como o fato de que os quantis amostrais seguem uma distribui¸cão normal em rela¸cão aos quantis teóricos. O teste de Shapiro-Wilk apresentou 0,5735 como p-valor, significando também a distribui¸cão normal dos res´ıduos.

Apesar de bem ajustado, o modelo ainda sofreu de elevada colinearidade, o que suscitou a utiliza¸cão de uma análise de componentes principais como forma de debelar o problema. A figura 2 denota a influência dos componentes, os quais são combina¸cões lineares das variáveis do modelo, já ajustados pela sua escala.

Figura 2: An´alise de Componentes Principais

Após sucessivas combina¸cões de componentes, ajustou-se um modelo que melhor se comportou dentro dos half-normal plot, ao mesmo tempo que reduziu a deviance residual. Foram também realizados testes para verificar qual fun¸cão de liga¸cão mais reduziria o erro pelo critério de Schwarz, sendo que os valores encontrados se assemelharam. Desta forma, com vistas à possibilidade de compara¸cão dos modelos, optou-se pela fun¸cão de liga¸cão logito. Os resultados encontram-se na tabela 24_:

Tabela 2: Regress˜ao Mpca

Variável Parâmetro Estimado Erro Padrão p-valor Intercepto -1.33584 0.09860 2e-16*** CP1 0.03180 0.02777 0.25205 CP2 -0.45905 0.05386 2e-16*** CP3 0.14874 0.05623 0.00816** CP4 0.19134 0.09321 0.04009* CP5 0.78781 0.10548 8.09e-14*** ´

E poss´ıvel verificar que o primeiro componente não foi significativo, ao passo que CP2, CP5 e o intercepto foram significativos ao n´ıvel de significância de 1%, CP3 foi significativo ao n´ıvel de 5% e CP4 o foi ao n´ıvel de 10%. Isso demonstra que a maior parte das variáveis correlacionadas, que detêm 52% da variância do modelo, não explicam o regressando. Isso ocorreu porque o primeiro componente é dominado pela variável scaled variance minor axis, a qual foi não se apresentou significativa no modelo saturado.

(9)

A figura 3 mostra a qualidade dos ajustes dos dois modelos, denotados por ”Mstep”(modelo ajus-tado com método stepwise) e ”Mpca”(modelo ajustado pelo método de componentes principais). A análise mostra que possuem res´ıduos totalmente involucrados nos envelopes de confian¸ca, assim como a distribui¸cão dos quantis amostrais seguem uma distribui¸cão normal em rela¸cão aos quantis teóricos.

Figura 3: Half-normal plots e qqplots dos modelos

Como o modelo Mstep ainda apresentou fator de infla¸c˜ao de variˆancia elevado, utilizou-se somente o modelo Mpca como preditor.

4.3 Predi¸

c˜

ao do Modelo

Foram utilizados dados de valida¸cão como forma de comprova¸cão da capacidade de ajuste do modelo Mpca: retirou-se 1/3 da amostra para valida¸cão. A figura 4 evidencia a curva ROC para o modelo ajustado, utilizando o ajuste completo: o valor encontrado sob a curva foi de 75%, o que indica a adequa¸cão do modelo como preditor de quando o ve´ıculos será um ônibus ou não:

Figura 4: Curva ROC ajustada

(10)

especificidades. A tabela 3 mostra as diferentes medidas associadas a cada uma das probabilidades:

Tabela 3: Sensibilidade e Especificidade

Probabilidade Sensibilidade Especificidade 0.3 0.65476190 0.7171717 0.5 0.27380952 0.9292929 0.7 0.02380952 0.9949495

Considerando-se, por exemplo, que uma empresa que gerencia estacionamentos deseja saber que tipo de ve´ıculo trafega em suas imedia¸cões, é prefer´ıvel classificar o ve´ıculo como sendo um ônibus quando ele não é (Erro Tipo I), uma vez que é melhor alocar espa¸co e não utilizá-lo a não ter mais vagas. Logo, prefere-se uma maior sensibilidade a uma maior especificidade, o que indica que o ponto de corte de 0.3 ´

e mais indicado para esta situa¸c˜ao.

5 Conclus˜

ao

O modelo linear generalizado se mostrou o instrumento correto para a análise do problema, não obstante os problemas decorrentes da colinearidade forte entre as variáveis. As tentativas de regulariza¸cão do problema resultaram em um modelo bem ajustado e com poder preditivo maior, ainda que ao custo de sua interptretabilidade. Nota-se também que o esfor¸co por captar medidas para avaliar a imagem resultante da silhueta dos ve´ıculos foi demasiado, uma vez que boa parte das medidas, contidas no primeiro componente, dominado pela variável scatter ratio, foi não significativo.

Uma poss´ıvel extensão deste trabalho seria a verifica¸cão da probabilidade de a silhueta ser outro tipo de ve´ıculo, comparando o modelo que melhor se ajusta e as variávies que melhor compõem a probabilidade de resposta a determinado fator.

6 Referˆ

encias

PAULA, Gilberto A. MODELOS DE REGRESS ÃO com apoio computacional.Instituto de Matemática e Estat´ıstica Universidade de São Paulo. São Paulo: 2013.