Modelos lineares generalizados - IBM SPSS Advanced Statistics 26 IBM

O modelo linear generalizado expande o modelo linear geral de modo que a variável dependente seja linearmente relacionada com os fatores e as covariáveis através de uma função de ligação especificada. Além do mais, o modelo permite que a variável dependente tenha uma distribuição não normal. Ele cobre modelos estatísticos amplamente utilizados, tais como regressão linear para respostas distribuídas normalmente, modelos logísticos para dados binários, modelos log-lineares para dados de contagem, modelos log-log complementares para dados de sobrevivência com censura intervalar, além de muitos outros modelos estatísticos através de sua formulação de modelo muito geral.

Exemplos. Um companhia de navegação pode usar modelos lineares generalizados para ajustar uma

regressão de Poisson às contagens de danos para diversos tipos de navios construídos em períodos de tempo diferentes e o modelo resultante pode ajudar a determinar quais tipos de navios são mais propensos a dano.

Uma empresa automobilística pode usar modelos lineares generalizados para ajustar uma regressão de gama às reclamações de danos para carros e o modelo resultante pode ajudar a determinar os fatores que contribuem mais com o tamanho da reclamação.

Pesquisadores médicos podem usar modelos lineares generalizados para ajustar uma regressão log-log complementar aos dados de sobrevivência censurados por intervalo para predizer o tempo para recorrência para uma condição médica.

Considerações de Dados de Modelos Lineares Generalizados

Dados. A resposta pode ser escala, contagens, binária ou eventos em avaliações. Fatores são considerados

categóricos. As covariáveis, a ponderação de escala e o offset são considerados escala.

Suposições. Casos são considerados observações independentes.

Para Obter um Modelo Linear Generalizado Nos menus, escolha:

1. Especifique uma função de distribuição e de ligação (veja abaixo para obter detalhes sobre as várias opções).

2. Na guia Resposta, selecione uma variável dependente.

3. Na guia Preditores, selecione fatores e covariáveis para uso na predição da variável dependente. 4. Na guia Modelo, especifique efeitos do modelo usando os fatores e as covariáveis selecionados. A guia Tipo de Modelo permite que você especifique a função de distribuição e de ligação para o seu modelo, fornecendo atalhos para vários modelos comuns que são categorizados por tipo de resposta. Tipos de modelo

Resposta Escalar. As seguintes opções estão disponíveis:

v Linear.Especifica Normal como a distribuição e Identidade como a função de ligação.

v Gama com ligação de log. Especifica Gama como a distribuição e Log como a função de ligação.

Resposta Ordinal. As seguintes opções estão disponíveis:

v Logística Ordinal. Especifica Multinomial (ordinal) como a distribuição e Logit Acumulativo como a função de ligação.

v Probito Ordinal. Especifica Multinomial (ordinal) como a distribuição e Probito acumulativo como a função de ligação.

Contagens. As seguintes opções estão disponíveis:

v Poisson log-linear.Especifica Poisson como a distribuição e Log como a função de ligação. v Binomial negativa com ligação de log.Especifica Binomial negativa (com um valor 1 para o

parâmetro auxiliar) como a distribuição e Log como a função de ligação. Para que o procedimento estime o valor do parâmetro auxiliar, especifique um modelo customizado com distribuição Binomial negativa e selecione Estimar valor no Grupo paramétricas.

Resposta Binária ou Dados de Eventos/Avaliações. As seguintes opções estão disponíveis: v Logística binária.Especifica Binomial como a distribuição e Logit como a função de ligação. v Probito binário.Especifica Binomial como a distribuição e Probito como a função de ligação. v Sobrevivência censurada de intervalo.Especifica Binomial como a distribuição e Log-log

complementar como a função de ligação.

Mistura. As seguintes opções estão disponíveis:

v Tweedie com ligação de log.Especifica Tweedie como a distribuição e Log como a função de ligação. v Tweedie com ligação de identidade.Especifica Tweedie como a distribuição e Identidade como a

função de ligação.

Customizada. Especifique a sua própria combinação de distribuição e função de ligação. Distribuição

Essa seleção especifica a distribuição da variável dependente. A capacidade para especificar uma

distribuição não normal e a função de ligação de não identidade é a melhoria essencial do modelo linear generalizado sobre o modelo linear geral. Há muitas combinações de função de ligação de distribuição e diversas podem ser apropriadas para qualquer conjunto de dados especificado, de forma que a sua opção possa ser guiada por considerações teóricas a priori ou pela combinação que se ajuste melhor.

v Binomial.Essa distribuição é apropriada somente para variáveis que representam uma resposta binária ou um número de eventos.

v Gama.Essa distribuição é apropriada para variáveis com valores de escala positiva que são desviados em direção a valores positivos maiores. Se um valor de dados for menor que ou igual a 0 ou estiver omisso, então, o caso correspondente não será usado na análise.

v Gaussiano Inversa.Essa distribuição é apropriada para variáveis com valores de escala positiva que são desviados em direção a valores positivos maiores. Se um valor de dados for menor que ou igual a 0 ou estiver omisso, então, o caso correspondente não será usado na análise.

v Binomial negativa.Essa distribuição pode ser considerada como o número de avaliações necessárias para observar sucessos k e é apropriada para variáveis com valores de número inteiro não negativo. Se um valor dos dados for não inteiro, menor que 0 ou omisso, então, o caso correspondente não será usado na análise. O valor do parâmetro auxiliar da distribuição binomial negativa pode ser qualquer número maior que ou igual a 0; é possível configurá-lo para um valor fixo ou permitir que ele seja estimado pelo procedimento. Quando o parâmetro auxiliar é configurado como 0, usar essa distribuição é equivalente a usar a distribuição de Poisson.

v Normal.Isso é apropriado para variáveis de escala cujos valores usam uma distribuição simétrica, em forma de sino sobre um valor (média) central. A variável dependente deve ser numérica.

v Poisson.Essa distribuição pode ser considerada como o número de ocorrências de um evento de interesse em um período de tempo fixo e é apropriada para variáveis com valores de número inteiro não negativo. Se um valor dos dados for não inteiro, menor que 0 ou omisso, então, o caso

correspondente não será usado na análise.

v Tweedie.Essa distribuição é apropriada para variáveis que podem ser representadas por misturas de Poisson de distribuições gama; a distribuição é "mista" no sentido de que ela combina propriedades de distribuições contínuas (usa valores reais não negativos) e distribuições discretas (massa de

probabilidade positiva a um valor único, 0). A variável dependente deve ser numérica, com valores dos dados maiores que ou iguais a zero. Se um valor de dados for menor que zero ou omisso, então, o caso correspondente não será usado na análise. O valor fixo do parâmetro da distribuição Tweedie pode ser qualquer número maior que um e menor que dois.

v Multinomial.Essa distribuição é apropriada para variáveis que representam uma resposta ordinal. A variável dependente pode ser numérica ou sequência de caracteres e ela deve ter pelo menos dois valores dos dados válidos distintos.

Funções de Ligação

A função de ligação é uma transformação da variável dependente que permite estimação do modelo. As funções a seguir estão disponíveis:

v Identidade. f(x)=x. A variável dependente não é transformada. Essa ligação pode ser usada com

qualquer distribuição.

v Log-log complementar. f(x)=log(−log(1−x)). Isso é apropriado apenas com a distribuição binomial.

v Cauchit Acumulativo. f(x) = tan(π (x – 0.5)), aplicado à probabilidade acumulativa de cada categoria da

resposta. Isso é apropriado apenas com a distribuição multinomial.

v Log-log complementar acumulativo. f(x)=ln(−ln(1−x)), aplicado à probabilidade acumulativa de cada

categoria da resposta. Isso é apropriado apenas com a distribuição multinomial.

v Logit acumulativo. f(x)=ln(x / (1−x)), aplicado à probabilidade acumulativa de cada categoria da

resposta. Isso é apropriado apenas com a distribuição multinomial.

v Log-log negativo acumulativo. f(x)=−ln(−ln(x)), aplicado à probabilidade acumulativa de cada

categoria da resposta. Isso é apropriado apenas com a distribuição multinomial.

v Probito Acumulativo. f(x)=Φ−1(x), aplicado à probabilidade acumulativa de cada categoria da resposta, em que ⁻¹é a função de distribuição a acumulativa normal padrão inversa. Isso é apropriado apenas com a distribuição multinomial.

v Log. f(x)=log(x). Essa ligação pode ser usada com qualquer distribuição.

v Complemento de log. f(x)=log(1−x). Isso é apropriado apenas com a distribuição binomial. v Logit. f(x)=log(x / (1−x)). Isso é apropriado apenas com a distribuição binomial.

v Binomial negativa.f(x)=log(x / (x+k⁻¹)), em que k é o parâmetro auxiliar da distribuição binomial negativa. Isso é apropriado apenas com a distribuição binomial negativa.

v Log-log negativo. f(x)=−log(−log(x)). Isso é apropriado apenas com a distribuição binomial.

v Poder das chances. f(x)=[(x/(1−x))α−1]/α, if α ≠ 0. f(x)=log(x), if α=0. for a especificação de número necessária e deve ser um número real. Isso é apropriado apenas com a distribuição binomial. v Probito. f(x)=Φ−1(x), em que −1é a função de distribuição acumulativa normal padrão inversa. Isso é

apropriado apenas com a distribuição binomial.

v Poder. f(x)=x^α, if α ≠ 0. f(x)=log(x), if α=0. for a especificação de número necessária e deve ser um número real. Essa ligação pode ser usada com qualquer distribuição.

No documento IBM SPSS Advanced Statistics 26 IBM (páginas 32-35)