• Nenhum resultado encontrado

O gráfico 12 mostra o resultado da regressão logística que empregou o método de seleção Forward, listando os coeficientes que foram selecionados, bem como a soma do valor absoluto da representatividade dos seus Valores-T, que são os coeficientes divididos pelo seu erro padrão.

Gráfico 12 - Resultado Regressão Logística – Variáveis e seus Valores-T

A tabela 7 mostra a estatística do chi-quadrado de Wald - que testa a significância de cada variável em relação às demais do modelo - listando as variáveis que entraram efetivamente no mesmo, suas descrições, graus de liberdade, e o valor-p da estatística de Wald.

Tabela 7 - Regressão Logística – Teste de Significância

Variável Descrição da variável GL Chi-quadrado de Wald Pr > Chi2

RENDA Renda Demográfica 1 31,61 <,0001

GRP_CDESTCIV Agrupamento do Estado Civil 2 6.924,81 <,0001

GRP_IDADE Agrupamento de Idade 8 434,16 <,0001

GRP_REG_DDD Agrupamento de Estado / Capital X Interior 3 470,65 <,0001 DT_TMK24_TOT Nº de Disponibilizações no Telemarketing 24 meses 1 54,67 <,0001 GRP_MESREF_RISCO Agrupamento Ano de obtenção do pré-aprovado 2 898,88 <,0001

A tabela 8 mostra a análise para cada categoria de cada variável, os coeficientes da equação (na forma da equação logística e o exponencial), a estatística chi-quadrado de Wald, e o conseqüente Valor-p (quanto menor, significa que a chance de o valor observado ser diferente do esperado se deva menos ao acaso), além dos intervalos de confiança de 95%.

Tabela 8 - Regressão Logística – Análise Detalhada dos Coeficientes

A tabela 9 mostra o risco relativo das variáveis. O risco relativo mostra que, quanto mais distante do valor um, maior é a chance de aquela variável determinar a venda de um cartão em relação a uma não venda. Valores mais próximos de um são relativamente neutros, não afetando em muito a chance da ocorrência do evento de venda. Por exemplo, se o ano de obtenção do pré-aprovado for “Sem Informação” versus 2003, a chance de contratação é 6,17 vezes maior.

Tabela 9 - Regressão Logística – Risco Relativo

Variável Descrição Domínio Coeficiente Erro Padrão Chi2 de Wald Pr > Chi2 e(coeficiente)

Intercept Intercepto -0,4707 0,048 95,10 <,0001 0,63 -0,5654 -0,3761

renda Renda valor da renda -0,0001 0,000 31,61 <,0001 1,00 -0,0002 -0,0001

GRP_CDESTCIV 1 Agrupamento Estado Civil 1 7 - Casado 2,3133 0,032 5.307,83 <,0001 10,11 2,2511 2,3755

GRP_CDESTCIV 2 Agrupamento Estado Civil 2 2 - Solteiro -1,0014 0,042 559,33 <,0001 0,37 -1,0844 -0,9184

GRP_IDADE 1 Agrupamento de Idade 1 Sem Informação -1,7977 0,104 301,06 <,0001 0,17 -2,0007 -1,5946

GRP_IDADE 2 Agrupamento de Idade 2 Idade < 22 anos 0,5448 0,071 59,39 <,0001 1,72 0,4062 0,6833

GRP_IDADE 3 Agrupamento de Idade 3 22 <= Idade < 24 anos 0,2890 0,071 16,82 <,0001 1,34 0,1509 0,4272

GRP_IDADE 4 Agrupamento de Idade 4 24 <= Idade < 32 anos 0,0167 0,045 0,14 0,7091 1,02 -0,0709 0,1042

GRP_IDADE 5 Agrupamento de Idade 5 32 <= Idade < 47 anos 0,0428 0,042 1,04 0,3071 1,04 -0,0393 0,1250

GRP_IDADE 6 Agrupamento de Idade 6 47 <= Idade < 48 anos 1,0884 0,106 106,36 <,0001 2,97 0,8815 1,2952

GRP_IDADE 7 Agrupamento de Idade 7 48 <= Idade < 52 anos 0,0860 0,074 1,34 0,2477 1,09 -0,0598 0,2319

GRP_IDADE 8 Agrupamento de Idade 8 52 <= Idade < 56 anos 0,0033 0,077 0,00 0,9661 1,00 -0,1477 0,1542

GRP_REG_DDD 1 Agrupamento Estado / Capitais 1 Vide tabela 5 0,6959 0,050 193,03 <,0001 2,01 0,5977 0,7941

GRP_REG_DDD 2 Agrupamento Estado / Capitais 2 Vide tabela 5 0,5881 0,039 227,63 <,0001 1,80 0,5117 0,6645

GRP_REG_DDD 3 Agrupamento Estado / Capitais 3 Vide tabela 5 0,1617 0,036 19,87 <,0001 1,18 0,0906 0,2328

DT_TMK24_TOT Nº Disponibilizações no telemarketing 24 meses valor nº disp. -0,1404 0,019 54,67 <,0001 0,87 -0,1777 -0,1032

GRP_MESREF_RISCO 1 Ano de concessão do crédito pré-aprovado 1 Sem Informação 1,0067 0,034 889,83 <,0001 2,74 0,9406 1,0729

GRP_MESREF_RISCO 2 Ano de concessão do crédito pré-aprovado 2 2004, 2005, 2006 -0,1944 0,030 42,84 <,0001 0,82 -0,2526 -0,1362

IC 95%

Variável Descrição Faixas e valores Risco Relativo

renda Renda demográfica 1,00 GRP_CDESTCIV Agrupamento Estado Civil 1 vs 3 37,53 GRP_CDESTCIV Agrupamento Estado Civil 2 vs 3 1,36 GRP_IDADE Agrupamento Idade 1 vs 9 0,22 GRP_IDADE Agrupamento Idade 2 vs 9 2,27 GRP_IDADE Agrupamento Idade 3 vs 9 1,76 GRP_IDADE Agrupamento Idade 4 vs 9 1,34 GRP_IDADE Agrupamento Idade 5 vs 9 1,37 GRP_IDADE Agrupamento Idade 6 vs 9 3,90 GRP_IDADE Agrupamento Idade 7 vs 9 1,43 GRP_IDADE Agrupamento Idade 8 vs 9 1,32 GRP_REG_DDD Agrupamento Estado X Capitais 1 vs 4 8,51 GRP_REG_DDD Agrupamento Estado X Capitais 2 vs 4 7,64 GRP_REG_DDD Agrupamento Estado X Capitais 3 vs 4 4,99 DT_TMK24_TOT Nº Disponibilizações no telemarketing 0,87 GRP_MESREF_RISCO Ano de obtenção do pré-aprovado 1 vs 3 6,17 GRP_MESREF_RISCO Ano de obtenção do pré-aprovado 2 vs 3 1,86

Também é interessante analisar a tabela de classificação no gráfico 13, que mostra o quanto o que foi previsto está de acordo com o que foi observado. Ou seja, avalia o quanto o modelo previu de vendas versus as vendas observadas, e o quanto o modelo previu de não vendas versus as não vendas observadas. Modelos válidos devem necessariamente apresentar uma taxa significativamente maior de acertos na previsão, o que é o caso.

Gráfico 13 – Classificação: Previsto X Real – Regressão logística

É importante ressaltar que, durante o desenvolvimento do modelo, diversas variáveis foram testadas, discriminaram bem, mas estavam fortemente correlacionadas com outras (maior do que 0,7). Um exemplo claro é a variante do cartão. Como a variante é calculada a partir do limite de crédito, que por sua vez é determinado a partir da renda, pode-se apenas utilizar uma das duas: renda ou variante. O mesmo ocorreu para UF – Unidade federativa e DDD – Código de Discagem a Distância, pois mesmo sem verificar a correlação de fato entre elas, a própria geografia as correlaciona. No desenvolvimento do modelo de regressão logística também foram testadas as interações - ver Hosmer e Lemeshow (2000) - entre todas as variáveis, duas a duas.

OBSERVADO Não Venda Venda Total Não Venda 8.845 1.081 9.926

Venda 1.632 8.283 9.915 Total 10.477 9.364 19.841

No entanto, os efeitos das interações não demonstraram ser significativos para as variáveis em questão.

Analisando as variáveis que entraram no modelo, conclui-se que elas fazem sentido do ponto de vista do negócio, bem como do que se tem de informações disponíveis dos clientes potenciais. Ao contrário dos modelos de correntistas, dos quais se dispõe de uma quantidade maior de informações, oriundas do relacionamento prévio, os não correntistas carecem de informações mais individualizadas, pois o que se sabe é basicamente onde moram, sua renda demográfica inferida (sujeita a muitos erros, pois há diferentes padrões de residências que às vezes coexistem no mesmo CEP), sua idade, estado civil, e seu sexo. E foram basicamente essas variáveis que fizeram parte do resultado final do modelo.

4.2 Árvore de Decisão - Gini

O esquema 8 mostra uma visão parcial da árvore de decisão que utilizou o índice Gini como critério de divisão, restringindo a profundidade a três níveis, para fins de apresentação (o modelo final contou com uma profundidade de cinco níveis). Observa-se, na ordem dentro dos retângulos: percentual de eventos de venda e não venda (1 e 0), número de vendas e não vendas, e total do nó. Abaixo dos nós, ficam as variáveis selecionadas para a divisão, até que se chegue às folhas, quando as divisões adicionais não trazem mais pureza.

Documentos relacionados