• Nenhum resultado encontrado

Denominamos variáveis independentes derivadas aquelas que foram obtidas a partir das variáveis independentes originais por meio de algum tipo de cálculo ou lógica. A seguir, mostramos como elas foram definidas.

Dados da Transação

1. Dia da Semana da Transação: foi obtido o dia da semana correspondente à data da transação.

2. Período da Transação: através do horário da transação, registramos se a transação ocorreu pela manhã, tarde, noite ou madrugada.

3. Categoria Valor da Transação: os valores da transação foram categorizados con- forme o nível de risco de transações fraudulentas.

4. Número de Parcelas da Transação: número de parcelas escolhido pelo comprador. 5. Categoria do BIN: o BIN do cartão foi classificado em grupos de acordo com o índice de fraude da quantidade das transações em pontos base - basis points - (#Frau- des/#Transações x 10.000).

6. Tempo de Validade do Cartão: diferença entre data de expiração do cartão e data da transação.

7. Ticket Médio do Estabelecimento: soma dos valores das transações dividida pela quantidade de transações do estabelecimento.

8. Valor da Transação Maior que Ticket Médio: verifica se o valor da transação é maior que o valor do ticket médio das transações do estabelecimento.

9. Percentil 95 da Transação: verifica se o valor da transação é maior que o valor do percentil 95 das transações do estabelecimento.

10. Limite Superior da Transação: é o valor do ticket médio somado a três vezes o desvio padrão dividido pela raiz quadrada da quantidade de transações no período especificado do estabelecimento.

11. Diferença Valor Transação e Ticket Médio: diferença do valor da transação e o ticket médio do estabelecimento agrupados em categorias.

12. Diferença Valor Transação e Percentil 95: diferença do valor da transação e o percentil 95 do estabelecimento agrupados em categorias.

13. Diferença Valor Transação e Limite Superior : diferença do valor da transação e limite superior do estabelecimento agrupados em categorias.

6.5 VARIÁVEIS INDEPENDENTES DERIVADAS 63

Dados do Comprador

14. Tempo de Filiação do Comprador: obtido pelo cálculo da diferença entre a data da transação e a data de filiação do comprador em dias.

15. Idade do Comprador: obtido pelo cálculo da diferença entre a data da transação e a data de nascimento do comprador em anos.

16. Estado Comprador: os estados nos quais estavam localizados os compradores no momento da transação foram padronizados para evitar erros previsíveis de categoriza- ção, como, por exemplo,“SP” e “São Paulo” serem classificados em categorias distintas. Dessa maneira, temos 27 estados e uma categoria “default” para dados faltantes. 17. Estado do CPF do Comprador: estado de emissão do CPF do comprador obtido

pela verificação do nono dígito do número de CPF.

18. Estado do Telefone do Comprador: estado de registro do número de telefone infor- mado pelo comprador e identificado pelos dois dígitos do número de telefone conforme tabela do DDD (discagem direta à distância) de cada cidade ou região.

19. Região do CEP: região a que pertence o CEP informado pelo comprador, obtido pela verificação do primeiro dígito do número que compõe o CEP.

20. Subregião do CEP: subregião a que pertence o CEP informado pelo comprador, obtido pela verificação do segundo dígito do número que compõe o CEP.

21. Setor do CEP: setor a que pertence o CEP informado pelo comprador, obtido pela verificação do terceiro dígito do número que compõe o CEP.

22. Tamanho do E-mail: número de caracteres do e-mail usado na compra. 23. Domínio do E-mail: domínio do e-mail utilizado pelo comprador.

24. Tamanho do E-mail Categorizado: tamanho do e-mail agrupado em categorias.

Dados do Titular do Cartão de Crédito Usado na Compra

25. Idade do Titular do Cartão

26. Idade do Titular do Cartão Categorizado 27. Estado do CPF do Titular do Cartão 28. Estado do Telefone do Titular do Cartão

64 METODOLOGIA DO EXPERIMENTO 6.5

Dados do Estabelecimento

29. Tempo de Filiação do Estabelecimento por Período: obtido pelo cálculo da di- ferença entre a data da transação e a data de filiação do estabelecimento e categorizado em períodos mensais.

30. Tempo de Filiação do Estabelecimento em Dias: diferença entre a data da transação e a data de filiação do estabelecimento em dias agrupados em categorias.

Comparações

31. Comparação CPF: comparação do CPF do comprador e do titular do cartão. 32. Comparação Datas de Nascimento: comparação entre as datas de nascimento do

comprador e do titular do cartão.

33. Comparação Diferença Datas de Nascimento: diferença entre a data de nasci- mento do comprador e do titular do cartão em meses.

34. Comparação Telefone: comparação do telefone do comprador e do titular do cartão. 35. Comparação Telefone e CEP: verifica se o telefone e CEP informados pelo com-

prador estão na mesma região.

36. Comparação Telefone e CPF: verifica se o telefone e CPF informados pelo com- prador estão na mesma região.

37. Comparação CEP e CPF: verifica se o CEP e CPF informado pelo comprador estão na mesma região.

38. Comparação OSA1: comparação do e-mail do comprador e o nome do titular do

cartão pelo algoritmo OSA5.

39. Comparação OSA2: comparação do nome do comprador e nome titular do cartão pelo algoritmo OSA.

40. Comparação OSA3: comparação do nome do comprador e e-mail do comprador pelo algoritmo OSA.

41. Comparação QGRAM1: comparação do e-mail do comprador e o nome do titular

do cartão pelo algoritmo QGRAM6 usando tamanho da subsequência igual a 1.

5

Optimal String Alignment distance (OSA), ou distância de alinhamento de string ótima, é parecido com a distância de edição (Levenshtein), que é dada pelo número mínimo de operações necessárias para transformar uma string em outra. Porém, também permite a transposição de caracteres adjacentes e cada substringpodem ser editada apenas uma vez.

6

Q-gram é uma subsequência de q caracteres consecutivos de uma seqüência. Se x(y) é um vetor que conta a ocorrência de q-gram em a(b), sendo a e b as sequências comparadas, a distância de q-gram é dada pela soma das diferenças absolutas de |xi− yi|. O cálculo é anulado quando q é maior do que o comprimento

6.7 VALOR DA INFORMAÇÃO E PESO DA EVIDÊNCIA 65 42. Comparação QGRAM2: comparação do nome do comprador e nome titular do

cartão pelo algoritmo QGRAM usando tamanho da subsequência igual a 1.

43. Comparação QGRAM3: comparação do nome do comprador e e-mail do comprador pelo algoritmo QGRAM usando tamanho da subsequência igual a 1.

Documentos relacionados