• Nenhum resultado encontrado

Framework OVERVIEW DATA QUALITY QUEM? ONDE? PROSPECTS

N/A
N/A
Protected

Academic year: 2021

Share "Framework OVERVIEW DATA QUALITY QUEM? ONDE? PROSPECTS"

Copied!
21
0
0

Texto

(1)

LOGO DO

SHOPPING

(2)

OVERVIEW

DATA QUALITY

QUEM ?

ONDE ?

PROSPECTS

(3)
(4)

Informações gerais

Base externa que

apresenta os atributos de

endereço, CPF, telefone e

e-mail sem padronização,

normatização e

consistência.

Problema Apresentado

Analisar, tratar e

padronizar os atributos de

endereço, CPF, telefone e

e-mail

Objetivo

Nome

(campo a ser tratado)

CPF

(campo a ser tratado)

Endereço

(campo a ser tratado)

E-mail

(campo a ser tratado)

Telefone

(campo a ser tratado)

Celular

(campo a ser tratado)

(5)

Fotografia da base

676.464

Registros

Recebidos

91%

(619.108) registros únicos

Cenário pós de-duplicação

Registros enriquecidos

(49%)

307.853

Atributos Adicionados

• HOUSE_HOLD_QTD

• HOUSE_HOLD_CLASSE

• FAIXA_RENDA

• CLASSE

• CBO

• GRAU_INSTRUCAO

• CNPJ_TRABALHA

• CNPJ_SOCIO

(6)
(7)

Endereço

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

Endereço Confirmado

253.956

Endereço Inválido

3.513

138.623

Endereços inválidos enriquecidos

Correção de endereço sugerida

3.130

Endereço Recuperado

7.646

Com Endereço

406.870

Sem

Endereço

212.237

65%

34%

(8)

Endereço

1.000.000

Sem

Endereço

900.000

82%

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

Ce

nário comparativo

PRÉ TRATAMENTO

253.956

PÓS TRATAMENTO

403.357

Crescimento

De

25%

STATUS

DESCRIÇÃO

QTD

%

0 Inválidos 215751 35% 1 Endereço confirmado 247.360 40%

2 Endereço confirmado, logradouro corrigido 460 0% 3 Endereço confirmado, localidade corrigida, cidade de CEP único 84 0% 4 Endereço padronizado, localidade corrigida, cidade de CEP único 149 0% 5 Endereço e localidade corrigidos 246 0% 6 Endereço recuperado e localidade corrigida 5 0% 7 Endereço confirmado, logradouro recuperado, localidade corrigida, cidade de CEP único 2 0% 8 Endereço recuperado, logradouro recuperado, localidade corrigida, cidade de CEP único 1 0% 9

Endereço recuperado, logradouro recuperado utilizando CEP como entrada e métodos de contagens de

toquens para logradouro 2015 0%

10

Endereço sugerido, logradouro recuperado utilizando CEP como entrada e métodos de contagens de

toquens para logradouro 2006 0%

11 Endereço confirmado, logradouro recuperado, complemento e CEP corrigido 174 0% 12 Endereço recuperado, logradouro recuperado, complemento e CEP corrigido 31 0% 13 Endereço confirmado, logradouro confirmado, CEP corrigido 6.237 1% 14 Endereço recuperado, logradouro corrigido, CEP corrigido 460 0% 15 Endereço sugerido, logradouro corrigido, CEP corrigido 449 0% 16 Endereço recuperado, logradouro corrigido, CEP corrigido utilizando busca em profundidade nível I 81 0% 17 Endereço sugerido, logradouro corrigido, CEP corrigido utilizando busca em profundidade nível I 230 0% 18 Endereço recuperado, logradouro corrigido, CEP corrigido utilizando busca em profundidade nível II 243 0% 19 Endereço sugerido, logradouro corrigido, CEP corrigido utilizando busca em profundidade nível II 27 0% 20 Endereço confirmado, logradouro recuperado, localidade corrigida, cidade de CEP único 23 0% 21 Endereço padronizado, logradouro padronizado, cidade de CEP único 12 0% 22 Endereço confirmado, logradouro confirmado, cidade de CEP único 80 0% 23

Endereço sugerido, logradouro sugerido utilizando busca em profundidade nível IV e métodos de

contagens de toquens para logradouro 200 0% 24

Endereço sugerido, logradouro sugerido utilizando busca em profundidade nível V e métodos de

contagens de toquens para logradouro 12 0% 25 Endereço padronizado, localidade padronizada, CEP corrigido, cidade de CEP único 3.941 1% 26 Endereço sugerido, logradouro sugerido, somente CEP como parâmeto de entrada 206 0% 27 Endereço inválidos enriquecidos 138.623 22%

(9)

E-mail

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

80,0%

90,0%

100,0%

Domínios Válidos

320.362

Domínios inválidos

17.134

15.231

Registros inválidos enriquecidos

Domínios Corrigidos

0

Domínios válidos(DMEX-PING)

0

Com E-mail

352.727

Sem

E-mail

266.381

56%

44%

(10)

E-mail

1.000.000

Sem

Endereço

900.000

82%

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

Ce

nário comparativo

PRÉ TRATAMENTO

320.362

PÓS TRATAMENTO

384.593

Crescimento

De

12%

0%

20%

40%

60%

80%

100%

120%

0

1

2

3

4

STATUS

DESCRIÇÃO

QTD

0

Domínios Inválidos

17.134

1

Domínios Válidos

320.362

2

Registros enriquecidos

46.797

3

Domínios Válidos(DMEX-PING)

0

4

Registros Corrigidos

0

(11)

Telefone

0,0%

5,0%

10,0%

15,0%

20,0%

25,0%

30,0%

35,0%

40,0%

45,0%

50,0%

Telefones Válidos

122.047

Telefones Inválidos

4.345

118.884

Registros inválidos enriquecidos

Telefones Corrigidos

17.257

Telefones válidos classificados como celular

4.435

Com Telefone

266.984

Sem

Telefone

352.133

43%

57%

(12)

Telefone

1.000.000

Sem

Endereço

900.000

82%

0,0%

5,0%

10,0%

15,0%

20,0%

25,0%

30,0%

35,0%

40,0%

45,0%

Ce

nário comparativo

PRÉ TRATAMENTO

126.482

PÓS TRATAMENTO

262.623

Crescimento

De

22%

0%

100%

200%

300%

400%

500%

0

1

2

3

4

STATUS

DESCRIÇÃO

QTD

0

Telefones Inválidos

4.345

1

Telefones Válidos

122.047

2

Telefones válidos classificados como celular

4.435

3

Telefones recuperados

17.257

4

Registros Enriquecidos

118.884

(13)

CPF

Com CPF

403.692

Sem

CPF

215.416

65%

35%

57,0%

58,0%

59,0%

60,0%

61,0%

62,0%

63,0%

64,0%

65,0%

66,0%

Ce

nário

comparativo

PRÉ TRATAMENTO

373.219

PÓS TRATAMENTO

403.692

Crescimento

De

5%

(14)
(15)

Perfil Geral

82%

18%

40% 60%

60%

Mulheres

40%

Homens

63%

67%

57%

49%

48%

37%

37%

33%

43%

51%

52%

63%

AA

A

B

C

D

E

6%

15%

31%

27%

13%

8%

AA

A

B

C

D

E

Clas

se

Social

Clas

se

Social

X

Sex

o

54%

54%

54%

52%

50%

53%

87%

46%

46%

46%

48%

50%

47%

13%

18-25

26-30

31-35

36-45

46-55

56-64

64+

Idade

X

S

ex

o

14%

11%

13%

22%

11%

5%

25%

(16)

Perfil Geral

82%

18%

40% 60%

Doutorado

Mestrado

Superior Completo

Superior Incompleto

Ensino Médio Completo

Ensino Médio Incompleto

Ensino Fundamental Completo

Ensino Fundamental Incompleto

3%

5%

5%

43%

9%

34%

1%

0%

Gra

u

de

ins

truç

ão

7%

14%

30%

26%

17%

6%

AA

A

B

C

D

E

Clas

se

Social

Fa

milia

r

Agrupa

mento

Familiar

31%

28%

23%

18%

T

ra

balha

dor

e

s

por

setor

Indústria

Comércio / Serviço Empreendedor

(17)

Perfil Geral

Gru

po

Oc

upac

ional

1%

1%

1%

2%

2%

2%

2%

6%

7%

8%

Oc

upaç

ão

es

pec

íf

ica

A

B

C

D

E

F

G

H

I

J

J

Assistente Administrativo

I

Auxiliar de Escritório, Em Geral

H

Vendedor de Comercio Varejista

G

Recepcionista, Em Geral

F

Operador De Caixa

E

Supervisor Administrativo

D

Professor De nível Médio No Ensino Fundamental

C

Administrador

B

Analista De Desenvolvimento De Sistemas

A

Operador De Telemarketing Ativo E Receptivo

40%

60%

Escriturários

Vendedores e P. Serv do comércio

Trabalhadores de Atendimento ao Público

Trabalhadores dos Serviços

Gerentes

Prof das Ciências Sociais e Humanas

Técnicos De Nível Médio em Adm

Profissionais do Ensino

5%

5%

5%

5%

8%

8%

10%

22%

(18)
(19)

Onde ?

82%

18%

1%

1%

2%

3%

3%

82%

3%

3%

3%

3%

3%

3%

2%

2%

2%

2%

2%

2%

2%

2%

2%

Iraja

Olaria

Inhauma

Meier

Ramos

Tijuca

Cachambi

Pavuna

Penha

Bonsucesso

Del Castilho

Vila Da Penha

Engenho De Dentro

Higienopolis

Taquara

N

it

erói

N

ov

a

Iguaçu

Belf

ord

R

ox

o

São

J

oao

D

e

M

erit

i

D

uque

D

e

C

ax

ias

Rio

De J

aneiro

T

op

5

C

ida

de

s

T

op

15

Bairr

os

(20)
(21)

Prospects

82%

18%

23%

21%

29%

59%

65%

55%

18%

14%

16%

D

C

B

Total de Registros

3

6

a

4

5

Ano

s

1

8

a

2

5

Ano

s

60+

a 5

5

Ano

s

50546

41999

36421

20727

12754

11977

11707

9810

9613

8702

34753

15547

27233

15558

8566

9196

9303

6863

7051

6615

13514

3663

5305

4548

1412

2941

3231

1896

2615

662

Total

Telefone

Email

Referências

Documentos relacionados

f) A comprovação da regularidade fiscal e trabalhista de microempresas, empresas de pequeno porte ou cooperativas que preencham as condições estabelecidas no

Para a análise empírica dos determinantes do comércio intraindustrial entre o Brasil e os países da União Europeia e a China, foram estimados modelos econométricos

40 Andre Pereira de Queiroz / Ronaldo Rodrigues dos Santos Curitiba - Pr. 1º

neoliberal consiste numa radical transformação nas finalidades da privação de liberdade, que passam daquilo que Zaffaroni chamou de ‘ideologias re’ (reinserção social,

As variáveis estudadas foram: gê- nero, categoria do bolsista, instituição de origem, tempo de conclusão do doutorado, artigos nacionais e estrangeiros com o respectivo

O deslizamento da cabeça do fêmur presente neste caso de HPP é outro ponto atípico, já que a asso- ciação das duas doenças é extremamente rara, existin- do apenas quatro

Ele foi fundamentado pela teoria da sustentabilidade da dívida, apropriadamente adaptado para a Dívida Pública Mobiliária Federal interna (DPMFi), com foco em sua trajetória.

Neste cap´ıtulo foram apresentadas as metodologias de modelagem estat´ıstica desenvolvidas para o monitoramento de doen¸cas de notifica¸c˜ ao compuls´ oria. Para tanto, foi