• Nenhum resultado encontrado

6.2 Dados Banc´ arios

6.2.4 Diferen¸ca entre as Duas Classifica¸c˜ oes

ASM Average ASM Complete ASM Ward.D2

ASH 0.37 0.37 0.29

AC Hartigan-Wong 0.35 0.29 0.39

ASM Hartigan-Wong 0.56 0.43 0.67

ASM MacQueen 0.88 0.28 1.00

Tabela 6.14: Valor do ´Indice de Rand Ajustado entre ASM Hier´arquico e as solu¸c˜oes das classifica¸c˜oes n˜ao hier´arquicas - Dados Banc´arios

ˆ H´a uma semelhan¸ca entre as solu¸c˜oes encontradas pelos m´etodos ASM MacQueen e WardD2 — ver Tabela 6.14 — o que n˜ao ´e de estranhar, pois os centros ini- ciais para a classifica¸c˜ao n˜ao-hier´arquica foram extra´ıdos do m´etodo Ward.D2, significando apenas que o m´etodo ASM MacQueen n˜ao melhorou a solu¸c˜ao inicial;

ˆ A solu¸c˜ao dada pelo m´etodo complete ´e bastante diversa das apresentadas pelas restantes abordagens;

ˆ Comparando a composicional hier´arquica com a n˜ao-hier´arquica em todas as abordagens, h´a uma semelhan¸ca significativa entre os m´etodos WardD2 e ASM MacQueen (valor do ´ındice de Rand = 0.80).

AC Average AC Ward.D2

ASH 0.32 0.40

AC Hartigan-Wong 0.52 0.60

ASM Hartigan-Wong 0.11 0.58

ASM MacQueen 0.23 0.80

Tabela 6.15: Valor do ´Indice de Rand Ajustado entre AC Hier´arquico e as solu¸c˜oes das classifica¸c˜oes n˜ao hier´arquicas- Dados Banc´arios

A maior diferen¸ca entre as solu¸c˜oes dos dois tipos de classifica¸c˜ao ocorre quando a abordagem na classifica¸c˜ao hier´arquica ´e a simb´olica Histograma na medida em que o m´aximo valor atingido ´e 0.38 (tabela 6.16).

ASH Average ASH Ward.D2

SW 0.49 0.51

CW Hartigan-Wong 0.30 0.32

ASM Hartigan-Wong 0.31 0.40

ASM MacQueen 0.38 0.20

Tabela 6.16: Valor do ´Indice de Rand Ajustado entre ASH Hier´arquico e as solu¸c˜oes das classifica¸c˜oes n˜ao hier´arquicas- Dados Banc´arios

Resumindo:

ˆ Apenas na classifica¸c˜ao n˜ao hier´arquica ´e que foi poss´ıvel analisar a qualidade das diferentes solu¸c˜oes, conclui-se que a Abordagem Simb´olica Modal foi a que apresentou melhores resultados quando o m´etodo aplicado ´e o de Hartigan- Wong(neste caso a taxa de in´ercia foi de 83.6%;

ˆ As diferentes an´alises realizadas mostram que para qualquer dos m´etodos de classifica¸c˜ao h´a diferen¸cas significativas nas solu¸c˜oes das diversas abordagens; ˆ Na classifica¸c˜ao hier´arquica a maior semelhan¸ca ocorreu entre as abordagens

modal e composicional;

ˆ As solu¸c˜oes mais semelhantes na classifica¸c˜ao n˜ao hier´arquica ocorreram entre as duas abordagens simb´olicas, contudo a semelhan¸ca destas duas solu¸c˜oes n˜ao ´e t˜ao not´oria como no caso anterior;

ˆ Por outro lado, a abordagem composicional parece separar tendo em conta a generalidade das caracter´ısticas enquanto nas abordagens simb´olicas s˜ao determinadas vari´aveis as respons´aveis por determinada separa¸c˜ao;

ˆ Nenhuma das classifica¸c˜oes analisadas separou os elementos ‘31’, ‘41’, ‘51’, clientes que gastam menos;

ˆ Tamb´em n˜ao foram separados os clientes ‘35’, ‘45’ por serem os que mais consomem.

6.3

Dados Sociol´ogicos Americanos

6.3.1

Classifica¸c˜ao Hier´arquica

Generalidades

Tal como no exemplo anterior, h´a uma diversidade dos dendrogramas em cada uma das abordagens (Tabela 6.17). Nas sec¸c˜oes ser˜ao analisadas, tal como com os dados anteriores, as solu¸c˜oes dos m´etodos Average, Complete, Ward.D2 para se compreender o qu˜ao semelhantes s˜ao as solu¸c˜oes dos referidos m´etodos nas trˆes abordagens. A primeira abordagem a ser analisada ser´a a Abordagem Simb´olica Modal.

Descri¸c˜ao ASM AC ASH Complete 1.399729 10.27271 0.7976075

Average 0.9460297 8.324547 0.53154 Ward.D2 2.256508 10.77484 1.325567

Tabela 6.17: Altura do dendrogramas para os diferentes M´etodos em diferentes Abordagens: Dados Sociol´ogicos Americanos

Abordagem Simb´olica Modal M´etodo Average

Figura 6.10: Dendrograma -M´etodo Average-ASM - Dados Sociol´ogicos Americanos

Grupo1={‘OH0,‘P A0,‘M A0,‘W I0,‘CT0,‘N J0}

Grupo2={‘LN0,‘F L0,‘N Y0,‘N C0,‘CA0,‘V A0,‘GA0,‘T N0,‘T X0,‘AL0,‘M O0,‘OR0,‘W A0,‘OK0}

Grupo3={‘GA0}

Grupo PES1 PES2 PES3 PES4 PE1 PE2 PE3 PE4 1 0.20 0.26 0.26 0.28 0.36 0.30 0.17 0.17 2 0.32 0.28 0.28 0.12 0.16 0.24 0.32 0.28 3 0.14 0.11 0.22 0.54 0.46 0.19 0.16 0.19 Grupo PD1 PD2 PD3 PD4 PI1 PI2 PI3 PI4 1 0.13 0.17 0.30 0.40 0.19 0.24 0.27 0.30 2 0.53 0.25 0.14 0.09 0.43 0.31 0.16 0.10 3 0.08 0.05 0.08 0.78 0.05 0.16 0.19 0.59

Tabela 6.18: Centros - M´etodo Average- ASM - Dados Sociol´ogicos Americanos

No grupo 1 est˜ao presentes os estados cujas cidades possuem uma percentagem significativa de habitantes com mais de 25 anos que n˜ao possuem o ensino b´asico e ainda uma taxa de div´orcio consider´avel (PES4 e PD4 muito elevadosem termos comparativos, respetivamente) e, em contrapartida h´a uma maior taxa de desemprego (valor elevado em PE1 e PE2 e pequeno em PE3 e PE4). O Estado da Ge´orgia

destaca-se pelas elevadas Taxas de Imigra¸c˜ao, de desemprego e uma consider´avel percentagem de cidades os seus habitantes, com mais de 25 anos que n˜ao possuem o ensino b´asico.

M´etodo Complete

Figura 6.11: Dendrograma -M´etodo Complete-ASM - Dados Sociol´ogicos Americanos

Grupo1 = {‘GA0, ‘N C0, ‘CA0, ‘T N0, ‘T X0, ‘AL0, ‘V A0, ‘F L0, ‘OK0, ‘OR0, ‘W A0} Grupo2 = {‘CT0, ‘W I0, ‘M A0, ‘N J0}

Grupo3 = {‘OH0, ‘P A0, ‘N Y0, ‘LN0, ‘M O0}

Com este m´etodo formam-se trˆes classes. Na primeira encontram-se os estados em que existe um elevado n´umero de cidades com uma percentagem significativa de cidad˜aos com mais de 25 anos que n˜ao possuem o ensino b´asico, com elevada taxa de div´orcio e de Imigra¸c˜ao. Por outro lado, o grupo 2 possui estados cujas cidades apresentam elevada taxa de emprego - ver Tabela 6.19.

Grupo PES1 PES2 PES3 PES4 PE1 PE2 PE3 PE4 1 0.21 0.24 0.23 0.32 0.37 0.28 0.16 0.19 2 0.32 0.29 0.25 0.13 0.07 0.24 0.37 0.32 3 0.20 0.28 0.34 0.17 0.36 0.31 0.19 0.14 Grupo PD1 PD2 PD3 PD4 PI1 PI2 PI3 PI4 1 0.11 0.15 0.26 0.48 0.12 0.24 0.28 0.36 2 0.58 0.27 0.10 0.04 0.41 0.31 0.16 0.12 3 0.30 0.19 0.29 0.22 0.42 0.25 0.20 0.12

M´etodo Ward.D2

Figura 6.12: Dendrograma -M´etodo Ward.D2-ASM - Dados Sociol´ogicos Americanos

Grupo1 = {‘CT0, ‘W I0, ‘M A0, ‘N J0} Grupo2 = {‘OH0, ‘P A0, ‘N Y0, ‘M O0}

Grupo3 = {‘V A0, ‘F L0, ‘OK0, ‘OR0, ‘LN0, ‘W A0} Grupo4 = {‘GA0, ‘N C0, ‘CA0, ‘T N0, ‘T X0, ‘AL0}

Grupo PES1 PES2 PES3 PES4 PE1 PE2 PE3 PE4 1 0.18 0.12 0.21 0.49 0.36 0.29 0.16 0.20 2 0.32 0.29 0.25 0.13 0.07 0.24 0.37 0.32 3 0.22 0.37 0.28 0.12 0.35 0.29 0.18 0.18 4 0.22 0.27 0.32 0.19 0.38 0.29 0.19 0.13

Grupo PD1 PD2 PD3 PD4 PI1 PI2 PI3 PI4

1 0.12 0.18 0.28 0.42 0.09 0.21 0.29 0.42 2 0.58 0.27 0.10 0.04 0.41 0.31 0.16 0.12 3 0.11 0.11 0.25 0.53 0.22 0.25 0.25 0.28 4 0.33 0.22 0.29 0.16 0.40 0.28 0.20 0.11

Tabela 6.20: Centros - M´etodo Ward.D2 - ASM - Dados Sociol´ogicos americanos

Atrav´es deste m´etodo os estados s˜ao divididos em quatro grupos:

ˆ Connecticut, Massachusetts, Nova Jersey, Wisconsin formam novamente uma ´

unica classe, tal como foi referido anteriormente s˜ao os estados onde as cidades que a eles pertencem apresentam uma maior taxa de habitantes, com mais de 25 anos, que n˜ao possuem o ensino b´asico;

ˆ O grupo 2 ´e semelhante ao terceiro grupo do m´etodo Complete `a exce¸c˜ao do estado Louisiana que passou para um outro grupo onde se encontram os estados cujas cidades possuem uma taxa elevada de div´orcio - grupo 3;

ˆ Na classe 4 est˜ao os restantes elementos (Tabela 6.20 e Fig.6.12.

Nesta abordagem

ˆ Os estados Connecticut, Wisconsin, Massachusetts, Nova Jersey est˜ao sempre na mesma classe, sendo estados com forte taxa de desemprego D.1;

ˆ Georgia, Carolina do Norte, Calif´ornia, Tennessee, Texas, Alabama tamb´em nunca se encontram separados, sendo estados cuja popula¸c˜ao tem pouca instru- ¸c˜ao .

ˆ Oklahoma,Oregon nunca se separam, sendo estados com elevada taxa de de- semprego e baixa taxa de imigra¸c˜ao

As solu¸c˜oes dos diferentes m´etodos n˜ao s˜ao muito semelhantes - ver Tabela 6.21. A maior semelhan¸ca verifica-se entre as solu¸c˜oes dos m´etodos Average, Complete para os quais o valor do ´ındice de Rand ´e 0.52.

ASM Average ASM Complete ASM Ward.D2

ASM Average 1.00 0.43 0.27

ASM Complete 0.43 1.00 0.52

ASM Ward.D2 0.27 0.52 1.00

Tabela 6.21: Valor do ´Indice de Rand Ajustado - ASM -Dados Sociol´ogicos America- nos

Seguidamente ser´a tratado o mesmo problemas mas agora, sob o ponto de vista composicional.

Abordagem Composicional

M´etodo Average

Figura 6.13: Dendrograma -M´etodo Average - AC - Dados Sociol´ogicos Americanos

Grupo1={‘N Y0}

Grupo2={‘OK0}

Grupo3={‘LN0,‘OH0,‘P A0,‘CT0,‘W I0,‘M A0,‘N J0,‘GA0,‘N C0,‘CA0,‘T N0,‘T X0,‘AL0,‘M O0,‘V A0,‘F L0,‘OR0,‘W A0}

Grupo PES1 PES2 PES3 PES4 PE1 PE2 PE3 PE4 1 0.05090929 0.05764184 0.06221051 0.06301256 0.09335963 0.07748096 0.04517347 4.818449e-02 2 0.07995428 0.07323725 0.07243310 0.02985048 0.02973034 0.06302053 0.08051173 7.078806e-02 3 0.02173860 0.05978116 0.10325836 0.06521581 0.13586626 0.08695441 0.02717325 2.430613e-05 Grupo PD1 PD2 PD3 PD4 PI1 PI2 PI3 PI4

1 0.03068551 0.03303087 0.06927941 0.1145377 0.03595807 0.06070245 0.07022405 0.08760920 2 0.13614831 0.06345976 0.03360178 0.0148325 0.11354747 0.07797969 0.03994181 0.02096290 3 0.04891185 0.06521581 0.10325836 0.0326079 0.09238906 0.06521581 0.07608511 0.01630395

Tabela 6.22: Centros-M´etodo Average - AC - Dados Americano

uma maior percentagem de cidades com uma taxa de desemprego elevada; ˆ Oklahoma tamb´em fica isolado, estado em que a taxa habitantes das respetivas

cidades que n˜ao possuem o ensino b´asica ´e pouco elevada;

M´etodo Complete

Figura 6.14: Dendrograma -M´etodo Complete-AC - Dados Sociol´ogicos Americanos

Grupo1={‘N Y0}

Grupo2={‘OK0}

Grupo3={‘OH0,‘M A0,‘P A0,‘W I0,‘CT0,‘N J0}

Grupo4={‘LN0,‘OR0,‘W A0,‘F L0,‘M O0,‘GA0,‘N C0,‘CA0,‘T N0,‘T X0,‘AL0,‘V A0}

Grupo PES1 PES2 PES3 PES4 PE1 PE2 PE3 PE4 1 0.04641948 0.03477472 0.05487317 0.11808399 0.09071233 0.07543005 0.04183870 4.654472e-02 2 0.07995428 0.07323725 0.07243310 0.02985048 0.02973034 0.06302053 0.08051173 7.078806e-02 3 0.05282937 0.09684782 0.06710429 0.02821638 0.08995656 0.07448798 0.04602973 4.674648e-02 4 0.02173860 0.05978116 0.10325836 0.06521581 0.13586626 0.08695441 0.02717325 2.430613e-05

Grupo PD1 PD2 PD3 PD4 PI1 PI2 PI3 PI4

1 0.03578162 0.04071078 0.07056834 0.09087538 0.02529184 0.05423043 0.07312083 0.10074361 2 0.13614831 0.06345976 0.03360178 0.01483250 0.11354747 0.07797969 0.03994181 0.02096290 3 0.02389925 0.02411558 0.06317759 0.13979761 0.05051036 0.06451025 0.06241710 0.06935366 4 0.04891185 0.06521581 0.10325836 0.03260790 0.09238906 0.06521581 0.07608511 0.01630395

Tabela 6.23: Centros -M´etodo Complete - AC - Dados Sociol´ogicos Americanos ˆ Nova York e Oklahoma caracterizados baixa taxa de emprego, e elevada taxa

de div´orcio e imigra¸c˜ao respetivamente;

ˆ Os restantes estados s˜ao divididos em mais duas classes;

ˆ Na terceira est˜ao os Estados Connecticut, Ohio, Massachusetts, Nova Jersey, Pensilvˆania ,Wisconsin-(tabela 6.23), estado cujos habitantes possuem poucas habilita¸c˜oes liter´arias..

M´etodo Ward.D2

Este m´etodo encontra a mesma solu¸c˜ao que o m´etodo Complete desta abordagem (Fig. 6.15 e Tabela 6.24).

Figura 6.15: Dendrograma -M´etodo WardD2 - AC - Dados Sociol´ogicos Americanos

AC Average AC Complete AC Ward.D2

AC Average 1.00 0.55 0.55

AC Complete 0.55 1.00 1.00

AC Ward.D2 0.55 1.00 1.00

Tabela 6.24: Valor do ´Indice de Rand Ajustado - AC -Dados Sociol´ogicos Americanos

Nesta abordagem pode-se observar:

ˆ Todos os m´etodos nesta abordagem isolam os Estados Nova York e Oklahoma. No primeiro caso trata-se de um estado com pouco emprego enquanto que em Oklahoma salienta-se a elevada taxa de imigra¸c˜ao;

ˆ Dois m´etodos encontram a mesma solu¸c˜ao.

Em seguida ser˜ao analisadas as solu¸c˜oes encontradas atrav´es da abordagem Simb´olica Histograma

Abordagem Simb´olica Histograma

A tabela seguinte apresenta a m´edia de cada uma das vari´aveis nos diferentes Estados. Estado PES PE PD PI AL 14.686 47.233 12.209 45.442 CA 10.591 59.143 12.686 49.529 CT 6.8809 66.634 8.1479 23.944 FL 8.0444 45.589 13.511 36.394 GA 17.439 49.473 14.716 53.5 IN 8.4427 54.76 13.031 28.25 MA 7.0203 62.837 7.5041 27.077 MO 10.696 53.655 11.393 36.25 NC 16.587 55.859 14.261 46.402 NJ 9.0213 63.818 7.9597 32.874 NY 9.0652 43.859 11.598 29.293 OH 6.3941 51.73 11.302 26.973 OK 7.3264 51.194 13.75 39.472 OR 6.1935 54.823 14.29 44.79 PA 7.5347 54.876 8.4653 25.089 TN 16.171 51.686 13.586 42.971 TX 14.806 51.787 11.914 46.284 VA 11.773 57.091 12.879 44.833 WA 6.4 52.263 14.3 41.525 WI 7.3833 63.033 8.3167 31.642

Tabela 6.25: M´edia de cada Vari´avel pelos diversos Estados - ASH -Dados Sociol´ogicos Americanos

M´etodo Average

Figura 6.16: Dendrograma - M´etodo Average-ASH - Dados Sociol´ogicos Americanos

Este m´etodo forma trˆes classes, sendo a segunda classe constitu´ıda pelos Estados caracterizados por elevada taxa de desemprego e pouca instru¸c˜ao. O terceiro grupo situam-se os estados com um n´ıvel de escolaridade que, em termos relativos, n˜ao sendo o mais elevado tamb´em n˜ao ´e o mais baixo (Tabela 6.25).

Grupo1 = {‘N C0, ‘CA0, ‘T N0, ‘GA0, ‘T X0, ‘AL0, ‘V A0, ‘M O0, ‘OR0, ‘W A0, ‘OK0} Grupo2 = {‘M A0, ‘W I0, ‘CT0, ‘N J0}

M´etodo Complete

Figura 6.17: Dendrograma -M´etodo Complete-ASH - Dados Sociol´ogicos Americanos

Grupo1 = {‘W A0, ‘M O0, ‘OK0, ‘OR0}

Grupo2 = {‘GA0, ‘N C0, ‘CA0, ‘T N0, ‘T X0, ‘AL0, ‘V A0} Grupo3 = {‘CT0, ‘W I0, ‘M A0, ‘N J0}

Grupo4 = {‘F L0, ‘P A0, ‘LN0, ‘N Y0, ‘M O0, ‘OH0} H´a forma¸c˜ao de 4 classes:

ˆ Os estados Connecticut, Massachusetts, Wisconsin, Nova Jersi est˜ao nova- mente juntos s˜ao caracterizados por serem estados com uma forte taxa de emprego,elevada taxa de cidades cujos habitantes, com mais de 25 anos, n˜ao possuem o ensino b´asico;

ˆ No primeiro grupo encontram-se os estados cujas cidades que possuem taxas m´edias elevadas de imigra¸c˜ao;

ˆ O ´ultimo grupo ´e constitu´ıdo por elementos que n˜ao se destacam em nenhuma das vari´aveis, pois a sua taxa m´edia nem ´e das mais elevadas nem das mais baixas.

M´etodo Ward.D2

Figura 6.18: Dendrograma -M´etodo Ward.D2-ASH - Dados Sociol´ogicos Americanos

Grupo1 = {‘CT0, ‘W I0, ‘M A0, ‘N J0}

Grupo2 = {‘GA0, ‘N C0, ‘CA0, ‘T N0, ‘T X0, ‘AL0, ‘V A0}

Grupo3 = {‘W A0, ‘F L0, ‘P A0, ‘LN0, ‘N Y0, ‘M O0, ‘OK0, ‘OH0, ‘OR0}

ˆ Os estados Connecticut, Massachusetts, Wisconsin, Nova Jersi est˜ao nova- mente juntos s˜ao caracterizados por serem estados com uma forte taxa de emprego,elevada taxa de cidades cujos habitantes, com mais de 25 anos, n˜ao possuem o ensino b´asico;

ASH Average ASH Complete ASH Ward.D2

ASH Average 1.00 0.48 0.27

ASH Complete 0.48 1.00 0.74

ASH Ward.D2 0.27 0.74 1.00

Tabela 6.26: Valor do ´Indice de Rand Ajustado aplicado aos diferentes M´etodos da Abordagem Simb´olica Histograma - Dados Sociol´ogicos Americanos

Com esta abordagem os m´etodos n˜ao conduzem a solu¸c˜oes muito semelhantes. A maior semelhan¸ca verifica-se entre os m´etodos Complete e Ward.D2 - valor do ´ındice Rand ´e 0.74 - ver tabela 6.26.

Por outro lado,

ˆ Os estados Connecticut, Massachusetts, Wisconsin, Nova Jersi est˜ao novamente juntos s˜ao caracterizados por serem estados com uma forte taxa de desemprego ,elevada taxa de cidades cujos habitantes, com mais de 25 anos, n˜ao possuem o ensino secund´ario;

ˆ Alabana, Ge´orgia,Carolina do Norte, Calif´ornia, Tennessee, Texas,Virg´ınia s˜ao estados que nunca se separam, tendo em comum as poucas habilita¸c˜oes liter´arias por parte dos seus habitantes, no entanto, a taxa de desemprego n˜ao ´e elevada contrariamente ao grupo anterior.

ˆ Oklahoma,Oregon nunca se separam, sendo estados com elevada taxa de de- semprego e baixa taxa de imigra¸c˜ao (tabela D.1).

Documentos relacionados