• Nenhum resultado encontrado

Considerem-se cinco instituic¸˜oes de ensino caracterizadas pelo n´umero de docentes de

Matem´atica a lecionar nessa instituic¸˜ao, vari´avel real, Y

1

, com Y

1

: E → [0, 25], as

classificac¸˜oes obtidas pelos alunos no exame nacional de Matem´atica, vari´avel intervalar,

Y

2

, com Y

2

: E → [0, 20], e a ´area de formac¸˜ao inicial dos professores (a: Matem´atica

educacional, b: Matem´atica Aplicada, c: Economia e d: Engenharia), vari´avel categ´orica

modal, como ´e apresentado na Tabela 4.11.

Tabela 4.11: Tabela de dados inicial

NoDocentes Classif. Formac¸˜ao inicial

Inst1 15 [9,18] a(0.6) b(0.2) c(0.1) d(0.1)

Inst2 10 [7,17] a(0.7) b(0.1) c(0.2) d(0.0)

Inst3 20 [3,14] a(0.3) b(0.2) c(0.2) d(0.3)

Inst4 18 [10,19] a(0.7) b(0.1) c(0.1) d(0.1)

Inst5 21 [4,16] a(0.8) b(0.2) c(0.0) d(0.0)

Na primeira etapa ser´a constru´ıda a descric¸˜ao de todas as classes de dois elementos

que podem ser formadas. Estas podem ser encontradas na Tabela 4.12.

Tabela 4.12: Descric¸˜ao das classes candidatas

NoDocentes Classif. Formac¸˜ao inicial

{Inst1,Inst2} [10,15] [7,18] {a[0.6,0.7], b[0.1,0.2], c[0.1,0.2], d[0.0,0.1]} {Inst1,Inst3} [15,20] [3,18] {a[0.3,0.6], b[0.2,0.2], c[0.1,0.2], d[0.1,0.3]} {Inst1,Inst4} [15,18] [9,19] {a[0.6,0.7], b[0.1,0.2], c[0.1,0.1], d[0.1,0.1]} {Inst1,Inst5} [15,21] [4,18] {a[0.6,0.8], b[0.2,0.2], c[0.0,0.1], d[0.0,0.1]} {Inst2,Inst3} [10,20] [3,17] {a[0.3,0.7], b[0.1,0.2], c[0.2,0.2], d[0.0,0.3]} {Inst2,Inst4} [10,18] [7,19] {a[0.7,0.7], b[0.1,0.1], c[0.1,0.2], d[0.0,0.1]} {Inst2,Inst5} [10,21] [4,17] {a[0.7,0.8], b[0.1,0.2], c[0.0,0.2], d[0.0,0.0]} {Inst3,Inst4} [18,20] [3,19] {a[0.3,0.7], b[0.1,0.2], c[0.1,0.2], d[0.1,0.3]} {Inst3,Inst5} [20,21] [3,16] {a[0.3,0.8], b[0.2,0.2], c[0.0,0.2], d[0.0,0.3]} {Inst4,Inst5} [18,21] [4,19] {a[0.7,0.8], b[0.1,0.2], c[0.0,0.1], d[0.0,0.1]}

De seguida procede-se ao c´alculo da medida de generalidade de cada classe conside-

rada, tal como demonstrado na secc¸˜ao anterior. Os valores obtidos podem ser encontrados

na Tabela 4.13.

A classe com menor medida de generalidade ´e a classe C

1

= {Inst1,Inst4}, com

descric¸˜ao d

(1)

= ([15, 18], [9, 19], {a[0.6, 0.7], b[0.1, 0.2], c[0.1, 0.1], d[0.1, 0.1]}), e me-

dida de generalidade G(d

1

) = 0.2233333. Esta classe cont´em as instituic¸˜oes que tˆem

entre 15 a 18 docentes, as notas obtidas no exame nacional de matem´atica variam entre

os 9 e os 18 valores e em que 60% a 70% dos docentes de matem´atica s˜ao de matem´atica

educacional, 10% a 20% de matem´atica aplicada, 10% de economia e 10% de engenharia.

A classe ´e eleg´ıvel, pois a sua descric¸˜ao cobre apenas as instituic¸˜oes que a formam

e mais nenhuma outra, ou seja, os intervalos m´ınimos de cada vari´avel que descrevem

cada instituic¸˜ao, que n˜ao as que fazem parte da classe formada, n˜ao est˜ao contidos nos

Tabela 4.13: Medidas de generalidade para as classes candidatas

Grau de generalidade {Inst1,Inst2} 0.2833333 {Inst1,Inst3} 0.3666667 {Inst1,Inst4} 0.2233333 {Inst1,Inst5} 0.3466667 {Inst2,Inst3} 0.4333333 {Inst2,Inst4} 0.3233333 {Inst2,Inst5} 0.3966667 {Inst3,Inst4} 0.3600000 {Inst3,Inst5} 0.3133333 {Inst4,Inst5} 0.3233333

intervalos m´ınimos das vari´aveis que descrevem a classe candidata. Assim, como a classe

´e eleg´ıvel e tem grau de generalidade m´ınima, ´e a classe a ser formada.

A Instituic¸˜ao 1 e a Instituic¸˜ao 4 ser˜ao retiradas do conjunto inicial dos dados e a

este ser´a acrescentado a nova classe (Tabela 4.14). Este ´e o conjunto de dados a ser

considerado na pr´oxima etapa.

Tabela 4.14: Tabela de dados 2

NoDocentes Classif. Formac¸˜ao inicial

Inst2 10 [7,17] a(0.7) b(0.1) c(0.2) d(0.0)

Inst3 20 [3,14] a(0.3) b(0.2) c(0.2) d(0.3)

Inst5 21 [4,16] a(0.8) b(0.2) c(0.0) d(0.0)

{Inst1,Inst4} [15,18] [9,19] a[0.6,0.7] b[0.1,0.2] c[0.1,0.1] d[0.1,0.1]

As classes a considerar na segunda etapa, as suas descric¸˜oes e medidas de generalidade

podem ser encontradas na Tabela 4.15.

Tabela 4.15: Segundo passo

NoDocentes Classif. Formac¸˜ao inicial Medida gen.

{Inst2,Inst3} [10,20] [3,17] {a[0.3,0.7], b[0.1,0.2], c[0.2,0.2], d[0.0,0.3]} 0.4333333 {Inst2,Inst5} [10,21] [4,17] {a[0.7,0.8], b[0.1,0.2], c[0.0,0.2], d[0.0,0.0]} 0.3966667 {Inst2,Inst1,Inst4} [10,18] [7,19] {a[0.6,0.7], b[0.1,0.2], c[0.1,0.2], d[0.0,0.1]} 0.3400000 {Inst3,Inst5} [20,21] [3,16] {a[0.3,0.8], b[0.2,0.2], c[0.0,0.2], d[0.0,0.3]} 0.3133333 {Inst3,Inst1,Inst4} [15,20] [3,19] {a[0.3,0.7], b[0.1,0.2], c[0.1,0.2], d[0.1,0.3]} 0.4000000 {Inst5,Inst1,Inst4} [15,21] [4,19] {a[0.6,0.8], b[0.1,0.2], c[0.0,0.1], d[0.0,0.1]} 0.3716667

descric¸˜ao d

2

= ([20, 21], [3, 16], {a[0.3, 0.8], b[0.2, 0.2], c[0.0, 0.2], d[0.0, 0.3]}) e medida

de generalidade G(d

2

) = 0.3133333. Como a classe ´e eleg´ıvel, esta ´e a classe a ser

formada na segunda etapa.

Na terceira etapa o conjunto de dados a considerar encontra-se na Tabela 4.16 e as

classes candidatas est˜ao apresentadas na Tabela 4.17.

Tabela 4.16: Tabela de dados 3

NoDocentes Classif. Formac¸˜ao inicial

Inst2 10 [7,17] a(0.7) b(0.1) c(0.2) d(0.0)

{Inst1,Inst4} [15,18] [9,19] a[0.6,0.7] b[0.1,0.2] c[0.1,0.1]d[0.1,0.1]) {Inst3,Inst5} [20,21] [3,16] a[0.3,0.8] b[0.2,0.2] c[0.0,0.2] d[0.0,0.3]

Tabela 4.17: Terceiro passo

NoDocentes Classif. Formac¸˜ao inicial Medida gen.

{Inst2,Inst1,Inst4} [10,18] [7,19] {a[0.6,0.7], b[0.1,0.2], c[0.1,0.2], d[0.0,0.1]} 0.3400000 {Inst2,Inst3,Inst5} [10,21] [3,17] {a[0.3,0.8], b[0.1,0.2], c[0.0,0.2], d[0.0,0.3]} 0.4716667 {Inst1,Inst4,Inst3,Inst5} [15,21] [3,19] {a[0.3,0.8], b[0.1,0.2], c[0.0,0.2], d[0.0,0.3]} 0.4383333

Nesta etapa a classe a ser formada ´e a classe C

3

= {Inst2,Inst1,Inst4}, com descric¸˜ao

d

3

= ([10, 18], [7, 19], {a[0.6, 0.7], b[0.1, 0.2], c[0.1, 0.2], d[0.0, 0.1]}), pois ´e eleg´ıvel e

tem grau de generalidade m´ınimo, G(d

3

) = 0.3400000.

Por ´ultimo, ficam dois conjuntos de dados na tabela de dados final (Tabela 4.18).

Tabela 4.18: Tabela de dados 4

NoDocentes Classif. Formac¸˜ao inicial

{Inst3,Inst5} [20,21] [3,16] {a[0.3,0.8], b[0.2,0.2], c[0.0,0.2], d[0.0,0.3]} {Inst2,Inst1,Inst4} [10,18] [7,19] {a[0.6,0.7], b[0.1,0.2], c[0.1,0.2], d[0.0,0.1]}

A classe a ser formada nesta ´ultima etapa ´e a classe C

4

= E, descrita por d

4

=

([10, 21], [3, 19], {a[0.3, 0.8], b[0.1, 0.2], c[0.0, 0.2], d[0.0, 0.3]}) e grau de generalidade G(d

4

) =

A Figura 4.1 representa o dendrograma obtido na classificac¸˜ao, indexado pelo valor

do grau de generalidade.

Cap´ıtulo 5

Implementac¸˜ao do M´etodo

Este cap´ıtulo exp˜oe a implementac¸˜ao do m´etodo em estudo. Detalha a forma como o

conjunto de dados se deve apresentar para ser reconhecida pelo m´etodo implementado e

apresenta as func¸˜oes desenvolvidas no software R que permitem executar o m´etodo.

5.1

Preparac¸˜ao pr´evia dos dados

De forma a poderem ser corretamente reconhecidos pelo c´odigo, os conjuntos de dados

necessitam de uma preparac¸˜ao pr´evia de forma a normalizar diferentes tipos de formatos.

O ficheiro com o conjunto de dados deve estar no formato CSV com as colunas sepa-

radas por ponto e v´ırgula. A primeira coluna deve corresponder ao nome dos objetos e as

restantes devem conter os valores das vari´aveis. Cada vari´avel necessita de ter duas colu-

nas consecutivas no conjunto de dados, em que a primeira corresponde ao valor m´ınimo

do intervalo e a segunda ao valor m´aximo. Os nomes das colunas, presentes na primeira

linha, devem conter o nome da vari´avel no in´ıcio seguido do car´ater “ ” para separar

eventuais sufixos, como por exemplo “ min” ou “ max”.

No caso de uma vari´avel ter duas ou mais categorias, estas devem estar dispostas

em diferentes colunas e o nome dessas colunas deve comec¸ar pelo nome da vari´avel

sendo a diferenciac¸˜ao das categorias feita no sufixo ap´os o car´ater “ ”. Por exemplo,

considere-se no exemplo da Secc¸˜ao 4.6 a vari´avel modal “formac¸˜ao” com as categorias

a: matem´atica educacional, b: matem´atica aplicada, c: economia e d: engenharia. Neste

caso, as respetivas colunas ser˜ao nomeadas com o seguinte formato: “formac¸˜ao a min”,

“formac¸˜ao a max”, “formac¸˜ao b min”, “formac¸˜ao b max”, “formac¸˜ao c min”, “forma-

c¸˜ao c max”, “formac¸˜ao d min” e “formac¸˜ao d max”. A Figura 5.1 apresenta algumas

linhas de um ficheiro de dados de entrada no formato adequado.

Figura 5.1: Conjunto de dados

Documentos relacionados