• Nenhum resultado encontrado

CAPÍTULO 2 – RELAÇÃO ENTRE A MÉDIA FINAL OBTIDAS NAS DISCIPLINAS DO

2.4 Etapas

2.4.5 Interpretação

Figura 15 - Resultado WEKA

Após a execução do algorítmo J48 no WEKA foi possível obter as seguintes informações que são importantes para a proposta que foi feita no início do capítulo:

 Número total de instâncias: 133;

 Número de instâncias classificadas corretamente: 98 ou, aproximadamente, 74%;

 Número de instâncias classificadas incorretamente: 35 ou, aproximadamente, 26%;

 O fator de precisão para classe pleno (“S”) foi de 0,775 ou 77,5%; e o fator de precisão para a classe não-pleno (“N”) foi re 0,679 ou 67,9%

 A Matriz de Confusão (Confusion Matrix):

o Apresentou 94 instâncias classificadas corretamente, sendo 62 classificadas como “S” (aluno pleno) e 36 como “N” (aluno com reprovação em alguma disciplina);

o Apresentou 35 instâncias classificadas incorretamente, sendo 17 falsos positivos para “S” e 18 falsos positivos para “N”, ou seja, 17 instâncias foram classificadas com “S” quando deveriam ser “N” e 18 instâncias foram classificadas com “N” quando deveriam ser “S”;

Figura 17 - Árvore WEKA

A árvore gerada após a execução do algorítmo possui 11 folhas, tamanho 21 e teve como raiz a disciplina D2 (Análise de Sistemas). Ao fazer a análise da árvore gerada, pudemos que os alunos que tiveram nota menor ou igual a 5,09 não concluíram o curso plenos, onde 25 alunos foram classificados corretamente como “N” e 1 foi classificado incorretamente.

Em D7 (Contabilidade e Economia para Computação), os alunos que obtiveram nota menor ou igual a 6,7 e obtiveram nota menor ou igual a 8,35 na disciplina D8 (Direito e Ética em Informática) não concluíram o curso plenos (11 alunos), enquanto os que obtiveram nota menor ou igual a 6,7 em D7 e nota maior que 8,35 em D8 concluiram o curso pleno, onde 3 alunos foram classificados corretamente como “S” e 1 foi classificado incorretamente.

Os alunos que obtiveram nota maior que 5,09 em D2, maior que 6,7 em D7, menor ou igual a 5,6 em D3 (Arquitetura de Computadores) e maior que 8,85 em D9 (Eletricidade e Lógica Digital) não concluíram o curso plenos (6 alunos); enquanto que os alunos que obtiveram nota maior ou igual a 8,85 em D9 e maior ou igual a 7,8 em D4 (Banco de Dados) concluíram o curso plenos (4 alunos) e os que tiveram nota menor que 7,8 em D4 não concluíram o curso plenos (2 alunos).

Os alunos que obtiveram nota maior que 5,09 em D2, maior que 6,7 em D7, maior que 5,6 em D3, menor ou igual a 7,13 em D4 e menor ou igual a 7,7 em D16 (Novas Aplicações em Sistemas de Informação) não concluíram o curso pleno (4 alunos), enquanto os

que tiveram nota maior que 7,7 em D16 concluíram o curso pleno, onde 5 alunos foram classificados corretamente como “S” e 1 foi classificado incorretamente.

Os alunos que obtiveram nota maior que 5,09 em D2, maior que 6,7 em D7, maior que 5,6 em D3, maior que 7,13 em D4 e maior que 8,4 em D8 concluíram o curso plenos (50 alunos), os que tiveram nota menor ou igual a 8,4 em D8 e menor ou igual a que 9,23 em D3 também concluíram o curso plenos, onde 20 foram classificados como “S” e 2 foram classificados incorretamente; enquanto os que obtiveram nota maior que 9,23 em D3 não concluíram o curso plenos.

Resumindo, de acordo com a execução do algorítmo, para que o alunos conclua o curso pleno ele deve atender umas das seguintes regras:

 Nota maior que 5,09 em D2, menor ou igual a 6,7 em D7 e maior que 8,35 em D8;

 Nota maior que 5,09 em D2, maior que 6,7 em D7, menor ou igual a 5,6 em D3, menor ou igual a 8,85 em D9 e menor ou igual a 7,8 em D4;

 Nota maior que 5,09 em D2, maior que 6,7 em D7, maior que 5,6 em D3, menor ou igual a 7,13 em D4 e maior que 7,7 em D16, neste caso houve 1 falso positivo;

 Nota maior que 5,09 em D2, maior que 6,7 em D7, maior que 5,6 em D3, maior que 7,13 em D4 e maior que 8,4 em D8;

 Nota maior que 5,09 em D2, maior que 6,7 em D7, maior que 5,6 em D3, maior que 7,13 em D4, menor ou igual a 8,4 em D8 e menor ou igual a 9,23 em D3, neste caso houveram 2 falsos positivos.

Houveram também 1 falsos negativos em:

 Nota menor ou igual a 5,09 em D2 apresentou 1 falso negativo;

Com a aplicação da Mineração de Dados foi possível identificar que as notas obtidas nas disciplinas D2, D3, D4, D7, D8, D9 e D16 podem determinar se aluno concluirá o curso pleno ou não, enquanto as notas obtidas nas outras disciplinas não influem. Nenhuma das disciplinas influencia diretamente se o alunos concluirá o curso pleno ou não, apenas a nota da disciplina D2 influencia diretamente mas para dizer que o aluno não concluirá o curso

pleno, neste caso se ele obtiver uma nota menor ou igual a 5,09 e mesmo assim ainda apresenta um falso negativo.

CONCLUSÃO / RECOMENDAÇÕES

O volume de dados gerados dentro das organizações atualmente é muito grande e a tendência é que continue a crescer, tendo em vista a automação cada vez maior das tarefas dentro das empresas. Esses dados podem representar uma vantagem competitiva para a empresa, desde que eles sejam analisados de forma correta e transformados em informação valiosa para a empresa.

A mineração de dados é uma ferramenta que a empresa pode utilizar para adquirir informações que podem ser de grande utilidade na tomada de decisões táticas e estratégicas possibilitando uma vantagem sobre seus concorrentes e agregar valor sobre seus negócios.

As técnicas da Mineração de Dados podem ser aplicadas a diferentes tipos de dados, resultando em diferentes resultados, portanto cabe ao responsável escolher qual técnicas se aplica melhor aos dados que ele possui e quais os resultados esperados para que assim a técnicas que melhor resolva essas questões possa ser aplicada e os resultados sejam satisfatórios.

A aplicação do KDD é imprescindível para o sucesso da Mineração de Dados, uma vez que a Mineração de Dados é uma etapa do KDD e altamente dependente das etapas que a precedem e que são fundamentais e influenciam diretamente o resultado da Mineração de Dados.

Durante a aplicação das técnicas de Mineração de Dados na base utilizada no estudo, foi possível perceber como a Mineração de Dados, através de cada uma de suas etapas, vai transformando uma coleção de dados em informação útil.

Com a aplicação da Mineração de Dados foi possível identificar que as notas obtidas nas disciplinas D2, D3, D4, D7, D8, D9 e D16 podem determinar se aluno concluirá o curso pleno ou não, enquanto as notas obtidas nas outras disciplinas não influem. Nenhuma das disciplinas influencia diretamente se o alunos concluirá o curso pleno ou não, apenas a nota da disciplina D2 influencia diretamente mas para dizer que o aluno não concluirá o curso pleno.

Um grande problema encontrado durante o desenvolvimento do trabalho foi na utilização do software WEKA no momento da aplicação do algorítmo no arquivo ARFF que

havia sido gerado, fazendo com que o resultado da execução do algorítmo não correspondesse ao resultado esperado, foram necessários inúmeros testes e alterações nos tipos dados e na quantidade de atributos para que o problema fosse resolvido.

Como sugestão para os próximos trabalhos sobre esse tema, é recomendado um estudo mais aprofundado sobre o software WEKA e uma abrangência maior dos diferentes algorítmos de mineração de dados e seus diferentes resultados.

REFERÊNCIAS

AMO, Sandra de. Técnicas de Mineração de Dados. Universidade Federal de Uberlândia,

Faculdade de Computação, 2004. Disponível em:

http://www.deamo.prof.ufu.br/arquivos/JAI-cap5.pdf. Acesso em: 25 mar. 2011.

Attribute-Relation File Format (ARFF). 2008. Disponível em:

http://www.cs.waikato.ac.nz/ml/weka/arff.html. Acesso em: 20 set. 2011.

BOZZA, Daniel; KONO, Frank; TAVARES, Claudio. Descoberta de Conhecimento

Aplicado a Dados Eleitorais. Revista Gestão e Conhecimento / Faculdade de Ciências

Sociais Aplicadas do Paraná e Faculdade de Ciência e Tecnologia do Paraná. Curitiba:

Faculdades Facet, 2007. 94 págs. Disponível em:

http://gc.facet.br/artigos/resumo.php?artigo=34. Acesso em: 20 set. 2011.

CARACIOLO, Marcel Pinheiro. [Artigo] Introdução a árvores de decisão para a

classificação e Mineração de Dados. 2009. Disponível em:

http://aimotion.blogspot.com/2009/04/artigo-introducao-arvores-de-decisao.html. Acesso em: 4 jul. 2011.

CARVALHO, André Ponce de Leon F. de. Redes Neurais Artificiais. Disponível em:

http://www.icmc.usp.br/~andre/research/neural/. Acesso em: 16 mai. 2011.

CHIU, Susan; TAVELLA, Domingo. Data Mining and Marketing Intelligence for

CÔRTES, Sérgio da Costa; LIFSCHITZ, Sérgio; PORCARO, Rosa Maria. Mineração de

Dados – Funcionalidades, Técnicas e Abordagens. PUC-Rio, 2002. Disponível em: http://www.dbd.puc-rio.br/depto_informatica/02_10_cortes.pdf. Acesso em: 30 mar. 2011.

CPBR10 – Software Livre. Oficina: Data Mining WEKA. Disponível em: http://www.youtube.com/watch?v=sDD8nsZ1fQo. Acesso em: 29 dez. 2010.

HALFEN, Idel. Mineração de Dados. 2010. Disponível em: http://halfen-

mktsport.blogspot.com/2010/11/mineracao-de-dados.html. Acesso em: 19 mai. 2011.

MARTIN, James R. What is Data Mining?. Disponível em:

http://maaw.info/DataMining.htm. Acesso em: 20 mai. 2011.

MICROSOFT. Algoritmo Microsoft Clustering. Disponível em:

http://technet.microsoft.com/pt-br/library/ms174879%28SQL.100%29.aspx. Acesso em: 15 mai. 2011.

NETO, Ary Fagundes Bressane; SILVA, Flávio Soares Corrêa da. Oficina Data Mining com

WEKA. 2010. Disponível em: http://www.slideshare.net/campuspartybrasil/campus- party2010. Acesso em: 29 dez. 2010.

O que é Mineração de Dados?. GSI – Grupo de Sistemas Inteligentes – Mineração de

Dados, DIN – Departamento de Informática, UEM – Universidade Estadual de Maringá, Maringá, 1998. Disponível em: http://www.din.uem.br/ia/mineracao/introducao/index.html. Acesso em: 15 mai. 2011.

REYNOL, Fábio. Mineração de dados para diagnósticos médicos. 2010. Disponível em:

SBARAI, Rafael. A Mineração de Dados em Redes Sociais. 2010. Disponível em:

http://derepente.com.br/2010/01/18/a-mineracao-de-dados-em-redes-sociais/. Acesso em: 18 mar. 2011.

PRASS, Fernando Sarturi. KDD: Processo de Descoberta em Banco de Dados. Grupo de Interesse em Engenharia de Software, Florianópolis, 2004.

SILVA, Marcelino Pereira dos Santos. Mineração de Dados – Conceitos, Aplicações e

Experimentos com WEKA. Disponível em:

http://bibliotecadigital.sbc.org.br/download.php?paper=35. Acesso em: 30 dez. 2010.

SOLIEMAN, Osama K. Data Mining in Sports: A Research Overview. MIS Masters

Project. 2006. Disponível em:

http://www.google.com/url?sa=t&source=web&cd=2&ved=0CCMQFjAB&url=http%3A%2 F%2Fai.arizona.edu%2Fmis480%2Fsyllabus%2F6_Osama-

DM_in_Sports.pdf&rct=j&q=minera%C3%A7%C3%A3o%20de%20dados%20nba&ei=zqoc TvDICcmtgQe32rDfCQ&usg=AFQjCNFZ_uG9HZxlMWoHhNWReVShd9zgZQ&sig2=Lwl 4fWhwGZqrmlX_m_wKHQ&cad=rja. Acesso em: 12 jul. 2011.

VIANA, Reinaldo. Mineração de Dados: Introdução e Aplicações. Disponível em:

http://www.sqlmagazine.com.br/Resumo_SQL10.asp. Acesso em: 20 mai. 2011.

WIKIPEDIA. Extração de Conhecimento. Disponível em:

http://pt.wikipedia.org/wiki/Extra%C3%A7%C3%A3o_de_conhecimento. Acesso em: 31 jan. 2011.

WIKIPEDIA. Mineração de Dados. Disponível em:

http://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados. Acesso em: 30 dez. 2010.

ZANUSSO, Maria Bernadete. Data Mining. DCT, UFMS. Disponível em:

APÊNDICE I – CRONOGRAMA DE ATIVIDADES DO

Documentos relacionados