• Nenhum resultado encontrado

No decorrer do desenvolvimento deste estudo foram identificadas algumas oportunidades para o desenvolvimento de trabalhos futuros relacionados ao tema deste trabalho. São elas:

 Aplicar os métodos utilizados nesta pesquisa em outras bases de dados, a fim de comparar o desempenho preditivo entre as bases;

 Comparar outros métodos de redução de dimensionalidade para os mesmos algoritmos classificadores, além das mesmas bases utilizadas neste estudo;

 Utilizar outros algoritmos de classificação, bem como mudança de parâmetros de entrada dos algoritmos;

 Facilitar futuros estudos comparativos quando um pesquisador propõe um novo método, devido à grande quantidade de experimentos realizados.

REFERÊNCIAS

AHA, D.W.; KIBLER, D.; ALBERT, M. K. Instance-based learning algorithms. Machine learning, v. 6, n. 1, p. 37-66, 1991.

ALBERTS, B.; JOHNSON, A.; LEWIS, J.; RAFF, M.; ROBERTS, K.; WALTER, P. Biologia Molecular da Célula. Artes Médicas. 5ª ed. Artmed, 2010.

ALVES, F. C.; FRAGAL, E. H. Avaliação dos Algoritmos MAXVER e SVM na Classificação da Cobertura Vegetacional da Planície de Inundação do Alto Rio Paraná. In: ENCONTRO ESTADUAL DE GEOGRAFIA E ENSINO, II, SEMANA DE GEOGRAFIA, XX, 2011, Maringá. Anais... Maringá: 2011. p. 0621-0632.

APOLLONI, J.; LEGUIZAMÓN, G; ALBA, E. Two hybrid wrapper-filter feature selection algorithms applied to high-dimensional microarray experiments. Applied Soft Computing, v. 38, p. 922-932, 2016.

APPELBAUM F.R. Transplante de Células Hematopoiéticas. In: LONGO, D.L. Hematologia e Oncologia de Harrison. AMGH Editora, cap.30, p.316, 2015.

BAGINSKY, S.; et al. Update on gene expression analysis, proteomics, and network discovery. Plant Physiol., v. 152, 2010.

BARBOSA, E. B.; et al. Proteômica: metodologias e aplicações no estudo de

doenças humanas. Revista da Associação Médica Brasileira. São Paulo, v. 58, n. 3, p. 366-375, 2012.

BARSHAN, E.; GHODSJ, A.; AZIMIFAR, Z.; JAHROMI, M. Z. Supervised principal component analysis: Visualization, classification and regression on subspaces and submanifolds. Pattern Recognition, 2011.

BARTL, E.; REZANKOVA,H.; SOBISEK, L. Comparison of classical dimensionality reduction methods with Novel approach based on formal concept analysis. In: YAO, J.;RAMANNA, S.;WANG, G.; SURAJ, Z.(Eds.). Rough sets and knowledge

technology (RSKT 2011), October 9–12 2011, Banff, Canada. Lecture notes in computer science, v. 6954, p. 26-35, Springer, 2011.

BEER, D. G.; et al. Gene-expression Profiles Predict Survival of Patients with Lung Adenocarcinoma. Nature Medicine, v. 8, n. 8, p. 816-824, ago. 2002.

BERTON, L. Caracterização de classes e detecção de outliers em redes complexas. 2011. 89f. Dissertação (Mestrado em Ciências de Computação e Matemática Computacional) – Universidade de São Paulo. São Carlos, 2011.

BHATTACHARJEE, A.; et al. Classification of Human Lung Carcinomas by mRNA Expression Profiling Reveals Distinct Adenocarcinoma Subclasses. PNAS, v. 98, n. 24, p. 13790-13795, nov. 2001.

BINGHAM, E.; MANNILA, H. Random projection in dimensionality reduction:

applications to image and text data. In: Proceedings of the seventh ACM SIGKDD international conference on knowledge discovery and data mining (KDD 2001), August 26–29 2001, ACM: San Francisco, CA, USA. pp. 245–250, 2001.

BOENTE, A. N. P.; GOLDSCHMIDT, R. R.; ESTRELA, V. V. Uma metodologia de suporte ao processo de descoberta de conhecimento em bases de dados. In: SIMPÓSIO DE EXCELÊNCIA EM GESTÃO E TECNOLOGIA, 5., 2008. Resende (RJ). Anais...2008. v. 1. p. 4-5. Disponível em:

<http://www.boente.eti.br/publica/seget2008kdd.pdf>. Acesso em: 10 jun. 2015.

BOLÓN-CANEDO, V.; et al. A review of microarray datasets and applied feature selection methods. Information Sciences, v. 282, p. 111-135, 2014.

BORGES, H. B. Redução de dimensionalidade em bases de dados de

expressão gênica. 2006. 123 f. Dissertação (Mestrado em Informática) - Pontifícia Universidade Católica do Paraná. Curitiba, 2006.

BORGES, H. B.; NIEVOLA, J. C. Comparing the dimensionality reduction methods in gene expression databases. Expert Systems with Applications, vol. 39, p. 10780– 10795, 2012.

CARDOSO, O. N. P.; MACHADO, R. T. M. Gestão do conhecimento usando data mining: estudos de caso na Universidade Federal de Lavras. Revista de

Administração Pública, Fundação Getúlio Vargas, Rio de Janeiro, v. 42, n. 3, p. 495-528, maio/jun. 2008.

CASLEY, D. Primer on molecular biology. Technical report, U. S. Department of Energy, Office of Health and Environmental Research, 1992.

CHUANG, L.T.; YANG, C.H.; WU, K.C.; YANG, C.H. A hybrid feature selection method for DNA microarray data. Computers in Biology and Medicine, v. 41, p. 228-237, 2011.

CIOS, K. J.; PEDRYCZ, W.; SWINIARSKI, R. W.; KURGAN, L. A. Data Mining – A Knowledge Discovery Approach. Springer, 2007.

COLE, Laurence A. Biology of Life: Biochemistry, Physiology and Philosophy. Academic Press, p.57, 2016.

COLOMBO J.; RAHAL, P. A tecnologia de microarray no estudo do câncer de cabeça e pescoço, Revista Brasileira de Biociências, v. 8, n. 1, p. 64-72, 2010.

CORTES, C.; VAPNIK, V. Support vector networks. Machine Learning, v. 20, n 3, p. 273-297, 1995.

CRUZ, C. S. D.; TANOUE, L. T.; MATTHAY, R.A. Lung cancer: epidemiology, etiology, and prevention. Clinics in chest medicine, v. 32, n. 4, p. 605-644, 2011.

DASH, M.; LIU, H. Feature selection for classification. Intelligent Data Analysis, 1 (1-4), p. 131–15, 1997.

DUGGAN, D. J.; BITTNER, M.; CHEN, Y.; MELTZER, P.; TRENT, J.M. Expression profiling using cDNA microarrays. Nature Genetics, v. 21, p. 10-14, 1999.

DUNTEMAN, G. H. Principal components analysis. Sage University paper series on quantitative applications in the social sciences, Newbury Park, CA, USA, 1999.

FAYYAD, U.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From Data Mining to Knowledge Discovery in Databases. American Association for Artificial Intelligence, 1996.

FRUTUOSO, D. G. Recuperação de informação e classificação de entidades organizacionais em textos não estruturados. 2014. 86 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco. Recife, 2014.

GALVÃO, N. D.; MARIN, H.F. Técnica de mineração de dados: uma revisão da literatura. Acta Paulista de Enfermagem (online), São Paulo, v. 22, n. 5, p. 686- 690. set/out, 2009.

GIL, A. C. Como elaborar projetos de pesquisa. São Paulo: Atlas, 2002. Métodos e Técnicas de Pesquisa Social, v. 5, p. 64-73, 2001.

GHOSH, Antara; BARMAN, Soma. Application of Euclidean distance measurement and principal component analysis for gene identification. Gene, v. 583, n. 2, p. 112- 120, 2016.

GOLDSCHIMIDT, R.; PASSOS, E. Data mining: um guia prático. Rio de Janeiro: Campus, 2005.

GUYON, I.; ELISSEEFF, A. An introduction to variable and feature selection. Journal of Machine Learning Research, v. 3, p. 1157-1182, 2003.

HALL, M. A. Correlation-based feature selection for machine learning. 198 f. 1999. Thesis (Doctor of Philosophy) - Department of Computer Science. University of Waikato. Hamilton (New Zealand), 1999.

HASTIE, T.; et al. Classification by pairwise coupling. Annals of statistics, v. 26, n. 2, p. 451-471, 1998.

HOLMES, S.; et al. Visualization and statistical comparisons of microbial

communities using R packages on phylochip data. Bioscomputing 2011: Proceedings of the Pacific Symposium. Hawaii, USA, p. 142-153, 2011.

INSTITUTO NACIONAL DE CÂNCER JOSÉ ALENCAR GOMES DA SILVA. Ministério da Saúde. Instituto Nacional de Câncer José Alencar Gomes da Silva. Coordenação de Prevenção e Vigilância. Estimativa 2016: incidência de câncer no Brasil / Instituto Nacional de Câncer José Alencar Gomes da Silva. Rio de Janeiro: INCA, 122p, 2015.

INSTITUTO NACIONAL DE CÂNCER JOSÉ ALENCAR GOMES DA SILVA. COORDENAÇÃO GERAL DE AÇÕES ESTRATÉGICAS. COORDENAÇÃO DE EDUCAÇÃO. ABC do câncer: abordagens básicas para o controle do câncer, 2011. Disponível em: <

http://bvsms.saude.gov.br/bvs/publicacoes/inca/abc_do_cancer_2ed.pdf>. Acesso em: 10 fev. 2017.

JOHN, G. H.; LANGLEY, Pat. Estimating continuous distributions in Bayesian classifiers. In: Proceedings of the Eleventh conference on Uncertainty in artificial intelligence. Morgan Kaufmann Publishers Inc., 1995. p. 338-345.

JOLLIFFE, I.T. Principal Component Analysis (2. ed.) Springer, New York, 2002.

KAMBER, M.; HAN, J.; PEI, J. Data mining: Concepts and techniques. Elsevier, 2012.

KDNUGGETS POLL. KDnuggets Annual Software Poll: Using Data Science software in 2013. Disponível em: < http://www.kdnuggets.com/2013/06/kdnuggets- annual-software-poll-rapidminer-r-vie-for-first-place.html>. Acesso em: 01 abr. 2017.

KENT RIDGE Bio-medical Dataset. Disponível em: <http://datam.i2r.a- star.edu.sg/datasets/krbd//>. Acesso em: 30 abr. 2015.

KHALILABAD, N. D.; HASSANPOUR, H. Employing image processing techniques for cancer detection using microarray images. Computers in Biology and Medicine, v. 81, p. 139-147, 2017.

KIRA, K.; RENDELL, L. A. The feature selection problem: traditional methods and a new algorithm. In: CONFERENCE ON ARTIFICIAL INTELLIGENCE, 10.,

Proceedings... Menlo Park (CA), p. 129-136, 1992.

KOHAVI R.; JOHN, G. H. The Wrapper Approach. In: LIU, H.; MOTODA (Eds.). Proceedings of the feature extraction, construction and selection: A data mining perspective, 1998, p. 33–49.

KOPRINSKA, I.; RANA, M.; AGELIDIS, V. G. Correlation and instance based feature selection for electricity load forecasting. Knowledge-Based Systems, v.82, p.29-40, 2015.

KUMAR, Vinay; ASTER, Jon C.; ABBAS, Abbas. Robbins & Cotran Patologia- Bases Patológicas das Doenças. Elsevier Brasil, 2015.

LATKOWSKI, T.; OSOWSKI, S. Data mining for feature selection in gene expression autism data. Expert Systems with Applications, v. 42, n. 2, p. 864-872, 2015.

LAUSCH, A.; SCHMIDT, A.; TISCHENDORF, L. Data mining and linked open data– New perspectives for data analysis in environmental research. Ecological

Modelling, v. 295, p. 5-17, 2015.

LAZAR, C.; TAMINAU, J.; MEGANCK, S.; STEENHOFF, D.; COLETTA, A.;

MOLTER, C.; SCHAETZEN, V.; DUQUE, R.; BERSINI, H.; NOWE, A. A survey on Filtro techniques for feature selection in gene expression microarray analysis. IEEE/ACM Transactions on Computacional Biology and Bioinformatics, v. 9, p.1106-1119, 2012.

LINS, T. S.; MERSCHMANN, L. H. C. Técnicas de seleção de atributos utilizando paradigmas de algoritmos Disciplina de Projeto e Análise de Algoritmos.

Universidade Federal de Ouro Preto. Ouro Preto, Minas Gerais, 2010.

LIU, H.; YU, L. Toward Integrating Feature Selection Algorithms for Classification Vand Clustering. IEEE Transactions on Knowledge and Data Engineering, v.17, n. 4, p. 491-502, 2005.

LIU, L.; SO, A. Y.L.; FAN, J.B. Analysis of cancer genomes through microarrays and next-generation sequencing. Translational Cancer Research, v. 4, n. 3, p. 212-218, 2015.

LODISH, H.; et al. Biologia celular e molecular. Artmed Editora, 7° ed. 2014.

MACEDO, D.C. Comparação da redução de dimensionalidade de dados usando seleção de atributos e conceitos de framework: um experimento no domínio de clientes. Dissertação (Mestrado em Engenharia de Produção) – Universidade Tecnológica Federal do Paraná. Ponta Grossa, 2012.

MACEDO, D.C.; ISHIKAWA, E.C.M.; SANTOS, C.B.; MATOS, S.N.; BORGES, H.B.; FRANCISCO, A.C. Proposed method for dimensionality reduction based on

framework in gene expression domain. Genetics and Molecular Research, v.13, p.10597-10606, 2014.

MACEDO, D.C. Redução de dimensionalidade de dados derivados do domínio de expressão gênica: uma proposta de método. 2015. 138 f. Tese (Doutorado em Engenharia de Produção) – Universidade Tecnológica Federal do Paraná. Ponta Grossa, 2015.

MALUCELLI, A.; et al. Classificação de microáreas de risco com uso de mineração de dados. Revista de Saúde Pública, São Paulo, v. 44, n. 2, abr. 2010.

MARKOS, A. I.; VOZALIS, M. G.; MARGARITIS, K. G. An optimal scaling approach to collaborative filtering using categorical principal component analysis and neighborhood formation. In H. Papadopoulos, A. S. Andreou, & M. Bramer (Eds.), Artificial intelligence applications and innovations (AIAI 2010),

October 6–7 2010. Larnaca, Cyprus: Proceedings. IFIP Advances in information and communication technology (v. 339, p. 22-29). Springer, 2010.

MITCHELL, T. M. Machine learning. Boston: WCB/McGraw-Hill, 1997.

MORIN, P.J.; et al. Genética do Câncer. In: KASPER, D. L.; HAUSER, S.L.;

JAMESON, J.L.; FAUCI, A.S.; LONGO, D.L.; LOSCALZO, J. Medicina Interna de Harrison. McGraw, cap.7, p101e., 2016.

______. Generative and Discriminative classifiers: Naive Bayes and Logistic Regression. Machine Learning, Projeto da 2.ed, jan. 2010.

NASCIMENTO, M. C.; TOLEDO, F. M.; DE CARVALHO, A. C. Investigation of a new GRASP-based clustering algorithm applied to biological data. Computers &

Operations Research, v. 37, n. 8, p. 1381-1388, 2010.

PEREIRA, M. A.L. S. C. Manifestações neurológicas como forma de

apresentação do cancro do pulmão. 2009. 44f. Dissertação (Mestrado Integrado em Medicina) – Faculdade de Medicina da Universidade de Coimbra, Coimbra, 2009.

PERMONIAM, V. A. Visualização Exploratória de Dados do Desempenho na Aprendizagem em um Ambiente Adaptável. 2008. 124f. Tese (Doutorado em Engenharia Elétrica) – Universidade de São Paulo, Escola de Engenharia de São Carlos, São Carlos, 2008.

PRIETO-MORENO, A.; LLANES-SANTIAGO, O.; GARCÍA-MORENO, E. Principal components selection for dimensionality reduction using discriminant information applied to fault diagnosis. Journal of Process Control, v. 33, p. 14-24, 2015.

QUINLAN, J. R. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, 1993.

REZENDE, S. O. Sistemas inteligentes: fundamentos e aplicações. Barueri (SP): Manole, 2003.

SAEYS, Y.; INZA, I.; LARRANAGA, P. A review of feature selection techniques in bioinformatics, Bioinformatics, v. 23, p. 2507-2517, 2007.

SAKTHIVEL, N. R.; et al. Comparison of dimensionality reduction techniques for the fault diagnosis of mono block centrifugal pump using vibration signals. Engineering Science and Technology, an International Journal, v. 17, n. 1, p. 30-38, 2014.

SCHENA, M.; SHALON, D.; DAVIS, R. W.; BROWN, P. O. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science, v. 270, p.467–470, 1995.

SCHUCH, R.; DILL, S. L.; SUASEN, P. S.; PADOIN, E. L.; CAMPOS, M. Mineração de dados em uma subestação de energia elétrica. In: PROCEEDINGS OF THE 9TH

BRAZILIAN CONFERENCE ON DYNAMICS, CONTROLAND THEIR

APPLICATIONS – DINCON'10. Anais... Serra Negra, p. 804-810, jun. 2010.

SETÚBAL, J. C.; MEIDANIS, J. Introduction to Computational Molecular Biology. PWS Publishing Company, 1997.

SHLENS, J. A Tutorial on Principal Component Analysis. La Jolla, California, USA: Systems Neurobiology Laboratory, Salk Institute for Biological Studies, 2005.

SILVA, F. H. Apostila - curso de biologia molecular. INBIO - I Escola Brasileira de Inteligência Artificial e Bioinformática, Instituto de Ciências Matemáticas e de

Computação, Universidade de São Paulo. 2001. Disponível em:<http://

genfis40.esalq.usp.br/downloads/biologia_molecular.pdf>. Acesso em: 04 jun. 2015.

SILVA, L. A. F.; PASSOS, N. S. DNA Forense - coleta de amostras biológicas em locais de crime para estudo do DNA. Maceió: Edufal - Editora Gráfica da

Universidade Federal de Alagoas, 2002.

SONG, M.; YANG, H.; SIADAT, S.; PECHENIZKIY, M. A comparative study of dimensionality reduction techniques to enhance trace clustering performances. Expert Systems with Applications, v. 40, pp. 3722–3737, 2013.

SORENSEN, K.D.; ORNTOFT, T.F. Discovery of prostate cancer biomarkers by microarray gene expression profiling. Expert Review of Molecular Diagnostics, v.10, n.1, p.49-64, 2010.

SOUZA, C. P. Perfil de expressão de microRNAs e seus alvos moleculares em carcinoma pulmonar. 2016. 81f. Tese (Doutorado em Bases Gerais da Cirurgia). Universidade Estadual Paulista. Botucatu, 2016.

SOUZA, M.C. Câncer de pulmão: tendências de mortalidade e fatores associados à sobrevida dos pacientes do Instituto Nacional de Câncer José Alencar Gomes da Silva. 2012. 172 f. Tese (Doutorado em Ciências) – Escola Nacional de Saúde Pública Sergio Arouca. Rio de Janeiro, 2012.

SOUZA, P. C. Estudo da participação do colágeno V no câncer de pulmão, especificamente no carcinoma não de pequenas células. 2011. 219f.Tese (Doutorado em Ciências). Faculdade de Medicina da Universidade de São Paulo. São Paulo, 2011.

SUH, S. C. Practical applications of data mining. Jones & Bartlett Publishers, 2012.

TAVARES, C.; BOZZA, D.; KONO, F. Descoberta de conhecimento aplicado a dados eleitorais. Revista Gestão & Conhecimento, v. 5, n. 1, p. 54-9, jan./jun. 2007: Disponível em:

<http://gc.facet.br/v5n1/pdf/descoberta_de_conhecimento_aplicado_a_dados_eleitor ais.pdf>. Acesso em: 08 jun. 2015.

TORRE, L. A.; BRAY, F.; SIEGEL, R.L.; FERLAY, J.; LORTET-TIEULENT, J.; JERNAL, A. Global cancer statistics, 2012. CA Cancer J Clin.65: p.87-108, 2015.

VAPNIK, V. N. The Nature of Statistical Learning Theory. Springer-Verlag, 1995.

VOET, D.; VOET, J.G.; Bioquímica, 4ª edição. Artmed Editora, 2013.

WANG, G.; SONG, Q.; XU, B.; ZHOU, Y. Selecting feature subset for high

dimensional data via the propositional foil rules. Pattern Recognition, v. 46, p.199- 214, 2013a. Disponível em:

<http://www.sciencedirect.com/science/article/pii/S0031320312003469>. Acesso em: 30 abr. 2016.

WANG, J.; WU, L.; KONG, J.; YUXIN, LI.; ZHANG, B. Maximum weight and minimum redundancy: a novel Framework for feature subset selection. Pattern Recognit, v. 46, p. 1616-1627, jun. 2013b.

WEKA. The University of Waikato. Software. Disponível em:

<http://www.cs.waikato.ac.nz/ml/weka/>. Acesso em: 26 abr. 2016.

WORLD HEALTH ORGANIZATION. Cancer. Disponível em: <http://www.who.int/cancer/en/>. Acesso em: 30 abr.2017.

WIGLE, D. A.; et al. Molecular Profiling of Non-Small Cell Lung Cancer and

Correlation with Disease-free Surviva. Cancer Research, v. 62 p. 3005-3008, jun. 2002.

WITTEN, I. H.; FRANK, E.; HALL, M, A. Data mining: Practical machine learning tools and techniques (2nd ed.). San Francisco: Morgan Kaufmann, 2005.

WU, X.; et al. Top 10 algorithms in data mining. Knowledge and information systems, v. 14, n. 1, p. 1-37, 2008.

XU, X.; WANG, X. An adaptive network intrusion detection method based on PCA and support vector machines. In X. LI, S.; WANG, Z. Y. Dong (Eds.),

Advanced data mining and applications, first international conference (ADMA 2005), July 22–24, 2005. Wuhan, China: Proceedings. Lecture notes in computer science (v. 3584, p. 696–703). Springer, 2005.

YAMAGUCHI, J. K. Diretrizes para a escolha de técnicas de visualização aplicadas no processo de extração do conhecimento. 2010. 182f. Dissertação (Mestrado em Ciência da Computação) – Universidade Estadual de Maringá, Maringá, 2010.

YANG, H. HARRINGTON, C. A.; VARTANIAN, K.; COLDREN, C. D.; HALL, R.; CHURCHILL, G. A. Randomization in laboratory procedure is key to obtaining reproducible microarray results. PLoS One, 3:e3724, 2008.

YANG, Y.; LIU, X. A re-examination of text categorization methods. In: SIGIR'99 Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Berkeley. ACM Press, p. 42-49, 1999.

YIN, H.; HUANG, W. Adaptive nonlinear manifolds and their applications to pattern recognition. Information Sciences, 180(14):2649-62, 2010.

ZATZ, M. A biologia molecular contribuindo para a compreensão e a prevenção das doenças hereditárias. Ciência e Saúde Coletiva, v.7, n.1, p.85-99, 2002.

ZHANG, Z.; JIANG, M.; YE, N. Effective multiplicative updates for non-negative discriminative learning in multimodal dimensionality reduction. Artificial Intelligence Review, v.34, n.3, p. 235–260, 2010.

ZOU, D.; MA, L.; YU, J.; ZHANG, Z. Biological databases for human research. Genomics, proteomics & bioinformatics, v. 13, n. 1, p. 55-63, 2015.

Genes selecionados

A fim de apresentar os conhecimentos gerados, serão descritos os genes que foram selecionados com mais frequência e o percentual de vezes que apareceram nos experimentos nas bases de dados estudadas para o método de Seleção de Atributos. A Tabela 13 refere-se aos genes com relação a base LungCancer-Michigan, seguidamente da Tabela 14, que se refere à base LungCancer-Ontario e a Tabela 15 para a base LungCancer-Harvard.

Outra questão importante é que os genes identificados são fundamentados nos estudos feitos pelos autores de cada base de dados. As informações pertinentes aos genes podem ser vistas em instituições de pesquisa como National Center For

Biotechnology Informations – NCBI, Affymetric, Ensembl, entre outros.

Tabela 13 - Genes selecionados com mais frequência na base LungCancer-Michigan pelo Método de Seleção de Atributos

Atributo Percentual

J02874_at 33,3%

L34657_at 44,4%

U60115_at 44,4%

X64559_at 22,2%

Fonte: Autoria própria

Tabela 14 – Genes selecionados com mais frequência na base LungCancer-Ontario pelo método de Seleção de Atributos

Atributo Percentual 281898 44,4% 302402 33,3% 259592 22,2% 50416 22,2% 470571 22,2%

Fonte: Autoria própria

Tabela 15 – Genes selecionados com mais frequência na base LungCancer-Harvard pelo método de Seleção de Atributos

Atributo Percentual 33529_at 22,2% 34981_at 22,2% 36743_at 33,3% 38138_at 33,3% (continua)

(continuação) 41453_at 33,3% 31791_at 33,3% 32650_at 22,2% 33322_i_at 22,2% 34708_at 22,2% 35669_at 44,4% 37639_at 22,2% 38689_at 33,3% 38700_at 22,2% 33904_at 22,2% 36105_at 22,2% 37406_at 22,2% 38032_at 22,2% 41325_at 22,2% 1814_at 44,4% 598_at 22,2% 39990_at 22,2%

Documentos relacionados