4.2 Metodologia
4.2.1 Entendimento do Problema
4.2.1.1 Mapeamento do Problema
O mapeamento do problema é o primeiro processo a ser realizado na metodologia
DMBuilding. Durante esse processo são elaboradas documentações formais sobre o problema
a ser resolvido para que haja um entendimento comum de todos os envolvidos no projeto. As entradas desse processo são o documento de formalização do início do projeto e a informações sobre a situação do negócio da organização.
Capítulo 4 – DMBuilding: Metodologia Proposta 47
Entender o negócio como um todo é um pré-requisito para o descobrimento de conhecimento. Sem esse entendimento, é provável que ocorram diversos problemas na fase de preparação de dados e montagem da visão. Conseqüentemente os dados não serão tratados de forma a produzir resultados confiáveis após a aplicação de qualquer algoritmo [Berry & Linoff 2004].
Os responsáveis por esse processo são o líder do projeto e analista de negócios, que coletam, analisam e documentam todos os objetivos da organização. Contam com o suporte do especialista do domínio, que possui todas as informações referentes ao domínio da aplicação e do especialista em TI, que auxilia nas questões referentes à área de informática.
A primeira atividade a ser realizada é a compreensão do que a organização realmente deseja realizar. É freqüente que existam muitos objetivos concorrentes e restrições que devem ser balanceadas. O objetivo é expor, desde o início, os fatores importantes que podem influenciar o resultado do projeto. Após a compreensão dos objetivos, define-se o problema que a organização deseja resolver. Uma possível conseqüência ao não realizar essa atividade é gastar muito esforço para produzir as respostas certas para as perguntas erradas [Chapman et al. 2000].
Diversas discussões com os responsáveis pela organização devem ser realizadas, a fim de alinhar as informações com todos os envolvidos no projeto. É importante que todas as reuniões e entrevistas sejam documentadas para posteriores consultas.
O próximo passo é verificar se o problema que se pretende resolver pode/deve ser traduzido em um problema que possa ser resolvido através da utilização de técnicas de MD. Nos casos onde o problema pode ser resolvido com MD, o projeto segue adiante. Em alguns casos, ou não é possível se resolver com MD ou existe solução mais prática (como uma simples solução algorítmica). Nos casos onde não é possível o uso de técnicas de MD, deve-se verificar se é possível uma nova definição do problema que seja traduzida em um problema de MD. Se uma nova definição não é possível, o projeto é abortado. Caso haja a possibilidade de tradução, o projeto segue seu fluxo.
Para a definição de um problema, é importante considerar que o projeto deve ter o tamanho ideal para ser considerado praticável e ser relevante para a organização. Em casos de dúvidas quanto à melhor caracterização do problema, uma das alternativas é examinar exemplos de problemas que foram executadas com sucesso na mesma área de atuação da organização.
Após a especificação do problema, deve ser averiguado e documentado o fluxo de informação da organização. Segundo [Petró et al. 2006], o fluxo de informação está
Capítulo 4 – DMBuilding: Metodologia Proposta 49
relacionado a atividades ligadas à produção, disseminação e uso da informação, desde a concepção de uma idéia até a sua explicitação e aceitação como parte do conhecimento universal.
Para o problema, o fluxo da informação identifica a forma como os dados são obtidos, relacionados e armazenados. Esse tipo de informação é importante para:
• Definir quais variáveis podem ser utilizadas;
• Entender o motivo de anomalias presentes nos dados, como falta de preenchimento, erro em formato, entre outros;
• Compreender o fluxo do negócio;
• Definir o melhor momento para utilizar os resultados que serão obtidos com o projeto de mineração de dados.
Outra questão importante é a relação dos recursos mínimos para a realização do projeto. Devem ser verificados os recursos atualmente disponíveis (incluindo pessoas, dados, recursos computacionais, softwares, entre outros). Posteriormente é necessário definir quais os recursos extras que devem ser adquiridos. Se os recursos necessários para o desenvolvimento do projeto não podem ser adquiridos, deve-se avaliar se uma nova definição de problema pode ser feita (por exemplo, fazendo a redução do escopo do problema), considerando os objetivos da organização e os recursos disponíveis. Caso não seja possível, o projeto pode ser abortado.
É de suma importância o total envolvimento da equipe de T.I. da organização, pois problemas com máquinas, recursos humanos, documentação, organização, responsabilidade e agilidade podem afetar o rendimento do projeto.
Além da análise dos recursos, é importante identificar os riscos associados ao projeto. Um risco é qualquer que pode causar atrasos ou falhas no projeto. Se existem riscos associados ao projeto, um plano alternativo deve ser criado a fim de descrever as ações que devem ser executadas caso os riscos ocorram.
O analista de negócios também é responsável por criar um glossário com todas as terminologias referentes ao projeto. No glossário devem constar termos referentes ao domínio da organização e à mineração de dados, para que todos os envolvidos no projeto estejam habituados com os termos mais utilizados.
A última atividade desse processo é a definição das pessoas envolvidas no projeto. Um documento relacionando nomes, responsabilidades e formas de contato é gerado nesta
atividade. Na grande maioria dos casos, uma mesma pessoa pode acumular responsabilidades, dependendo do seu papel na organização ou no projeto.
As entradas, as saídas, os responsáveis e as atividades associadas a este processo estão especificadas abaixo.
Entradas:
• Documento de formalização do início do projeto;
• Documentos informativos relacionados ao negócio da organização (mercado, rendimento, área de atuação, etc);
Atividades:
• Identificar e definir o problema a ser resolvido; • Especificar o fluxo da informação da organização; • Definir os recursos disponíveis e os necessários;
• Especificar os riscos associados ao projeto e elaborar um plano alternativo; • Elaborar o glossário;
• Definir os papéis e responsabilidades dos envolvidos no projeto.
Responsáveis: • Líder do projeto; • Analista de Negócio; • Especialista do Domínio; • Especialista em TI. Saídas:
• Documento com a descrição do problema: descreve o problema a ser resolvido com mineração de dados;
• Fluxo da informação: mostra o fluxo da informação dentro da organização; • Recursos disponíveis e necessários: lista os recursos necessários para a
realização do projeto, especificando os atualmente disponíveis e os que deverão ser adquiridos;
• Lista de riscos e plano alternativo: contém os riscos associados ao projeto e as alternativas que devem ser tomadas caso os riscos venham a acontecer;
Capítulo 4 – DMBuilding: Metodologia Proposta 51
• Glossário do projeto: contém toda a terminologia do projeto, seja relacionada ao negócio ou à mineração de dados;
• Lista de envolvidos no projeto e suas responsabilidades: os nomes, os papéis, as responsabilidades e as formas de contato das pessoas envolvidas no projeto.