• Nenhum resultado encontrado

4.2 Metodologia

4.2.1 Entendimento do Problema

4.2.1.1 Mapeamento do Problema

O mapeamento do problema é o primeiro processo a ser realizado na metodologia

DMBuilding. Durante esse processo são elaboradas documentações formais sobre o problema

a ser resolvido para que haja um entendimento comum de todos os envolvidos no projeto. As entradas desse processo são o documento de formalização do início do projeto e a informações sobre a situação do negócio da organização.

Capítulo 4 – DMBuilding: Metodologia Proposta 47

Entender o negócio como um todo é um pré-requisito para o descobrimento de conhecimento. Sem esse entendimento, é provável que ocorram diversos problemas na fase de preparação de dados e montagem da visão. Conseqüentemente os dados não serão tratados de forma a produzir resultados confiáveis após a aplicação de qualquer algoritmo [Berry & Linoff 2004].

Os responsáveis por esse processo são o líder do projeto e analista de negócios, que coletam, analisam e documentam todos os objetivos da organização. Contam com o suporte do especialista do domínio, que possui todas as informações referentes ao domínio da aplicação e do especialista em TI, que auxilia nas questões referentes à área de informática.

A primeira atividade a ser realizada é a compreensão do que a organização realmente deseja realizar. É freqüente que existam muitos objetivos concorrentes e restrições que devem ser balanceadas. O objetivo é expor, desde o início, os fatores importantes que podem influenciar o resultado do projeto. Após a compreensão dos objetivos, define-se o problema que a organização deseja resolver. Uma possível conseqüência ao não realizar essa atividade é gastar muito esforço para produzir as respostas certas para as perguntas erradas [Chapman et al. 2000].

Diversas discussões com os responsáveis pela organização devem ser realizadas, a fim de alinhar as informações com todos os envolvidos no projeto. É importante que todas as reuniões e entrevistas sejam documentadas para posteriores consultas.

O próximo passo é verificar se o problema que se pretende resolver pode/deve ser traduzido em um problema que possa ser resolvido através da utilização de técnicas de MD. Nos casos onde o problema pode ser resolvido com MD, o projeto segue adiante. Em alguns casos, ou não é possível se resolver com MD ou existe solução mais prática (como uma simples solução algorítmica). Nos casos onde não é possível o uso de técnicas de MD, deve-se verificar se é possível uma nova definição do problema que seja traduzida em um problema de MD. Se uma nova definição não é possível, o projeto é abortado. Caso haja a possibilidade de tradução, o projeto segue seu fluxo.

Para a definição de um problema, é importante considerar que o projeto deve ter o tamanho ideal para ser considerado praticável e ser relevante para a organização. Em casos de dúvidas quanto à melhor caracterização do problema, uma das alternativas é examinar exemplos de problemas que foram executadas com sucesso na mesma área de atuação da organização.

Após a especificação do problema, deve ser averiguado e documentado o fluxo de informação da organização. Segundo [Petró et al. 2006], o fluxo de informação está

Capítulo 4 – DMBuilding: Metodologia Proposta 49

relacionado a atividades ligadas à produção, disseminação e uso da informação, desde a concepção de uma idéia até a sua explicitação e aceitação como parte do conhecimento universal.

Para o problema, o fluxo da informação identifica a forma como os dados são obtidos, relacionados e armazenados. Esse tipo de informação é importante para:

• Definir quais variáveis podem ser utilizadas;

• Entender o motivo de anomalias presentes nos dados, como falta de preenchimento, erro em formato, entre outros;

• Compreender o fluxo do negócio;

• Definir o melhor momento para utilizar os resultados que serão obtidos com o projeto de mineração de dados.

Outra questão importante é a relação dos recursos mínimos para a realização do projeto. Devem ser verificados os recursos atualmente disponíveis (incluindo pessoas, dados, recursos computacionais, softwares, entre outros). Posteriormente é necessário definir quais os recursos extras que devem ser adquiridos. Se os recursos necessários para o desenvolvimento do projeto não podem ser adquiridos, deve-se avaliar se uma nova definição de problema pode ser feita (por exemplo, fazendo a redução do escopo do problema), considerando os objetivos da organização e os recursos disponíveis. Caso não seja possível, o projeto pode ser abortado.

É de suma importância o total envolvimento da equipe de T.I. da organização, pois problemas com máquinas, recursos humanos, documentação, organização, responsabilidade e agilidade podem afetar o rendimento do projeto.

Além da análise dos recursos, é importante identificar os riscos associados ao projeto. Um risco é qualquer que pode causar atrasos ou falhas no projeto. Se existem riscos associados ao projeto, um plano alternativo deve ser criado a fim de descrever as ações que devem ser executadas caso os riscos ocorram.

O analista de negócios também é responsável por criar um glossário com todas as terminologias referentes ao projeto. No glossário devem constar termos referentes ao domínio da organização e à mineração de dados, para que todos os envolvidos no projeto estejam habituados com os termos mais utilizados.

A última atividade desse processo é a definição das pessoas envolvidas no projeto. Um documento relacionando nomes, responsabilidades e formas de contato é gerado nesta

atividade. Na grande maioria dos casos, uma mesma pessoa pode acumular responsabilidades, dependendo do seu papel na organização ou no projeto.

As entradas, as saídas, os responsáveis e as atividades associadas a este processo estão especificadas abaixo.

Entradas:

• Documento de formalização do início do projeto;

• Documentos informativos relacionados ao negócio da organização (mercado, rendimento, área de atuação, etc);

Atividades:

• Identificar e definir o problema a ser resolvido; • Especificar o fluxo da informação da organização; • Definir os recursos disponíveis e os necessários;

• Especificar os riscos associados ao projeto e elaborar um plano alternativo; • Elaborar o glossário;

• Definir os papéis e responsabilidades dos envolvidos no projeto.

Responsáveis: • Líder do projeto; • Analista de Negócio; • Especialista do Domínio; • Especialista em TI. Saídas:

• Documento com a descrição do problema: descreve o problema a ser resolvido com mineração de dados;

• Fluxo da informação: mostra o fluxo da informação dentro da organização; • Recursos disponíveis e necessários: lista os recursos necessários para a

realização do projeto, especificando os atualmente disponíveis e os que deverão ser adquiridos;

• Lista de riscos e plano alternativo: contém os riscos associados ao projeto e as alternativas que devem ser tomadas caso os riscos venham a acontecer;

Capítulo 4 – DMBuilding: Metodologia Proposta 51

• Glossário do projeto: contém toda a terminologia do projeto, seja relacionada ao negócio ou à mineração de dados;

• Lista de envolvidos no projeto e suas responsabilidades: os nomes, os papéis, as responsabilidades e as formas de contato das pessoas envolvidas no projeto.