• Nenhum resultado encontrado

Sobre os objetivos definidos no começo dessa iniciativa, é possível fazermos os seguintes destaques:

• O serviço comercial selecionado para o tema da modelagem mostrou ser altamente relevante para a gestão operacional da distribuidora, visto a dificuldade da empresa em conseguir organizar seus recursos produtivos diante de um ingresso até então imprevisto de uma nova solicitação comercial, sendo tema estratégico para a gestão de uma empresa regulada;

• Sobre os modelos gerados, a visualização das regras de classificação por meio das árvores de decisão facilitou em muito as discussões com os profissionais da empresa, comprovando a facilidade de comunicação que tal modelagem viabiliza para o modelador no momento de apresentar os resultados. Ao longo da execução das diferentes simulações, também foi possível identificar variáveis testadas que não agregavam ganho de informação aos algoritmos, facilitando a depuração de quais atributos deveriam permanecer na modelagem. Para uma primeira iniciativa de análise de dados desse tipo realizada na referida distribuidora de energia, houve um consenso de que trabalhos futuros nesse formato deverão ser expandidos dentro da organização.

• A análise do histórico de dados identificou uma base inicial de casos para o desenvolvimento do trabalho, tendo conseguindo estabelecer várias regras para a ordenação separação das informações existentes, graças a interação frequente com os profissionais comerciais da distribuidora.

Com relação aos resultados obtidos, devido aos baixos índices de assertividade na classificação, foi então possível compreender que fatores diversos podem sim ter influenciado diretamente a modelagem. Dos pontos discutidos com a equipe de trabalho, destacaram-se as seguintes hipóteses:

• Durante a etapa do modelo CRISP-DM de Preparação dos Dados, houve o cuidado de se separarem casos de clientes em que as informações registradas no banco de dados da empresa compreendiam erros de registros e/ou situações em que a nota de serviço utilizada continha outras ações além da ligação nova.

Entende-se que a possibilidade de outros erros no histórico podem não ter sido identificadas, justificando uma revisita a etapa de limpeza das informações;

• O registro de mais informações a respeito do comportamento do consumidor corresponde a grande oportunidade de abertura de novos dados a serem testados pelos modelos de árvore de decisão. Desde a análise de situações corriqueiras no dia a dia da empresa como os atendimentos presenciais e por call-centers (passíveis de análise de mineração de texto), bem como a possiblidade de se entrevistar o cliente em pesquisas de opinião, são recursos que devem ser melhor considerados na formação de informações sobre o comportamento do consumidor; • A característica intrínseca a cidade de Santa Maria, localidade esta que é reconhecida por um intenso fluxo de cidadãos devido a ser um polo universitário e militar, pode, de certa forma, comprometer o histórico de dados. O ponto aqui é levantar a suposição de que o comportamento do consumidor dessa região pode ser atípico ao de demais regiões onde tal fluxo seja tão presente. Alternativas a serem consideradas são a utilização dos modelos desenvolvidos em outras localidades (onde tal característica de mobilidade não seja presente) pode obter resultados melhores;

• Outra possibilidade de interferência nos resultados está na própria condição econômica vigente no país, onde a perda de poder aquisitivo pode ser sim um fator de influência. Relembrando que a origem da interrupção do fornecimento reside em débitos não quitados para com a distribuidora, um percentual maior de consumidores pode não estar tendo condições financeiras de quitarem suas pendências, demandando mais tempo para obterem o recurso necessário para regularizar a situação. Por outro lado, é preciso também investigar se a própria empresa distribuidora não alterou suas práticas de cobrança e negociação, visto que índices maiores de inadimplência podem a ter levado a adotar uma política de negociação mais restritiva.

Independentemente das novas etapas do trabalho que poderão vir a ser executadas em uma nova etapa do projeto, é possível afirmar que a escolha dos modelos de árvores de decisão contribuiu muito para o debate e entendimento do trabalho junto com os profissionais participantes da distribuidora. A visualização em árvores das informações modeladas e testadas ao longo do tempo auxiliara no entendimento da relevância dos atributos, o que

colaborou diretamente para a seleção dos casos mais relevantes na etapa de limpeza dos dados. Conforme prescrito na definição do modelo CRISP-DM, a construção do conhecimento é feita de avanços e recuos ao longo das etapas previstas, sendo a interação entre analistas de projeto e modelos estatísticos a chave para gradativamente o ponto fundamental para o refino do conhecimento gerado e criação de novas perspectivas a respeito do negócio em estudo.

REFERÊNCIAS

AGÊNCIA NACIONAL DE ENERGIA ELÉTRICA. Procedimentos da Distribuição, Módulo 8: Qualidade da energia elétrica PRODIST, Brasília, DF, 2017, revisão 8.

AGÊNCIA NACIONAL DE ENERGIA ELÉTRICA. Resolução Normativa nº 414, Brasília, DF, 2010.

AMIN, A.; ANWAR, S.; ADNAN, A.; NAWAZ, M.; ALAWFI, K., HUSSAIN, A.; HUANG, K. Customer churn prediction in the telecommunication sector using a rough set approach. Neurocomputing, 237(2017), 242-254.

BREIMAN, L.; FRIEDMAN, J.; STONE, C.; OLSHEN, R. Classification and Regression Trees. Taylor and Francis, 1984.

CHEN, C.; CHIANG, R.; WU, T.; CHU, H. A combined mining-based framework for predicting telecommunications customer payments behaviors. Expert Systems with Applications, 40(2013), 6561-6569.

COELLI, T.; GAUTIER, A.; PERELMAN, S.; POP, R. Estimating the cost of improving quality in electricity distribution: A parametric distance function approach. Energy Policy, 53 (2013), 287-297.

CORTON, M.; ZIMMERMANN, A.; PHILLIPS, M. The low cost of quality improvements in the electricity distribution sector of Brazil. Energy Policy, 97 (2016), 485-493.

CULLMANN, A.; NIESWAND, M. Regulation and investment incentives in electricity distribution: An empirical assessment. Energy Economics, 57 (2016), 192-203.

FAYYAD, U. M. et al. Data mining and knowledge discovery. Boston: Kluwer. 1996.

FERNANDES, C.; CANDELA, A.; GÓMEZ, T. An approach to calibrate incentives for continuity of supply in the Spanish electricity distribution system. Electric Power Systems Research, 82 (2012), 81-87.

GARCIA, D.; NEBOT, A.; VELLIDO, A. Intelligente data analysis approaches to churn as a business problem: a survey. Knowledge Information Systems, 51(2017), 719-774.

GERHARDT, T. E.; SILVEIRA, D. T. Métodos de Pesquisa. UFRGS Editora, (2009), 120 páginas.

HAN, S.H.; LU, S.X.; LEUNG, S.C.H. Segmentation of telecom customers based on customer value by decision tree model. Expert Systems with Applications, 39 (2012), 3964- 3973.

HANEY, A.B.; POLLITT, M.G. Efficiency analysis of energy networks: An international survey of regulators. Energy Policy, 37 (2009), 5814-5830.

HIZIROGLU, A. Soft computing applications in customer segmentation: State-of-art review and critique. Expert Systems with Applications, 40(2013), 6491-6507.

HUANG, B.; KECHADI, M.; BUCKLEY, B. Customer churn prediction in telecommunications. Expert Systems with Applications, 39(2012), 1414-1425.

JAMASB, T.; OREA, L.; POLLITT, M. Estimating the marginal cost of quality improvements: The case of the UK electricity distribution companies. Energy Economics, 34 (2012), 1498-1506.

JAMASB, T.; POLLITT, M. Incentive regulation of electricity distribution networks: Lessons of experience from Britain. Energy Policy, 35 (2007), 6163-6187.

KERAMATI, A.; MARANDI, R.J.; ALIANNEJADI, M.; AHMADIAN, I.; MOZAFFARI, M.; ABBASI, U. Improved churn prediction in telecommunication industry using data mining techniques. Applied Soft Computing, 24 (2014), 994-1012.

KD Nuggets. Data Mining Methodology. Disponível em:

<https://kdnuggets.com/polls/2004/data_mining_methodology.htm>. Acesso em: 02 dez. 2018.

LARIVIÈRE, B.; POEL, D. V. Predicting customer retention and profitability by using random forests and regression forests techniques. Expert Systems with Applications, 29 (2005), 472-484.

LAROSE, D. T.; LAROSE, C. D. Data mining and predictive analytics. Wiley series on methods and applications in data mining, 2015, 827 pages.

LI, Y.; THOMAS, M.; OSEI-BRYSON. A snail shell process model for knowledge discovery via data analytics. Decision Support Systems, 91(2016), 1-12.

LIAO, S.; CHU, P.; HSIAO, P. Data mining techniques and applications – A decade review from 2000 to 2011. Expert Systems with Applications, 39(2012), 11303-11311.

LIN, S.; CHEN, S. Parameter determination and feature selection for C4.5 algorithm using scatter search approach. Soft Computing, 16(2012), 63-75.

MARTINEZ, A.; SCHMUCK, C.; JR, S.; PIRKER, C.; HALTMEIER, M. A machine learning framework for customer purchase prediction in the non-contractual setting. European Journal of Operational Research, 000(2018), 1-9.

MUATA, K.; OSEI-BRYSON. A context-aware data mining process model based framework for supporting evaluation of data mining results. Expert Systems with Applications, 39(2012), 1156-1164.

NEPAL, R.; JAMASB, T. Incentive regulation and utility benchmarking for electricity network security. Economic Analysis and Policy, 48 (2015), 117-127.

NIE, G.; ROWE, W.; ZHANG, L.; TIAN, Y.; SHI, Y. Credit card churn forecasting by logistic regression and decision tree. Expert Systems with Applications, 38(2011), 15273- 15285.

POUDINEH, R.; JAMASB, T. Determinants of investment under incentive regulation: The case of the Norwegian electricity distribution networks. Energy Economics, 53 (2016), 193- 202.

PROVOST, F.; FAWCETT, T. Data Science para Negócios – O que você precisa saber sobre Mineração de Dados e Pensamento Analítico de Dados, Rio de Janeiro: Alta Books. 2016. SCHMIDTHALER, M.; COHEN, J.; REICHL, J.; SCHMIDINGER, S. The effects of network regulation on electricity supply security: a European analysis. J Regul Econ (2015) 48:285-316.

SHARMA, S.; OSEI-BRYSON, KASPER, G. Evaluation of an integrated Knowledge Discovery and Data Mining process model. Expert Systems with Applications, 39(2012), 11335-11348.

SHARMA, S.; OSEI-BRYSON. Framework for formal implementation of the business understanding phase of data mining projects. Expert Systems with Applications, 36(2009), 4114-4124.

SHARMA, S.; OSEI-BRYSON. Toward and integrated knowledge discovery and data mining process model. The Knowledge Engineering Review, Vol. 25:1, 49-67.

SHEARER, C. The CRISP-DM model: The new blueprint for data mining. Journal of Data Warehousing, 5(4), 13-22. 2000.

YEO, B.; GRANT, D. Predicting service industry performance using decision tree analysis. International Journal of Information Management, 38(2018), 288-300.

VERBEKE, W.; DEJAEGER, K.; MARTENS, D.; HUR, J.; BAESENS, B. New insights into churn prediction in the telecommunication sector: A profit driven data mining approach. European Journal of Operational Research, 218(2012), 211-229.

VIDULIN, V.; BOHANEC, M.; GAMS, M. Combining human analysis and machine data mining to obtain credible data relations. Information Sciences, 288(2014), 254-278.

VIEGAS, J.; VIEIRA, S.; MELÍCIO, R.; MENDES, V.; SOUSA, J. Classification of new electricity customers based on surveys and smart metering data. Energy, 107(2016), 804-817. WANG, Y.F.; CHIANG, D.A.; HSU, M.H.; LIN, C.J.; LIN, I.L. A recommender system to avoid customer churn: A case study. Expert Systems with Applications, 36 (2009), 8071- 8075.

ANEXO I - DESCRIÇÃO DOS ATRIBUTOS RECEBIDOS DURANTE A ETAPA DE

Documentos relacionados