5. Conclusões

5.3. Limitações e Trabalho Futuro

No trabalho exposto foi possível percepcionar como é que determinados atributos influenciaram o resultado das campanhas de subscrição de depósitos a prazo e qual a sua importância na definição de um modelo explicativo. Para confirmar os resultados, seria interessante compará-los com os obtidos através de técnicas clássicas de estatística, como por exemplo, a regressão logística. Por um lado, poder-se-ia averiguar se as descobertas em ambos os casos eram similares e, por outro, permitiria verificar até que ponto as mais recentes técnicas de Data Mining estão em condições de substituir uma abordagem clássica.

A utilidade de um modelo explicativo vai no sentido de fornecer conhecimento às equipas de gestão do negócio. No entanto, a criação de um processo automático de utilização desse conhecimento pressuporia a implementação de um modelo preditivo. Tal permitiria uma selecção automática dos contactos mais adequados a uma campanha com base nas características de cada cliente, definidas em função dos valores dos seus atributos.

O facto de se ter usado informação sobre a execução de contacto, obtida somente após o início da campanha, relevou-se extremamente importante na definição do modelo: dos cinco atributos mais importantes para o modelo, três são referentes a dados de contacto, sendo dois deles os mais importantes. Esta revelação permite pressupor que seria difícil obter um bom modelo preditivo somente com os dados utilizados, removendo a informação de contacto.

Apesar de tudo, no estudo de Javaheri (2008) ficou patente que, apenas com atributos de informação bancária, era possível obter um modelo preditivo com uma capacidade de previsão bastante aceitável. Nesse trabalho foram usados 84 atributos relacionados todos com informação bancária, muitos deles quantitativos. Por comparação, no caso da presente investigação, só foram usados 13 atributos, e todos nominais binários (com excepção do saldo bancário). Assim, deveria ser obtida informação bancária mais detalhada para auxiliar na definição eventual de um modelo preditivo.

Adicionalmente, alguma da informação pessoal do cliente acabou por não ser utilizada. Por exemplo, o local de residência: como existiam demasiadas freguesias e códigos postais,

não foram utilizados para a definição dos modelos. No entanto, pode-se extrapolar o concelho e distrito de residência tendo em conta o código postal, com recurso a uma base de dados pública disponibilizada pelos CTT26. Tais dados poderiam ser úteis na previsão de sucessos, uma vez que é um facto que há distritos onde o rendimento per capita é superior a outros27.

Existe ainda informação que poderia ser relevante para um modelo preditivo: em qualquer produto que se pretenda vender, existem duas características chave – o preço e a qualidade. No caso de depósitos a prazo, a qualidade não é relevante, uma vez que as instituições possuem, em geral, uma imagem sólida e suportada por fundos de garantia do Banco de Portugal. Assim, o preço pode ser um factor decisivo e, no caso dos depósitos, é consubstanciado pela taxa de juro oferecida. Desta forma, o conjunto de dados poderia ser enriquecido pela adição de, pelo menos, mais três atributos: a taxa oferecida no depósito, a taxa média dos depósitos a prazo de todos os bancos, e uma taxa de referência para a generalidade das operações bancárias (eventualmente, ou a taxa Euribor, ou a taxa de referência do Banco Central Europeu - BCE).

26 CTT (Correios Telégrafos e Telefones) – Empresa de Correios de Portugal.

27 Retirado do Semanário Expresso, “Mapa dos salários em Portugal”, edição online de 31 de Março de 2011 – http://aeiou.expresso.pt/mapa-dos-salarios-em-portugal=f574045.

