• Nenhum resultado encontrado

Caracterização de competitividade de pregões eletrônicos por meio de mineração de dados

N/A
N/A
Protected

Academic year: 2017

Share "Caracterização de competitividade de pregões eletrônicos por meio de mineração de dados"

Copied!
76
0
0

Texto

(1)

1.

2.

ABBOTT

Pró-Reitoria de Pós-Graduação e Pesquisa

Stricto Sensu em Gestão do Conhecimento e da Tecnologia da

Informação

CARACTERIZAÇÃO DE COMPETITIVIDADE DE PREGÕES

ELETRÔNICOS POR MEIO DE MINERAÇÃO DE DADOS

Brasília - DF

2011

(2)

RICARDO AKL LASMAR DE ALVARENGA

CARACTERIZAÇÃO DE COMPETITIVIDADE DE PREGÕES ELETRÔNICOS POR MEIO DE MINERAÇÃO DE DADOS

Dissertação apresentada ao Programa de Pós-Graduação Strictu Sensu em Gestão do Conhecimento e da Tecnologia da Informação da Universidade Católica de Brasília, como requisito parcial para obtenção do Título de Mestre em Gestão do Conhecimento e da Tecnologia da Informação.

Orientador: Prof. Remis Balaniuk

Coorientador: Prof. Hércules Antônio do Prado

(3)
(4)
(5)

AGRADECIMENTOS

 À Deus, por me guiar em todos os momentos, me dar a força necessária para superar as dificuldades e me suprir em todas as minhas necessidades.

 Á minha esposa (Maressa Alvarenga), companheira fiel de estudo, pelo amor, incentivo, alegria, força e exemplo de determinação. Fundamental para o sucesso das pesquisas relacionadas ao processo de compras dos órgãos do Governo Federal brasileiro.

 Aos meus pais (Carlos Magno e Maria Inês) e à minha irmã (Carolina

Lasmar), pelo carinho, paciência, companheirismo e amor incondicional. São exemplos de vida em harmonia.

 Aos professores – Remis Balaniuk, Hercules Prado e Edilson Fernda – pela orientação prestada neste trabalho acadêmico.

(6)

RESUMO

A Controladoria Geral da União (CGU) possui autonomia para fiscalizar os proces-sos de compras dos órgãos do Governo Federal brasileiro, punir os fraudadores e prevenir a ocorrência de fraudes. Para adquirir serviços ou produtos os órgãos go-vernamentais devem seguir um processo administrativo pré-definido, denominado licitação. Dentre as modalidades de compra contempladas pela licitação está o pre-gão eletrônico que, assim como as demais, está sujeito a fraudes. Os comportamen-tos dos fraudadores modificam-se constantemente e detectá-los é uma tarefa com-plexa. Pretende-se, com os resultados da presente pesquisa, auxiliar a CGU a aferir o grau de competitividade dos pregões eletrônicos por meio da utilização de padrões obtidos pela aplicação de técnicas de Mineração de Dados (MD) no Data Warehouse (DW) das compras governamentais. O principal resultado alcançado foi a caracteri-zação de grupos de pregões com diferentes graus de competitividade, a partir de indicadores especificados para este fim, com base no conhecimento de especialistas do ramo.

(7)

ABSTRACT

The Controladoria Geral da União (CGU) has autonomy to oversee the procurement processes of the organs of the Brazilian federal government, punishing fraudsters and prevent fraud. To purchase products or services, government agencies must fol-low a pre-defined administrative process, called licitation. Among the arrangements for purchase contemplated by the electronic trading is that, like the others, is prone to fraud. The behaviors of fraudsters change constantly and detect them is a complex task. It is intended, with the results of this study, help CGU to gauge the degree of competitive electronic auctions through the use of patterns obtained by applying techniques of Data Mining (DM) in the Data Warehouse (DW) of government pro-curement. The main result achieved is the characterizing group of sessions with dif-ferent degrees of competitiveness using indicators specified for this purpose, based on the knowledge of experts in the field.

(8)

SUMÁRIO

RESUMO... 5

ABSTRACT ... 6

1 INTRODUÇÃO ... 8

1.1 TEMA ... 8

1.2 REVISÃO DA LITERATURA ... 12

1.3 RELEVÂNCIA DO ESTUDO ... 16

1.4 PROBLEMA ... 16

1.5 OBJETIVOS ... 17

2 REFERENCIAL TEÓRICO ... 19

2.1 LICITAÇÃO ... 19

2.2 INDICADORES ... 21

2.3 GESTÃO DO CONHECIMENTO ... 27

2.4 DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS ... 29

2.5 DATA WAREHOUSE ... 32

3 METODOLOGIA ... 36

3.1 CLASSIFICAÇÃO DA PESQUISA ... 36

3.2 PRESSUPOSTO FUNDAMENTAL ... 36

3.3 COLETA E ANÁLISE DOS DADOS ... 38

3.4 DELIMITAÇÃO DO ESTUDO ... 38

4 APLICAÇÃO ... 39

4.1 COMPREENSÃO DO NEGÓCIO ... 39

4.2 COMPREENSÃO DOS DADOS ... 41

4.3 PREPARAÇÃO DOS DADOS ... 43

4.4 MODELAGEM ... 52

4.5 AVALIAÇÃO ... 59

4.6 APLICAÇÃO ... 69

5 CONCLUSÃO E TRABALHOS FUTUROS ... 71

(9)

1 INTRODUÇÃO

1.1 TEMA

Para adquirir serviços ou produtos, os órgãos do Governo Federal devem rea-lizar uma licitação, processo administrativo pelo qual se busca selecionar a proposta mais vantajosa e proporcionar igual oportunidade aos fornecedores (licitantes), se-jam eles pessoas físicas ou jurídicas. Este processo é regulado pela lei ordinária brasileira nº 8.666 (BRASIL, 1993), que define as seguintes modalidades de licita-ção: Concorrência, Tomada de Preços, Leilão, Concurso e Convite. Em 2002, a lei 10.520 (BRASIL, 2002) instituiu o pregão no ordenamento jurídico brasileiro para aquisição de bens e serviços comuns em processos licitatórios.

Apesar de todo cuidado que cerca a realização de uma licitação todo e o rigor da legislação sobre o assunto, desde a elaboração do edital até a adjudicação dos resultados, práticas ilícitas ocorrem, requerendo da parte do poder público o aprimo-ramento constante do processo de compras governamentais. Em um cenário em que recursos financeiros dos órgãos governamentais são desviados de forma criminosa por indivíduos ou grupos organizados, áreas importantes como transporte, saúde e educação são privadas de investimentos, deixando à população serviços públicos de baixa qualidade.

A mitigação de corrupção em licitações demanda fiscalização e controle das atividades exercidas por pessoas, órgãos governamentais e fornecedores. A obser-vação de padrões de comportamento dos vários atores que participam de uma licita-ção permite a identificalicita-ção de situações anômalas, possivelmente associadas a atos ilícitos. No Brasil, esse controle é exercido pelos Tribunais de Contas (TC) e pela Controladoria Geral da União (CGU). Estes órgãos possuem autonomia para fiscali-zar os processos de compras do governo, punir os fraudadores e prevenir a ocorrên-cia de fraudes.

Os Tribunais de Contas exercem jurisdição administrativa, julgando contas dos administradores de recursos públicos, e são organizados da seguinte maneira:

 O Tribunal de Contas da União (TCU), com sede no Distrito Federal e repre-sentação em todas as Unidades da Federação;

(10)

 Quatro Tribunais de Contas dos Municípios, localizados nos Estados da Bahia, Ceará, Pará e Goiás; e

 Dois Tribunais de Contas Municipais, localizados nos Municípios de São Paulo e Rio de Janeiro.

Vale ressaltar que o Tribunal de Contas dos Municípios é distinto do Tribunal de Contas Municipal, pois o primeiro fiscaliza as contas relacionadas aos municípios pertencentes a um estado e o segundo fiscaliza as contas de um município específi-co.

De forma complementar, a CGU é responsável por assistir a Presidência da República em assuntos relativos à defesa do patrimônio público e ao incremento da transparência da gestão por meio de atividades de controle interno, auditoria, correi-ção, prevencorrei-ção, combate à corrupção e ouvidoria.

Em 2008, a CGU inaugurou o Observatório da Despesa Pública (ODP), vincu-lado ao Programa de Governo de Controle Interno, Prevenção e Combate à Corrup-ção. O ODP foi constituído como uma unidade permanente com o objetivo de apri-morar o controle interno, servindo como mais uma ferramenta de combate à corrup-ção para apoiar a Gestão Pública. O foco dessa unidade é aplicar métodos científi-cos de Tecnologia da Informação em dados oriundos de diversas fontes relaciona-dos aos gastos públicos para a produção de informações relevantes que venham a identificar má aplicação de recursos federais. O ODP conta com equipe especializa-da em técnicas de inteligência investigativa e faz uso de ferramentas de Business Intelligence (BI), Online Analytical Processing (OLAP), processamento estatístico e análise investigativa em seus laboratórios. Para isso, é seguido um processo, com-posto por cinco fases (Iniciação, Elaboração, Execução, Conclusão e Difusão), que define desde os dados a serem analisados até a produção de relatórios para as par-tes interessadas.

Desde novembro de 2009, a Universidade Católica de Brasília (UCB) volve, em conjunto com a CGU, um projeto de pesquisa que visa estudar e desen-volver métodos, técnicas e ferramentas de combate à corrupção no Governo Fede-ral. A presente dissertação é um dos resultado desse projeto.

(11)

corres-ponde a, aproximadamente, 242.924 (duzentos e quarenta e dois mil, novecentos e vinte e quatro) compras por ano.

Além do número de pregões que ocorrem no Brasil, é importante destacar que o montante de recursos financeiros movimentado por essa modalidade de compra foi, entre 1997 de 2009 de R$ 20.363.654.641 (vinte bilhões, trezentos e sessenta e três milhões, seiscentos e cinquenta e quatro mil e seiscentos e quarenta e um reais) em produtos e serviços adquiridos via pregão eletrônico. Isso corresponde a, apro-ximadamente, R$ 1.566.434.972 (um bilhão, quinhentos e sessenta e seis milhões, quatrocentos e trinta e quatro mil e novecentos e setenta e dois reais) por ano.

Este trabalho visa, por meio da exploração de técnicas de Mineração de Da-dos (MD), analisar a competitividade de pregões para identificação de compras for-jadas ou de baixa concorrência. A análise foi realizada sobre os dados de compras do Ministério do Planejamento, Orçamento e Gestão, registrados nos seus sistemas de controle. Espera-se que o resultado permita a criação de conhecimento que indi-que baixa competitividade em pregões eletrônicos e possa auxiliar os órgãos contro-ladores na detecção de irregularidades.

MD é o processo de explorar grandes quantidades de dados para identifica-ção de padrões que podem auxiliar a descoberta de conhecimento. Este conheci-mento pode ser apresentado de diversas formas como: agrupaconheci-mentos, regras, hipó-teses e grafos. Essa disciplina se desenvolveu devido ao crescimento exorbitante do volume de dados disponível, o que inviabiliza a análise humana e fortalece o concei-to de que o computador pode ser ágil e útil para detectar novos padrões e conceiconcei-tos. Para aplicar a MD em informações relacionadas às compras governamentais, neste estudo foi utilizada a metodologia CRISP-DM (CHAPMAN et al, 1998), que divide em fases as atividades de um projeto de descoberta de conhecimento em bancos de dados:

1. Entendimento do negócio – estudo dos principais conceitos relacionados a compras governamentais (foco em pregão eletrônico) e corrupção.

2. Entendimento dos dados – entendimento de como os dados estão distribuídos para serem capturados e combinados, de forma que possam ser aplicados no contexto da pesquisa.

(12)

4. Modelagem – seleção, aplicação e calibragem da(s) técnica(s) de mineração a serem utilizadas no projeto.

5. Avaliação – avaliação dos resultados obtidos para averiguar se os objetivos do negócio foram atingidos .

6. Aplicação – final do projeto. Apresentação dos resultados obtidos às partes in-teressadas e demonstração de como aplicá-los/utilizá-los.

Os dados utilizados no estudo estão armazenados em um armazém de dados alimentado pelos sistemas que registram as compras realizadas pelos órgãos gover-namentais. O Sistema de Serviços Gerais (SISG) organiza a gestão das atividades de serviços gerais, compreendendo licitações, contratações, transportes, comunica-ções administrativas, documentação e administração de edifícios públicos e de imó-veis. Este sistema organiza a área de compras governamentais, integrada por uni-dades administrativas distribuídas por todos os ministérios, autarquias e fundações públicas da administração federal. O órgão central do SISG é a Secretaria de Logís-tica e Tecnologia da Informação (SLTI), que faz parte da estrutura do Ministério do Planejamento, Orçamento e Gestão (MP). A SLTI é responsável pela normatização e supervisão técnica das áreas de serviços gerais, incluindo a incumbência de elabo-rar normas e procedimentos para as compras e contratações no âmbito da adminis-tração federal.

(13)

Após análise da estrutura dos dados de compras do Ministério do Planeja-mento, Orçamento e Gestão, foram identificadas entidades relevantes – compras, órgãos, pregoeiros, fornecedores e funcionários – que podem apresentar comporta-mentos anômalos que podem estar associados a irregularidades, tais como o conlui-o, prática que tem reflexo na competitividade do processo licitatório.

O conluio caracteriza-se por ações combinadas entre entidades que visam, ir-regularmente, obter vantagem perante o mercado. Em licitações públicas, isto é da-noso aos órgãos governamentais, pois pode privilegiar um fornecedor, ferindo assim a lei da livre concorrência e/ou fazendo com que os órgãos adquiram produtos e ser-viços com preços acima do praticado no mercado. Essa prática se concretiza pelo envolvimento de diversas entidades, como acordos órgão-fornecedor, pregoeiro-fornecedor, fornecedor-fornecedor ou órgão-pregoeiro.

A hipótese central deste trabalho é que, por meio da análise de comportamen-tos dos atores envolvidos no processo licitatório, refletida nos dados registrados, po-de-se produzir conhecimento útil à CGU que venha a identificar se os pregões ele-trônicos realizados pelos órgãos do Governo Federal Brasileiro estão de acordo com os padrões de competitividade.

1.2 REVISÃO DA LITERATURA

Poucas publicações foram encontradas em fontes acadêmicas envolvendo as palavras-chave desta pesquisa: Descoberta de conhecimento em base de dados; Conluio; Detecção de fraudes; Compras governamentais; Pregão eletrônico. Retra-tando que o tema é pouco explorado no Brasil. O mesmo ocorre no âmbito interna-cional. Dentre os trabalhos encontrados, os que mais se aproximam do contexto desta pesquisa abordam a detecção de fraudes por meio da utilização de técnicas de MD.

Como contexto para a discussão da literatura pertinente, foi utilizado o traba-lho de Phua et al (2005), que expõe uma visão geral da aplicação das técnicas de MD para detecção de fraudes em diversos campos. Os autores sintetizaram diversos estudos, descrevendo os métodos e técnicas de MD usualmente aplicados para a detecção de fraudes e as respectivas aplicações.

(14)

causado. Para melhor identificação dos perfis dos fraudadores os autores classifi-cam-nos em: (i) internos, gerentes e funcionários ligados à instituição inerente a fraude, e (ii) externos, clientes e fornecedores que podem ter os perfis de fraudado-res habituais, criminosos e crime organizado.

Após enfatizar a importância da mitigação e detecção de fraudes, os autores julgam que as várias ações tomadas nesse sentido, quando operacionais, são ge-ralmente caras, lentas e com baixa eficácia. Nesse contexto, as técnicas de MD ga-nham importância, pois são capazes de otimizar o processo por meio de atividades que proporcionam automatização de processos, redução de custos e diminuição ou mesmo eliminação de esforço manual.

A utilização de técnicas de MD pode ser compensadora para detectar transa-ções fraudulentas e apontar comportamentos suspeitos de forma online ou offline. Entretanto, apesar dessa detecção ser eficiente em alguns casos, não se pode aco-modar com a identificação de um único padrão, já que os fraudadores mudam cons-tantemente de comportamento visando desenvolver novas formas de transgredir as barreiras desenvolvidas.

Apesar das vantagens em utilizar MD serem óbvias, há dois fatores que difi-cultam o amadurecimento dessa disciplina na detecção de fraudes. A falta de dados reais para realização dos experimentos é um deles. Devido à dificuldade de obter dados reais, muitos pesquisadores criam dados sintéticos para testar seus modelos. BARSE, E. L.; KVARNSTROM, H.; JONSSON, E. (2003) admitem que os dados sin-téticos podem ser úteis no treinamento de bases para identificação de comportamen-tos fraudulencomportamen-tos, mas ressaltam que estes comportamencomportamen-tos devem ser, posterior-mente, buscados em bases reais. Além disso, há resistência de se publicar os estu-dos, pois assim os fraudadores tomariam conhecimento dos comportamentos mape-ados e produzam novos tipos de ações fraudulentas.

Após relatar, de modo genérico, a utilização de MD para a detecção de frau-des, os autores aprofundam o assunto e discutem os tipos de aprendizagem de má-quina que podem ser aplicados ao tema:

(15)

 A aprendizagem não-supervisionada utiliza dados não classificados e detecta fraudes que não foram identificadas anteriormente por meio da identificação de padrões anômalos.

 A aprendizagem semi-supervisionada mescla a aprendizagem supervisionada com o não-supervisionado.

Após analisar as técnicas utilizadas para cada tipo de aprendizagem, os auto-res concluem que técnicas mais complexas como Redes Neurais e Support Vector Machine (SVM) são mais utilizadas, porém, alternativas menos complexas como Redes Bayesianas e métodos estatísticos podem produzir resultados tão bons quan-to aqueles, e se os dados analisados precisam ser examinados em tempo real, a utilização de aprendizagem supervisionada pode ser ineficaz.

Fawcett (1997) cita uma ideia muito utilizada para detecção de fraudes origi-nada da aplicação de MD em serviços de anti-spam. Nessa abordagem, busca-se entender a natureza temporal da irregularidade incluída em uma black-list visando a configuração do comportamento do motor de varredura para automatizar o processo de remoção dos spams. Além disso, o autor enfatiza a existência de barreiras que prejudicam a identificação de fraudes com MD, como o grande volume de dados, os diversos modelos de fraudes, a mudança das leis e dos comportamentos dos frau-dadores.

ABBOTT, D.; MATKOVSKY, P.; ELDER, J. (1998) apresentam um estudo que compara as ferramentas de MD do mercado utilizadas para detecção de fraudes, visando prover aos desenvolvedores de aplicações subsídios para a escolha da fer-ramenta mais adequada a uma determinada aplicação.

Para Weatherford (2002) a disciplina de MD possui dois desafios relacionados à detecção de Fraudes: (i) elaborar algoritmos que possam aprender sobre os diver-sos cenários de fraude e identificar e prever novos cenários e (ii) elaborar sistemas que trabalham rápido o suficiente para detectar atividades fraudulentas em tempo de execução. Para a autora, a utilização de redes neurais é vantajosa por proporcionar flexibilidade, velocidade e adaptatividade.

(16)

usuá-rios. Outro ponto explorado pelos autores é a utilização de indicadores de desempe-nho para avaliar a eficácia da técnica aplicada, pois o objetivo principal na detecção de fraudes é maximizar as previsões corretas e minimizar as incorretas. Por exem-plo, no caso de se construir classificadores (aprendizagem supervisionada), poder-se-ia utilizar como métricas de qualidade a taxa de erro do modelo, a média de falso positivo/negativo e a rapidez da detecção. Os autores citam apenas as abordagens supervisionada e não-supervisionada e, para cada classe de estudo, são utilizados abordagens específicas. Assim, (i) para fraudes com cartões de crédito, sugerem o uso de Redes Neurais; (ii) para detecção de intrusão em ambientes computacionais, indicam o uso de Sistemas Especialistas, Redes Neurais, Modelos Baseados em Raciocínio, Modelos de Associação/Classificação, Análise de Transição de Estado ou Algoritmos Genéticos; (iii) no contexto das telecomunicações, sugeren Redes Neurais e Métodos de Visualização.

Chen et al (2004) focam em investigação policial. Os autores afirmam que as técnicas de MD são vantajosas para as investigações, pois podem analisar Bases de Dados extensas de forma rápida e eficiente. Os custos destes softwares são meno-res do que o treinamento de recursos humanos e os computadomeno-res são menos pro-pensos a falhas do que os seres humanos, uma vez que as investigações precisam de horas contínuas de dedicação e análise. Dentre as técnicas citadas pelos autores estão: Extração de Entidades, Análise de Agrupamentos, Regras de Associação, Detecção de Desvios, Classificação, Comparação de Strings e Análise de Redes Sociais. Um estudo de caso mostra como a utilização de MD, por meio de análise de vínculos, desvendou 16 membros-chaves de gangues, bem como os seus grupos e subgrupos.

Apparao et al (2009) apresenta um framework para a aplicação de MD em ex-tensas bases de dados com o objetivo de detectar fraudes. O framework segue o fluxo tradicional de informação para MD: coleta de dados, integração de dados, pro-cessamento de dados, mineração de dados e avaliação de padrões. Os dados utili-zados são classificados como oriundos de: “companhias com fraude e sem fraude”,

(17)

Nos estudos analisados, verificou-se ausência de abordagens voltadas para a identificação de situações anômalas em licitações, justificando, assim a pertinência o presente estudo.

1.3 RELEVÂNCIA DO ESTUDO

O processo de compra de órgãos governamentais é vulnerável, o que possibi-lita a ocorrência de fraudes. Controlar as compras governamentais é complexo, pois, além dos fraudadores modificarem o comportamento constantemente para burlar a fiscalização, o número de licitações que acontecem no Brasil diariamente é alto.

Atualmente, há vários estudos que visam à aplicação de MD para a detecção de fraudes e comportamentos suspeitos em áreas como a venda via cartão de crédi-to e a detecção de intrusão em sistemas computacionais. Porém, nenhum trabalho relevante foi encontrado sobre a aplicação de MD em informações relacionadas à licitação. Assim, este trabalho visa explorar a aplicação de MD em licitações, na mo-dalidade Pregão Eletrônico, a fim de caracterizar a competitividade do certame.

A utilização de MD aplicada aos dados de compras do Ministério do Planeja-mento, Orçamento e Gestão (MPOG) pode ocasionar a emergência de padrões rele-vantes de relacionamento entre dados para a CGU de modo a auxiliá-la no processo de fiscalização e controle das licitações, com foco em pregão eletrônico. De forma subsidiária, espera-se que este trabalho contribua com a expansão do conhecimento do processo de compras governamentais e das aplicações bem sucedidas de MD.

1.4 PROBLEMA

Diariamente ocorrem diversas compras governamentais e fiscalizá-las é com-plexo devido ao excesso de dados e à constante criação/mudança de comportamen-to dos licitantes fraudadores. Efetuar a fiscalização utilizando recursos humanos é caro, lento e com baixa eficácia. Neste ponto, as técnicas de MD podem ser bem exploradas, pois são capazes de otimizar o processo por meio de atividades que proporcionam: automatização, redução de custos e diminuição ou, até mesmo, eli-minação de esforço manual.

(18)

Analisan-do o contexto dessa modalidade, é possível definir diversos indicaAnalisan-dores que podem ser alimentados com dados de compras do MPOG.

Indicadores são instrumentos de gestão ligados ao monitoramento de um da-do contexto e auxiliam na medição da-do resultada-do e da-do desempenho de determinadas atividades. São dados concretos que representam características úteis às equipes de gestão.

A aplicação de MD em indicadores relacionados às compras realizadas via pregão eletrônico permite acompanhar o comportamento das entidades envolvidas para avaliar se o processo está de acordo com os padrões de competitividade, o que pode levar os órgãos controladores a detectarem irregularidades e tomarem ações corretivas. As mesmas técnicas de MD e os indicadores utilizados para detectar possíveis irregularidades podem ser utilizados, após a tomada de ações corretivas, para averiguar se a estratégia e ações aplicadas na correção foram eficazes. De-pendendo do resultado obtido nessa análise, novas estratégias de correção podem ser elaboradas.

Neste trabalho, foram aplicadas técnicas de MD em indicadores definidos em conjunto com especialistas e alimentados com informações extraídas da base que contém os dados das compras governamentais com o intuito de detectar pregões eletrônicos com baixa concorrência ou, até mesmo, forjados.

A partir do exposto, a questão geradora desta pesquisa poderia ser enunciada da seguinte forma: Como as técnicas de MD aplicadas em indicadores alimentados com dados de compras do MPOG podem produzir conhecimento útil às entidades controladoras para identificarem se os pregões eletrônicos realizados pelos órgãos do Governo Federal brasileiro são competitivos?

1.5 OBJETIVOS

O objetivo deste trabalho é caracterizar grupos de pregões eletrônicos a partir da aplicação de técnicas de MD (segmentação) nos dados de compras do Governo Federal Brasileiro de modo que sejam identificados agrupamentos suspeitos, cujo comportamento destoa dos demais em aspectos ligados à concorrência.

(19)

entida-des suspeitas de praticarem comportamentos irregulares. Para isso, serão executa-das as seguintes atividades:

 Levantamento das situações hipotéticas de irregularidades em pregões eletrô-nicos;

 Definição, junto com especialistas de negócio, de indicadores relacionados a compras governamentais;

 Alimentação dos indicadores com dados extraídos do armazém de dados de compras do MPOG;

 Identificação de pregões eletrônicos com baixa concorrência;

 Identificação de comportamentos suspeitos que podem representar falta de competitividade em pregões eletrônicos;

 Análise dos comportamentos detectados e medir o grau de relevância;

 Validação dos resultados com especialistas;

 Medição do grau de normalidade de um pregão eletrônico;

(20)

2 REFERENCIAL TEÓRICO

2.1 LICITAÇÃO

O processo de licitação no Brasil é regulado pela lei 8.666 (BRASIL, 1993). O princípio básico da licitação é o edital, pois nele estão as regras do processo que será realizado, bem como todas as características do produto ou serviço pretendido pela entidade licitatória.

A licitação possui duas fases: (i) a interna, destinada a firmar a intenção da enti-dade licitante, bem como obter informações necessárias à consolidação da licitação, e (ii) a externa, que é a licitação propriamente dita, destinada a selecionar a melhor proposta relacionada ao objeto desejado. Apenas objetos semelhantes que podem ser fornecidos por mais de uma entidade são licitáveis, devido à obrigatoriedade de concorrência. Há casos em que a licitação deixa de ser obrigatória. A lei 8.666 prevê três situações de exclusão do procedimento licitatório: (i) licitação dispensada, nos casos previstos no art. 17, quando a Administração não poderá realizar a licitação, uma vez que a lei afasta a possibilidade de realização do procedimento, (ii) licitação dispensável, modalidade em que a Lei estabelece, no art. 24, todas as hipóteses em que a licitação, embora possível, não é obrigatória, e (iii) licitação inexigível, quando há impossibilidade jurídica de competição, cujas hipóteses são previstas no art. 25. A principal diferença entre a dispensa e a inexigibilidade é que a primeira ainda per-mite a concorrência/competição, enquanto a segunda não, pois, neste caso, há ape-nas uma entidade que atende às necessidades do Órgão.

A lei 8.666/1993 prevê cinco modalidades de licitação, relacionadas com o va-lor estimado de contrato:

 Concorrência: modalidade na qual podem participar quaisquer interessados que na fase de habilitação preliminar comprovem possuir os requisitos mínimos de qualificação exigidos no edital para execução do objeto da licitação. Exem-plo: obras e serviços de engenharia acima de R$ 1.500.000,00, e compras e outros serviços acima de R$ 650.000,00;

(21)

de R$ 150.000,00 até R$ 1.500.000,00, e compras e outros serviços acima de R$ 80.000,00 até R$ 650.000,00;

 Convite: modalidade realizada entre interessados do ramo tratado pelo objeto da licitação, escolhidos e convidados em número mínimo de três pela Adminis-tração. Exemplo: obras e serviços de engenharia entre R$ 15.000,00 e R$ 150.000,00, e compras e outros serviços entre R$ 8.000,00 e R$ 80.000,00;

 Concurso: modalidade realizada entre quaisquer interessados para escolha de trabalho técnico, científico ou artístico, mediante a instituição de prêmios ou remuneração aos vencedores, conforme critérios constantes de edital publica-do na imprensa oficial com antecedência mínima de 45 dias;

 Leilão: modalidade realizada entre quaisquer interessados para a venda de bens móveis inservíveis para a Administração ou de produtos legalmente apre-endidos ou penhorados, ou para a alienação de bens imóveis prevista no art. 19, a quem oferecer o maior lance, igual ou superior ao valor da avaliação.

Pela Medida Provisória nº 2.026/2000 (BRASIL, 2000), convertida na Lei n° 10.520/2002 (BRASIL, 2002), foi instituída uma sexta modalidade de licitação:

 Pregão: modalidade em que a disputa pelo fornecimento de bens ou serviços comuns é feita em sessão pública. Os licitantes apresentam suas propostas de preços por escrito e por lances verbais (pregão presencial), ou via internet (pregão eletrônico), independentemente do valor estimado da contratação.

Aplicáveis à maioria das modalidades, com exceção do concurso, há quatro tipos de licitação:

 Menor preço: critério de seleção em que a proposta mais vantajosa para a Ad-ministração é a de menor preço. É utilizado para compras e serviços de modo geral;

 Melhor técnica: critério de seleção em que a proposta mais vantajosa para a Administração é escolhida com base em fatores de ordem técnica. É usado ex-clusivamente para serviços de natureza predominantemente intelectual, em es-pecial na elaboração de projetos, cálculos, fiscalização, supervisão e gerenci-amento e de consultoria em geral e, em particular, para elaboração de estudos técnicos preliminares e projetos básicos e executivos;

(22)

no-tas obtidas nas proposno-tas de preço e técnica. É obrigatório na contratação de bens e serviços de informática, na modalidade tomada de preços e concorrên-cia;

 Maior lance ou oferta: Nos casos de alienação de bens ou concessão de direito real de uso.

2.2 INDICADORES

A definição de indicadores é um passo primordial quando se deseja caracteri-zar (quantificar ou qualificar) objetivos, metas ou resultados. Não há uma metodolo-gia ou processo padrão para essa definição, porém, a Secretaria de Gestão do MPOG elaborou, a partir da revisão das principais experiências de construção de indicadores para o setor público e privado, um roteiro para assegurar a coerência e objetividade na formulação de indicadores (MPOG, 2009). Este roteiro é composto por 10 passos, conforme mostrado na Figura 1.

Figura 1: Passos para definição de indicadores

(23)

Como a definição e a manipulação de indicadores é algo primordial para esta pesquisa, a metodologia sugerida pelo MPOG foi adaptada de modo que possa ser aplicada no desenvolvimento deste trabalho. A seguir, é apresentada a descrição de cada um dos 10 passos, adaptados para o tema da pesquisa.

Passo 1 - Identificação do nível e da dimensão

Inicialmente, são identificadas informações básicas e fundamentais para a e-xecução das fases posteriores. Perguntas como: ‘Por que é necessário utilizar

indi-cadores?’, ‘O que será mensurado?’, ‘Quem será beneficiado?’ e ‘Para quem será modelado os indicadores?’ devem ser feitas e respondidas nessa fase.

Uma vez respondidos estes questionamentos, são definidos os níveis dos in-dicadores. Uma ferramenta eficiente para a definição dos níveis é a cadeia de valor, pois facilita a representação do universo que será analisado. Na Figura 2 está repre-sentada essa cadeia que, a partir da elaboração de respostas para os questiona-mentos contidos nos balões, permite a identificação dos níveis.

Figura 2: Cadeia de Valor

Fonte: MPOG (2009)

Após a identificação dos níveis, devem ser definidas dimensões para classifi-car e subdividir os indicadores. Assume-se como razoável que o número de níveis e

dimensões respeite o número mágico de Miller, “7 mais ou menos 2” (MILLER,

(24)

Quadro 1: Definição de níveis e dimensões

Nível Dimensão

Fornecedores Capacidade

Competitividade Confiabilidade Conformidade Economicidade

Passo 2 - Estabelecimento de indicadores

Finalizado o passo 1, os subsídios principais para a elaboração dos indicado-res já estão definidos. Os indicadoindicado-res devem ser especificados por meio de métricas estatísticas, comumente formadas por porcentagem, média, número bruto, propor-ção e índice. Para a definipropor-ção dos indicadores, deve ser levado em conta a relevân-cia e alguns critérios como:

 Seletividade ou importância: fornece informações sobre as principais variáveis estratégicas e prioridades definidas de ações, produtos ou impactos esperados;

 Simplicidade, clareza, inteligibilidade e comunicabilidade: os indicadores devem ser simples e compreensíveis, capazes de levar a mensagem e o significado. Os nomes e expressões devem ser facilmente compreendidos e conhecidos por todos os públicos interessados;

 Representatividade, confiabilidade e sensibilidade: capacidade de demonstrar a mais importante e crítica etapa de um processo, projeto, etc. Os dados devem ser precisos, capazes de responder aos objetivos e coletados na fonte de da-dos correta e devem refletir tempestivamente os efeitos decorrentes das inter-venções;

 Investigativos: os dados devem ser fáceis de analisar, sejam estes para regis-tro ou para reter informações e permitir juízos de valor;

 Comparabilidade: os indicadores devem ser facilmente comparáveis com as re-ferências internas ou externas, bem como com séries históricas de aconteci-mentos;

 Estabilidade: procedimentos gerados de forma sistemática e constante, sem muitas alterações e complexidades, uma vez que é relevante manter o padrão e permitir a série histórica;

(25)

be-nefícios em relação aos custos devem satisfazer todos os outros demais níveis. Nem todas as informações devem ser mensuradas, é preciso avaliar os benefí-cios gerados em detrimento do ônus despendido.

Neste passo, a tabela construída no passo 1 pode ganhar mais uma coluna para representar a evolução da definição dos indicadores, como mostrado no Qua-dro 2.

Quadro 2: Definição de Indicadores

Nível Dimensão Indicadores

Fornecedores Capacidade Porte do Fornecedor

Tempo de Existência do Fornecedor Situação atual do Fornecedor

Total, em dinheiro, ganho pelo fornecedor

Total, em dinheiro, ganho pelo fornecedor por ano Quantidade de licitações que o fornecedor já participou

Passo 3 - Validação preliminar dos indicadores com as partes interessadas

Neste passo, já há alguns indicadores definidos e as partes interessadas en-tram no processo para validar a utilidade destes. É importante conscientizá-los dos critérios citados no passo anterior, para que sejam selecionados os melhores indica-dores e removidos ou revistos os que não se adéquam a realidade.

Para facilitar o processo de validação dos indicadores, é aconselhável elabo-rar uma tabela semelhante á anterior com mais três colunas – Complexidade, Rele-vância e Viabilidade – que devem ser preenchidas com valores de 1 a 5 (indicativos de peso):

 Complexidade: quão difícil é obter dados que possam alimentar os indicadores. Deve ser preenchida pela(s) equipe(s) envolvida(s) nos passos anteriores.

 Relevância: a importância do indicador para o negócio. Deve ser preenchida pelas partes interessadas.

(26)

Viabilidade =

5

6ComplexidadeRelevância

(1)

considerando-se como indicador viável aquele cujo resultado for maior que 2,5.

Passo 4 - Construção de fórmulas e unidades de medida

Após a validação preliminar dos indicadores com as partes interessadas, são construídas as fórmulas que descrevem como os indicadores serão calculados. Fórmulas complexas e inviáveis devem ser evitadas. Além disto, a facilidade de compreensão deve ser considerada. Cada fórmula deve possuir uma unidade de medida e seguir uma linha de raciocínio, possibilitando a análise do resultado obtido e a comparação com uma série histórica. A partir das fórmulas, os indicadores são classificados em simples, um valor atribuível a uma variável, ou composto, expres-sam relação entre duas ou mais variáveis, como coeficientes, porcentagem e razão.

Após a conclusão desta fase, a tabela ganha mais duas colunas: fórmula e unidade de medida, conforme mostrado no Quadro 3.

Quadro 3: Definição de fórmulas

Nível Dimensão Indicadores Fórmula de medida Unidade

Fornecedor Capacidade Total, em dinheiro, ganho pelo fornecedor por ano

a p

Onde p representa a quantia, em dinheiro, ganha pelo fornecedor em cada pregão e a os anos que existem pregões onde o fornecedor concorreu

R$

Passo 5 - Definição de responsáveis

Aqui é definida a periodicidade da coleta dos dados (semanal, mensal, ...) e são estabelecidos os responsáveis pela geração, divulgação e apuração dos resul-tados de cada indicador.

Passo 6 - Geração de sistema de coleta de dados

(27)

ob-tenção de dados acessíveis, confiáveis e de qualidade.

Passo 7 - Ponderação e validação final dos indicadores com as partes interessadas

Este passo é semelhante ao 3, porém é mais consistente, uma vez que os in-dicadores já foram, previamente, validados e estão mais fundamentados. Aqui são escolhidos os indicadores relevantes e eliminados os irrelevantes, de modo que os indicativos sejam legítimos, capazes de demonstrar a visão global do todo.

Para que a seleção dos indicadores seja coerente e segura, os critérios para se estabelecer um ranqueamento das medidas propostas são os seguintes: (i) re-presentatividade (proximidade com o objetivo da unidade de análise), (ii) atendimen-to às necessidades de informação das partes interessadas, (iii) confiabilidade meatendimen-to- meto-dológica, (iv) confiabilidade da fonte, (v) simplicidade, (vi) objetividade, clareza e co-municabilidade, (vii) exequibilidade de mensuração, (viii) economicidade de obten-ção, (ix) estabilidade ao longo do tempo, (x) investigativos (capazes de serem ras-treados ao longo do tempo), (xi) tempestividade, (xii) comparabilidade e (xiii) sensibi-lidade.

Com os indicadores bem definidos, é aconselhável fazer um levantamento da correlação entre eles, demonstrando como um pode influenciar o outro ou, até mes-mo, quais variáveis comuns são utilizadas pelos indicadores. Uma vez que os indi-cadores estão validados e selecionados, devem ser documentados e bem definidos de forma que haja consenso entre os envolvidos.

Passo 8 - Mensuração do desempenho

Após a execução dos passos primordiais e a definição dos indicadores, pas-sa-se à coleta de dados e sua utilização no cálculo dos indicadores.

Passo 9 - Análise e interpretação dos indicadores

(28)

Passo 10 - Comunicação do desempenho

Após análise e interpretação dos indicadores, o resultado ou andamento deve ser comunicado aos envolvidos e interessados para que possam agir em prol da me-ta desejada. Esme-ta eme-tapa pode ser ilustrada com a utilização de gráficos intuitivos para a mensagem ser transmitida de forma rápida e objetiva.

2.3 GESTÃO DO CONHECIMENTO

Segundo Nonaka e Takeushi (1997), o conhecimento pode ser classificado como explícito ou tácito. O conhecimento explícito é o mais tangível, podendo ser representado, articulado, codificado e armazenado em livros, documentos, base da-dos, etc. O conhecimento tácito, por sua vez, é intangível, difícil de ser formalizado ou exteriorizado por ser subjetivo e inerente às habilidades de um indivíduo ou gru-po. Esses dois tipos de conhecimento são utilizados na geração de novos conheci-mentos e formam um bem valioso para as organizações.

(29)

Figura 3: Modelo SECI - Processo de conversão do conhecimento

Fonte: Nonaka e Takeushi (1997)

O conhecimento explícito é o mais fácil de administrar, pois o tácito é difícil de ser armazenado e compartilhado com várias pessoas. Apesar de existir o conheci-mento organizacional, uma organização não pode criar conheciconheci-mento por si mesma, sem a iniciativa de um indivíduo e/ou a interação de um grupo.

A Gestão do Conhecimento (GC) oferece instrumentos que permitem à orga-nização se valer do conhecimento existente no seu interior. De modo geral, GC visa controlar e desenvolver todo o tipo de conhecimento da organização. Para que isto ocorra de forma eficiente, é necessário estabelecer políticas, procedimentos e tecno-logias que venham a auxiliar à coleta, distribuição e utilização do conhecimento.

(30)

2.4 DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS

Descoberta de Conhecimento em Base de Dados (DCBD) é o processo de descoberta de padrões válidos, úteis e compreensíveis em bases de dados extensas e complexas (FAYYAD, 1997). A base da disciplina DBCD é a Mineração de Dados que, por meio da aplicação de algoritmos em bases de dados, busca descobrir com-portamentos suspeitos e/ou desconhecidos pela detecção de padrões e relaciona-mentos.

A acessibilidade e a disponibilidade de dados proporcionadas atualmente, principalmente pelo crescimento e popularização da internet, fez com que essa dis-ciplina ganhasse importância, pois quanto maior a quantidade de dados, maior a difi-culdade de entendê-los e manipulá-los. Com o crescimento deste campo de investi-gação surgiram diversas técnicas e métodos. Não é correto dizer que determinado método é certo ou errado, pois a aplicabilidade está relacionada ao objetivo da mine-ração e à qualidade dos dados disponíveis (WOLPERT, 1997).

DCBD vem sendo aplicada em diversas áreas. Para a detecção de fraudes, em particular, ela vem sendo utilizada para detectar padrões e relações fraudulentas em bases de dados com informações que podem expor comportamentos suspeitos. Exemplos de bases que possuem dados com estas características estão relaciona-das às áreas financeiras, relações criminosas e processos de compra.

Existem diversas propostas para o processo de DCBD. O processo proposto pelo método Cross-Industry Standard Process for Data Mining - CRISP-DM (CHAP-MAN et al, 2000), é o seguinte (Figura 4):

1. O entendimento do negócio tem por objetivo identificar as metas e requerimen-tos do projeto a partir de uma perspectiva de negócio;

2. O entendimento dos dados visa esclarecer aspectos relativos à procedência, às características estruturais e á qualidade dos dados a serem usados;

3. Na preparação dos dados, é feita a extração, limpeza e transformação dos da-dos de forma a adequá-los aos algoritmos de DM a serem utilizada-dos;

4. Durante a modelagem, o(s) algoritmo(s) de aprendizagem de máquina selecio-nados são parametrizados e utilizados para a construção de modelos computa-cionais que refletem os padrões encontrados nos dados;

(31)

6. Finalmente, é efetivada a aplicação do(s) modelo(s) gerado(s), na forma, por exemplo, de sistemas de apoio à tomada de decisão.

Figura 4: Processo de descoberta de conhecimento em base de dados

Fonte: Chapman et al (2000)

Para a aplicação de técnicas de MD são aplicados métodos estatísticos e de aprendizagem de máquina, tanto supervisionada como não-supervisionada.

2.4.1 Aprendizagem supervisionada

O termo aprendizagem supervisionada representa uma família de algoritmos que, dado um conjunto de observações históricas, constrói um modelo que relaciona variáveis independentes e dependentes a partir daquelas observações, podendo ser utilizado para estimar ou prever o valor das variáveis dependentes em situações no-vas. Esse tipo de aprendizagem inclui tarefas como classificação ou regressão.

(32)

Um modelo de regressão relaciona um conjunto de variáveis de entrada com um valor de saída contínuo. Por esse modelo, um valor numérico para uma variável é definido a partir de valores extraídos de variáveis conhecidas (pré-definidas).

2.4.2 Aprendizagem não-supervisionada

Na aprendizagem não-supervisionada, o rótulo da classe não é conhecido e o objetivo é identificar padrões inesperados em um conjunto de objetos usando métri-cas como similaridade entre os objetos ou co-ocorrência de itens. Dentre as técnimétri-cas desse tipo de aprendizagem estão a associação e a análise de agrupamentos.

Algoritmos de associação visam detectar padrões de relacionamentos entre os itens de uma base de dados. Uma aplicação deste tipo de regra é a determinação de produtos adquiridos em conjunto em algum estabelecimento comercial.

Algoritmos de análise de agrupamentos visam formar grupos de acordo com uma determinada medida de similaridade por meio de sucessivas iterações. Estes agrupamentos permitem a identificação de grupos homogêneos para os quais de-terminadas ações podem ser dirigidas.

Pela aplicação da análise de agrupamentos, é possível identificar nuvens de objetos no espaço multidimensional, que podem ser definidas de acordo com a pro-ximidade ou distancia dos grupos, levando à indicação de padrões e correlações. Um exemplo de sua utilização é a determinação de grupos de clientes com compor-tamentos similares, o que possibilita a aplicação de marketing diferenciado e focado para cada grupo.

Entre os vários tipos de análise de agrupamentos estão (HAN e KAMBER, 2001):

 Métodos de partição, visam decompor os dados em conjuntos separados de agrupamentos. Dado um conjunto de n objetos de uma base de dados, o méto-do de partição constrói k partições, em que cada uma representa um grupo, sendo k ≤ n. A função tenta minimizar a dessemelhança no interior do agrupa-mento e maximizar a dessemelhança entre os grupos. K-means é o exemplo mais conhecido de algoritmo de partição.

(33)

bottom-up, inicia formando um grupo para cada objeto, seguindo-se da junção dos grupos até existir apenas um único ou até uma determinada condição de parada. O método divisivo, também chamado aproximação top-down, inicia com todos os objetos no mesmo grupo e, após cada iteração, divide-se em vá-rios grupos, até atingir uma condição de parada. Exemplos de algoritmos que usam este tipo de método são CURE, BIRCH e CHAMALEON;

 Métodos baseados em densidade, a maioria dos métodos de divisão de obje-tos em agrupamenobje-tos são baseados na distância. Estes métodos apenas con-seguem encontrar grupos com formas esféricas e há dificuldade na descoberta de agrupamentos com formas arbitrárias. Outros métodos foram desenvolvidos baseados na noção de densidade. Alguns algoritmos que usam este tipo de método são: DBSCAN, OPTICS e DENCLUE;

 Métodos baseados em grid, quantificam o espaço de objetos num número finito de células que formam uma estrutura em grade. A principal vantagem desta a-proximação é o seu rápido tempo de processamento, que geralmente é inde-pendente do número de objetos e depende apenas do número de células em cada dimensão. STING é um típico algoritmo de um método baseado em gra-de.

 Métodos baseados em modelo, criam um modelo para cada agrupamento e a-justa a informação de acordo com o modelo. Um exemplo de algoritmo que uti-liza este dado é o COBWEB.

2.5 DATA WAREHOUSE

A produção dados aumenta vertiginosamente. Estes dados são dispersos em várias bases e podem ser recuperados de diversas maneiras, porém, essa distribui-ção prejudica a consolidadistribui-ção de dados. A tecnologia de Data Warehouse (DW) per-mite a geração de visões sintéticas sumarizadas das operações de uma organização de forma eficiente, produzindo resultados importantes para suporte à decisão.

(34)

Os dados contidos em um DW não são voláteis, pois são disponíveis apenas para leitura. Além de centralizar os dados dispersos, o DW evita que os sistemas tenham o desempenho afetado devido à concorrência de processamento entre tran-sações e emissão de relatórios, pois os relatórios passam a ser extraídos de outra base de dados, deixando a transacional para uso exclusivo dos sistemas OLTP.

O DW de uma organização pode ser formado, de maneira lógica, pela união de Data Marts, que podem ser entendidos com DWs departamentais, orientados por assuntos estratégicos do negócio.

O DW deve ser modelado de acordo com as necessidades dos usuários, ali-nhado às áreas funcionais da empresa e de acordo com as condições do negócio. Para isto, as quatro arquiteturas mais utilizadas são: Top-Down, Bottom-Up, Híbrida e Federada.

Na arquitetura Top-Down, o DW é o ponto central do ambiente analítico da empresa, possuindo dados que são exportados de um ou mais sistemas e integra-dos conforme a modelagem de daintegra-dos da empresa. Neste ambiente, os daintegra-dos são distribuídos para Data Marts, conforme mostrado na Figura 5.

(35)

Na arquitetura Bottom-Up, os Data Marts são alimentados com dados dos sis-temas legados, que geram o DW. A Figura 6 representa essa abordagem.

Figura 6: Arquitetura de Data Warehouse do tipo Bottom-Up

A arquitetura híbrida integra as abordagens Top-Down e Bottom-Up, tirando proveito da orientação do usuário e da velocidade existente na abordagem Bottom-Up, mas sem prejudicar a integração forçada por um DW que existe na abordagem Top-Down. O DW é modelado para posterior implementação dos Data Marts, con-forme apresentado na Figura 7.

(36)

O DW federado provê uma interface que o torna semelhante a um grande DW, mas que na realidade, apenas adiciona camadas sobre os DW existentes. É composto por camadas de DW existentes, acessados por meio da camada de inte-gração para carregar o DW federado, conforme mostrado na Figura 8.

Figura 8: Arquitetura de Data Warehouse do tipo Federada

Para alimentar o DW ou o Data Mart com dados, utilizam-se mecanismos de Extract-Transform-Load (ETL), ferramentas cuja função é a extração de dados de múltiplos sistemas, transformando-os conforme regras de negócio. O ETL é capaz de se comunicar com bases de dados relacionais e ler diversos tipos de arquivos utilizados por toda a organização.

A ferramenta mais popular para exploração de um DW é a Online Analytical Processing (OLAP), porém, outras podem ser utiliza

(37)

3 METODOLOGIA

LAKATOS, E. M.; MARCONI, A. (2001) define pesquisa como:

[...] um procedimento formal com método de pensamento reflexivo que re-quer um tratamento científico e se constitui no caminho para se conhecer a realidade ou para descobrir verdades parciais. Significa muito mais do que apenas procurar a verdade: é encontrar respostas para questões propostas, utilizando métodos científicos.

Assim, a busca por uma caracterização de atores no processo de compras gover-namentais constitui-se de um esforço para se conhecer uma realidade cujo contorno se especifica a partir de parâmetros relativos ao comportamento esperado daqueles atores. No caso, a verdade que se busca é aquela especificada por comportamentos anômalos, possivelmente de caráter criminoso, que o poder público visa coibir.

3.1 CLASSIFICAÇÃO DA PESQUISA

Segundo Moresi (2003), uma pesquisa pode ser classificada quanto à sua ntureza, abordagem, fins e meios. Assim, quanto à sua nantureza, esta pesquisa é a-plicada, por ter como objetivo a utilização de técnicas de MD para indicar o a compe-titividade dos pregões eletrônicos de modo que venha a ser útil para a CGU.

Quanto à abordagem, é quantitativa, uma vez que os dados analisados são extraídos de indicadores alimentados com dados de compras governamentais, de modo que possam ser identificados comportamentos suspeitos para, posteriormente, medir a objetividade do conhecimento encontrado.

Quanto aos fins, é descritiva, pois expõe as características de um fenômeno (compras governamentais) e estabelece correlações entre variáveis de modo que a natureza possa ser definida.

Quanto aos meios, é experimental, pois a pesquisa não se dá no local do fe-nômeno e os comportamentos das compras são extraídos de dados computacionais.

3.2 PRESSUPOSTO FUNDAMENTAL

(38)

relações em um espaço multidimensional. Para embasar o avanço nessa compreen-são, as categorias de eventos envolvidos na análise precisam ser definidas de an-temão, tais como:

 Empresas irmãs, possuem vínculos e participam dos pregões juntas para terem vantagens perante os lances. São exemplos de vínculo: (i) empresas distintas com o mesmo endereço e (ii) empresas com sócios em comum.

 Empresa coelho, é aquela que participa de pregões eletrônicos para beneficiar um dos outros participantes e prejudicar os demais. Elas agem lançando pre-ços baixos, sucessivamente, forçando os demais concorrentes a também abai-xarem o lance até que haja desistência e/ou desclassificação. Enquanto as concorrentes são eliminadas, o fornecedor que age em conluio com ela man-tém a cautela, aumentando a sua chance de vencer o pregão eletrônico.

 Cartel, é a união de duas ou mais empresas para se beneficiarem perante a concorrência. Como exemplos de ações de cartel em pregões eletrônicos po-de-se citar (i) grupos de empresas que participam constantemente das mesmas concorrências e que revezam, com certa frequência, a vitória no processo sele-tivo e (ii) empresas que vendem produtos de um mesmo fabricante e que parti-cipam das mesmas concorrências, porém, a combinação vencedor-órgão é a mesma.

 Pode-se caracterizar uma relação pregoeiro-empresa quando determinado pregoeiro declara a mesma empresa como vitoriosa nos pregões eletrônicos repetidas vezes.

 Relação órgão-empresa, pode ser caracterizada quando uma empresa ganha muitas concorrências em um mesmo órgão.

 Vitória de empresas novas em pregões de grande porte, pode ser tendenciosa,

além de este tipo de companhia poder ser “fantasma” (servir de fachada para justificar determinado custo).

 Dá-se a denominação de laranja a um indivíduo ou empresa cujo o nome é uti-lizado por um terceiro para a prática de irregularidades no pregão, com o obje-tivo de escapar de fiscalizações e facilitar a execução de atitudes ilícitas.

(39)

quando o dono ou algum colaborador da empresa vencedora do pregão possui parente no órgão.

 Dono insistente são os donos de empresas que ganham pregões, vão à falên-cia, mas abrem outras e repetem a ação.

3.3 COLETA E ANÁLISE DOS DADOS

Os dados utilizados nesta pesquisa foram coletados no DW – Compras, do MPOG, que armazena informações das compras efetuadas pelos Órgãos do Gover-no Federal. Após análise da estrutura desse DW, foram identificadas a seguintes entidades relevantes: órgão, fornecedor, pregão, pregoeiro e materiais/serviços.

Tomando como base o pressuposto descrito no capítulo anterior e as entida-des citadas no parágrafo acima, foram definidos vários indicadores para extração de informações do DW. Com estes indicadores em mãos, foi possível aplicar técnicas de MD nos dados coletados, sendo sinalizados eventuais conhecimentos para poste-rior avaliação. Neste trabalho, a MD será realizada por meio da ferramenta WEKA (WITTEN e FRANK ,2000).

3.4 DELIMITAÇÃO DO ESTUDO

(40)

4 APLICAÇÃO

As seções a seguir seguem a lógica definida pelo método de descoberta de conhecimento CRISP-DM (CHAPMAN et al, 2001).

4.1 COMPREENSÃO DO NEGÓCIO

4.1.1 Objetivo do Negócio

A CGU é o órgão controlador do Governo Federal Brasileiro responsável por assistir o Presidente da República quanto a assuntos relativos à defesa do patrimô-nio público e ao incremento da transparência da gestão, por meio de atividades de controle. Dentre as atividades controladas pela CGU estão as compras governamen-tais, efetuadas por intermédio dos órgãos governamentais. O número de órgãos e-xistentes é alto, e fiscalizá-los é uma tarefa árdua que exige tempo e recursos.

Por meio de fiscalização e controle dos processos licitatórios é possível identi-ficar eventuais irregularidades como o desvio de recursos púbicos. Geralmente, es-tes desvios visam beneficiar fornecedores e/ou pessoas e são caracterizados como corrupção.

(41)

4.1.2 Avaliação da situação

O problema abordado nessa dissertação está vinculado a um projeto de coo-peração entre a CGU e a Universidade Católica de Brasília, com foco no estudo so-bre técnicas e métodos para apoio à Inteligência a partir de fontes abertas de dados. Além da restrição de se ater apenas a fontes abertas para a obtenção de da-dos, arbitrou-se também que não seriam utilizados métodos amostrais para a sele-ção de instâncias, decidindo-se pela inclusão na análise de todos os dados disponí-veis sobre os pregões eletrônicos.

Por se tratar de um projeto de cooperação técnico-científica que envolve um órgão do Poder Executivo, foi estabelecido que a pesquisa deve gerar resultados de interesse prático, além da sua contribuição científica. Além disso, o conhecimento gerado deverá ser mantido em sigilo, uma vez que envolve diversas organizações públicas e particulares. Após a análise dos resultados pelos especialistas de negócio pode ser necessário um outro ciclo de mineração para obtenção de conhecimento mais preciso.

Por ser legada, a base de dados utilizada apresenta algumas inconsistências que tiveram que ser contornadas em prol da obtenção de resultados úteis. Exemplos de inconsistências encontradas serão citados na subseção 4.2.4 (Qualidade dos Da-dos). Ainda que não tenha comprometido os resultados da análise, esse fato certa-mente os limitou.

4.1.3 Objetivos da mineração de dados

Considerando as restrições colocadas quanto aos resultados esperados e ao foco da pesquisa, o objetivo da MD é, conforme apresentado no Capítulo 1 (Objeti-vos), identificar: (i) pregões eletrônicos com grau de competitividade irregular e (ii) entidades suspeitas de praticarem comportamentos irregulares.

4.1.4 Plano do projeto

(42)

(vi) aplicação de técnicas de MD nos dados captados; e (vii) avaliação dos resulta-dos obtiresulta-dos após a mineração resulta-dos daresulta-dos.

4.2 COMPREENSÃO DOS DADOS

4.2.1 Coleta inicial dos dados

O principal recurso de dados utilizado no projeto é o DW Compras, Orçamen-to e Gestão, mantido pelo MPOG (Ministério do PlanejamenOrçamen-to, OrçamenOrçamen-to e Ges-tão). Essa base contém informações relacionadas às compras realizadas pelos ór-gãos do Governo Federal Brasileiro. A Figura 9 representa a constelação do DW. É possível identificar as entidades envolvidas no processo licitatório e pertencentes à base de dados explorada. No entanto, nem todas contemplam o escopo do projeto. Além disto, a base é volumosa, o torna lenta a recuperação de dados.

Figura 9:Constelação do DW Compras, Orçamento e Gestão do MPOG

(43)

4.2.2 Descrição dos dados

Conforme descrito no tópico anterior, os dados estão em um DW e são rela-cionais. Este DW possui 110 GB e 155 tabelas e, devido a falta de documentação, foi necessário um estudo para se familiarizar com a estrutura e compreender sua lógica.

Nessa base, há atributos de diversos tipos. Vale salientar que os dados que serão úteis nesta pesquisa são dos tipos: texto, numérico, data, hora e moeda. Para captura das informações desejadas, foi feita a combinação de dados e a utilização de funções como Média, Máximo e Mínimo, bem a como ordenação e agrupamento de registros.

Como pontos negativos, destaca-se a ausência de índices e de chaves primá-rias e estrangeiras, torna a recuperação dos dados mais lenta e dificultando a dedu-ção dos relacionamentos existentes entre as tabelas, respectivamente.

4.2.3 Exploração dos dados

Conforme relatado anteriormente (Seção 2.2), a principal alternativa adotada para redução do volume de dados do DW foi a definição de indicadores. Para orga-nizar estes indicadores, foram estipulados níveis e dimensões.

Os níveis foram definidos a partir das entidades citadas na seção 4.2.1 (Cole-ta inicial dos dados): (i) Compra, (ii) Contrato, (iii) Fornecedor, (iv) Itens e (v) Órgão. As dimensões foram definidas a partir da análise das características de um processo licitatório e fatores que podem indicar irregularidades, e que sejam comuns a todos os níveis: (i) capacidade, (ii) competitividade, (iii) confiabilidade, (iv) confor-midade e (iv) economicidade. Analisando esta estrutura (níveis e dimensões), é pos-sível definir uma série de indicadores para cada nível e agrupá-los em dimensões.

Este modelo de definição de indicadores ajuda a organizar os dados relevan-tes para o escopo da pesquisa e a diminuir o volume agilizando o processo de mani-pulação dos dados e de produção de conhecimento.

4.2.4 Qualidade dos dados

(44)

Tipagem é um termo computacional para referenciar os tipos de dados, uma combinação de valores e operações que um dado pode comportar. Quanto à estrutu-ra relacional e tipagem foestrutu-ram constatadas as seguintes deficiências: (i) campos se-melhantes definidos com tipos distintos em tabelas diferente, (ii) falta de definição de chave-primária nas tabelas, (iii) inexistência de índices para melhorar o desempenho na recuperação dos dados, (iv) campos definidos com tipos inadequados, (v) inexis-tência de relacionamentos (chaves) entre as tabelas e (vi) campos que deveriam ser únicos possuem valores repetidos.

Quanto ao conteúdo, foram constatadas as seguintes deficiências: (i) registro com falta de dados cruciais, (ii) duplicação de registros, (iii) ausência de dados rela-cionados a todos os lances de um pregão (apenas o primeiro e o último lance de cada empresa é contemplado), (iv) um mesmo campo com dados formatados diver-sificadamente, (v) registros com conteúdo que fogem do padrão e (vi) dados relacio-nados com diferença de valores.

Apesar das deficiências encontradas, a base é considerada de boa qualidade, uma vez que consolida dados provenientes de diversas fontes e que está estrutura-da de forma relacional, proporcionando faciliestrutura-dade na manipulação dos estrutura-dados o que ajuda no tratamento das adversidades.

4.3 PREPARAÇÃO DOS DADOS

4.3.1 Seleção dos dados

A seleção dos dados foi baseada nos indicadores definidos seguindo os ní-veis e dimensões citados no tópico 4.2.3 (Exploração dos Dados), que aborda a ex-ploração dos dados.

Para se chegar a uma definição adequada destes indicadores, foram neces-sárias diversas reuniões com especialistas para validação, pois nem todos os indi-cadores definidos previamente eram relevantes para o negócio ou viáveis de serem extraídos da base.

Este processo de validação ocorreu seguindo os seguintes passos: 1. Validação dos níveis;

2. Validação das dimensões;

(45)

4. Verificação de viabilidade de extração dos indicadores; 5. Verificação de relevância dos indicadores para a pesquisa; 6. Eliminação dos indicadores inviáveis ou irrelevantes; 7. Adequação de alguns indicadores;

8. Elaboração da tabela final com a descrição dos indicadores.

Após conclusão da validação, foram definidos os indicadores considerados úteis e viáveis para a pesquisa. Os Quadros de 4 a 9 descrevem as tabelas do DW úteis para alimentação dos indicadores para cada nível.e os indicadores seleciona-dos.

Quadro 4: Tabelas do BD utilizadas para alimentação dos indicadores

Tabela Conteúdo

D_CMPR_COMPRA Descrição dos dados da compra como: modalidade da

compra, data de ocorrência e identificação do órgão licitante. D_CMPR_MODALIDADE_COMPRA Descrição de todas as modalidades de compras

contempladas pela licitação (ex.: pregão eletrônico, dispensa de licitação e concurso).

D_CNTR_CONTRATO Descrição dos contratos firmados após a finalização da

licitação.

D_FRND_FORNECEDOR Descrição dos fornecedores (ex.: razão social, localidade e

CNPJ).

D_FRND_PORTE_EMPRESA descrição dos portes que podem classificar um fornecedor

(ex.: pequeno porte, médio porte e grande porte)

D_FRND_SIT_ATUAL_FORNEC descrição da situação do fornecedor (ex.: ativo e inativo)

D_ITCP_CLASSE_MAT_SERV descrição das classes de materiais, para agrupá-los de acordo

com a característica (ex.: cabos de fibra ótica, filtros e lâmpadas elétricas).

D_ITCP_MATERIAL_SERVICO descrição dos materiais e serviços.

D_ITCP_SIT_ATUAL_MAT_SERV descrição da situação do material (ex.: ativo e inativo).

D_SCIO_SOCIO descrição dos sócios dos diversos fornecedores existentes na

base.

D_UNDD_ORGAO descrição dos órgãos do governo federal brasileiro.

D_UNDD_UNIDADE descrição das diversas unidades existentes nos órgãos.

F_CONTRATO Detalhes do contrato firmado após a compra (ex.: órgão,

fornecedor e vigência)

F_ITEM_COMPRA Relação dos materiais e serviços que foram objetos da

compra.

F_ITEM_EMPENHO Relação dos dados do empenho realizado pela compra.

F_ITEM_FORNECEDOR Relação dos itens das compras aos fornecedores que

participaram da concorrência específica.

(46)

45

Quadro 5: Indicadores relacionados ao nível Fornecedor

Dimensão Objeto de Mensuração Indicadores

Capacidade Capacidade do fornecedor em fornecer

produtos/serviços

Porte do fornecedor

Tempo de existência do fornecedor Situação atual do fornecedor

Total, em dinheiro, ganho pelo fornecedor

Total, em dinheiro, ganho pelo fornecedor por ano Quantidade de licitações que o fornecedor já participou

Competitividade Grau de competitividade do fornecedor Número de vitórias

Número de vitórias por órgão Número de derrotas

Número de derrotas por órgão

Média geral de vitórias (vitórias/total de participações) Média geral de derrotas (derrotas/total de participações)

Confiabilidade Histórico do fornecedor em processos

licitatórios Empresas criadas por condenados pelo TCU Empresas que possuem irmãs

Empresa com sócio que exerce o papel de homologador ou pregoeiro Empresas Fantasmas

Número de compras diretas ganhas pelo fornecedor

Conformidade Respeito às leis regulatórias do pregão

eletrônico e atendimento aos pré-requisitos para participação da concorrência

Número de contratos rescindidos

Número de licitações suspensas ou anuladas que o fornecedor participou Numero de vezes que o fornecedor inativo participou de licitações

Economicidade Proposta com preços vantajosos e utilização

de preço comum de mercado Número de licitações na qual estipulou o maior preço Número de licitações no qual estipulou o menor preço

Diferença entre o valor proposto e o estimado (proposto/estimado) Diferença entre o valor proposto e o último lance (proposto/ult. lance) Menor desconto que a empresa já ofereceu

(47)

46

Quadro 6:Indicadores relacionados ao nível Órgão

Dimensão Objeto de Mensuração Indicadores

Capacidade Capacidade do Órgão em organizar

processos licitatórios (ex.: elaborar editais, escolher a modalidade e tipo de licitação)

Número de licitações por modalidade

Quantidade de licitações elaboras pelo órgão

Quantidade de licitações elaboras pelo órgão por ano Total, em dinheiro, gasto pelo órgão

Total, em dinheiro, gasto pelo órgão por ano Competitividade Permitir que os fornecedores participantes

dos processos licitatórios possuam tratamento e chance semelhantes

Número de vitórias por fornecedor Número de derrotas por fornecedor

Confiabilidade Histórico do órgão em processos licitatórios Número de compras diretas

Número de compras diretas ganhas por Fornecedor Valor total de compras diretas

Média do número de compras diretas por total de compras Média do valor de compras diretas por total de compras

Conformidade Respeito às leis regulatórias do pregão

eletrônico e realização de compras que reflitam às necessidade e características descritas nos editais

Número de licitações suspensas ou anuladas realizadas pelo órgão

Número de contratos rescindidos no órgão

Economicidade Aquisição de produto e/ou serviço com

melhor custo-benefício Número de licitações em que o vencedor não ofereceu o menor preço Número de licitações em que o vencedor ofereceu o menor preço

Diferença entre o preço estimado e o preço contratado dos produtos

Imagem

Figura 1: Passos para definição de indicadores
Figura 2: Cadeia de Valor
Figura 3: Modelo SECI - Processo de conversão do conhecimento
Figura 4: Processo de descoberta de conhecimento em base de dados
+7

Referências

Documentos relacionados

The focus of this thesis was to determine the best standard conditions to perform a laboratory-scale dynamic test able to achieve satisfactory results of the

A presença do brometo na composição química das zeólitas modificadas também foi detectada;  O processo de adsorção do surfactante sobre a superfície do material zeolítico

A rede de teste 118 IEEE representada na figura 4.3 foi a rede que serviu de base para a aplicação da metodologia descrita e para os estudos de Data Mining apresentados nos

Em relação aos conhecimentos de saúde oral constatou-se que pais/encarregados de educação e crianças estão informados sobre a presença, ou não, de dentes cariados, bem como,

The SUnSET bovine spermatozoa results demand the use of other translation elongation inhibitors, namely emetine, in place of cycloheximide, a competitive inhibitor of the

Neste sentido, elegemos estudar uma importante área geográfica da região transmontana e duriense, designada nas Inquirições de 1220 e 1258 como Terra e Julgado de

Abstract: We consider the problem of robust model predictive control for linear sampled– data dynamical systems subject to state and control constraints and additive and

Na terceita parte foi desenvolvida a ferramenta, que partindo de ficheiros de entrada com o posicionamento dos jogadores e da bola durante um jogo, consegue calcular automaticamente