“
Gerenciamento e Auditoria Fiscal
Eletrô-nica através do uso de documentos XML
como objetivo para tomada de decisão com
Business Intelligence
”
Por
Bruno Leonardo Freire Freitas Andrade
Dissertação de Mestrado Profissional
Universidade Federal de Pernambuco [email protected] www.cin.ufpe.br/~posgraduacao
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
Bruno Leonardo Freire Freitas Andrade
“Gerenciamento e Auditoria Fiscal Eletrônica através
do uso de documentos XML como objetivo para
toma-da de decisão com Business Intelligence"
ORIENTADOR(A): Prof. Dr. Fernando da Fonseca de Souza
RECIFE, JUNHO/2013
Este trabalho foi apresentado à Pós-Graduação em Ciência da Computação do Centro de Informática da Universidade Federal de Pernambuco como requisito parcial para obtenção do grau de Mestre Profissional em Ciência da Computação.
Catalogação na fonte
Bibliotecária Jane Souto Maior, CRB4-571
Andrade, Bruno Leonardo Freire Freitas
Gerenciamento e auditoria fiscal eletrônica do uso de do-cumentos XML como objetivo para tomada de decisão com business intelligence / Bruno Leonardo Freire Freitas Andra-de. - Recife: O Autor, 2013.
118 f.: il., fig., tab., gráf., quadros
Orientador: Fernando da Fonseca de Souza.
Dissertação (mestrado profissional) - Universidade Federal de Pernambuco. CIn, Ciência da Computação, 2013.
Inclui referências.
1. Banco de dados. 2. Data warehouse. 3. Engenharia de softwa-re. I. Souza, Fernando da Fonseca de (orientador). II. Título.
decisão com Business Intelligence”, orientada pelo Professor Fernando da Fonseca de Souza e aprovada pela Banca Examinadora formada pelos professores:
______________________________________________ Prof. Robson do Nascimento Fidalgo
Centro de Informática / UFPE
______________________________________________ Prof. Methanias Colaço Rodrigues Junior
Universidade Federal de Sergipe
_______________________________________________
Prof. Fernando da Fonseca de Souza Centro de Informática / UFPE
Visto e permitida a impressão. Recife, 21 de junho de 2013.
___________________________________________________
Profª. EDNA NATIVIDADE DA SILVA BARROS
Coordenadora da Pós-Graduação em Ciência da Computação do
A
GRADECIMENTOS
A Deus, que sempre esteve ao meu lado me apoiando e incentivando para que eu não esmorecesse diante das dificuldades.
Agradeço aos meus pais e familiares: Sr. Francisco de Oliveira Andrade, Sra. Martha Maria Freire Freitas Andrade, que sempre me amaram, apoiaram e contribuíram para o meu amadurecimento pessoal e profissional; Sr. Flávio Ricardo Freire Freitas Andrade, que tanto amo e sempre me ajudou com palavras de incentivo e força quando eu mais precisava; Sra. Maria das Graças de Oliveira Andrade, que sempre torceu, ajudou e apoiou incondicionalmente. Minha segunda Mãe. Essas pessoas me proveram um suporte indispensável nesta caminhada.
Agradeço a cada uma das pessoas que, de certa forma, foram essenciais para a elaboração e conclusão deste trabalho e em particular:
Aos meus padrinhos, Sr. José Silva e Sra. Elaine Campos, que tanto me incentivaram nessa caminhada.
Aos meus amigos que tanto me deram força, compartilhando momentos de alegria e dificuldades entre projetos e sonhos. De maneira especial a Rodolfo Botto, Diego Melo, Edjostenes Poderoso, Rafael Reis, Rodrigo Reis, Antônio Fernando, Roosevelt Nunes, Thiago Rangel, Walisson Antônio, Carol Barbosa, Gardênia Costa, Jamile Campos, Aninha Souza, Camila Corrêa, Juliana Corrêa, Raquel Correia, Arabela Cavalcanti, Leilane Leite, Renato Lino e Marcelo Anderson.
Aos meus amigos e colegas de trabalho que ajudaram muito com os feedbacks, dicas extremamente pertinentes, apoio e motivação para superar as dificuldades apresentadas no dia a dia de trabalho, em especial a Max Castor Rodrigues Junior, Diego Bomfim Feitosa, Adler Oliveira Santos, Edmundo Soares Bezerra Filho, Tiego
Souza.
Ao meu orientador, Fernando da Fonseca de Souza, pela confiança e apoio no desenvolvimento deste trabalho.
Ao amigo e professor, Methanias Colaço Rodrigues Junior, pelo apoio e tantos conhecimentos passados aos longos dos anos desde a graduação e o início dos trabalhos com BI através do curso de extensão como primeiro passo.
“Se não puder voar, corra. Se não puder correr, ande. Se não puder andar, rasteje, mas continue em frente de qualquer jeito.” Martin Luther King. Jr.
Resumo
A ausência de um bom gerenciamento nos negócios é um dos principais
motivos para o seu fracasso. A implantação de alguma forma de
Business Intelligence (BI) para tomada de decisão, através de seus
métodos ou ferramentas, viabiliza melhorias significativas no
gerenciamento das empresas. Um bom exemplo para gerenciar em uma
empresa, seja ela do ramo de serviços ou varejo, é o controle de notas
fiscais que entram e saem do estabelecimento. Com o controle dessas
notas, o administrador ou gerente do estabelecimento possui muita
informação, da qual pode tomar inúmeras decisões, mas que
dependerão de sua análise final, pois para cada resultado obtido através
de um BI, o cenário pode ser diferente para cada empresa. Logo, a
proposta deste trabalho é apresentar um sistema que irá fazer análise
das notas fiscais eletrônicas (NFe), cujo uso é obrigatório para muitos
contribuintes e em pouco tempo será obrigatório de maneira geral.
Neste sistema, será armazenado o documento no formato XML e,
através dele, carregado o BI para uma análise mais detalhada das
informações. Com os resultados obtidos, ficou evidenciado que o
sistema atende aos requisitos levantados, de maneira a facilitar as
atividades dos contribuintes, para melhor gerenciar o seu negócio do
ponto de vista fiscal.
Palavras-chave: Gerenciamento do Negócio, Controle, Nota Fiscal Eletrônica,
Abstract
The lack good practices on business management is one of the main
reasons for failure. The implementation of some form of business
intelligence (BI) to help making decisions, through its methods or tools,
enables significant improvements to company management. A good
management case on a company, being it either in the service industry
or retail, is the control of invoices that enter and leave the establishment.
Such an invoice control offers managers of the establishment much
information from which they can take many decisions, but that will
depend on their final analysis, because for each result obtained through
a BI, the scenario may be different for each company. Thus, this work
aims to present a system that will analyze electronic invoices (Ie), whose
use is mandatory for many taxpayers and soon will be generally
mandatory. This system will store documents in XML format and also it
will load the BI to enable a detailed analysis of the information. With the
obtained results, it was shown that the system attends its requirements
by tuning taxpayers’ activities easier in order to improve business
management in a fiscal view point.
Key words: Business Management, Control, Electronic Invoice, Information,
CAPÍTULO 1: INTRODUÇÃO ... 1
1.1 MOTIVAÇÃO ... 3
1.2. OBJETIVOS ... 5
1.3. ESCOPO DA DISSERTAÇÃO ... 5
1.4. ESTRUTURA DO TRABALHO ... 6
CAPÍTULO 2: BUSINESS INTELLIGENCE ... 7
2.1 BENEFÍCIOS ... 8
2.2 APLICAÇÕES ORGANIZACIONAIS ... 9
2.3 COMPONENTES ... 10
2.4 CONSIDERAÇÕES FINAIS ... 26
CAPÍTULO 3: DOCUMENTOS FISCAIS ELETRÔNICOS ... 27
3.1. SPED FISCAL (EFD – ESCRITURAÇÃO FISCAL DIGITAL) ... 27
3.2. NF-E (NOTA FISCAL ELETRÔNICA) ... 30
3.3. CONVÊNIO 115/03 (NOTA FISCAL EM VIA ÚNICA – COMUNICAÇÃO, TELECOMUNICAÇÃO E ENERGIA ELÉTRICA) ... 34
3.4. CARTÃO DE CRÉDITO ... 36
3.5. CONSIDERAÇÕES FINAIS ... 37
CAPÍTULO 4: ESPECIFICAÇÃO E DESENVOLVIMENTO DO PROTÓTIPO ... 39
4.1. DESCRIÇÃO GERAL DO SISTEMA ... 39
4.2. ARQUITETURA ... 39
4.5. CASOS DE USO ... 49
4.6. ESTRUTURAÇÃO DO SISTEMA ... 56
4.7. PROJETO DE BANCO DE DADOS ... 66
4.8. CONSIDERAÇÕES FINAIS ... 79
CAPÍTULO 5: APLICAÇÃO PRÁTICA ... 81
5.1. CONSIDERAÇÕES FINAIS ... 108
CAPÍTULO 6: CONSIDERAÇÕES FINAIS ... 109
6.1. CONTRIBUIÇÕES ... 109
6.2. LIMITAÇÕES ... 110
6.3. SUGESTÕES DE TRABALHOS FUTUROS ... 110
Figura 1.1 - Quantidade de Dados no mundo ... 3
Figura 2.1 - Arquitetura para Business Intelligence ... 8
Figura 2.2 - Modelo Dimensional de banco de dados ... 13
Figura 2.3 - Modelo dimensional de banco de dados no esquema estrela e exemplo “Vendas” ... 13
Figura 2.4 - Modelo dimensional de bando de dados utilizando o esquema Snowflake ... 14
Figura 2.5 - Cubos de Business Intelligence ... 16
Figura 2.6 - Esquema de Entidade e Relacionamento ... 19
Figura 2.7 - Esquema Dimensional de Dados ... 19
Figura 2.8 - Representação dimensional – Valor pontual ... 21
Figura 2.9 - Representação dimensional – Valores em planos (Slicing) ... 21
Figura 2.10 - Representação dimensional – Valores em cubos (Dicing) ... 22
Figura 2.11 - Representação dimensional – Rotação de Planos ... 22
Figura 2.12 - Representação dimensional – Comandos Hierarquizados ... 23
Figura 2.13 - Representação dimensional – Comandos Hierarquizados (Drill-Across) ... 23
Figura 2.14 – Representação dimensional – Drill-Througth ... 24
Figura 2.15 - Seleção realizada pelo Data Mining ... 25
Figura 3.1 - SPED Fiscal ... 28
Figura 3.2 - Diagrama SPED ... 29
Figura 3.3 - Assinatura Digital EFD ... 29
Figura 3.4 - Utilização NFe ... 31
Figura 3.5 - Contingência SCAN ... 33
Figura 3.6 - Recibo de Entrega Convênio 115/03 ... 35
Figura 3.7 - Cartões de Crédito ... 36
Figura 4.1 – Desenho Geral da Arquitetura ... 42
Figura 4.2 – Diagrama de Casos de Uso ... 50
Figura 4.3 – Diagrama de Pacotes ... 58
Figura 4.4 – Diagrama de Componentes ... 61
Figura 4.5 – Diagrama de Classes ... 62
Figura 4.6 – Tabela XML NFe ... 67
Figura 4.7 – Arquivo XML NFe ... 68
Figura 4.10 – Tabela de Códigos Fiscais de Operações ... 70
Figura 4.11 – Tabela de Contribuintes ... 71
Figura 4.12 – Tabela de Categorias de Produtos ... 71
Figura 4.13 – Tabela de Localidade das Notas Fiscais ... 72
Figura 4.14 – Tabela de Modalidade de Frete ... 72
Figura 4.15 – Tabela de Movimentação das Notas Fiscais ... 73
Figura 4.16 – Tabela de Modelo das Notas Fiscais ... 73
Figura 4.17 – Tabela de Nomenclatura Comum do MERCOSUL ... 73
Figura 4.18 – Tabela de Período ... 74
Figura 4.19 – Tabela de Situação das Notas Fiscais ... 74
Figura 4.20 – Tabela de Itens das Notas Fiscais ... 75
Figura 4.21 – Tabela de Notas Fiscais ... 76
Figura 4.22 – BI – NFe ... 77
Figura 4.23 – Oracle RAC ... 78
Figura 4.24 – Comparativo dos SGBD ... 79
Figura 5.1 – Tela Inicial do Sistema ... 82
Figura 5.2 – Consulta Notas Fiscais ... 83
Figura 5.3 – Escolha das Notas Fiscais ... 84
Figura 5.4 – Erro ao escolher um arquivo ... 85
Figura 5.5 – Escolha dos arquivos “.xml” ... 86
Figura 5.6 – Enviando Arquivos ... 87
Figura 5.7 – Arquivos Enviados ... 88
Figura 5.8 – Erro ao processar arquivos ... 89
Figura 5.9 – Consulta Arquivos Processados ... 90
Figura 5.10 – Detalhamento NF-e (Identificação) ... 91
Figura 5.11 – Detalhamento NF-e (Emitente) ... 92
Figura 5.12 – Detalhamento NF-e (Destinatário) ... 93
Figura 5.13 – Detalhamento NF-e (Produtos/Serviços) – Resumo ... 94
Figura 5.14 – Detalhamento NF-e (Produtos/Serviços) – Detalhe ... 95
Figura 5.15 – Detalhamento NF-e (Totais) ... 96
Figura 5.16 – Detalhamento NF-e (Comércio Exterior) ... 97
Figura 5.20 – Relatórios ... 102
Figura 5.21 – Apuração das notas fiscais ... 103
Figura 5.22 – Quantidade de produtos vendidos ... 104
Figura 5.23 – Montante de impostos pagos ... 105
Figura 5.24 – Exibir o preço médio Líquido X Impostos dos produtos ... 106
Lista de Quadros
Quadro 2.1 - Diferenças entre OLTP e OLAP ... 18
Quadro 2.2 - Diferenças entre o esquema Dimensional e Relacional ... 20
Quadro 4.1 - Requisitos Funcionais e Não Funcionais ... 44
BI – Business Intelligence
SPED – Sistema Público de Escrituração Fiscal NFe – Nota Fiscal Eletrônica
Capítulo 1: Introdução
A constante busca por eficiência, melhor qualidade e menores custos nos processos torna-se o principal objetivo das empresas, impulsionadas principalmente pela crescente concorrência nos mercados globais e a escassez de recursos (Horita, 2012).
Atualmente, tudo é informatizado, mesmo em micro e pequenas empresas, ainda mais nas médias e grandes. A tecnologia da informação tem um papel importante como ferramenta meio no processo de uma empresa, mas ainda está muito voltada ao operacional e com isso deixando o apoio gerencial escasso de informação.
Ao coletar dados e organizá-los, esses são transformados em informações que, após serem analisadas, serão transformadas em inteligência. Essa inteligência quando aplicada aos negócios acarreta vantagens para a organização (Cramer, 2006; Souza, 2003). É esse tipo de coleta e organização dos dados que é feito com o Business Intelligence (BI), oferecendo os recursos necessários para solucionar os problemas, pois permite a gerentes a análise das informações de forma integrada, simples e objetiva, através de gráficos e relatórios gerados pela própria ferramenta de BI.
Grande parte das informações que são geradas em uma empresa é transmitida às secretarias de estado da fazenda de seus respectivos estados. Essas informações são referentes à vendas, clientes, fornecedores, entre outros aspectos primordiais da empresa que serão validados pelas secretarias.
Esse tipo de informação é muito importante para o gerenciamento do empreendimento, pois com ele é possível saber o quantitativo de vendas, rotatividade dos fornecedores, sazonalidade do negócio e muitos outros aspectos gerenciais.
Desde 22 de janeiro de 2007, com a iniciativa do governo federal, foi implantado o PAC – Programa de Aceleração do Crescimento – (2007-2010), que consiste na modernização sistemática atual do cumprimento das obrigações acessórias, transmitidas pelos contribuintes às administrações tributárias e aos órgãos fiscalizadores, utilizando-se de certificação digital para fins de assinatura dos documentos eletrônicos, garantindo assim a validade jurídica dos mesmos apenas na sua forma digital.
Logo abaixo estão discriminados os projetos que compõem o SPED – Sistema Público de Escrituração Digital, que é o sistema que reúne todos os outros projetos associados ao PAC (2007-2010):
SPED
o Sped Contábil (ECD – Escrituração Contábil Digital)
Tem por objetivo a substituição da escrituração em papel pela escrituração transmitida via arquivo, ou seja, corresponde à obrigação de transmitir, em versão digital, os livros diários e
fichas de lançamento comprobatórios dos assentamentos neles transcritos.
o FCONT
É uma escrituração das contas patrimoniais e de resultado, em partidas dobradas, que considera os métodos e critérios contábeis vigentes em 31.12.2007.
o Sped Fiscal
Conjunto de escriturações de documentos fiscais e de outras informações de interesse dos fiscos das unidades federadas e da Secretaria da Receita Federal do Brasil, bem como de registros de apuração de impostos referentes às operações e prestações praticadas pelo contribuinte.
o EFD – Contribuições
Arquivo digital a ser utilizado pelas pessoas jurídicas de direito privado na escrituração da contribuição para o PIS/PASEP e da COFINS, nos regimes de apuração nãocumulativo e/ou cumulativo, com base no conjunto de documentos e operações representativos das receitas auferidas, bem como dos custos, despesas, encargos e aquisições geradores de créditos de nãocumulatividade.
o NF-e
Documento fiscal eletrônico que vem substituir a sistemática atual de emissão do documento fiscal em papel, com validade jurídica garantida pela assinatura digital do remetente, simplificando as obrigações acessórias dos contribuintes e permitindo, ao mesmo tempo, o acompanhamento em tempo real das operações comerciais pelo fisco.
o CT-e
Novo modelo de documento fiscal eletrônico, que poderá ser utilizado para substituir os conhecimentos de transporte Rodoviário, Aquaviário, Aéreo e Ferroviário; as notas fiscais de serviço de transporte ferroviário e o modelo 7, quando utilizada em transportes de cargas.
Poderá ser utilizado também como documento fiscal eletrônico no transporte dutoviário e, futuramente, nos transportes multimodais.
o NFS-e
Projeto desenvolvido de forma integrada pela receita federal do Brasil (RFB) e Associação Brasileira das Secretárias de Finanças das Capitais (ABRASF), é um documento de existência digital, gerado e armazenado eletronicamente em ambientes nacionais pela RFB, pela prefeitura ou por outra entidade conveniada, para documentar as operações de
prestação de serviços.
O SPED é apenas um, dos vários programas que o governo federal possui para obter o controle das informações geradas pelas empresas e poder ter com isso base para fiscalização das mesmas. Outros exemplos que podemos citar são: Cartão de Crédito e Débito, Levantamento Específico, Convênio 115/03, etc.
Com base na NF-e, um dos programas do SPED, este trabalho pretende fazer o uso de BI para que possa ser gerada informação gerencial a partir da variedade de dados obtidos.
O modo como será desenvolvida toda a estrutura, a fim de que seja feita a análise das notas fiscais eletrônicas, será bastante semelhante para os demais programas do governo federal, conseguindo assim, maior agilidade aos programas de auditoria quando um novo programa federal for lançado e será preciso fiscalizar com base nesta nova informação.
1.1 Motivação
Atualmente a quantidade de informação que é gerada no mundo é muito grande, através de blogs, redes sociais, sites, sistemas web, entre outras formas de disseminar informação pela rede. Em 2010, a quantidade de informação que foi gerada no mundo era de 295 Exabytes (EB), podendo este número chegar a um Zetabyte(ZB) em 2013 no qual um Exabyte é equivalente a um milhão de gigabyte (GB) e um Zetabyte equivale a um bilhão de gigabyte. No entanto, muito dessa informação não é relevante (Hilbert, 2012), como é mostrado na Figura 1.1.
Figura 1.1 - Quantidade de Dados no mundo
Fonte: Terra Data (Higginbotham, 2010)
Reduzindo o escopo para uma empresa de médio ou grande porte, quanto de informação é gerada anualmente e está armazenada em suas bases de dados?
se dá a devida importância?
Na maioria dos casos, essas informações ficam soltas em meio a tantas outras e são muito importantes para a tomada de decisão, sendo estas geralmente não levadas em consideração. Com o propósito de ajudar as empresas a se conhecerem melhor, fazendo uso da grande quantidade de informação desestruturada que possuem, o Business Intelligence aparece com um conceito de fazer uso de diversas ferramentas que irão auxiliar na estruturação desses dados e exibi-los de forma que os Stakeholders, ou seja, as pessoas com poder de decisão sobre o negócio possam tomar as melhores decisões sobre o negócio, a fim de fazê-lo crescer ainda mais por poder identificar o que os seus clientes querem ou preferem, onde está sendo gasta a maior parte dos recursos financeiros ou pessoais, entre tantas outras informações que podem ser obtidas dessas bases de dados da empresa.
Várias são as informações que podem ser inferidas sobre a base de dados de uma empresa. Uma parte que é importante e crucial para a vida saudável de uma empresa, que são os seus documentos fiscais, ou seja, os documentos que toda empresa deve declarar à secretaria de fazenda do seu estado de origem, informando os seus rendimentos totais, suas vendas detalhadas e até, em alguns casos, o seu estoque em casos de auditoria.
As ferramentas de Business Intelligence permitem fazer a análise e busca das informações através dos documentos fiscais que são encaminhados às secretarias de fazendas estaduais, como por exemplo:
NFe – Nota Fiscal Eletrônica;
ECD – Escrituração Contábil Digital;
Cartão de Crédito; e
Convênio 115/03.
Com estes documentos a empresa pode ser auditada e evitar e emissão de multas e ter um controle maior sobre as suas informações sejam elas fiscais ou não, já que os documentos podem trazer mais informações além das fiscais, como clientes, regiões ou fornecedores (Horita, 2010).
Outros trabalhos realizados com BI, que em sua maioria tratam-se de documentos sem nenhum padrão previamente determinado, ou seja, são mais complexos para se montar um Data Warehouse, devido a seus dados serem muito heterogêneos. Contudo esses arquivos fiscais possuem um padrão que é regulamentado pelos órgãos federais o que melhora bastante o processo de ETL – Extract, Transform e Load, que por sua vez acarreta na maioria dos casos 70% do trabalho da montagem de um Data Warehouse ou Data Mart (Ballmann, 2005; Negash, 2004).
Sendo assim, podemos dizer que as motivações para a realização deste trabalho foram:
Grande quantidade de dados que as empresas possuem;
Informações que são obrigatórias o envio para as secretarias de estado da fazenda; e
Documentos com um padrão nacional.
1.2. Objetivos
Geral
O principal objetivo deste trabalho, ou objetivo geral, é detalhar todo um procedimento da coleta dos dados fiscais de uma organização e integrá-los ao
Business Intelligence, realizando a validação e apresentação dos dados, para que
seja feita uma análise gerencial sobre os mesmos.
Especifico
Sendo mais específico no objetivo, pretende-se desenvolver um modelo de fiscalização para as empresas de modo que estas não sejam pegas de surpresa em auditorias fiscais, livrando-as assim das altas multas aplicadas pelos estados e, em contrapartida, ajudando a secretarias de estado da fazenda a fazer uma melhor auditoria sobre as empresas de sua responsabilidade fiscal, diminuindo assim custos desnecessários, promovendo agilidade nas auditorias e aumento nas arrecadações com auditorias efetivadas, por terem um maior percentual de certeza de serem evidenciadas as provas, evitando litígios com os empresários estaduais devido a auditorias indevidas ou mal realizadas, as quais desperdiçam recursos e tempo de fiscalização.
Com a utilização desta proposta, as empresas, terão uma maneira rápida e fácil de observar suas vendas, movimentações, estoque, status dos documentos fiscais entregues, rejeitados ou até mesmo em andamento na própria empresa.
As secretarias de estado da fazenda também poderão fazer uso da proposta para um monitoramento mais amplo dos documentos fiscais com base na validação ou não do recebimento, se as regras de preenchimento foram atendidas ou até mesmo se as informações declaradas estão em conformidade com as atribuições fiscais da empresa.
1.3. Escopo da Dissertação
No escopo deste trabalho, será dada ênfase ao uso de documentos da Nota Fiscal Eletrônica (NFe), através de uma visão geral destes documentos e como
empresas. Este propósito será utilizado para apenas uma empresa, sendo assim possível obter uma análise bem detalhada do ponto de vista gerencial das notas fiscais emitidas pela empresa em questão.
Os demais documentos fiscais citados neste trabalho podem ser feitos da mesma maneira, no entanto, respeitando cada particularidade dos arquivos federais.
1.4. Estrutura do Trabalho
A estrutura do trabalho, além deste capítulo, é composta por mais cinco capítulos. O segundo capitulo é destinado a um estudo mais detalhado do que é
Business Intelligence, ou seja, sua estrutura, suas necessidades e seus benefícios
frente aos desafios do gerenciamento do negócio. O terceiro capítulo aborda a apresentação dos documentos fiscais que serão utilizados como entrada de dados para o BI. Em seguida, o quarto capitulo destaca quais os documentos fiscais foram criados e utilizados para a especificação e desenvolvimento do protótipo, podendo assim, os mesmos serem analisados de forma mais clara e não somente uma visão do código fonte. O capitulo cinco destaca o projeto de sistemas de data warehouse, neste projeto serão apresentadas soluções para a utilização de documentos eletrônicos fiscais no projeto de sistemas de data warehouse e descrever o desenvolvimento do protótipo para modelagem conceitual de um ambiente de data warehouse, e testes realizados sobre o mesmo, como também o resultado da análise sobre a avaliação experimental. Em seguida, o capitulo de conclusão aborda uma síntese do que pode ser extraído dos resultados deste trabalho, tecendo considerações finais sobre a ferramenta e o trabalho, além de identificar trabalhos futuros sobre o tema. Por fim, são listadas as referências bibliográficas utilizadas.
Capítulo 2: Business Intelligence
O termo Business Intelligence (BI) surgiu na década de 80, criado pelo Gartner Group (empresa de consultoria e pesquisa na área de tecnologia da informação) e pode ser definido como um conjunto de ferramentas e metodologias que permitem transformar dados em informações para apoio a decisão (Marigo, 2012).
As ferramentas de BI são responsáveis por prover aos gerentes as informações lapidadas a partir de grande volume de dados para que assim possam tomar decisões estratégicas e consequentemente tornarem suas empresas mais competitivas no cenário em que atuam.
O business intelligence (Inteligência nos Negócios) é um modelo de tecnologia e ferramentas voltadas para atender ao nível gerencial das empresas, permitindo uma melhor análise sobre os dados para poder aplicar o resultado dessas análises em melhorias para a empresa, tornando-a mais dinâmica e com decisões mais coerentes (Ballmann, 2005).
O principal objetivo é transformar uma grande quantidade de dados que atualmente estão perdidos na organização e transformá-los em informações úteis à gestão do negócio, viabilizando assim, uma série de análises dos principais indicadores organizacionais. O cenário típico atual é composto por empresas que detêm uma grande quantidade de informação, mas como é muito difícil o seu mapeamento, os gerentes ficam sem essas informações relevantes sobre o negócio ou com apenas a ponta do icebeg das mesmas. Isto porque as melhores estão muito bem escondidas nas planilhas e em outros diversos documentos engavetados na empresa (Ballmann, 2005).
A tecnologia BI não trabalha sozinha, ou seja, é necessária uma variedade de ferramentas que deem o suporte necessário para que os dados sejam expostos para as devidas análises. Essas ferramentas irão dar todo o suporte à decisão como por exemplo: Data Warehouse, ferramentas OLAP, ferramentas ETL entre outros (Figura 2.1.).
Fonte: Adaptado de Monteiro ET AL, 2004
2.1 Benefícios
Para sobreviver no mercado atual, os negócios têm que ser bem gerenciados, fazendo com que os mesmos deem lucro e não prejuízo, período no qual vive-se uma época de crise mundial e que está muito difícil dar continuidade aos negócios existentes. E o que dizer dos que estão iniciando?
Com a finalidade de ajudar a melhor gerir os negócios, o BI expõe uma proposta com uma variedade de recursos que, filtrando milhares de informações que aparecem diariamente de forma exponencial, oferece de uma maneira mais simples de que o gerente possua condições de analisá-las e fazer com que seu negócio gere lucro e não dívidas. Realizando essa análise de maneira minuciosa, o que está fora dos padrões pode ser perceptível e assim, a situação não sairá do controle devido à ingerência dos produtos ou serviços comercializados.
Existe uma enorme quantidade de dados que não são abordados pelos sistemas organizacionais, muitos dos quais localizados fora da empresa, como são exemplos: informações demográficas corporativas, arquivos de log da web, informações sobre concorrentes, clientes e fornecedores (Silveira, 2007).
2.2 Aplicações Organizacionais
As aplicações de BI permitem a uma organização as seguintes estratégias:
Antecipar e gerir os riscos
o Analisando as potencias evoluções que vão verificar no meio envolvente, através de uma análise criativa dos pontos fortes e fracos do ambiente econômico, extraindo assim potenciais ameaças e minimizando os potenciais riscos, ligados à incerteza;
Organizar as informações dispersas
o Extraindo somente as informações que possam ser relevantes para a empresa, e construindo cenários para ajudar os gestores na tomada de decisão;
Inovar
o Detectando oportunidades e novos mercados, além de analisando de forma criativa os dados recolhidos durante a pesquisa e que tenham se tornado pertinentes para a organização;
Agir Oportunamente
o Em meio aos concorrentes, conhecer o mercado, analisando quais as potencialidades de crescimento, quais os produtos que mais se adaptem às necessidades dos clientes;
Posicionar-se estrategicamente no mercado
o Adquirir um crescimento aprofundado do meio envolvente à organização. É necessário conhecer bem os atores em todas as suas dimensões: nível de competitividade, o número de concorrentes, procedimentos, tecnologia de que dispõem, e se possível estratégia. É viável explorar as fraquezas dos concorrentes, através do seu acompanhamento contínuo.
Criação de Banco de Dados
o Toda a informação relativa à atividade interna e externa da organização, relativa à concorrentes, à histórico de ações e resultados anteriores;
Antecipar as mudanças
o Em um mercado bastante competitivo, se assegurar de informações relevantes sobre mudanças que estão em curso e determinar sobre elas, quais representam ameaças ou oportunidades.
Enfim, com uma ferramenta de BI as empresas só têm a ganhar com a gerência de informações sobre si mesmas.
2.3 Componentes
Business Intelligence, na verdade, é um conjunto de recursos, técnicas e ferramentas que funcionando em conjunto são capazes de oferecer a dinamicidade, flexibilidade e riqueza de conteúdos necessários à produção de informações gerenciais.
2.3.1 Data Warehouse (DW)
Data Warehouse originou-se na década de 70, resultante de estudos do MIT com finalidade de desenvolver uma arquitetura mais eficiente para sistemas de informação de apoio à decisão (Reginato, 2009).
A grande mudança devido à disponibilidade de hardware e software e as diversas mudanças na natureza dos negócios vêm facilitando o uso do DW para analisar grandes quantidades de dados com maior rapidez e clareza nas informações alcançadas para gerir bem o negócio (Fortulan, 2006).
Ao reunir informações antes inacessíveis ou subaproveitadas, o data warehouse permite que sejam feitas análises bastante eficazes, transformando dados em informações estratégicas (Fortulan, 2006).
Um dos principais alicerces ao se trabalhar com BI é o data warehouse (DW), pois o mesmo pode ser definido como um repositório que permite armazenar um grande volume de dados, proveniente de arquivos, banco de dados relacionais (OLTP) ou até mesmo planilhas, de forma a centralizar os dados para a tomada de decisão.
Segundo Fortulan (2006), os DW possuem as seguintes características:
Orientados a Assunto
o Os dados são organizados para diferentes visões do negócio, por exemplo, Departamental;
Padronização
o Apesar de os dados serem provenientes de fontes diferentes, com plataformas distintas ou não, os mesmos são armazenados de forma padronizada e sem duplicação;
Não Voláteis
o Os dados sempre são inseridos e/ou consultados, mas raramente excluídos;
Posição histórica
o Possui um ponto temporal em seus dados;
Condensados
Não normalizados
o Podem existir dados redundantes.
Em geral, o DW é o banco de dados geral da empresa, onde os usuários poderão fazer consultas de maneira a oferecer subsídios ao processo decisório, já que os dados são organizados por assunto, integrados por data e parâmetros de tempo, constituindo-se em dados instantâneos.
É possível serem feitas análises históricas ou mesmo projeções futuras da empresa através do banco de dados, sendo isto retornado aos executivos, usuários experientes ou até mesmo aos que necessitam de informações casuais ou esporádicas.
O data warehouse é uma base de dados preparada em vários níveis de granularidade e obtida através de sistemas estruturados, de modo a facilitar o processo decisório extremamente complexo que as empresas enfrentam diariamente em um mercado com competitividade elevada (Barbieri, 2001).
O DW aparece de forma a facilitar e dar maior velocidade aos processos de tomada de decisão por diferentes níveis de gerenciamento, através do armazenamento de dados em vários níveis, originados dos sistemas de informação de produção, onde os dados devem estar modelados voltados para áreas específicas do DW, na qual os dados serão analisados, onde os conceitos de dimensionalidade, agregação e a falta de normalização, como já citados, aparecem como diferencial (Barbieri,2001).
Para que um data warehouse obtenha os resultados esperados ao ser construído, ele deve ter, o foco bem definido, ou seja, ter um objetivo bem definido, pois os atributos são definidos por usuários que normalmente não conseguem determinar claramente quais os seus problemas e quais as soluções desejadas. É também importante que se consiga um patrocinador forte, ou seja, em um projeto é possível se atingir várias áreas de uma organização, nas quais exista pelo menos um usuário com poder para definir pendências e esclarecer dúvidas; Acesso aos dados, ou seja, é primordial que antes de qualquer compromisso, seja feita uma análise bem detalhada dos dados, na qual será levada em consideração a natureza desses dados, sua periodicidade de atualização, sua qualidade atual, seus sistemas mantenedores e a perspectiva de duração daquela fonte de dados (Barbieri, 2001).
Segundo Fortulan (2006), uma boa implementação de um data warehouse é composta por alguns fatores como:
Planejamento, pois é indispensável que a arquitetura e a infraestrutura técnica sejam pensadas antes do início do desenvolvimento;
Obtenção das necessidades de dados e modelagem, pois é necessário compreender as necessidades do negócio e dos usuários;
Projeto físico do banco de dados e implementação, incluindo tabelas de fatos, relacionamento de tabelas e descrição de tabelas;
Buscar dados, integração e mapeamento, pois é a fase que normalmente toma mais tempo, pois inclui definir quais são as melhores fontes de dados, desenvolver especificações para conversão dos dados e refinar
Povoamento do data warehouse, que nesta fase consiste em desenvolver programas ou utilizar ferramentas para extrair, mover e integrar os dados;
Automatização do processo de extração, conversação, carga, backup e recuperação de dados;
Criação do conjunto inicial de relatórios;
Validação dos dados e integração usando o conjunto inicial de relatórios; e
Disponibilização da solução.
O processo de integração é um processo de padronização de nomes e valores visando resolver discrepâncias na representação dos dados, fundir valores comuns e analisar dados oriundos de fontes distintas e que representam o mesmo fato do negócio (Fortulan, 2006).
O processo de limpeza, transformação dos dados e carga no DW é também conhecido como ETL (Extract, Transform and Load), o qual faz a extração dos dados de diversas origens, que são lidos e copiados para uma área chamada de “Data
Stagins Area”, na qual os dados são manipulados antes de serem inseridos no data
warehouse. A citada fase de transformação dos dados, que nem sempre se faz necessária, mas objetiva a limpeza e padronização dos dados, pois as diversas fontes podem manipular os mesmos dados de formas distintas, como por exemplo, o campo “sexo”, que a depender da forma que foi implementado, pode ser preenchido como ‘Masculino / Feminino’, ou ‘M / F’, ou mesmo ‘0 / 1’. Outros problemas que podem ser resolvidos nesse processo são: a violação de integridade, valores duplicados e indefinidos, erros de digitação, entre outros. Já a carga move os dados da “Data Stagins Area” para o DW. Este processo consome um tempo significativo por isso deve ser analisado cuidadosamente e devem ser definidos os melhores horários para fazê-lo (Abreu, 2008).
Para a construção de um DW, que não deixa de ser um banco de dados, é necessário que seja feita uma modelagem do mesmo, assim como é feita a modelagem de base de dados transacionais. No entanto, essa modelagem é conhecida como modelagem dimensional que contrasta com a modelagem entidade-relacionamento comumente utilizada nos sistemas transacionais.
A modelagem dimensional é necessária para a modelagem do cubo do DW, estrutura que armazena os dados de forma multidimensional, o que torna a análise mais fácil. O cubo é formado pelas tabelas de fatos e as tabelas de dimensões. A tabela de fatos, também conhecida como tabela de medidas, é composta pelos elementos principais que se deseja fazer análise nas transações de negócio pelo DW. Já a tabela de dimensões é uma forma de caracterizar a tabela de fatos, armazenando basicamente as descrições do negócio como, por exemplo, dados sobre produtos, tempo e clientes. A tabela de dimensão é composta por uma única chave primária, que por sua vez formará a chave composta da tabela de fatos e as respectivas tabelas dimensões (Fortulan, 2006). A Figura 2.2 e Figura 2.3 mostram, respectivamente, diagramas representando um modelo dimensional de banco de dados e um esquema estrela sobre “Vendas”.
Figura 2.2 - Modelo Dimensional de banco de dados
Fonte: Adaptado de Fortulan, 2006
Figura 2.3 - Modelo dimensional de banco de dados no esquema estrela e exemplo “Vendas”
A esse tipo de modelagem dimensional se deu o nome de “Esquema Estrela”, no qual o algoritmo de otimização, de maneira geral, se baseia na realização da operação de produtos cartesianos entre todas as dimensões, mesmo isso gerando um valor combinatório muito alto, ainda oferece melhor desempenho do que a realização de “joins” individuais entre cada dimensão e a tabela fato (Barbieri,2001).
Segundo Fortulan (2006), alguns pontos podem ser considerados como vantagens ao se utilizar o esquema estrela para um data warehouse relativamente ao modelo relacional, como por exemplo:
Permitir criação de um projeto de banco de dados que fornecerá respostas rápidas, com menos tabelas e índices;
Permitir que o administrador do banco de dados trabalhe com projetos mais simples e assim produza melhores planos de execução;
Possuir uma estrutura mais intuitiva, assemelhando o projeto do banco de dados com a forma como o usuário final pensa e utiliza os dados;
Simplificar o entendimento e a navegação dos metadados para os usuários e desenvolvedores; e
Amplia as opções de escolha da ferramenta front-end de acesso a dados. Existe uma variação do esquema estela, que é conhecida como “Snowflake”. Esta variação consiste em uma normalização da terceira forma normal nas tabelas dimensão, ou seja, nelas não podem existir campos dependentes de outros campos que não seja a chave primária, e mantendo a tabela de fatos de modo inalterado (Fortulan, 2006). A Figura 2.4 mostra um esquema snowflake.
Figura 2.4 - Modelo dimensional de bando de dados utilizando o esquema Snowflake
O esquema snowflake tem a desvantagem de ser mais complexo devido a sua estrutura de dados. No entanto, essa complexidade pode ser compensada quando no esquema estrela as tabelas dimensionais estejam muito grandes ou devido à desnormalização, estiverem exigindo muito espaço em disco e com isso prejudicando o desempenho do sistema (Fortulan,2006).
Este modelo se chama snowflake porque cada dimensão se divide em várias outras tabelas, organizadas de certa forma lembrando um floco de neve.
Análises mostram que o ganho de espaço normalizando este tipo de esquema resulta em um ganho menor que 1% do espaço total no banco de dados, sendo assim necessária a adição de agregados e alteração na granularidade dos dados para reverter esse cenário (Moreira, 2006).
Através do uso de data warehouses é possível realizar diversos tipos de aplicações para o mundo real, como por exemplo:
Detecção de Fraudes – Aplicáveis a cartões de crédito, seguros, cartões telefônicos, etc. Através de análises históricas dos clientes, a fim de caracterizar padrões de fraude e então criar algoritmos que previnam em tempo real ou semirreal a fraude.
Marketing – Em um mercado saturado de informação, não adianta a quantidade e sim a qualidade dos contatos utilizados. Portanto, o que se deseja descobrir é quais os consumidores certos para uma campanha de marketing direcionada. Ultimamente, o objetivo é descobrir determinados “segmentos de consumidores” para os quais as mensagens de marketing sejam específicas para cada consumidor individual;
Análise de lucros por cliente – O objetivo é saber quais os clientes são lucrativos e quais não são, e assim criar um ranking que permita direcionar ações; e
Análise de risco para créditos – Os clientes normalmente são classificados dentro de três categorias: bons, ruins e instáveis.
A aplicabilidade do DW para os usuários sem experiência faz com que os mesmos o subutilizem e só a partir de um tempo de uso que eles começam a perceber os reais benefícios e recursos que o Data Warehouse tem a lhes proporcionar.
Normalmente, costuma-se pensar em data warehouse e data marts como depósito de informações internas da empresa. Contudo, algumas empresas já perceberam o real valor dessas informações e as estão disponibilizando para venda. Para exemplificar o fato, uma grande empresa distribuidora de medicamentos farmacêuticos oferece um sistema web no qual seus clientes e fornecedores buscam dados sobre compras de empresas. Outro bom exemplo é uma grande empresa na área de semicondutores que vende informações detalhadas de seus mais de 30.000 produtos diferentes (Barbieri,2001).
Um data mart é descrito como um subconjunto de dados contidos em um data warehouse, tipicamente desempenhando o papel de um data warehouse departamental, regional ou funcional. Uma empresa pode construir uma série de data marts ao longo do tempo e, eventualmente, vinculá-los por meio de um data warehouse lógico (Júnior, 2004; Fortulan, 2006).
Antigamente, os data marts eram definidos como um subconjunto altamente agregado aos dados para uma fatia específica do negócio. No entanto, isso enrijeceu os data marts, fazendo com que ficassem isolados e não pudessem ser combinados com os demais. Atualmente, o data mart é definido como um conjunto flexível de dados, com os dados mais atômicos possíveis e apresentados em um modelo dimensional (Monteiro et al., 2004).
Figura 2.5 - Cubos de Business Intelligence
Fonte: Adaptado de Reginato, 2006
Os data marts são muito utilizados para que os dados fiquem segregados para melhorar o desempenho do sistema do ponto de vista do usuário, mas devendo existir uma cópia dos dados onde somente pessoas com autorização devem ter o privilégio de acessá-las.
Em um ambiente corporativo, é importante fortalecer o conceito de propriedade dentro do banco de dados, no qual diferentes setores serão responsáveis por diferentes data marts.
Esse tipo de estrutura fisicamente distinta, traz benefícios para a organização. No entanto, deve-se tomar cuidados para que as informações não sejam duplicadas, pois isso iria de encontro aos conceitos de data warehouse associados à agilidade e à eficiência por parte da organização, além da existência de informações redundantes possibilitar a geração de informações diferentes ou inconsistentes (Junior, 2004).
Os data marts têm diminuído drasticamente o custo da implementação e manutenção de sistemas de apoio à decisão e têm sido disponibilizados para um número maior de corporações.
Outra grande vantagem dos data marts é a possibilidade de os mesmos serem prototipados muito mais rápido e com isso a geração de produtos pilotos estariam ocorrendo entre 30 e 120 dias. Ao contrário do que ocorre com produtos completos, os quais duram entre 3 a 6 meses para ficarem prontos.
Os data mats setoriais têm um escopo mais limitado e se fixam melhor em grupos de necessidades de usuários, o que traduz em esforço/time concentrado.
2.3.3 Processamento Transacional (OLTP) e Processamento Analítico
(OLAP)
A ferramenta OLAP não é nova. A IBM desenvolveu e implementou a primeira linguagem com análise multidimensional no final da década de 60 chamada de APL (A Programming Language) (Inácio, 2011). Acompanhando a evolução dos sistemas, na década de 90, surgiu no mercado uma nova classe que foi batizada de OLAP. As ferramentas OLAP possuem a maioria dos conceitos da linguagem APL, no entanto com maior integração na utilização dos dados fonte (Anzanello, 2005).
Juntamente com o OLAP, o OLTP é uma solução eficaz e inteligente, tornando pesquisas muito mais fáceis, ágeis e seguras de se fazer, reduzindo bastante o tempo nas consultas ao banco de dados (SISNEMA, 2004).
O OLAP trabalha com dados históricos, no sentido de analisar informações, já que o OLTP trabalha com os dados que movimentam a empresa no seu dia-a-dia, pois ele faz as operações cotidianas do negócio através do seu processo operacional, que tem como função alimentar a base de dados que compõe o OLAP, que é multidimensional, já que o OLTP é relacional, orientado a processo, trabalhando com um registro de cada vez (SISNEMA, 2004).
A finalidade do OLTP é fazer com que uma grande quantidade de pequenas informações que são originadas nos negócios não se perca, pois em cada uma delas está uma parte da movimentação da empresa.
As ferramentas de OLAP são geralmente de três arquiteturas: ROLAP – Relational OLAP, MOLAP – Multidimensional OLAP e HOLAP – Hybrid OLAP [Fernandez ET AL., 2008]:
MOLAP – Nesse tipo há uma cópia dos dados de origem do cubo juntamente com as suas agregações, onde os mesmos são armazenados de forma multidimensional, que consequentemente consegue reproduzir respostas rápidas às consultas;
ROLAP – Ao contrário do tipo anterior, os dados são armazenados em um banco de dados relacional, o que torna as consultas mais lentas. O ROLAP é utilizado normalmente para economizar espaço de armazenamento de dados, pois seu objetivo é armazenar os dados que são consultados com pouca frequência, ou seja, não é necessário que a resposta seja tão rápida; e
HOLAP – Este tipo faz uma combinação dos dois anteriores, mesclando o que há de bom em um, com o que há de bom no outro.
As aplicações OLAP solucionam os problemas de síntese, análise e consolidação dos dados, enquanto mantém uma estrutura de dados adequada e eficiente. Sua visão é feita a partir de dados agregados, pois a finalidade é apoiar as decisões gerenciais e estratégicas da empresa (Anzanello, 2005).
O Quadro 2.1 mostra algumas diferenças entre OLTP e OLAP.
Quadro 2.1 - Diferenças entre OLTP e OLAP
Características OLTP OLAP
Operação Típica Atualização Análise
Telas Imutável Definida pelo usuário
Nível de Dados Atomatizado Sumarizado
Idade dos Dados Presente Histórico, atual e projetado
Recuperação Poucos registros Muitos registros
Orientação Registro Vetores
Modelagem Processo Assunto
Fonte: Henrique, 2013
Mais que uma aplicação, OLAP é uma solução ambiente de integração e modelagem de dados. Para formar uma solução OLAP multidimensional, normalmente são feitas as perguntas: Quando ? O que ? Onde ? e Quem ?. Essas perguntas formam a base de todos os arrays multidimensionais (Anzanello, 2005).
Uma ferramenta OLAP completa um data warehouse, pois ao ponto que o segundo é responsável por armazenar uma enorme quantidade de informações, o primeiro desempenha o papel de recuperar esses dados e mostrá-los para o usuário da melhor maneira possível. Desta forma, para ter um bom data warehouse é necessário que já se tenha os relatórios necessários em mente.
2.3.3.1 Visão Multidimensional
O conceito de BI está relacionado com formas alternativas de tratamento de informações, ou seja, antigamente os dados eram tratados de forma tal que poderiam ser implantados e entendidos pelos sistemas de gerenciados de banco de dados (SGBD), que se ajustavam de forma que ficassem mais bem compreendidos com as características transacionais. No entanto, com o aparecimento de outras necessidades, alavancadas por aspectos de competitividade e busca de diferenciais de negócios, e consequentemente de tomada de decisão, esses modelos se mostraram inadequados, pois escondiam campos e relacionamentos importantes devido a sua estrutura relacional e pelo rigor das regras de normalização (Barbieri, 2001).
A Figura 2.6 e Figura 2.7 retratam a diferença entre os esquemas relacional e o multidimensional, enquanto que o Quadro 2.2 apresenta uma comparação entre os dois esquemas.
Figura 2.6 - Esquema de Entidade e Relacionamento
Fonte: Barbieri, 2001
Figura 2.7 - Esquema Dimensional de Dados
Quadro 2.2 - Diferenças entre o esquema Dimensional e Relacional
Esquema Dimensional Esquema Relacional
Padrão de estrutura fácil e intuitiva Equema mais complexo
Anterior ao MER, anos 60 Ênfase nos Banco de Dados Relacionais, anos 70
Tabelas de Fato e Dimensão Tabelas que representam Dados e Relacionamento
Tabelas de Fatos são o núcleo - normalizadas
Todas as tabelas são comumente normalizadas
Tabelas Dimensão são os pontos de entrada
As tabelas são indistintamente acessadas e de filtro inicial
Tabelas Dimensão opcionalmente normalizadas
Todas as tabelas são comumente normalizadas
Modelo mais facilmente remontado (“joined”)
Maior dificuldade de “join” pelo numero maior de tabelas
Leitura mais fácil do modelo por usuários não especializados
Maior dificuldade de leitura pelo usuário não especializado
Fonte: Scheeren, 2009
Em um esquema dimensional, várias são as possibilidades de análises sobre os dados. Por isso foram padronizados alguns dos modos de operar um esquema dimensional, a fim de facilitar a demonstração dessas visões.
O primeiro modo é o “Pontual ou ponto”, o qual representa a intersecção dos valores da tabela de fatos com os valores das tabelas dimensões e as tabelas fatos, como mostra a Figura 2.8.
Figura 2.8 - Representação dimensional – Valor pontual
Fonte: Barbieri, 2001
O segundo modo é o “Plano ou Faixa (Slicing)”, o qual representa uma faixa de valores onde fixa um ponto de uma tabela de dimensão e se faz uma intersecção com as outras dimensões e a tabela de fatos, como mostra a Figura 2.9.
Figura 2.9 - Representação dimensional – Valores em planos (Slicing)
Fonte: Barbieri, 2001
O terceiro modo é o “Cubo (Dicing)”, o qual representa uma união entre todas as tabelas dimensões e a tabela de fatos, como mostra a Figura 2.10.
Figura 2.10 - Representação dimensional – Valores em cubos (Dicing)
Fonte: Barbieri, 2001
O quarto modo é o “Pivotamento ou Rotação”, o qual representa uma união entre todas as tabelas dimensão e a tabela de fatos, onde se fixa uma dimensão para analisar as outras, permitindo a alternância da dimensão fixada, como mostrado na Figura 2.11.
Figura 2.11 - Representação dimensional – Rotação de Planos
O quinto modo é o “Drill-Down / Drill-Up”, o qual representa conceitos de visão detalhada ou abrangente de cada situação, onde o “Drill-Down” é o sentido de uma visão macro, ou seja, mais abrangente para uma visão mais detalhada e o “Drill-Up” é o inverso, conforme mostrado na Figura 2.12.
Figura 2.12 - Representação dimensional – Comandos Hierarquizados
Fonte: Barbieri, 2001
O sexto modo é o “Drill-Across”, o qual representa o mesmo conceito do Drill-Down e Drill-Up. No entanto, neste modo é possivel alteranar de um esquema para o outro de modo que possuam as mesmas dimensões, como mostra a Figura 2.13.
Figura 2.13 - Representação dimensional – Comandos Hierarquizados (Drill-Across)
informação em nível de detalhe menor do que foi colocado pela tabela de fatos, como mostra a Figura 2.14.
Figura 2.14 – Representação dimensional – Drill-Througth
Fonte: Infopedian, 2011
2.3.4 Data Mining
O processo de data mining é um processo do Business Intelligence, no entanto esta seção não será considerada no protótipo a ser desenvolvido.
Mineração de dados, ou data mining, é o processo de análise de conjunto de dados que tem por objetivo melhor definir as propostas de tratamento de dados e informações que possam representar informações úteis (Souza, 2003; Barbieri, 2001).
O Data Warehouse oferece memória para a empresa. No entanto, a aplicação de data mining ajuda na exploração da massa de dados geradas por diversas áreas da empresa que são disponibilizadas no grande banco de dados, proporcionando um feedback a outros processos para melhor alcançar os seus resultados (Reginato, 2006). A Figura 2.15 mostra uma seleção realizada pelo data mining.
Figura 2.15 - Seleção realizada pelo Data Mining
Fonte: Adaptada de Fernandes et. al., 2006
A premissa de data mining é uma argumentação ativa, ou seja, o usuário não irá mostrar o problema, mas a própria ferramenta pesquisa automaticamente por anomalias e possíveis relacionamentos, identificando assim problemas que não tinham sido percebidos pelo usuário. Assim ele decidirá somente buscar o conhecimento e produzir mais vantagens competitivas (Fernandes et. al., 2006).
Como mostrado na Figura 2.15, são destacadas as seguintes etapas (Amo, 2004):
Limpeza de dados – São eliminados os ruídos e dados inconsistentes;
Integração dos dados – Diferentes fontes de dados podem ser combinadas produzindo um único repositório de dados;
Seleção – São selecionados os atributos que interessam ao usuário. Por exemplo, o usuário pode decidir que informações como endereço e telefone não são relevantes para decidir se um cliente é um bom
Transformação dos dados – Onde os dados são transformados em um formato apropriado para a aplicação de algoritmos de mineração de dados, como por exemplo, através de operações de agregação;
Mineração – Essencial para o processo de construção da aplicação de técnicas inteligentes, a fim de extrair os padrões de interesse;
Avaliação ou Pós-processamento – Identificação dos padrões interessantes de acordo com algum critério do usuário; e
Visualização dos resultados – São utilizadas técnicas de representação de conhecimento a fim de apresentar ao usuário o conhecimento minerado.
O processo de data mining busca algo mais que a interação dos dados existentes, como é feito através do OLAP, pois visa fundamentalmente realizar inferências, tentando “adivinhar” possíveis fatos e correlações não explicitadas no grande volume de dados de um DW/DM [Barbieri, 2001].
2.4 Considerações Finais
A partir do ferramental de BI é possível a geração e a comunicação da informação aos usuários, disponibilizando os processos com maior agilidade e flexibilidade a fim de gerar um clima favorável ao contínuo desenvolvimento e ao pleno controle da organização (Reginato, 2006).
As tecnologias associadas ao Business Intelligence visam dar suporte e oferecer o instrumental necessário para retirar as melhores e mais importantes informações gerenciais da empresa, sendo estes dados armazenados em um Data Warehouse e filtrados por Data Mining.
O próximo capítulo trata dos documentos fiscais eletrônicos, estes sendo utilizados como base de informação para fazer o gerenciamento ou auditoria e com isso basear melhor a tomada de decisão nas empresas.
Capítulo 3: Documentos Fiscais
Eletrônicos
Neste capitulo serão abordados alguns documentos fiscais eletrônicos utilizados pelas secretarias da fazenda, a fim de colher informações sobre os seus contribuintes e assim poder fazer um estudo sobre essas informações através dos recursos de Business Intelligence que irão filtrar e agrupar os dados da melhor maneira possível, facilitando a tomada de decisão pelos stackholders.
3.1. SPED Fiscal (EFD – Escrituração Fiscal Digital)
Atualmente, no Brasil, a tributação representa um custo elevado de produção em relação ao Produto Interno Bruto (PIB). A variedade dos ramos de atividade das empresas existentes no país faz com que haja mais de 170 obrigações acessórias para serem cumpridas por meio da tributação (Faria, 2010).
Devido a uma deficiência específica de arrecadação, ocorre também a denominada de sonegação (ou evasão fiscal). O governo tenta combater essa sonegação fiscal, controlando cada vez mais os contribuintes com os sistemas de administração tributária.
Os grandes avanços nas áreas da tecnologia da informação e comunicação eletrônica também são utilizados pelos governos, no exercício de suas funções, promovendo uma fiscalização mais hábil e eficaz. O Brasil é líder em Governo Eletrônico entre os países em desenvolvimento.
O governo brasileiro utilizou-se da expertise ou experiência de países como: Espanha, Chile e México, que já possuíam um modelo de fiscalização dos contribuintes eficaz. Por este motivo o Brasil também entrou na era digital com o SPED – Sistema Público de Escrituração Digital, com a finalidade de aproximar o fisco dos seus contribuintes.
O SPED pode ser definido como um instrumento que unifica as atividades de recepção, validação, armazenamento e autenticação dos livros e documentos integrantes da escrituração comercial e fiscal das empresas, mediante fluxo único e computadorizado de informações. (DINIS, 2009).
Com a implantação do SPED, os contribuintes não mais passarão as suas informações por meio físico (papel) para os órgãos fiscalizadores e sim por meio de um sistema digital online, no qual as referidas informações irão para uma base de dados única que compartilhará esses arquivos com os órgãos autorizados (BRASIL, 2009).
Todo o procedimento de envio do arquivo ao ambiente SPED deve ser assinado digitalmente e transmitido via Internet mensalmente. A partir de suas bases de dados, a empresa gera esse arquivo digital de acordo com o layout abaixo, que foi definido em Ato COTEPE, informando todos os documentos fiscais e outras informações de interesse dos fiscos estadual e federal, referentes ao período de
e à validação pelo programa Validador e Assinador (PVA) fornecido pelo SPED, que tem como funcionalidades: digitação, alteração, assinatura digital da EFD, transmissão do arquivo, exclusão de arquivos, geração de cópia de segurança e sua restauração. A Figura 3.1 mostra como é feito o processo de envio dos arquivos solicitados no SPED.
Figura 3.1 - SPED Fiscal
Fonte: Alliansys Consulting, 2013
Um dos grandes projetos do SPED é a EFD ou Escrituração Fiscal Digital, à que se refere o Decreto n° 6.022, de 22 de janeiro de 2007, que se constitui de um conjunto de escriturações de documentos fiscais e de outras informações de interesse dos fiscos das unidades federadas e da Secretaria da Receita Federal do Brasil, bem como de registros de apuração de impostos referentes às operações e às prestações praticadas pelo contribuinte e busca promover a integração dos fiscos de âmbito federal, estadual distrito federal e, futuramente, municipal, sendo assim possível a total integração do processo relativo à escrituração fiscal. (Receita Federal, 2012; SEFAZ-SP, 2010).
A regra geral para a EFD é que caso exista a informação, o contribuinte está obrigado a prestá-la. A omissão de informação poderá acarretar penalidades e a obrigatoriedade de reapresentação do arquivo integral, de acordo com as regras estabelecidas pela administração tributária (SEFAZ-SP, 2010).
As empresas ficam obrigadas a entregar mensalmente as informações relativas a um mês civil ou fração, ainda que as apurações dos impostos (ICMS e IPI) sejam efetuadas em períodos inferiores a um mês, segundo a legislação de cada imposto (SEFAZ-SP, 2010).
Figura 3.2 - Diagrama SPED
Fonte: Starling Software, 2013
As assinaturas do certificado digital para a EFD são os tipos A1 ou A3, como mostrado na Figura 3.3.
Figura 3.3 - Assinatura Digital EFD
O certificado do tipo A1 possui um menor nível de segurança, pois o mesmo é gerado e armazenado no computador do usuário. Os dados são protegidos por uma senha de acesso, que somente através desta é possível acessar, mover e copiar a chave privada a ele associada (Ribeiro, 2013).
O certificado do tipo A3 possui um nível de segurança entre médio a alto, por se tratar de um certificado que é gerado e armazenado em um hardware criptográfico, podendo ser um cartão Inteligente ou um Token. Somente o detentor da senha de acesso pode utilizar a chave privada, e as informações não podem ser copiadas ou reproduzidas (Ribeiro, 2013).
3.2. NF-e (Nota Fiscal Eletrônica)
Pode-se dizer que o atual sistema de emissão de documentos fiscais no Brasil é um sistema tradicional, mantido híbrido por envolver o preenchimento de notas fiscais por meio (CRCPE, 2006):
Manual, que envolve os talões de documentos fiscais;
Sistemas mecanizados, onde ainda se conta com a tradicional máquina de escrever (apesar de estágio de aposentadoria), datilografando notas soltas; e Sistemas de informação que preenchem eletronicamente formulários contidos
concomitante com os lançamentos manuais ou integrados nos livros fiscais. O uso de novas tecnologias de informação no âmbito das administrações públicas com o intuito de melhorar a prestação de serviços para a sociedade constitui o que se convencionou chamar de e-governo (Pereira et al., 2008).
No Brasil, a melhor estratégia para a disseminação do uso da Internet na função pública e definição de qual é o papel do Estado neste campo vêm sendo objeto de crescente interesse e debate. O Governo Federal é amplamente comprometido com a aplicação e uso de novas tecnologias da informação e tem como grande desafio a ampliação do acesso à Internet para população de baixa renda (Pereira et. al., 2008).
As empresas deixaram de utilizar o jurássico talonário de notas ficais e suas cópias para migrar e fazer registros das operações através do procedimento eletrônico e online dos dados. Isso significa que as empresas vão literalmente invadir os portais das autoridades tributárias municipais, estaduais e federais e terão suas operações homologadas em tempo real (CRCPR, 2006).
A Figura 3.4 mostra como é o funcionamento da utilização da nota fiscal eletrônica (NF-e):
Figura 3.4 - Utilização NFe
Fonte: For System, 2013
A NF-e tem como objetivo implantar um modelo nacional de documento fiscal eletrônico para substituir gradativamente o modelo tradicional que é feito com a emissão de papel. Busca-se a simplificação dos processos relacionados às obrigações acessórias, possibilitando o acompanhamento em tempo real das operações comerciais pelo fisco (Pereira ET AL, 2008; BRASIL, 2013).
Segundo a pesquisa elaborada pelo Instituto Brasileiro de Planejamento Tributário – IBPT, o sistema tributário brasileiro é o mais complexo do mundo, pois apresenta 62 tributos, entre impostos, taxas e contribuições, além de possuir mais de 3,6 milhões de normas editadas nos últimos 19 anos, dificultando o acompanhamento de tais medidas legais por parte das indústrias e das pessoas (Pereira et. al., 2008).
A nota fiscal eletrônica possui algumas características e benefícios (Pereira et. al., 2008):