• Nenhum resultado encontrado

S ELEÇÃOP ARAA P RIMEIROSD ÍGITOS A MÍLCARA LVES

N/A
N/A
Protected

Academic year: 2019

Share "S ELEÇÃOP ARAA P RIMEIROSD ÍGITOS A MÍLCARA LVES"

Copied!
49
0
0

Texto

(1)

C

ONTABILIDA

S

ELEÇÃO

P

ARA

A

P

RIMEIROS

D

ÍGITO

A

MÍLCAR

A

LVES

ILIDADE

F

ISCALIDADE E

F

INAN

E

MPRESARIAIS

D

ISSERTAÇÃO

A

UDITORIA

T

RIBUTÁRIA

A

NÁLIS

GITOS

R

ELEVANTES

LVES

M

ARQUES

S

ETEMBRO

2013

INANÇAS

(2)

C

ONTABILIDA

S

ELEÇÃO

P

ARA

A

P

RIMEIROS

D

ÍGITO

A

MÍLCAR

A

LVES

E

DUARDO

B

ARBO

ILIDADE

F

ISCALIDADE E

F

INAN

E

MPRESARIAIS

D

ISSERTAÇÃO

A

UDITORIA

T

RIBUTÁRIA

A

NÁLIS

GITOS

R

ELEVANTES

LVES

M

ARQUES

RBOSA

D

O

C

OUTO

S

ETEMBRO

2013

INANÇAS

(3)

This work is an empirical study which intends to evaluate the use of digital

analysis, taking into account the distribution of frequencies of Benford series.

The analysis we want to perform is limited to sectors defined in accordance with

the portuguese classifier of economic activities: the restaurant sector and retail

meat trade sector. It was concluded that Benford's law is applicable to the

second and enables to identify, through the analysis of invoices, issuers that

have a greater noncompliance with this law. Can be very useful in particular in

all retail sectors. Digital analysis of the first two digits can be used in the

selection of business taxpayers to be audited, contributing effectively to relevant

and timely information from the portal e fatura.

Este trabalho é um estudo empírico no qual se pretende avaliar a utilização da

análise digital, tendo em conta a distribuição das frequências da série de

Benford. A análise que aqui se pretende efetuar é circunscrita aos sectores

definidos de acordo com o classificador das atividades económicas (CAE)

português: da restauração e do comércio a retalho de carne. Concluiu se que a

Lei de Benford é aplicável ao segundo e permite identificar, mediante a análise

das faturas, os emitentes que apresentam uma maior desconformidade com a

lei. Poderá ser de grande utilidade nomeadamente em todos os setores de

retalho. A análise digital aos dois primeiros dígitos pode ser usada na seleção

de contribuintes empresariais a serem sujeitos a auditoria tributária,

contribuindo eficazmente para retirar informação pertinente e atempada do

(4)

Índice

Lista de tabelas ... III Lista de figuras ... III

1 Introdução ... 4

2 Revisão da Literatura ... 6

2.1 Análise dos Dígitos – Lei de Benford ... 6

2.2 Aplicação à área contabilística auditoria ... 10

3 – Hipóteses, dados e metodologia ... 16

... 16

... 18

... 19

4 Análise dos dados ... 21

4.1 Considerações prévias ... 21

4.2 Condições de aplicabilidade da Lei de Benford ... 25

4.3 Limitações ... 26

4.4 Testes a realizar aos primeiros dígitos ... 28

4.4.1 Primeira ordem ... 28

4.4.2 Segunda ordem ... 29

4.4.3 Fator distorção ... 30

4.5 Medidas de quantificação ... 31

4.6 Seleção das amostras ... 33

4.7 Aplicação ao setor da restauração ... 34

4.7.1 Série de dados com todo o setor ... 34

4.8 Aplicação ao setor do comércio a retalho de carne ... 36

4.8.1 Série de dados com todo o setor ... 36

4.8.2 Série de dados de contribuinte empresarial ... 38

5 Conclusões ... 41

(5)

Lista de tabelas

TABELA I Lei de Benford: frequência esperada dos dígitos ... 8

TABELA II Valores referência para a MAD – dois primeiros dígitos ... 14

TABELA III Evolução entrega declarações informaticamente ... 22

TABELA IV Resultados da análise aos talhos ... 38

Lista de figuras

FIGURA 1 Faturas comunicadas à AT (apenas setores indicados). ... 24

FIGURA 2 – Gráficos das amostras com melhor e pior conformidade do setor da restauração. ... 35

FIGURA 3 – Gráficos das amostras com melhor e pior conformidade do setor do comércio a retalho de carne. ... 37

FIGURA 4 Gráficos das amostras com melhor e pior conformidade do talho 5. ... 39

(6)

1 Introdução

"Nada é mais certo neste mundo do que a morte e os impostos". A popular

frase de Benjamim Franklin contrasta de uma forma geral com a vontade dos

contribuintes, que de uma forma mais sofisticada (deslocalizações) ou mais

arcaica (caixa aberta), pretendem reduzir ao mínimo esse contributo.

A redução das receitas fiscais, originada por esquemas de fuga e evasão fiscal,

são uma crescente preocupação dos Estados, veja se a recente preocupação

do G20 que pretendem a aplicação do plano de ação da Organização para a

Cooperação e Desenvolvimento Económico (OCDE) para o combate à evasão

fiscal, i.e. deslocalizações e redes de filiais/sucursais que, através de vazios

legais nas legislações fiscais, permitem reduzir ou mesmo eliminar o

pagamento de impostos.

Mas, a problemática da diminuição das receitas fiscais, também opera

mediante esquemas menos elaborados, como é evidenciado pelo relatório da

Organização para a Cooperação e Desenvolvimento Económico (2013). A

ameaça perpetuada pela fuga aos impostos nos setores retalhista é tão ou

mais significativa. Neste relatório, que aborda a problemática da fuga ao “fisco”

no chamado mercado de retalho, é referido um estudo de uma associação de

restaurantes canadiana, a qual estima a omissão de vendas em cerca de 2,4

biliões de dólares canadianos no ano de 2009.

Segundo estudo do Observatório de Economia e Gestão de Fraude (2013) a

(7)

sendo que em 2010 o setor dos serviços, onde se inclui o retalho, representou

17,76% do PIB.

Em Portugal, desde o início de 2013, todas as faturas emitidas pelos

contribuintes empresariais são comunicadas informaticamente, via portal e

fatura, à Autoridade Tributária e Aduaneira (AT). Só o setor de atividade de

restauração e alojamento, submeteu cerca de 400.000.000 faturas, segundo

Autoridade Tributária e Aduaneira (2013b). Estes dados podem ser uma

importante fonte de informação, nomeadamente para encaminhar auditorias

tributárias, potenciando ganhos de eficiência e eficácia.

A Lei de Benford (doravante LB), pode ter aqui um papel relevante, como

ferramenta para retirar informação pertinente, sumarizando num indicador o

grau de conformidade. De facto, no domínio da auditoria contabilística, é

utilizada pelo menos há duas décadas, existindo uma larga experiência

internacional na sua aplicação.

O que se pretende com este estudo é, mediante a análise de dados reais

(faturas emitidas), verificar se a LB é aplicável a dois setores de atividade

específicos (restauração e comércio a retalho de carne). No caso da hipótese

se verificar, analisar as faturas de contribuintes empresariais (selecionados

aleatoriamente) e concluir da conformidade, ou não, com a LB.

Nos casos de não conformidade, procede se à análise da(s) medidas de

quantificação dessa desconformidade (fator de distorção, valor do teste Chi

(8)

mix, que poderá servir como critério na seleção de contribuintes empresariais a

serem auditados pela Autoridade Tributária e Aduaneira.

2 Revisão da Literatura

Em finais do século XIX, Newcomb (1881) publicou no ! "

# o artigo que descreve o que mais tarde ficou conhecido como a

LB. Resumidamente, ele constatou que os livros sobre logaritmos estavam

consideravelmente mais gastos nas páginas com números cujo primeiro dos

dígitos era mais baixo (1, 2 e 3) e menos gastos relativamente aos dígitos mais

altos (7, 8 e 9). Perante este padrão ele inferiu que existem mais números que

começavam pelo dígito um do que com o dígito dois e sucessivamente a

percentagem ia diminuindo, seguindo um padrão logaritmico.

Benford (1938) um engenheiro da $ % , redescobriu de forma

similar, este padrão na densidade de distribuição dos dígitos, e descreveu a

fórmula de probabilidade para o primeiro dígito:

P(d1)= Log10 (1+1/d1)

Sendo: d1 o dígito (1, 2, 3, X, 8, 9); e

P(d1) a probabilidade de ocorrência de d1,

P(1)= Log10 (1+1/1)=0,30103

(9)

E também para o segundo e seguintes dígitos:

9

P(d2) = Σ Log10 (1+1/d1d2) d1=1

Sendo: d2 o dígito (0, 1, 2, 3, X, 8, 9); e

P(d2) a probabilidade de ocorrência de d2,

P(0)= Log10 (1+1/10)+ Log10 (1+1/20)+ Log10 (1+1/30)+

Log10 (1+1/40)+ Log10 (1+1/50)+ Log10 (1+1/60)+ Log10

(1+1/70)+ Log10 (1+1/80)+ Log10 (1+1/90)= 0,11968

P(1)= Log10 (1+1/11) )+ Log10 (1+1/21)+ Log10 (1+1/31)+

Log10 (1+1/41)+ Log10 (1+1/51)+ Log10 (1+1/61)+ Log10

(1+1/71)+ Log10 (1+1/81)+ Log10 (1+1/91)=0,11389

Assim como para os dois primeiros dígitos:

P(d1d2)= Log10 (1+1/d1d2)

Sendo: d1d2 os dígito (10, 11, 12, X, 98, 99); e

P(d1d2) a probabilidade de ocorrência de d1d2,

P(10)= Log10 (1+1/10)=0,04139

P(11)= Log10 (1+1/11)=0,03779

Com base nestas fórmulas, determinou a probabilidade de ocorrência de cada

dígito ou conjunto de dígitos e, esta distribuição de probabilidades ficou para a

história como LB (vide tabela I a probabilidades para o primeiro, segundo,

terceiro e quarto dígitos). Por exemplo, o número 2013 tem quatro dígitos, com

(10)

utilização da tabela 1 a frequência esperada do número 2013 é

aproximadamente 0,00021 [=0,17609 x 0,11968 x 0,10138 x 0,10006 ≈ Log10

(1+1/2013)].

TABELA I Lei de Benford: frequência esperada dos dígitos

Posição no número

Dígito Primeiro Segundo Terceiro Quarto

0 0,11968 0,10178 0,10018

1 0,30103 0,11389 0,10138 0,10014

2 0,17609 0,10882 0,10097 0,10010

3 0,12494 0,10433 0,10057 0,10006

4 0,09691 0,10031 0,10018 0,10002

5 0,07918 0,09668 0,09979 0,09998

6 0,06695 0,09337 0,09940 0,09994

7 0,05799 0,09035 0,09902 0,09990

8 0,05115 0,08757 0,09864 0,09986

9 0,04576 0,08500 0,09827 0,09982

Fonte: Nigrini (1996)

Para testar as suas fórmulas, Benford efetuou uma recolha de dados, tendo

usado 20.229 registos de observações de métricas naturais, tais como

comprimentos de rios, pesos, taxas de mortalidade, números de porta de

moradas, etc., constatou que a sua formulação teórica gerava probabilidades

de frequência muito semelhantes à frequência de ocorrências dos dígitos dos

registos que analisou.

Ao longo do século XX, vários estudiosos se debruçaram sobre esta

descoberta com o intuito de obterem uma explicação, sendo Theodore P. Hill

em 1995 (segundo Durtschi 2004) quem apresentou uma das explicações

(11)

Aplicações para a LB foram surgindo para as mais variadas áreas (cotações da

bolsa, imagens digitais, censos, votos em eleições, auditoria, etc.),

nomeadamente para detetar adulteração de dados, enganos, erros.

De facto, a aplicação desta lei, baseia se num processo muito simples e de

fácil utilização, permitindo trabalhar com grandes quantidades de dados,

mormente pela utilização de sistemas informáticos, comparando a frequência

esperada (teórica) dos dígitos de números (segundo a LB) com a frequência

observada.

Este processo sinaliza as frequências anormais dos dígitos, já que a

adulteração de dados (invenção de números, reduzir ou aumentar valor) resulta

numa frequência que não respeita a LB, pois os números gerados pela mente

humana apresentam uma frequência do primeiro dígito igual para qualquer dos

dígitos (1 a 9) (P(d1)=1/9=0,11111). De facto esta característica da distribuição

de Benford é contra intuitiva, se questionarmos pessoas selecionadas ao

acaso, sobre qual a probabilidade de o primeiro dígito de um número ser 1 ou

9, a resposta (errada) será que a probabilidade é a mesma.

Nas últimas duas décadas, a LB tem sido alvo de grande atenção, segundo

Varma e Khan (2012) (Hurlimann 2006) contabilizou 350 publicações que se

referem à LB entre 1881 e 2006, sendo que entre 2000 e 2006 surgiram 166,

continuando até hoje a surgirem regularmente artigos oriundos de todas as

partes do mundo, como se pode constatar pela consulta ao sítio da internet

(12)

De acordo com Durtschi (2004) é apenas nos finais dos anos 80, do século

passado, que a LB é aplicada na contabilidade (auditoria), nomeadamente por

(Carslaw 1988) que a aplicou aos proveitos das firmas da Nova Zelândia e

(Thomas 1989) aos proveitos das firmas no EUA, referindo ainda que

aparentemente foi (Nigrini 1992) quem a aplicou aprofundadamente na

contabilidade (auditoria) com o intuito de detetar fraude.

&' ( ) "

Nigrini (1996) no seu estudo elaborado em 1992 aplica a pela primeira vez à

temática dos impostos. O objetivo era identificar, e de certa forma quantificar

(estimar), a fuga fiscal não planeada no * + , " - , , (IRS) dos

EUA, isto é, a fuga fiscal que ocorre no momento do preenchimento das

declarações fiscais e que se consubstancia no aumento de despesa ou

redução de receita, ambas mediante a invenção de números.

O seu estudo baseou se em analisar se as frequências dos dígitos, dos valores

nas declarações fiscais (despesas e rendimentos), eram diferentes das

frequências esperadas, de acordo com a LB, e se essa disparidade era devida

a fuga fiscal, tendo como pressuposto que os valores reais (não adulterados)

apresentam uma frequência de dígitos conforme com a LB.

Concluiu que, mediante a utilização de um modelo que apelidou de fator de

distorção (adiante explanado), é possível estimar a extensão da fuga fiscal (não

em valor, mas em quantidade de declarações suspeitas) em cada campo da

(13)

dos EUA, nomeadamente para identificar os campos mais propícios a serem

adulterados.

Nigrini e Mittermaier (1997) publicam um estudo no qual apresentam um

conjunto de seis testes de análise digital que podem ser usados no

planeamento das auditorias, nomeadamente para a delimitação e seleção de

amostras. Esses testes de análise digital realizam se:

ao primeiro dígito;

ao segundo dígito;

aos dois primeiros dígitos;

à duplicação de números;

ao arredondamento de números; e

aos dois últimos dígitos.

Estes testes têm por base a LB, nomeadamente os três primeiros e o último

teste, sendo adequados para situações em que os dados (registos de

operações) estão em suporte informático e são de grande volume

(preferencialmente mais de 1000 observações), providenciando ao auditor um

conjunto de indicadores que lhe permitem avaliar o nível de risco associado a

fraudes e/ou erros materialmente relevantes.

Para efeitos de quantificação, da probabilidade dos dados analisados não

respeitarem a LB (no pressuposto de que dados reais a respeitam), estes

autores referem ser adequado a utilização dos testes estatísticos de Chi

quadrado e da estatística de Z. No entanto em virtude destes serem afetados

pelo excessivo poder do tamanho da série de dados, este deve ser inferior a

(14)

indicação de não conformidade dos dados com a LB, mesmo quando os

desvios não são significativos.

Uma outra medida para avaliar a conformidade à LB é utilizar o valor da média

absoluta dos desvios (MAD). O óbice é a inexistência de valores de referência

que permitam classificar a conformidade do valor da MAD. Drake e Nigrini

(2000) elaboram, tendo por base a sua experiência, uma tabela de valores

referência da conformidade da MAD com a LB, para o primeiro, segundo e dois

primeiros dígitos.

Durtschi, Hillison e Pacini (2004), identificam diferentes tipos de dados em que

se espera uma ditribuição de Benford (registos contabilisticos: recebimentos;

pagamentos; vendas; despesas). Nestes, a análise digital pode ser útil na

deteção de situações de potencial fraude (pelo menos suspeitas de).

Identificam, também, os tipos de dados em que a LB não têm aplicação, é o

caso de por exemplo os números de identificação do tipo número de

contribuinte, número de segurança social ou os levantamentos de dinheiro no

multibanco. Apresentam um exemplo de análise a uma série de dados reais e a

outra de dados adulterados, demonstrado a utilidade da análise digital.

Concluíram que a análise digital usando a LB, quando usada corretamente

(estejam presentes um conjunto de carateristicas na série de dados a analisar),

é uma ferramenta útil para selecionar registos a serem investigados.

Watrin, C, Struffert, R and Ullmann, R (2008), publicaram um artigo no qual

concluem que a LB é útil no âmbito do esforço de combate à fuga aos

impostos, aumentando os níveis de eficiência e eficácia das auditorias,

(15)

Realizaram um estudo de laboratório, usando dados que sabiam não serem

manipulados, e solicitaram a adulteração dos dados a um grupo de indivíduos

em dois momentos distintos, antes e depois de lhes darem formação sobre a

LB. Concluíram que os indivíduos com conhecimento sobre a LB, não

conseguem manipular os dados para que estes sejam conformes com a

distribuição de Benford. Constataram que para efeitos de seleção de

contribuintes a auditar no terreno, é fundamental atestar que os dados, não

manipulados, sejam conformes com a distribuição de Benford.

Nigrini e Miller (2009), apresentam uma nova abordagem que os autores

intitulam de testes de segunda ordem. Resumidamente, baseia se na análise

da frequência dos dígitos da diferença entre os registos de uma série de dados

ordenados (de forma crescente), tendo concluído que estes apresentam grande

semelhança com a distribuição de Benford e que se aplicam a qualquer série

de dados, identificando positivamente a não conformidade, com reduzido falsos

positivos. A desvantagem que apresenta advém de se basear em diferenças,

não permitindo identificar os registos concretos a serem investigados.

Nigrini (2011) apresenta diversas técnicas para detetar valores anormais dentro

de uma série de dados, entre as quais a utilização da LB a que dedica quatro

capítulos. Apresenta diversas ferramentas, com instruções de utilização,

baseadas nas aplicações informáticas “ ..%--” e “%/.% ”.

No que respeita aos testes a desenvolver, baseados na LB, o autor do livro

defende a utilização da análise aos dois primeiros dígitos para validar a

conformidade à LB, os testes estatísticos Z para os dígitos individualmente, os

(16)

Refere que, no entanto, estes testes estatísticos sofrem do excesso de poder

da quantidade de observações (N) da série de dados, e que a fronteira é as

2500 (valor referência também usado pelo IDEA1).

Para efeitos de avaliação da conformidade com a LB, defende a utilização da

média absoluta dos desvios (MAD), em virtude de não ser afetada pela

dimensão da amostra (N). No entanto não existe um valor estatisticamente

validado a partir do qual se pode considerar a não conformidade com a LB.

Contudo, partindo do trabalho de Drake e Nigrini (2000) e baseado na sua

experiência e na análise de 25 séries de dados distintas, apresenta a tabela II

com os valores para a MAD, que serve de referência para classificar os dados

analisados em quatro níveis atendendo a conformidade com a LB.

TABELA II Valores referência para a MAD – dois primeiros dígitos

INTERVALO MAD CONCLUSÕES

0,0000 a 0,0012 CONFORMIDADE PRÓXIMA

0,0012 a 0,0018 CONFORMIDADE ACEITÁVEL

0,0018 a 0,0022 CONFORMIDADE MARGINAL

superior a 0,0022 NÃO CONFORMIDADE

Fonte: Nigrini (2011)

Também autores portugueses têm trabalhos publicados em revistas

internacionais, sobre esta temática. É o caso de Silva, Carlos Gomes da e

Carreira, Pedro M. R. (2013) que apresentam dois modelos matemáticos para

1 IDEA – Aplicação informática usado por auditores e analistas de dados,

desenvolvido pela Caseware, mais detalhes em

(17)

auxiliar os auditores, nomeadamente a determinarem o tamanho e os

elementos da(s) amostra(s) a recolher dos registos, com o intuito de aprofundar

os procedimentos de auditoria no terreno.

Em 2012 Varma e Khan publicam um artigo no qual demonstram que a LB

contribui de forma efetiva para a deteção de fraude nos registos de

fornecimentos. No seu estudo, analisam os registos de todos fornecedores (em

conjunto) de um departamento de determinada organização, efetuam o teste ao

primeiro dígito e concluem que os resultados são similares aos da distribuição

de Benford. Posteriormente analisaram os registos de cada um dos

fornecedores (individualmente) tendo detetado um fornecedor, relativamente ao

qual a frequência do primeiro dígito dos registos não respeitava a LB, tendo

concluído, após investigação mais aprofundada, existirem fortes indícios de

fraude.

Nigrini (2012) dedica vários capítulos a casos práticos de aplicação da LB,

inclusive a análise de séries de dados relacionadas com escândalos financeiros

como foram a falência do banco # # , à *$, % , , até às

declarações fiscais do casal . .

Conclui que a análise ao primeiro e segundo dígito é muito superficial, e que a

análise aos dois primeiros dígitos é essencial para se retirarem conclusões,

sugerindo que a MAD é uma ferramenta adequada para concluir sobre a

conformidade, ou não, da serie de dados à LB.

Sugere, para o futuro, a realização de estudos no desenvolvimento de métodos

(18)

das bases de dados (as quais ocorrem no setor de retalho e restauração) por

via de técnicas como o “0# 1 ” e “2 ”.

3 – Hipóteses, dados e metodologia

Pretende se neste trabalho avaliar se a utilização da análise digital, tendo em

conta a distribuição das frequências da série de Benford, quantificando a não

conformidade, pode ser útil na seleção de contribuintes empresariais a serem

auditados pela Autoridade Tributária, tendo por base o valor das faturas

comunicadas.

A LB pode ter aqui um papel relevante, como ferramenta para avaliar a

frequência dos primeiros dígitos do valor das faturas emitidas. De facto, no

domínio da auditoria a LB, é utilizada pelo menos há duas décadas, e existe

uma larga experiência internacional na sua aplicação. Atualmente, a maior

parte das aplicações informáticas de auditoria (ACL, IDEA, etc.), possuem esta

ferramenta que permite avaliar as séries de dados e sinalizar a não

conformidade, identificando, desta forma, dados suspeitos que podem/devem

ser investigados.

A análise que aqui se pretende efetuar é circunscrita aos sectores definidos de

acordo com o classificador das atividades económicas (CAE) português: da

(19)

Para o efeito, analisando amostras aleatórias retiradas dos dados constantes

do repositório do portal e fatura, relativos a cada um dos setores alvo,

pretende se testar as seguintes hipóteses:

– As amostras, para cada setor analisado, retiradas das bases de

dados, apontam para a aplicabilidade da LB ao setor;

– As amostras, para cada setor analisado, retiradas das bases de

dados, indicam a não aplicabilidade ao setor da LB;

Na condição da hipótese se verificar, para onde aponta a teoria, avaliado

pela análise gráfica da distribuição e pelas medidas de quantificação, o estudo

prossegue para análise das faturas dos contribuintes empresariais

selecionados aleatoriamente, onde se pretende avaliar as seguintes hipóteses:

– A amostra aleatória das faturas emitidas pelos contribuintes

empresariais, analisados individualmente, indicam conformidade com a

LB;

– A amostra aleatória das faturas emitidas pelos contribuintes

empresariais, analisados individualmente, indicam não conformidade

com a LB;

Na condição de se verificar a hipótese , procede se à escolha das medidas

de quantificação dessa desconformidade (fator de distorção, valor do teste Chi

quadrado, MAD), com o intuito de escolher uma ou um mix de medidas, que

poderá servir como critério, conjugado com a utilização de outros, a usar para a

seleção de contribuintes empresariais a serem auditados pela Autoridade

(20)

Os dados base utilizados na análise efetuada são dados reais obtidos de

faturas emitidas pelos contribuintes empresariais em Portugal. Em virtude das

alterações introduzidas na legislação fiscal, pelos decretos lei 197 e 198 Diário

da República (2012a, 2012b), a partir de 1 de janeiro de 2013, todos os

documentos emitidos pelos contribuintes empresariais (faturas, fatura

simplificada e fatura recibo) têm de ser comunicadas à AT (número documento,

data, valor sem IVA, IVA e valor total), por transmissão eletrónica2. Tal

obrigatoriedade originou uma base de dados com uma dimensão colossal, só

no primeiro trimestre mais de 900.000.000 faturas foram comunicadas,

segundo Ministério das Finanças (2013).

Para efeitos de aplicação prática, efetuaram se algumas restrições aos dados a

serem trabalhados, pelo que a base de dados de suporte a este estudo

contem, apenas, as faturas cuja atividade comercial, classificada de acordo

com a classificação portuguesa de atividades económicas (CAE), de

restaurantes e de comércio a retalho de carne.

O acesso aos dados foi solicitado por requerimento dirigido ao Diretor Geral da

Autoridade tributária.

Com os dados obtidos criaram se duas bases de dados, uma para cada setor

de atividade a ser estudado, nomeadamente:

BD_Rest com as faturas do setor atividade da restauração; e

2 Existem exceções a esta regra, nomeadamente para contribuintes

(21)

BD_ComerRet_C com as faturas do setor atividade do comércio a

retalho de carne.

Cada uma das bases de dados é composta pela codificação do contribuinte

empresarial3, o número da fatura, a data e o valor total. Sendo retiradas

amostras aleatórias de cada uma delas e realizado o estudo do grau de

conformidade do valor das faturas com distribuição de Benford. Posteriormente,

para as atividades em que o grau de conformidade for elevado, testar

individualmente amostras aleatórias das faturas de contribuintes que se

dediquem a essa atividade.

De acordo com Hill (1995), um dos teóricos de referência no que respeita à LB,

a utilização de amostras aleatórias obtidas de dados onde se verifica a LB,

também elas se comportam de acordo com a referida Lei, pelo que da amostra

se pode inferir para a população.

Apesar de teoricamente o valor das faturas, quando analisadas no contexto de

uma base de dados de milhões de registos e de centenas de realidades

económicas, se adequar à LB, conforme defendem diversos autores, como por

exemplo Nigrini e Mittermaier (1997), Durtschi et al (2004), Watrin et al (2008) e

Nigrini (2011, 2012), primeiro é necessário validar essa adequação, através da

realização dos testes de primeira ordem e de segunda ordem aos dois

primeiros dígitos e do fator de distorção, avaliados mediante a visualização dos

(22)

gráficos de frequências, da estatística de Z e de Chi quadrado, e da média

absoluta dos desvios.

Assim, primeira tarefa a realizar é gerar as amostras aleatórias de registos,

retiradas de cada uma das bases de dados: BD_Rest; e BD_ComerRet_C.

Para a sua seleção é usada a ferramenta constante do sítio da internet

www.random.org, que garante a aleatoriedade.

A análise dos dados realiza se mediante a utilização das aplicações

informáticas IDEA e %/.% .

Posteriormente, relativamente aos setores de atividade em que se observa

uma adequação à LB, selecionar aleatoriamente contribuintes, de cada base de

dados. De seguida procede se à amostragem aleatória dos valores das faturas,

sendo o tamanho da amostra no máximo de 2500 registos ou a totalidade dos

registos se estes forem inferiores.

Por último, analisar a conformidade do valor total das faturas, de cada amostra,

à luz da LB, mediante a realização dos testes de primeira ordem aos dois

primeiros dígitos (Nigrini e Mittermaier, 1997), e avaliação através das

estatísticas Chi quadrado, da MAD (Nigrini, 2011) e do fator de distorção

(Nigrini, 1996). Utilizando também os testes de segunda ordem (diferença entre

o valor das faturas ordenadas de forma crescente) (Nigrini e Miller, 2009),

avaliação através da análise do gráfico e da MAD, embora com valores de

referência maiores (Nigrini, 2012).

Os contribuintes empresariais que apresentem, no conjunto dos diversos

(23)

conformidade, são sinalizados como alvos potenciais para serem auditados por

suspeitas de adulteração do valor das faturas.

4 Análise dos dados

3 . &4 5,

As administrações tributárias têm como objetivo a diminuição do gap entre as

receitas tributárias obtidas e as potenciais (ausência de fuga fiscal). Segundo

estudos do Observatório de Economia e Gestão de Fraude (2013) a economia

paralela, em Portugal (todos os setores), representou em 2011 mais de 25% do

PIB.

De facto, a predisposição para a fuga fiscal é enorme e está presente em todos

os setores económicos, em todos os estratos sociais e é comum a todos os

géneros. Das grandes empresas às pequenas empresas, numa sociedade

global em que nascem e morrem empresas a cada segundo, ainda mais num

ciclo económico de crise, o ónus que pende sobre as autoridades tributárias é

ainda maior.

A seleção de contribuintes a auditar é crucial na administração tributaria

portuguesa, segue as orientações emanadas pela direção geral e

materializadas, anualmente, no Plano Nacional da Atividade da Inspeção

Tributária (PNAIT). Assenta, em grande parte, na deteção de incumprimento

por parte dos contribuintes por via de cruzamentos de dados constantes de

(24)

entre declarações, não existindo avaliação, nesta fase, da autenticidade dos

dados declarados.

Atualmente, as obrigações declarativas dos contribuintes são prestadas em

suporte informático (veja se a tabela III) com a evolução das principais

declarações entregues por via informática à administração tributária

portuguesa.

TABELA III Evolução entrega declarações informaticamente

(parcial)

IRS Fase 1 2.738.744 2.840.609 2.968.094 3.280.370

IRS Fase 2 1.442.380 1.500.228 1.495.482 1.801.427

IRC 430.670 446.014 462.918 439.490

IES/DA 581.646 581.340 559.248 518.891

Modelo 10 606.410 601.039 602.386 572.990

IVA 3.698.348 3.595.506 3.504.314 2.486.486

Ret.IRS/IRC e Selo 3.414.912 3.563.089 3.194.369 2.231.367

TOTAL 12.913.110 13.127.825 12.786.811 11.331.021

Fonte: AUTORIDADE TRIBUTÁRIA E ADUANEIRA (2013a). Estatísticas Tributárias [Base de dados], Setembro 2013. Lisboa: AT. Disponível em http://www.portaldasfinancas.gov.pt/pt/main.jsp?body=/portal dgci/Stats.jsp.

No entanto, os contribuintes e os seus colaboradores, na área fiscal e

contabilística, estão conscientes que as autoridades tributárias atuam

primordialmente mediante cruzamentos e validações de declarações efetuadas

por terceiros.

E a efervescência dos negócios, por outro, a gerar um colossal volume de

(25)

adaptaram se a esta nova era, principalmente porque a grande maioria das

transações realizadas são registadas em suporte informático.

Organização para a Cooperação e Desenvolvimento Económico (2013), refere

um estudo de uma associação de restaurantes canadiana, a qual estima a

omissão de vendas em cerca de 2,4 biliões de dólares canadianos no ano de

2009.

Neste relatório, que aborda a problemática da fuga ao “fisco” no chamado

mercado de retalho, são identificadas técnicas como o “0# 1 ” e

2 ”, que, resumidamente, são aplicações informáticas instalados

(0# 1 ) no disco do sistema informático ou aplicações informáticas que

funcionam através de uma ligação à internet, em discos USB ou através de CD

(2 ) e que alteram linhas de registos de operações (trocando um produto

de maior valor por um de menor) e/ou simplesmente apagam linhas de vendas.

Desde o início de 2013, além das declarações, todas as faturas emitidas pelos

contribuintes empresariais são comunicadas informaticamente, via portal e

fatura, à Autoridade Tributária e Aduaneira (AT) portuguesa.

Avaliar a “qualidade” dos dados constantes do repositório do portal e fatura é

fundamental neste momento. Relativamente ao setor de atividade da

restauração, constam cerca de 400 milhões de faturas, das quais apenas 5%

têm o número de contribuinte do cliente (Figura 1). Uma questão que se coloca

é porque razão os empresários deste setor são avessos a colocar o número de

(26)

contribuinte do cliente pod

e fatura?

FIGURA 1 Faturas comu Fonte: https://faturas.porta

A legislação que instituiu

concede um benefício fisc

dedução ao IRS correspo

da restauração e alojam

motociclos e de cabeleire

emitida com o número de

Retirar informação pertine

de controlos e cruzamen

liquidado nas declaraçõ

comerciais realizadas pe

negócios. No entanto, esta

a transações entre contrib

te podem ser consultadas e confirmadas por e

comunicadas à AT (apenas setores indicados) .portaldasfinancas.gov.pt/home.action. Setem

stituiu a obrigação de comunicação das fatu

io fiscal aos clientes (contribuintes não empre

respondente a 15% do IVA pago, nos setores

alojamento, da reparação automóvel, na r

beleireiros, sendo para isso necessário que

ro de contribuinte do cliente.

ertinente é fundamental, sendo possível efetu

amentos, como por exemplo validar o IVA

larações periódicas de IVA (resumem as

as pelos contribuintes empresariais) ou o

o, estas validações são abrangentes apenas r

ontribuintes empresariais, sendo muito limitada

por este no portal

ados).

etembro 2013.

s faturas emitidas,

empresariais), uma

etores de atividade

na reparação de

que a fatura seja

l efetuar uma série

o IVA deduzido e

m as transações

ou o volume de

as relativamente

(27)

clientes são particulares que não têm atividade económica. É o caso por

exemplo do setor da restauração ou do comércio a retalho.

A LB pode ter aqui um papel relevante, como ferramenta para avaliar o valor

das faturas emitidas.

3 . &4 )

Tendo por base os contributos de Drake e Nigrini (2000), Durtschi et al (2004),

Cho e Gaines (2007), Watrin et al (2008), Nigrini (1996, 1997, 2009, 2011 e

2012), existem algumas condições adjacentes aos números que constituem o

que se designa por serie de Benford (a frequência observada dos dígitos é

igual à frequência esperada deduzida da LB), nomeadamente:

os dados devem respeitar à mesma realidade, ter a mesma unidade de

medida, i. e. não devem estar juntos dados em quantidade e em preço;

os números da série de dados não devem ser formados pelo

pensamento humano (valores psicológicos, por exemplo: 0,99, 1,99,

9,99);

os dados não devem estar subordinados a um mínimo ou a um máximo

imposto, por exemplo uma série de dados que só tem registos de valor

superior a € 1.000,00 ou inferior a € 5.000,00, não é de esperar que seja

conforme a LB;

a série de dados deve ser suficientemente longa, sendo referido na

literatura que deverá, pelo menos, ter mais de 1000 observações;

(28)

não sejam números de identificação, como é o caso dos números de

contribuinte, de segurança social, de conta bancária, de telefone, etc.; e

existam mais números pequenos que grandes, e quando ordenados de

forma crescente se assemelhem a uma série geométrica.

Há três caraterísticas, demonstradas por diversos autores, e que podem ser

observadas numa série de Benford:

Independente da escala, se multiplicar todos os valores de uma série de

Benford por uma qualquer constante gera uma nova série de Benford

(Pinkham,1961);

Independente da base, é aplicável não só a sistemas numéricos de base

10, mas também em todos outros (Hill, 1995); e

Independente de operações matemáticas, potências, multiplicação,

divisão, adição e subtração, entre séries de Benford geram uma nova

serie de Benford (Hamming, 1970; Schatte, 1988; Boyle, 1994).

Uma série de dados que reúna todas estas condições e caraterísticas é de

esperar que a frequência dos primeiros dígitos esteja conforme com a LB.

3 &4

A utilização da LB na análise de séries de dados, com o objetivo de detetar

fraude, deve ser efetuada com precaução, pois o facto de os dados analisados

serem considerados não conformes, i. e. não terem o mesmo padrão da serie

(29)

normal segundo a LB), e não significa necessariamente que os mesmos são

falsos.

Na realidade, mesmo estando presentes na série de dados em análise, todas

as condições e caraterísticas referidas no subcapítulo anterior, e os dados

serem reais, a frequência dos dígitos pode não ser semelhante com a da LB.

Por exemplo Nigrini (2012) refere questões culturais, como por exemplo o

dígito 8 que na cultura chinesa representa fortuna, donde resultará, em séries

de dados relacionados com este país, que o oito terá uma frequência muito

maior que na LB. O mesmo poderá ocorrer, por exemplo, em empresas em que

o seu volume de negócios resulta da venda de poucos produtos e em

quantidades fixas.

Mesmo em situações de fraude ou falsificação de dados, a análise da

frequência dos primeiros dígitos, apenas permite detetar os casos em que

ocorre de forma sistemática, i. e. a falsificação do valor de uma dezena de

faturas, numa série de centenas de milhares, não é detetável. Também as

situações de eliminação de registos não são, pelo menos por agora, detetáveis,

a não ser que sistematicamente sejam eliminados os valores com os dígitos

mais elevados.

A utilização da LB, na análise de séries de dados, deve ser efetuada com

descrição e com forte intuito de investigação direcionada para os dígitos que

apresentam frequências mais anormais, procurando primeiro encontrar uma

justificação plausível para a sua existência e, apenas no caso de esta não ser

(30)

fraude, eventualmente no decurso desta investigação podem surgir provas

concretas de manipulação de dados.

Assim, quando perante dados que não se comportam como o esperado, de

acordo com Cleary e Thibodeau (2005), podem existir pelo menos quatro

explicações possíveis:

A série de dados (completa) segue a LB, mas por causas aleatórias a

amostra analisada não segue (é o clássico erro tipo I);

O pressuposto de muitas ordens de grandeza não se verifica;

Existe(m) explicação para a existência de um excesso de determinados

primeiros dígitos; e

Existem de facto dados fraudulentos.

A existência de dados falsos é penas uma das hipóteses, pelo que do ponto de

vista de auditoria é sempre necessário realizar uma investigação aprofundada,

com o intuito de determinar a origem da não conformidade.

3 3 6 7

3 3 0

Na análise das séries de dados, existem diversos testes que permitem avaliar a

conformidade com a LB: os testes ao primeiro dígito, ao segundo dígito, aos

dois primeiros dígitos, aos três primeiros dígitos, aos dois últimos dígitos. No

entanto, segundo Nigrini, para a análise de grandes séries de dados, nem

todos são adequados, o autor defende a utilização do teste aos dois primeiros

(31)

A análise ao primeiro ou segundo dígito é demasiado superficial não permitindo

só por si identificar dados anormais. Quanto aos três primeiros dígitos a análise

é demasiado extensa, resulta em 900 primeiros dígitos, dificultando a obtenção

relevante de conclusões (Nigrini 2012).

A generalidade dos autores sugere a eliminação dos dados de valor inferior a

10,00 u. m. e dos valores negativos por não possuírem dois primeiros dígitos.

No entanto, neste estudo em que se pretende analisar o valor das faturas

emitidas por restaurantes e retalhistas, setores identificados no relatório da

OCDE por manipularem o valor das linhas de vendas (transformando valores

grandes em pequenos), optou se por trabalhar o valor em cêntimos de euro,

pelo que os valores excluídos das amostras aleatórias são os valores inferiores

a 10 cêntimos de euro, não existindo dados de valor negativo.

3 3 - "

Nigrini e Miller (2009) apresentam uma nova abordagem que intitulam de testes

de segunda ordem. Resumidamente, baseia se na análise da frequência dos

dígitos da diferença entre os registos de uma série de dados ordenados (de

forma crescente) os autores concluíram que este tipo de dados apresenta

grande semelhança com a distribuição de Benford e que se aplica a qualquer

série de dados. Para efeitos desta análise este teste é efetuado tendo por base

a totalidade dos dados ordenados do menor para o maior valor, como sugere

(32)

3 3 8 &'

O modelo do fator de distorção exige um tratamento dos dados a analisar. Este

modelo assenta na comparação entre a média da frequência dos dados a

analisar com a média da série de Benford (designação atribuída a um conjunto

de dados cuja distribuição de dígitos segue a Lei Benford). No entanto, a média

da série de Benford pode ser muito variada (depende da ordem de grandeza

dos seus valores e da sua amplitude). Nigrini (1996) elaborou o seu modelo

(fator de distorção) usado uma série de Benford com dados no intervalo

[10;100[, cuja média, constatou, é aproximadamente 39,08. Para efeitos de

comparabilidade, os dados a analisar maiores ou iguais a 100 são

transformados para uma escala igual [10;100[, sendo eliminados todos os

dados menores que 10. De referir que também aqui a unidade de medida dos

dados a analisar é os cêntimos de euro.

O valor do fator de distorção deve ser lido como uma sub ou sobre valorização

em percentagem, da série de dados em análise em comparação com a série de

Benford, e indicia uma manipulação negativa (valor do fator distorção negativo)

ou positiva (valor do fator distorção positivo). O fator de distorção (FD) é então

calculado da seguinte forma:

FD = (MO – ME) / ME

Em que: MO é a média observada dos dados em análise após tratamento

ME é a média esperada calculada da seguinte fórmula:

ME = 90 / (N (101/N – 1))

(33)

O modelo do fator de distorção foi desenvolvido para detetar a chamada fuga

aos impostos não planeada, assentando nos pressupostos de que se trata de

aumentos do valor das despesas e/ou redução do valor dos rendimentos,

dentro da mesma ordem de grandeza. Por exemplo uma fatura emitida de €

45,68 é reduzida para € 12, 68, mediante a redução do valor nas linhas de

produtos vendidos, precisamente o que permitem as técnicas relatadas pelo já

citado relatório da Organização para a Cooperação e Desenvolvimento

Económico (2013), pelo que se entende ser pertinente a sua inclusão no

presente estudo.

3 9 :" &'

A análise da conformidade dos dados com a LB pode ser verificada pela

análise gráfica da distribuição das frequências dos primeiros dígitos dos dados

e a sua comparação com o padrão da distribuição de frequências de Benford.

No entanto essa análise simplista é subjetiva, não é quantificável, pelo que têm

sido usados por diversos autores, dedicados ao estudo deste fenómeno,

técnicas estatísticas para quantificar essa conformidade. As mais comummente

usadas são: o teste da estatística de Z; e do Chi quadrado, com um nível de

significância de 5%.

A estatística de Z é usada para testar dígito a dígito enquanto o Chi quadrado é

usado para testar todos os dígitos ao mesmo tempo. Neste estudo, a estatística

(34)

para testar o fator de distorção mediante a utilização da fómula deduzida por

Nigrini (1996):

Zcálculado = FD

N / 0,638253

Para avaliar a conformidade dos dados à LB, a todos os dígitos, é usado o

valor Chi quadrado de 112,02, a um nível de significância de 5% e com 894

graus de liberdade, sendo o valor calculado da seguinte forma:

K

Chi quadradocálculado =

Σ

(Fobsi – Fespi) / Fespi

i=1

O problema identificado na utilização destas medidas é o excesso de poder da

dimensão (N) dos dados analisados, originando que em séries de dados

(amostras) muito grandes mesmo pequenas diferenças originam a classificação

dos dados como não conformes, sendo que não existe uma definição concreta

do que é grande. No entanto, Nigrini (2011) considera estes testes adequados

para amostras de 2500 observações (também usado pelo IDEA), sendo neste

estudo o valor utilizado na dimensão das amostras.

Existe, contudo, uma media que não é afetada por este problema que é a

média absoluta dos desvios (MAD), calculada da seguinte forma:

K

MAD=

Σ

|Fobsi – Fespi| / K

i=1

Em que: Fobs é a frequência observada dos dígitos;

Fesp é a frequência esperada, frequência de Benford; e

4 Existem 90 primeiros dois dígitos (do 10 ao 99), os graus de liberdade são

(35)

K é o número de dígitos diferentes (para os dois primeiros é 90).

No entanto esta média, também tem associado a dificuldade de não existirem

valores de referência, validados estatisticamente, que permitam classificar os

dados em análise em conformes ou não. Drake e Nigrini (2000) foram os

primeiros a construir uma tabela de referência para esta classificação, tendo

por base a experiencia acumulada ao longo de anos a analisar séries de

dados. Neste estudo é usada uma nova tabela5, elaborada por Nigrini (2011)

tendo por base os resultados da análise a 25 séries de dados distintas. No

entanto, na avaliação dos testes de segunda ordem, Nigrini (2012) refere que

devem ser considerados valores de referência significativamente superiores.

3 ; - &'

Para a análise das duas séries de dados, procedeu se à seleção de oito

amostras aleatórias, quatro para cada setor de atividade, cada amostra com

2500 observações (faturas).

Mediante a utilização de ferramenta disponível no sítio www.random.org, foram,

em duas fases distintas, geradas quatro séries de 2500 números aleatórios,

considerando a dimensão da população de cada setor de atividade, ordenada

entre 1 (a primeira fatura) e o último registo (última fatura).

5 Tabela II – Valores referência para a MAD – dois primeiros dígitos, incluída na

(36)

Utilizando o EXCEL, para cada ficheiro com os dados de cada um dos dois

setores de atividade, previamente ordenados sequencialmente, procedeu se à

identificação do valor correspondente que fará parte da amostra, sendo este

valor multiplicado por dez para trabalharmos em cêntimos de euro. Obtendo se

assim as amostras aleatórias de todas as faturas dos dois setores de atividade.

Para análise dos contribuintes empresariais, a seleção aleatória destes, bem

como as amostras aleatórias das faturas de cada um deles, foi efetuada nos

mesmos moldes.

Relativamente aos testes de segunda ordem e do fator de distorção, utilizaram

se todos os dados.

3 < &' " &'

3 < -5

Trata se de um setor de atividade económica, ao qual são atribuídas as

práticas de manipulação dos registos informáticos (OCDE 2013). Dependendo

da técnica, o resultado que os perpetuadores pretendem atingir é uma dupla

redução dos impostos a pagar, sobre a despesa e sobre o rendimento.

Analisados os dados constata se que, ao contrário do esperado, as amostras

aleatórias das faturas emitidas no setor da restauração (cerca de 750.000), não

existe conformidade com a LB.

Os dois primeiros dígitos foram analisados, como proposto, e obtiveram se,

para todas as amostras, resultados que, em termos estatísticos, rejeitam a

(37)

Podemos assim afirmar que o padrão dos dois primeiros dígitos dos dados do

setor da restauração não é semelhante ao padrão dos dois primeiros dígitos da

série de Benford, como se constata pela análise gráfica da figura 2.

FIGURA 2 – Gráficos das amostras com melhor e pior conformidade do setor

da restauração.

O valor calculado do Chi quadrado é, na média das amostras, de 3.763,48,

portanto muito superior ao valor esperado (112,02) considerando um nível de

0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

LB freq obs limite inf limite sup

0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 0,090 0,100

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

(38)

significância de 5% e 89 graus de liberdade. O valor mínimo é o obtido pela

amostra R_11 (3.172,93) e o máximo é o da amostra R_4 (4.126,89).

O fator de distorção apresenta o valor de 1,15%, a MAD de todos os dados é

de 0,00607 e o teste de segunda ordem apresenta uma MAD de 0,00614.

Todos corroboram a rejeição da hipótese nula, i. e. que a série de dados do

setor da restauração não é conforme com a LB, estamos portanto perante a

situação da hipótese HB.

3 = &' 5 #

3 = -5

Analisados os dados constata se que, como era esperado, as amostras

aleatórias retiradas do universo de todas as faturas emitidas no setor do

comércio a retalho de carne, apresentam conformidade com a LB.

Os dois primeiros dígitos foram analisados, como proposto, e obtiveram se

para todas as amostras resultados que, em termos estatísticos, não rejeitam a

hipótese nula, i. e. estamos perante dados que são conformes com a LB.

Podemos afirmar que, o padrão dos dois primeiros dígitos dos dados do setor

do comércio a retalho de carne é semelhante ao padrão dos dois primeiros

dígitos da série de Benford, como se constata pela análise gráfica da figura 3.

Os limites superior e inferior representam o valor da estatística de Z, para um

nível de significância de 5%. O valor da frequência observada, à exceção de

dois picos em cada uma das amostras, comporta se dentro dos limites de

(39)

FIGURA 3 – Gráficos das amostras com melhor e pior conformidade do setor

do comércio a retalho de carne.

O valor calculado do Chi quadrado é, na média das quatro amostras, de 86,97,

portanto significativamente inferior ao valor esperado (112,02) considerando

um nível de significância de 5% e 89 graus de liberdade. O valor mínimo foi a

amostra T4 (69,57) e o máximo foi a amostra T1 (103,46).

0,000 0,010 0,020 0,030 0,040 0,050 0,060

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

LB freq obs limite inf limite sup

0,000 0,010 0,020 0,030 0,040 0,050 0,060

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

(40)

O fator de distorção apresenta o valor de 0,82%, a MAD é de 0,0005 e o teste

de segunda ordem apresenta uma MAD de 0,0029, sendo que todos eles

corroboram a não rejeição da hipótese nula, i. e. que a série de dados do setor

do comércio de carne é conforme com a LB.

3 = -5 )"

Analisadas as quatro amostras dos dados relativos a cada um dos contribuintes

empresariais, que se dedicam ao comércio a retalho de carne (comummente

designados de talhos), constata se que os resultados dos testes são variados,

apresentando valores que se coadunam desde a conformidade próxima até à

não conformidade, como se pode verificar pela tabela IV.

TABELA IV Resultados da análise aos talhos

!"

Talho1 Talho2 Talho3 Talho4 Talho5 Amostra 1 130,16 213,21 97,68 101,20 87,59 Amostra 2 153,02 195,36 112,80 142,18 91,14 Amostra 3 129,21 197,89 130,80 133,83 88,34 Amostra 4 154,52 202,09 127,07 115,56 86,98

#$i %& % &% ' % ' ((%)

DF 1,97% 2,31% 2,13% 1,47% 1,91% Z calculado 2,01 2,02 4,69 2,19 2,77

MAD 0,0018 0,0026 0,0009 0,0013 0,0009

* !

(41)

O talho 5, apresenta valores que o permitem classificar como conforme com a

LB, como se constata pela análise da figura 4, apenas um e dois pico fora dos

limites (até três picos é de aceitar a conformidade segundo Nigrini (2012)).

Para as quatro amostras os valores de Chi quadrado variam entre 86,98 e

91,14, portanto muito inferior ao valor referência de 112,02 (nível de

significância de 5% e 89 graus de liberdade), a MAD de todos os dados é de

0,00091 (conformidade próxima).

FIGURA 4 Gráficos das amostras com melhor e pior conformidade do talho 5.

0,000 0,010 0,020 0,030 0,040 0,050 0,060

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

)

LB freq obs limite inf limite sup

0,000 0,010 0,020 0,030 0,040 0,050 0,060

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

)

(42)

Por outro lado o talho 2, apresenta valores que o permitem classificar como

não conforme com a LB, como se constata pela análise da figura 5, mais de

três picos fora dos limites. Para as quatro amostras os valores de Chi quadrado

variam entre 195,36 e 213,21, portanto muito superior ao valor referência de

112,02 (nível de significância de 5% e 89 graus de liberdade), sendo a MAD de

0,0025 (não conformidade).

FIGURA 5 Gráficos das amostras com melhor e pior conformidade do talho 2.

0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

LB freq obs limite inf limite sup

0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070

10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95

(43)

O fator de distorção apresenta valores muito semelhantes que rondam os 2%.

Relativamente aos testes de segunda ordem, a quantidade de diferenças entre

as observações são muito poucas, isto é, existem muitos valores iguais, o que

redunda em muitas diferenças de valor zero.

5 Conclusões

Não obstante, não ter sido possível obter séries de dados de grande dimensão

e com muitos contribuintes empresarias, os dados com que se efetuou este

trabalho são dados reais, que permitem retirar conclusões sobre a

aplicabilidade da análise digital, nomeadamente da LB, como um critério, de

preferência conjugado com outros de cariz contabilístico e financeiro, a ser

utilizado na seleção de contribuintes empresarias para auditorias tributárias.

Os testes realizados aos dois primeiros dígitos por via de amostragem

aleatória, ao fator de distorção relativo a todos os dados de cada uma das

séries e os de segunda ordem (dois primeiros dígitos), avaliados pelos valores

calculados (amostras) da estatística de chi quadrado e da MAD (totalidade dos

dados), são consistentes entre si.

Ressalva ao setor do comércio a retalho de carne, nomeadamente no que

respeita ao fator de distorção, que apresenta valores que rondam os 2%, muito

baixos e semelhantes, e que não permitem seriar a classificação dos dados

como conformes ou não, possivelmente por os dados não se adequarem a este

tipo de teste, mais adequado para detetar manipulações de valores dentro da

(44)

permitem retirar conclusões, em virtude da quantidade de diferenças entre as

observações serem muito poucas (rondam as duas centenas) isto é existem

muitos valores iguais, o que redunda em muitas diferenças de valor zero.

Verificou se, pelas amostras retiradas de um universo de cerca de 70.000

faturas do setor do comércio a retalho de carne e de 750.000 faturas do setor

da restauração, apresentam um padrão de conformidade para as primeiras e

não conformidade para as últimas.

Quando analisados individualmente as faturas dos contribuintes individuais,

verificou se claramente que o talho 2 apresenta um padrão de não

conformidade e que, por outro lado, o talho 5 apresenta um elevado grau de

conformidade. Numa ótica de seleção de contribuintes a serem auditados

sinaliza claramente o talho 2, sendo o melhor critério de seleção o teste de

CHI QUADRADO e a MAD.

Os resultados obtidos não significam, e muito menos provam, por si só a

existência de manipulação de dados e fuga aos impostos. Significam apenas

que o setor de atividade de comércio a retalho de carne segue um padrão

muito semelhante ao da LB, e que alguns dos contribuintes empresariais

apresentam um padrão que não a segue.

As razões para tal ocorrer podem ser várias e entre elas pode efetivamente

estar a manipulação de dados com o intuito de fuga aos impostos, pelo que

esta análise dos dígitos relevantes não é um fim em si mesmo, mas antes

(45)

como é o portal e fatura, podendo ser utilizado como critério para sinalizar

contribuintes empresariais a serem auditados.

Conclui se que a análise das faturas emitidas no setor do comércio a retalho de

carne, constantes do portal e fatura, podem ser avaliadas quanto à

conformidade com a LB pelos dois primeiros dígitos, sendo pertinente nessa

avaliação quantificar a conformidade através dos testes CHI QUADRADO e da

MAD.

Futuramente, seria útil efetuar um estudo de caso, em que um conjunto de

contribuintes empresariais fosse selecionado para auditar, utilizando a análise

digital aos dois primeiros dígitos, e no âmbito do planeamento da auditoria

fosse também utilizada esta abordagem para identificar as faturas a investigar,

com a frequência anormal dos dígitos, avaliando os resultados das auditorias

quanto à eficiência e eficácia dos procedimentos, i. e. se a abordagem usando

a LB contribui ou não para um aumento de eficácia e eficiência nas auditorias.

Por outro lado, seria também interessente analisar mais aprofundadamente o

setor da restauração, com o intuito de identificar um padrão, que como se

constata na figura 2 ele aparentemente existe (picos crescentes para os dois

primeiros dígitos 50, 55, 60 e 65), que possa ser usado como uma lei própria

(46)

Bibliografia

Autoridade tributária e aduaneira (2013a). Estatísticas Tributárias [Base de

dados], Setembro 2013. Lisboa: AT. Disponível em

http://www.portaldasfinancas.gov.pt/pt/main.jsp?body=/portal dgci/Stats.jsp.

[Acesso em 2013/09/04].

Autoridade tributária e aduaneira (2013b). E fatura [Em linha]. Disponível em

https://faturas.portaldasfinancas.gov.pt/home.action. [Acesso em 2013/09/02].

Benford, F (1938). The law of anomalous numbers. Proceedings of the

American Philosophical Society 78, 551 572.

Carlos Gomes da Silva and Pedro M. R. Carreira (2013) Selecting Audit

Samples Using Benford's Law. AUDITING: A Journal of Practice & Theory: May

2013, Vol. 32, No. 2, pp. 53 65.

Carslaw, CAPN (1988). Anomalies in Income Numbers: Evidence of Goal

Oriented Behavior. The Accounting Review 63, No. 2, 321 327.

Cho, Wendy K. Tam and Gaines, Brian J. (2007). Breaking the (Benford) Law:

Statistical Fraud Detection in Campaign Finance. The American Statistician,

Vol. 61 (3), 218 223.

Cleary, R and Thibodeau, JC (2005). Applying Digital Analysis Using Benford‘s

Law to Detect Fraud: The Dangers of Type I Errors. Auditing A Journal of

Practice & Theory 24(1), 77 81. ISSN:0278 0380.

Decreto Lei 197 (2012a). Diário da Republica, 1ªSerie Nº 164 de 24 de Agosto

(47)

http://www.dre.pt/pdf1s/2012/08/16400/0465604666.pdf. [Acesso em:

2013/09/02].

Decreto Lei 198 (2012b). Diário da Republica, 1ªSerie Nº 164 de 24 de Agosto

[Em linha]. Disponível em:

http://www.dre.pt/pdf1s/2012/08/16400/0466604677.pdf. [Acesso em:

2013/09/02].

Drake, P. D., Nigrini, MJ (2000). Computer assisted analytical procedures using

Benford’s Law, Journal of Accounting Education, 18, 127 146.

Durtschi, C, Hillison, W and Pacini, C (2004). The effective use of Benford’s law

to assist in detecting fraud in accounting data. Journal of Forensic Accounting

1524 5586/Vol. V, 17 34.

Hill, TP (1995). The Significant Digit Phenomenon. American Mathematical

Monthly 102(4), 322 327. ISSN:0002 9890.

Hill, TP (1999). The difficulty of faking data. Chance 12(3), 27 31.

Hill, TP, Berguer, A (2013). Benford online bibliography (2013) [Em linha].

Disponível em: http://www.benfordonline.net/. [Acesso em: 2013/08/02].

Ministério das Finanças (2013). Maior ação de fiscalização externa da

autoridade tributária e aduaneira [Em linha]. Disponível em:

http://www.portugal.gov.pt/pt/os ministerios/ministerio das financas/mantenha

se atualizado/20130527 seaf faturas.aspx [Acesso em 2013/09/02].

Newcomb, S (1881). Note on the frequency of use of the different digits in

natural numbers. American Journal of Mathematics 4(1), 39 40. ISSN:0002

(48)

Nigrini, MJ (1996). A taxpayer compliance application of Benford’s law. Journal

of the American Taxation Association 18(1), 72 91.

Nigrini, MJ and Mittermaier, LJ (1997). The use of Benford's Law as an aid in

analytical procedures. Auditing A Journal of Practice & Theory 16(2), 52 67.

ISSN:0278 0380.

Nigrini, MJ and Miller, SJ (2009). Data Diagnostics Using Second Order Tests

of Benford's Law. Auditing: A Journal of Practice & Theory 28(2), 305 324.

Nigrini, MJ (2011). Forensic analytics: methods and techniques for forensic

accounting investigations, New Jersey: John Wiley & Sons, Inc.

Nigrini, MJ (2012). Benford's Law: Applications for Forensic Accounting,

Auditing, and Fraud Detection, New Jersey: John Wiley & Sons, Inc.

Organização para a Cooperação e Desenvolvimento Económico (2013)

Electronic sales suppression: a threat to tax revenues © OECD 2013 [Em linha].

Disponível em: http://www.oecd.org/ctp/crime/ElectronicSalesSuppression.pdf.

[Acesso em 2013/08/21].

Observatório de Economia e Gestão de Fraude (2013). Actualização do índice

de Economia Não Registada para Portugal. Disponível em:

http://www.gestaodefraude.eu/images/gf_upload/APIT_Lisboa2013.pdf.

[Acesso em 2013/08/21].

Silva, Carlos Gomes da e Carreira, Pedro M. R. (2013). Selecting Audit

Samples Using Benford's Law. AUDITING: A Journal of Practice & Theory: May

(49)

Varma, Tej N. P, Khan, Da (2012). Fraud Detection in Supply Chain using

Benford Distribution. International Journal of Research in management 2, Vol 5,

90 96.

Watrin, C, Struffert, R and Ullmann, R (2008). Benford’s Law: an instrument for

Referências

Documentos relacionados

• Quando o navegador não tem suporte ao Javascript, para que conteúdo não seja exibido na forma textual, o script deve vir entre as tags de comentário do HTML. &lt;script Language

Nos tempos atuais, ao nos referirmos à profissão docente, ao ser professor, o que pensamos Uma profissão indesejada por muitos, social e economicamente desvalorizada Podemos dizer que

Tendo em vista todo contexto positivo que as aulas práticas laboratoriais causam no processo de aprendizagem e das muitas dificuldades encontradas para suas

Tendo como parâmetros para análise dos dados, a comparação entre monta natural (MN) e inseminação artificial (IA) em relação ao número de concepções e

Arriscaríamos dizer – levando em consideração o que foi exposto no capítulo III sobre as visões piagetianas e vygotskyanas tópico 3.2, capítulo III, e sobre a visão da LA

A) Rodrigo Augusto Morais dos Reis, com residência na Rua das Arrudas, nº1, freguesia do Cabouco, Concelho de Lagoa, na qualidade de proprietário, solicitando a

Uma maneira viável para compreender uma reação química é através da conservação das massas, isso porque numa abordagem mais ampla, como demonstra no livro

Ligações pessoais e profundas, existentes por décadas, vinculavam, não somente cativos de diferentes senhores, mas também senhores e cativos, &#34;mormente senhores sem filhos,