C
ONTABILIDA
S
ELEÇÃO
P
ARA
A
P
RIMEIROS
D
ÍGITO
A
MÍLCAR
A
LVES
ILIDADE
F
ISCALIDADE E
F
INAN
E
MPRESARIAIS
D
ISSERTAÇÃO
A
UDITORIA
T
RIBUTÁRIA
A
NÁLIS
GITOS
R
ELEVANTES
LVES
M
ARQUES
S
ETEMBRO
2013
INANÇAS
C
ONTABILIDA
S
ELEÇÃO
P
ARA
A
P
RIMEIROS
D
ÍGITO
A
MÍLCAR
A
LVES
E
DUARDOB
ARBOILIDADE
F
ISCALIDADE E
F
INAN
E
MPRESARIAIS
D
ISSERTAÇÃO
A
UDITORIA
T
RIBUTÁRIA
A
NÁLIS
GITOS
R
ELEVANTES
LVES
M
ARQUES
RBOSA
D
OC
OUTOS
ETEMBRO
2013
INANÇAS
This work is an empirical study which intends to evaluate the use of digital
analysis, taking into account the distribution of frequencies of Benford series.
The analysis we want to perform is limited to sectors defined in accordance with
the portuguese classifier of economic activities: the restaurant sector and retail
meat trade sector. It was concluded that Benford's law is applicable to the
second and enables to identify, through the analysis of invoices, issuers that
have a greater noncompliance with this law. Can be very useful in particular in
all retail sectors. Digital analysis of the first two digits can be used in the
selection of business taxpayers to be audited, contributing effectively to relevant
and timely information from the portal e fatura.
Este trabalho é um estudo empírico no qual se pretende avaliar a utilização da
análise digital, tendo em conta a distribuição das frequências da série de
Benford. A análise que aqui se pretende efetuar é circunscrita aos sectores
definidos de acordo com o classificador das atividades económicas (CAE)
português: da restauração e do comércio a retalho de carne. Concluiu se que a
Lei de Benford é aplicável ao segundo e permite identificar, mediante a análise
das faturas, os emitentes que apresentam uma maior desconformidade com a
lei. Poderá ser de grande utilidade nomeadamente em todos os setores de
retalho. A análise digital aos dois primeiros dígitos pode ser usada na seleção
de contribuintes empresariais a serem sujeitos a auditoria tributária,
contribuindo eficazmente para retirar informação pertinente e atempada do
Índice
Lista de tabelas ... III Lista de figuras ... III
1 Introdução ... 4
2 Revisão da Literatura ... 6
2.1 Análise dos Dígitos – Lei de Benford ... 6
2.2 Aplicação à área contabilística auditoria ... 10
3 – Hipóteses, dados e metodologia ... 16
... 16
... 18
... 19
4 Análise dos dados ... 21
4.1 Considerações prévias ... 21
4.2 Condições de aplicabilidade da Lei de Benford ... 25
4.3 Limitações ... 26
4.4 Testes a realizar aos primeiros dígitos ... 28
4.4.1 Primeira ordem ... 28
4.4.2 Segunda ordem ... 29
4.4.3 Fator distorção ... 30
4.5 Medidas de quantificação ... 31
4.6 Seleção das amostras ... 33
4.7 Aplicação ao setor da restauração ... 34
4.7.1 Série de dados com todo o setor ... 34
4.8 Aplicação ao setor do comércio a retalho de carne ... 36
4.8.1 Série de dados com todo o setor ... 36
4.8.2 Série de dados de contribuinte empresarial ... 38
5 Conclusões ... 41
Lista de tabelas
TABELA I Lei de Benford: frequência esperada dos dígitos ... 8
TABELA II Valores referência para a MAD – dois primeiros dígitos ... 14
TABELA III Evolução entrega declarações informaticamente ... 22
TABELA IV Resultados da análise aos talhos ... 38
Lista de figuras
FIGURA 1 Faturas comunicadas à AT (apenas setores indicados). ... 24FIGURA 2 – Gráficos das amostras com melhor e pior conformidade do setor da restauração. ... 35
FIGURA 3 – Gráficos das amostras com melhor e pior conformidade do setor do comércio a retalho de carne. ... 37
FIGURA 4 Gráficos das amostras com melhor e pior conformidade do talho 5. ... 39
1 Introdução
"Nada é mais certo neste mundo do que a morte e os impostos". A popular
frase de Benjamim Franklin contrasta de uma forma geral com a vontade dos
contribuintes, que de uma forma mais sofisticada (deslocalizações) ou mais
arcaica (caixa aberta), pretendem reduzir ao mínimo esse contributo.
A redução das receitas fiscais, originada por esquemas de fuga e evasão fiscal,
são uma crescente preocupação dos Estados, veja se a recente preocupação
do G20 que pretendem a aplicação do plano de ação da Organização para a
Cooperação e Desenvolvimento Económico (OCDE) para o combate à evasão
fiscal, i.e. deslocalizações e redes de filiais/sucursais que, através de vazios
legais nas legislações fiscais, permitem reduzir ou mesmo eliminar o
pagamento de impostos.
Mas, a problemática da diminuição das receitas fiscais, também opera
mediante esquemas menos elaborados, como é evidenciado pelo relatório da
Organização para a Cooperação e Desenvolvimento Económico (2013). A
ameaça perpetuada pela fuga aos impostos nos setores retalhista é tão ou
mais significativa. Neste relatório, que aborda a problemática da fuga ao “fisco”
no chamado mercado de retalho, é referido um estudo de uma associação de
restaurantes canadiana, a qual estima a omissão de vendas em cerca de 2,4
biliões de dólares canadianos no ano de 2009.
Segundo estudo do Observatório de Economia e Gestão de Fraude (2013) a
sendo que em 2010 o setor dos serviços, onde se inclui o retalho, representou
17,76% do PIB.
Em Portugal, desde o início de 2013, todas as faturas emitidas pelos
contribuintes empresariais são comunicadas informaticamente, via portal e
fatura, à Autoridade Tributária e Aduaneira (AT). Só o setor de atividade de
restauração e alojamento, submeteu cerca de 400.000.000 faturas, segundo
Autoridade Tributária e Aduaneira (2013b). Estes dados podem ser uma
importante fonte de informação, nomeadamente para encaminhar auditorias
tributárias, potenciando ganhos de eficiência e eficácia.
A Lei de Benford (doravante LB), pode ter aqui um papel relevante, como
ferramenta para retirar informação pertinente, sumarizando num indicador o
grau de conformidade. De facto, no domínio da auditoria contabilística, é
utilizada pelo menos há duas décadas, existindo uma larga experiência
internacional na sua aplicação.
O que se pretende com este estudo é, mediante a análise de dados reais
(faturas emitidas), verificar se a LB é aplicável a dois setores de atividade
específicos (restauração e comércio a retalho de carne). No caso da hipótese
se verificar, analisar as faturas de contribuintes empresariais (selecionados
aleatoriamente) e concluir da conformidade, ou não, com a LB.
Nos casos de não conformidade, procede se à análise da(s) medidas de
quantificação dessa desconformidade (fator de distorção, valor do teste Chi
mix, que poderá servir como critério na seleção de contribuintes empresariais a
serem auditados pela Autoridade Tributária e Aduaneira.
2 Revisão da Literatura
Em finais do século XIX, Newcomb (1881) publicou no ! "
# o artigo que descreve o que mais tarde ficou conhecido como a
LB. Resumidamente, ele constatou que os livros sobre logaritmos estavam
consideravelmente mais gastos nas páginas com números cujo primeiro dos
dígitos era mais baixo (1, 2 e 3) e menos gastos relativamente aos dígitos mais
altos (7, 8 e 9). Perante este padrão ele inferiu que existem mais números que
começavam pelo dígito um do que com o dígito dois e sucessivamente a
percentagem ia diminuindo, seguindo um padrão logaritmico.
Benford (1938) um engenheiro da $ % , redescobriu de forma
similar, este padrão na densidade de distribuição dos dígitos, e descreveu a
fórmula de probabilidade para o primeiro dígito:
P(d1)= Log10 (1+1/d1)
Sendo: d1 o dígito (1, 2, 3, X, 8, 9); e
P(d1) a probabilidade de ocorrência de d1,
P(1)= Log10 (1+1/1)=0,30103
E também para o segundo e seguintes dígitos:
9
P(d2) = Σ Log10 (1+1/d1d2) d1=1
Sendo: d2 o dígito (0, 1, 2, 3, X, 8, 9); e
P(d2) a probabilidade de ocorrência de d2,
P(0)= Log10 (1+1/10)+ Log10 (1+1/20)+ Log10 (1+1/30)+
Log10 (1+1/40)+ Log10 (1+1/50)+ Log10 (1+1/60)+ Log10
(1+1/70)+ Log10 (1+1/80)+ Log10 (1+1/90)= 0,11968
P(1)= Log10 (1+1/11) )+ Log10 (1+1/21)+ Log10 (1+1/31)+
Log10 (1+1/41)+ Log10 (1+1/51)+ Log10 (1+1/61)+ Log10
(1+1/71)+ Log10 (1+1/81)+ Log10 (1+1/91)=0,11389
Assim como para os dois primeiros dígitos:
P(d1d2)= Log10 (1+1/d1d2)
Sendo: d1d2 os dígito (10, 11, 12, X, 98, 99); e
P(d1d2) a probabilidade de ocorrência de d1d2,
P(10)= Log10 (1+1/10)=0,04139
P(11)= Log10 (1+1/11)=0,03779
Com base nestas fórmulas, determinou a probabilidade de ocorrência de cada
dígito ou conjunto de dígitos e, esta distribuição de probabilidades ficou para a
história como LB (vide tabela I a probabilidades para o primeiro, segundo,
terceiro e quarto dígitos). Por exemplo, o número 2013 tem quatro dígitos, com
utilização da tabela 1 a frequência esperada do número 2013 é
aproximadamente 0,00021 [=0,17609 x 0,11968 x 0,10138 x 0,10006 ≈ Log10
(1+1/2013)].
TABELA I Lei de Benford: frequência esperada dos dígitos
Posição no número
Dígito Primeiro Segundo Terceiro Quarto
0 0,11968 0,10178 0,10018
1 0,30103 0,11389 0,10138 0,10014
2 0,17609 0,10882 0,10097 0,10010
3 0,12494 0,10433 0,10057 0,10006
4 0,09691 0,10031 0,10018 0,10002
5 0,07918 0,09668 0,09979 0,09998
6 0,06695 0,09337 0,09940 0,09994
7 0,05799 0,09035 0,09902 0,09990
8 0,05115 0,08757 0,09864 0,09986
9 0,04576 0,08500 0,09827 0,09982
Fonte: Nigrini (1996)
Para testar as suas fórmulas, Benford efetuou uma recolha de dados, tendo
usado 20.229 registos de observações de métricas naturais, tais como
comprimentos de rios, pesos, taxas de mortalidade, números de porta de
moradas, etc., constatou que a sua formulação teórica gerava probabilidades
de frequência muito semelhantes à frequência de ocorrências dos dígitos dos
registos que analisou.
Ao longo do século XX, vários estudiosos se debruçaram sobre esta
descoberta com o intuito de obterem uma explicação, sendo Theodore P. Hill
em 1995 (segundo Durtschi 2004) quem apresentou uma das explicações
Aplicações para a LB foram surgindo para as mais variadas áreas (cotações da
bolsa, imagens digitais, censos, votos em eleições, auditoria, etc.),
nomeadamente para detetar adulteração de dados, enganos, erros.
De facto, a aplicação desta lei, baseia se num processo muito simples e de
fácil utilização, permitindo trabalhar com grandes quantidades de dados,
mormente pela utilização de sistemas informáticos, comparando a frequência
esperada (teórica) dos dígitos de números (segundo a LB) com a frequência
observada.
Este processo sinaliza as frequências anormais dos dígitos, já que a
adulteração de dados (invenção de números, reduzir ou aumentar valor) resulta
numa frequência que não respeita a LB, pois os números gerados pela mente
humana apresentam uma frequência do primeiro dígito igual para qualquer dos
dígitos (1 a 9) (P(d1)=1/9=0,11111). De facto esta característica da distribuição
de Benford é contra intuitiva, se questionarmos pessoas selecionadas ao
acaso, sobre qual a probabilidade de o primeiro dígito de um número ser 1 ou
9, a resposta (errada) será que a probabilidade é a mesma.
Nas últimas duas décadas, a LB tem sido alvo de grande atenção, segundo
Varma e Khan (2012) (Hurlimann 2006) contabilizou 350 publicações que se
referem à LB entre 1881 e 2006, sendo que entre 2000 e 2006 surgiram 166,
continuando até hoje a surgirem regularmente artigos oriundos de todas as
partes do mundo, como se pode constatar pela consulta ao sítio da internet
De acordo com Durtschi (2004) é apenas nos finais dos anos 80, do século
passado, que a LB é aplicada na contabilidade (auditoria), nomeadamente por
(Carslaw 1988) que a aplicou aos proveitos das firmas da Nova Zelândia e
(Thomas 1989) aos proveitos das firmas no EUA, referindo ainda que
aparentemente foi (Nigrini 1992) quem a aplicou aprofundadamente na
contabilidade (auditoria) com o intuito de detetar fraude.
&' ( ) "
Nigrini (1996) no seu estudo elaborado em 1992 aplica a pela primeira vez à
temática dos impostos. O objetivo era identificar, e de certa forma quantificar
(estimar), a fuga fiscal não planeada no * + , " - , , (IRS) dos
EUA, isto é, a fuga fiscal que ocorre no momento do preenchimento das
declarações fiscais e que se consubstancia no aumento de despesa ou
redução de receita, ambas mediante a invenção de números.
O seu estudo baseou se em analisar se as frequências dos dígitos, dos valores
nas declarações fiscais (despesas e rendimentos), eram diferentes das
frequências esperadas, de acordo com a LB, e se essa disparidade era devida
a fuga fiscal, tendo como pressuposto que os valores reais (não adulterados)
apresentam uma frequência de dígitos conforme com a LB.
Concluiu que, mediante a utilização de um modelo que apelidou de fator de
distorção (adiante explanado), é possível estimar a extensão da fuga fiscal (não
em valor, mas em quantidade de declarações suspeitas) em cada campo da
dos EUA, nomeadamente para identificar os campos mais propícios a serem
adulterados.
Nigrini e Mittermaier (1997) publicam um estudo no qual apresentam um
conjunto de seis testes de análise digital que podem ser usados no
planeamento das auditorias, nomeadamente para a delimitação e seleção de
amostras. Esses testes de análise digital realizam se:
ao primeiro dígito;
ao segundo dígito;
aos dois primeiros dígitos;
à duplicação de números;
ao arredondamento de números; e
aos dois últimos dígitos.
Estes testes têm por base a LB, nomeadamente os três primeiros e o último
teste, sendo adequados para situações em que os dados (registos de
operações) estão em suporte informático e são de grande volume
(preferencialmente mais de 1000 observações), providenciando ao auditor um
conjunto de indicadores que lhe permitem avaliar o nível de risco associado a
fraudes e/ou erros materialmente relevantes.
Para efeitos de quantificação, da probabilidade dos dados analisados não
respeitarem a LB (no pressuposto de que dados reais a respeitam), estes
autores referem ser adequado a utilização dos testes estatísticos de Chi
quadrado e da estatística de Z. No entanto em virtude destes serem afetados
pelo excessivo poder do tamanho da série de dados, este deve ser inferior a
indicação de não conformidade dos dados com a LB, mesmo quando os
desvios não são significativos.
Uma outra medida para avaliar a conformidade à LB é utilizar o valor da média
absoluta dos desvios (MAD). O óbice é a inexistência de valores de referência
que permitam classificar a conformidade do valor da MAD. Drake e Nigrini
(2000) elaboram, tendo por base a sua experiência, uma tabela de valores
referência da conformidade da MAD com a LB, para o primeiro, segundo e dois
primeiros dígitos.
Durtschi, Hillison e Pacini (2004), identificam diferentes tipos de dados em que
se espera uma ditribuição de Benford (registos contabilisticos: recebimentos;
pagamentos; vendas; despesas). Nestes, a análise digital pode ser útil na
deteção de situações de potencial fraude (pelo menos suspeitas de).
Identificam, também, os tipos de dados em que a LB não têm aplicação, é o
caso de por exemplo os números de identificação do tipo número de
contribuinte, número de segurança social ou os levantamentos de dinheiro no
multibanco. Apresentam um exemplo de análise a uma série de dados reais e a
outra de dados adulterados, demonstrado a utilidade da análise digital.
Concluíram que a análise digital usando a LB, quando usada corretamente
(estejam presentes um conjunto de carateristicas na série de dados a analisar),
é uma ferramenta útil para selecionar registos a serem investigados.
Watrin, C, Struffert, R and Ullmann, R (2008), publicaram um artigo no qual
concluem que a LB é útil no âmbito do esforço de combate à fuga aos
impostos, aumentando os níveis de eficiência e eficácia das auditorias,
Realizaram um estudo de laboratório, usando dados que sabiam não serem
manipulados, e solicitaram a adulteração dos dados a um grupo de indivíduos
em dois momentos distintos, antes e depois de lhes darem formação sobre a
LB. Concluíram que os indivíduos com conhecimento sobre a LB, não
conseguem manipular os dados para que estes sejam conformes com a
distribuição de Benford. Constataram que para efeitos de seleção de
contribuintes a auditar no terreno, é fundamental atestar que os dados, não
manipulados, sejam conformes com a distribuição de Benford.
Nigrini e Miller (2009), apresentam uma nova abordagem que os autores
intitulam de testes de segunda ordem. Resumidamente, baseia se na análise
da frequência dos dígitos da diferença entre os registos de uma série de dados
ordenados (de forma crescente), tendo concluído que estes apresentam grande
semelhança com a distribuição de Benford e que se aplicam a qualquer série
de dados, identificando positivamente a não conformidade, com reduzido falsos
positivos. A desvantagem que apresenta advém de se basear em diferenças,
não permitindo identificar os registos concretos a serem investigados.
Nigrini (2011) apresenta diversas técnicas para detetar valores anormais dentro
de uma série de dados, entre as quais a utilização da LB a que dedica quatro
capítulos. Apresenta diversas ferramentas, com instruções de utilização,
baseadas nas aplicações informáticas “ ..%--” e “%/.% ”.
No que respeita aos testes a desenvolver, baseados na LB, o autor do livro
defende a utilização da análise aos dois primeiros dígitos para validar a
conformidade à LB, os testes estatísticos Z para os dígitos individualmente, os
Refere que, no entanto, estes testes estatísticos sofrem do excesso de poder
da quantidade de observações (N) da série de dados, e que a fronteira é as
2500 (valor referência também usado pelo IDEA1).
Para efeitos de avaliação da conformidade com a LB, defende a utilização da
média absoluta dos desvios (MAD), em virtude de não ser afetada pela
dimensão da amostra (N). No entanto não existe um valor estatisticamente
validado a partir do qual se pode considerar a não conformidade com a LB.
Contudo, partindo do trabalho de Drake e Nigrini (2000) e baseado na sua
experiência e na análise de 25 séries de dados distintas, apresenta a tabela II
com os valores para a MAD, que serve de referência para classificar os dados
analisados em quatro níveis atendendo a conformidade com a LB.
TABELA II Valores referência para a MAD – dois primeiros dígitos
INTERVALO MAD CONCLUSÕES
0,0000 a 0,0012 CONFORMIDADE PRÓXIMA
0,0012 a 0,0018 CONFORMIDADE ACEITÁVEL
0,0018 a 0,0022 CONFORMIDADE MARGINAL
superior a 0,0022 NÃO CONFORMIDADE
Fonte: Nigrini (2011)
Também autores portugueses têm trabalhos publicados em revistas
internacionais, sobre esta temática. É o caso de Silva, Carlos Gomes da e
Carreira, Pedro M. R. (2013) que apresentam dois modelos matemáticos para
1 IDEA – Aplicação informática usado por auditores e analistas de dados,
desenvolvido pela Caseware, mais detalhes em
auxiliar os auditores, nomeadamente a determinarem o tamanho e os
elementos da(s) amostra(s) a recolher dos registos, com o intuito de aprofundar
os procedimentos de auditoria no terreno.
Em 2012 Varma e Khan publicam um artigo no qual demonstram que a LB
contribui de forma efetiva para a deteção de fraude nos registos de
fornecimentos. No seu estudo, analisam os registos de todos fornecedores (em
conjunto) de um departamento de determinada organização, efetuam o teste ao
primeiro dígito e concluem que os resultados são similares aos da distribuição
de Benford. Posteriormente analisaram os registos de cada um dos
fornecedores (individualmente) tendo detetado um fornecedor, relativamente ao
qual a frequência do primeiro dígito dos registos não respeitava a LB, tendo
concluído, após investigação mais aprofundada, existirem fortes indícios de
fraude.
Nigrini (2012) dedica vários capítulos a casos práticos de aplicação da LB,
inclusive a análise de séries de dados relacionadas com escândalos financeiros
como foram a falência do banco # # , à *$, % , , até às
declarações fiscais do casal . .
Conclui que a análise ao primeiro e segundo dígito é muito superficial, e que a
análise aos dois primeiros dígitos é essencial para se retirarem conclusões,
sugerindo que a MAD é uma ferramenta adequada para concluir sobre a
conformidade, ou não, da serie de dados à LB.
Sugere, para o futuro, a realização de estudos no desenvolvimento de métodos
das bases de dados (as quais ocorrem no setor de retalho e restauração) por
via de técnicas como o “0# 1 ” e “2 ”.
3 – Hipóteses, dados e metodologia
Pretende se neste trabalho avaliar se a utilização da análise digital, tendo em
conta a distribuição das frequências da série de Benford, quantificando a não
conformidade, pode ser útil na seleção de contribuintes empresariais a serem
auditados pela Autoridade Tributária, tendo por base o valor das faturas
comunicadas.
A LB pode ter aqui um papel relevante, como ferramenta para avaliar a
frequência dos primeiros dígitos do valor das faturas emitidas. De facto, no
domínio da auditoria a LB, é utilizada pelo menos há duas décadas, e existe
uma larga experiência internacional na sua aplicação. Atualmente, a maior
parte das aplicações informáticas de auditoria (ACL, IDEA, etc.), possuem esta
ferramenta que permite avaliar as séries de dados e sinalizar a não
conformidade, identificando, desta forma, dados suspeitos que podem/devem
ser investigados.
A análise que aqui se pretende efetuar é circunscrita aos sectores definidos de
acordo com o classificador das atividades económicas (CAE) português: da
Para o efeito, analisando amostras aleatórias retiradas dos dados constantes
do repositório do portal e fatura, relativos a cada um dos setores alvo,
pretende se testar as seguintes hipóteses:
– As amostras, para cada setor analisado, retiradas das bases de
dados, apontam para a aplicabilidade da LB ao setor;
– As amostras, para cada setor analisado, retiradas das bases de
dados, indicam a não aplicabilidade ao setor da LB;
Na condição da hipótese se verificar, para onde aponta a teoria, avaliado
pela análise gráfica da distribuição e pelas medidas de quantificação, o estudo
prossegue para análise das faturas dos contribuintes empresariais
selecionados aleatoriamente, onde se pretende avaliar as seguintes hipóteses:
– A amostra aleatória das faturas emitidas pelos contribuintes
empresariais, analisados individualmente, indicam conformidade com a
LB;
– A amostra aleatória das faturas emitidas pelos contribuintes
empresariais, analisados individualmente, indicam não conformidade
com a LB;
Na condição de se verificar a hipótese , procede se à escolha das medidas
de quantificação dessa desconformidade (fator de distorção, valor do teste Chi
quadrado, MAD), com o intuito de escolher uma ou um mix de medidas, que
poderá servir como critério, conjugado com a utilização de outros, a usar para a
seleção de contribuintes empresariais a serem auditados pela Autoridade
Os dados base utilizados na análise efetuada são dados reais obtidos de
faturas emitidas pelos contribuintes empresariais em Portugal. Em virtude das
alterações introduzidas na legislação fiscal, pelos decretos lei 197 e 198 Diário
da República (2012a, 2012b), a partir de 1 de janeiro de 2013, todos os
documentos emitidos pelos contribuintes empresariais (faturas, fatura
simplificada e fatura recibo) têm de ser comunicadas à AT (número documento,
data, valor sem IVA, IVA e valor total), por transmissão eletrónica2. Tal
obrigatoriedade originou uma base de dados com uma dimensão colossal, só
no primeiro trimestre mais de 900.000.000 faturas foram comunicadas,
segundo Ministério das Finanças (2013).
Para efeitos de aplicação prática, efetuaram se algumas restrições aos dados a
serem trabalhados, pelo que a base de dados de suporte a este estudo
contem, apenas, as faturas cuja atividade comercial, classificada de acordo
com a classificação portuguesa de atividades económicas (CAE), de
restaurantes e de comércio a retalho de carne.
O acesso aos dados foi solicitado por requerimento dirigido ao Diretor Geral da
Autoridade tributária.
Com os dados obtidos criaram se duas bases de dados, uma para cada setor
de atividade a ser estudado, nomeadamente:
BD_Rest com as faturas do setor atividade da restauração; e
2 Existem exceções a esta regra, nomeadamente para contribuintes
BD_ComerRet_C com as faturas do setor atividade do comércio a
retalho de carne.
Cada uma das bases de dados é composta pela codificação do contribuinte
empresarial3, o número da fatura, a data e o valor total. Sendo retiradas
amostras aleatórias de cada uma delas e realizado o estudo do grau de
conformidade do valor das faturas com distribuição de Benford. Posteriormente,
para as atividades em que o grau de conformidade for elevado, testar
individualmente amostras aleatórias das faturas de contribuintes que se
dediquem a essa atividade.
De acordo com Hill (1995), um dos teóricos de referência no que respeita à LB,
a utilização de amostras aleatórias obtidas de dados onde se verifica a LB,
também elas se comportam de acordo com a referida Lei, pelo que da amostra
se pode inferir para a população.
Apesar de teoricamente o valor das faturas, quando analisadas no contexto de
uma base de dados de milhões de registos e de centenas de realidades
económicas, se adequar à LB, conforme defendem diversos autores, como por
exemplo Nigrini e Mittermaier (1997), Durtschi et al (2004), Watrin et al (2008) e
Nigrini (2011, 2012), primeiro é necessário validar essa adequação, através da
realização dos testes de primeira ordem e de segunda ordem aos dois
primeiros dígitos e do fator de distorção, avaliados mediante a visualização dos
gráficos de frequências, da estatística de Z e de Chi quadrado, e da média
absoluta dos desvios.
Assim, primeira tarefa a realizar é gerar as amostras aleatórias de registos,
retiradas de cada uma das bases de dados: BD_Rest; e BD_ComerRet_C.
Para a sua seleção é usada a ferramenta constante do sítio da internet
www.random.org, que garante a aleatoriedade.
A análise dos dados realiza se mediante a utilização das aplicações
informáticas IDEA e %/.% .
Posteriormente, relativamente aos setores de atividade em que se observa
uma adequação à LB, selecionar aleatoriamente contribuintes, de cada base de
dados. De seguida procede se à amostragem aleatória dos valores das faturas,
sendo o tamanho da amostra no máximo de 2500 registos ou a totalidade dos
registos se estes forem inferiores.
Por último, analisar a conformidade do valor total das faturas, de cada amostra,
à luz da LB, mediante a realização dos testes de primeira ordem aos dois
primeiros dígitos (Nigrini e Mittermaier, 1997), e avaliação através das
estatísticas Chi quadrado, da MAD (Nigrini, 2011) e do fator de distorção
(Nigrini, 1996). Utilizando também os testes de segunda ordem (diferença entre
o valor das faturas ordenadas de forma crescente) (Nigrini e Miller, 2009),
avaliação através da análise do gráfico e da MAD, embora com valores de
referência maiores (Nigrini, 2012).
Os contribuintes empresariais que apresentem, no conjunto dos diversos
conformidade, são sinalizados como alvos potenciais para serem auditados por
suspeitas de adulteração do valor das faturas.
4 Análise dos dados
3 . &4 5,
As administrações tributárias têm como objetivo a diminuição do gap entre as
receitas tributárias obtidas e as potenciais (ausência de fuga fiscal). Segundo
estudos do Observatório de Economia e Gestão de Fraude (2013) a economia
paralela, em Portugal (todos os setores), representou em 2011 mais de 25% do
PIB.
De facto, a predisposição para a fuga fiscal é enorme e está presente em todos
os setores económicos, em todos os estratos sociais e é comum a todos os
géneros. Das grandes empresas às pequenas empresas, numa sociedade
global em que nascem e morrem empresas a cada segundo, ainda mais num
ciclo económico de crise, o ónus que pende sobre as autoridades tributárias é
ainda maior.
A seleção de contribuintes a auditar é crucial na administração tributaria
portuguesa, segue as orientações emanadas pela direção geral e
materializadas, anualmente, no Plano Nacional da Atividade da Inspeção
Tributária (PNAIT). Assenta, em grande parte, na deteção de incumprimento
por parte dos contribuintes por via de cruzamentos de dados constantes de
entre declarações, não existindo avaliação, nesta fase, da autenticidade dos
dados declarados.
Atualmente, as obrigações declarativas dos contribuintes são prestadas em
suporte informático (veja se a tabela III) com a evolução das principais
declarações entregues por via informática à administração tributária
portuguesa.
TABELA III Evolução entrega declarações informaticamente
(parcial)
IRS Fase 1 2.738.744 2.840.609 2.968.094 3.280.370
IRS Fase 2 1.442.380 1.500.228 1.495.482 1.801.427
IRC 430.670 446.014 462.918 439.490
IES/DA 581.646 581.340 559.248 518.891
Modelo 10 606.410 601.039 602.386 572.990
IVA 3.698.348 3.595.506 3.504.314 2.486.486
Ret.IRS/IRC e Selo 3.414.912 3.563.089 3.194.369 2.231.367
TOTAL 12.913.110 13.127.825 12.786.811 11.331.021
Fonte: AUTORIDADE TRIBUTÁRIA E ADUANEIRA (2013a). Estatísticas Tributárias [Base de dados], Setembro 2013. Lisboa: AT. Disponível em http://www.portaldasfinancas.gov.pt/pt/main.jsp?body=/portal dgci/Stats.jsp.
No entanto, os contribuintes e os seus colaboradores, na área fiscal e
contabilística, estão conscientes que as autoridades tributárias atuam
primordialmente mediante cruzamentos e validações de declarações efetuadas
por terceiros.
E a efervescência dos negócios, por outro, a gerar um colossal volume de
adaptaram se a esta nova era, principalmente porque a grande maioria das
transações realizadas são registadas em suporte informático.
Organização para a Cooperação e Desenvolvimento Económico (2013), refere
um estudo de uma associação de restaurantes canadiana, a qual estima a
omissão de vendas em cerca de 2,4 biliões de dólares canadianos no ano de
2009.
Neste relatório, que aborda a problemática da fuga ao “fisco” no chamado
mercado de retalho, são identificadas técnicas como o “0# 1 ” e
“2 ”, que, resumidamente, são aplicações informáticas instalados
(0# 1 ) no disco do sistema informático ou aplicações informáticas que
funcionam através de uma ligação à internet, em discos USB ou através de CD
(2 ) e que alteram linhas de registos de operações (trocando um produto
de maior valor por um de menor) e/ou simplesmente apagam linhas de vendas.
Desde o início de 2013, além das declarações, todas as faturas emitidas pelos
contribuintes empresariais são comunicadas informaticamente, via portal e
fatura, à Autoridade Tributária e Aduaneira (AT) portuguesa.
Avaliar a “qualidade” dos dados constantes do repositório do portal e fatura é
fundamental neste momento. Relativamente ao setor de atividade da
restauração, constam cerca de 400 milhões de faturas, das quais apenas 5%
têm o número de contribuinte do cliente (Figura 1). Uma questão que se coloca
é porque razão os empresários deste setor são avessos a colocar o número de
contribuinte do cliente pod
e fatura?
FIGURA 1 Faturas comu Fonte: https://faturas.porta
A legislação que instituiu
concede um benefício fisc
dedução ao IRS correspo
da restauração e alojam
motociclos e de cabeleire
emitida com o número de
Retirar informação pertine
de controlos e cruzamen
liquidado nas declaraçõ
comerciais realizadas pe
negócios. No entanto, esta
a transações entre contrib
te podem ser consultadas e confirmadas por e
comunicadas à AT (apenas setores indicados) .portaldasfinancas.gov.pt/home.action. Setem
stituiu a obrigação de comunicação das fatu
io fiscal aos clientes (contribuintes não empre
respondente a 15% do IVA pago, nos setores
alojamento, da reparação automóvel, na r
beleireiros, sendo para isso necessário que
ro de contribuinte do cliente.
ertinente é fundamental, sendo possível efetu
amentos, como por exemplo validar o IVA
larações periódicas de IVA (resumem as
as pelos contribuintes empresariais) ou o
o, estas validações são abrangentes apenas r
ontribuintes empresariais, sendo muito limitada
por este no portal
ados).
etembro 2013.
s faturas emitidas,
empresariais), uma
etores de atividade
na reparação de
que a fatura seja
l efetuar uma série
o IVA deduzido e
m as transações
ou o volume de
as relativamente
clientes são particulares que não têm atividade económica. É o caso por
exemplo do setor da restauração ou do comércio a retalho.
A LB pode ter aqui um papel relevante, como ferramenta para avaliar o valor
das faturas emitidas.
3 . &4 )
Tendo por base os contributos de Drake e Nigrini (2000), Durtschi et al (2004),
Cho e Gaines (2007), Watrin et al (2008), Nigrini (1996, 1997, 2009, 2011 e
2012), existem algumas condições adjacentes aos números que constituem o
que se designa por serie de Benford (a frequência observada dos dígitos é
igual à frequência esperada deduzida da LB), nomeadamente:
os dados devem respeitar à mesma realidade, ter a mesma unidade de
medida, i. e. não devem estar juntos dados em quantidade e em preço;
os números da série de dados não devem ser formados pelo
pensamento humano (valores psicológicos, por exemplo: 0,99, 1,99,
9,99);
os dados não devem estar subordinados a um mínimo ou a um máximo
imposto, por exemplo uma série de dados que só tem registos de valor
superior a € 1.000,00 ou inferior a € 5.000,00, não é de esperar que seja
conforme a LB;
a série de dados deve ser suficientemente longa, sendo referido na
literatura que deverá, pelo menos, ter mais de 1000 observações;
não sejam números de identificação, como é o caso dos números de
contribuinte, de segurança social, de conta bancária, de telefone, etc.; e
existam mais números pequenos que grandes, e quando ordenados de
forma crescente se assemelhem a uma série geométrica.
Há três caraterísticas, demonstradas por diversos autores, e que podem ser
observadas numa série de Benford:
Independente da escala, se multiplicar todos os valores de uma série de
Benford por uma qualquer constante gera uma nova série de Benford
(Pinkham,1961);
Independente da base, é aplicável não só a sistemas numéricos de base
10, mas também em todos outros (Hill, 1995); e
Independente de operações matemáticas, potências, multiplicação,
divisão, adição e subtração, entre séries de Benford geram uma nova
serie de Benford (Hamming, 1970; Schatte, 1988; Boyle, 1994).
Uma série de dados que reúna todas estas condições e caraterísticas é de
esperar que a frequência dos primeiros dígitos esteja conforme com a LB.
3 &4
A utilização da LB na análise de séries de dados, com o objetivo de detetar
fraude, deve ser efetuada com precaução, pois o facto de os dados analisados
serem considerados não conformes, i. e. não terem o mesmo padrão da serie
normal segundo a LB), e não significa necessariamente que os mesmos são
falsos.
Na realidade, mesmo estando presentes na série de dados em análise, todas
as condições e caraterísticas referidas no subcapítulo anterior, e os dados
serem reais, a frequência dos dígitos pode não ser semelhante com a da LB.
Por exemplo Nigrini (2012) refere questões culturais, como por exemplo o
dígito 8 que na cultura chinesa representa fortuna, donde resultará, em séries
de dados relacionados com este país, que o oito terá uma frequência muito
maior que na LB. O mesmo poderá ocorrer, por exemplo, em empresas em que
o seu volume de negócios resulta da venda de poucos produtos e em
quantidades fixas.
Mesmo em situações de fraude ou falsificação de dados, a análise da
frequência dos primeiros dígitos, apenas permite detetar os casos em que
ocorre de forma sistemática, i. e. a falsificação do valor de uma dezena de
faturas, numa série de centenas de milhares, não é detetável. Também as
situações de eliminação de registos não são, pelo menos por agora, detetáveis,
a não ser que sistematicamente sejam eliminados os valores com os dígitos
mais elevados.
A utilização da LB, na análise de séries de dados, deve ser efetuada com
descrição e com forte intuito de investigação direcionada para os dígitos que
apresentam frequências mais anormais, procurando primeiro encontrar uma
justificação plausível para a sua existência e, apenas no caso de esta não ser
fraude, eventualmente no decurso desta investigação podem surgir provas
concretas de manipulação de dados.
Assim, quando perante dados que não se comportam como o esperado, de
acordo com Cleary e Thibodeau (2005), podem existir pelo menos quatro
explicações possíveis:
A série de dados (completa) segue a LB, mas por causas aleatórias a
amostra analisada não segue (é o clássico erro tipo I);
O pressuposto de muitas ordens de grandeza não se verifica;
Existe(m) explicação para a existência de um excesso de determinados
primeiros dígitos; e
Existem de facto dados fraudulentos.
A existência de dados falsos é penas uma das hipóteses, pelo que do ponto de
vista de auditoria é sempre necessário realizar uma investigação aprofundada,
com o intuito de determinar a origem da não conformidade.
3 3 6 7
3 3 0
Na análise das séries de dados, existem diversos testes que permitem avaliar a
conformidade com a LB: os testes ao primeiro dígito, ao segundo dígito, aos
dois primeiros dígitos, aos três primeiros dígitos, aos dois últimos dígitos. No
entanto, segundo Nigrini, para a análise de grandes séries de dados, nem
todos são adequados, o autor defende a utilização do teste aos dois primeiros
A análise ao primeiro ou segundo dígito é demasiado superficial não permitindo
só por si identificar dados anormais. Quanto aos três primeiros dígitos a análise
é demasiado extensa, resulta em 900 primeiros dígitos, dificultando a obtenção
relevante de conclusões (Nigrini 2012).
A generalidade dos autores sugere a eliminação dos dados de valor inferior a
10,00 u. m. e dos valores negativos por não possuírem dois primeiros dígitos.
No entanto, neste estudo em que se pretende analisar o valor das faturas
emitidas por restaurantes e retalhistas, setores identificados no relatório da
OCDE por manipularem o valor das linhas de vendas (transformando valores
grandes em pequenos), optou se por trabalhar o valor em cêntimos de euro,
pelo que os valores excluídos das amostras aleatórias são os valores inferiores
a 10 cêntimos de euro, não existindo dados de valor negativo.
3 3 - "
Nigrini e Miller (2009) apresentam uma nova abordagem que intitulam de testes
de segunda ordem. Resumidamente, baseia se na análise da frequência dos
dígitos da diferença entre os registos de uma série de dados ordenados (de
forma crescente) os autores concluíram que este tipo de dados apresenta
grande semelhança com a distribuição de Benford e que se aplica a qualquer
série de dados. Para efeitos desta análise este teste é efetuado tendo por base
a totalidade dos dados ordenados do menor para o maior valor, como sugere
3 3 8 &'
O modelo do fator de distorção exige um tratamento dos dados a analisar. Este
modelo assenta na comparação entre a média da frequência dos dados a
analisar com a média da série de Benford (designação atribuída a um conjunto
de dados cuja distribuição de dígitos segue a Lei Benford). No entanto, a média
da série de Benford pode ser muito variada (depende da ordem de grandeza
dos seus valores e da sua amplitude). Nigrini (1996) elaborou o seu modelo
(fator de distorção) usado uma série de Benford com dados no intervalo
[10;100[, cuja média, constatou, é aproximadamente 39,08. Para efeitos de
comparabilidade, os dados a analisar maiores ou iguais a 100 são
transformados para uma escala igual [10;100[, sendo eliminados todos os
dados menores que 10. De referir que também aqui a unidade de medida dos
dados a analisar é os cêntimos de euro.
O valor do fator de distorção deve ser lido como uma sub ou sobre valorização
em percentagem, da série de dados em análise em comparação com a série de
Benford, e indicia uma manipulação negativa (valor do fator distorção negativo)
ou positiva (valor do fator distorção positivo). O fator de distorção (FD) é então
calculado da seguinte forma:
FD = (MO – ME) / ME
Em que: MO é a média observada dos dados em análise após tratamento
ME é a média esperada calculada da seguinte fórmula:
ME = 90 / (N (101/N – 1))
O modelo do fator de distorção foi desenvolvido para detetar a chamada fuga
aos impostos não planeada, assentando nos pressupostos de que se trata de
aumentos do valor das despesas e/ou redução do valor dos rendimentos,
dentro da mesma ordem de grandeza. Por exemplo uma fatura emitida de €
45,68 é reduzida para € 12, 68, mediante a redução do valor nas linhas de
produtos vendidos, precisamente o que permitem as técnicas relatadas pelo já
citado relatório da Organização para a Cooperação e Desenvolvimento
Económico (2013), pelo que se entende ser pertinente a sua inclusão no
presente estudo.
3 9 :" &'
A análise da conformidade dos dados com a LB pode ser verificada pela
análise gráfica da distribuição das frequências dos primeiros dígitos dos dados
e a sua comparação com o padrão da distribuição de frequências de Benford.
No entanto essa análise simplista é subjetiva, não é quantificável, pelo que têm
sido usados por diversos autores, dedicados ao estudo deste fenómeno,
técnicas estatísticas para quantificar essa conformidade. As mais comummente
usadas são: o teste da estatística de Z; e do Chi quadrado, com um nível de
significância de 5%.
A estatística de Z é usada para testar dígito a dígito enquanto o Chi quadrado é
usado para testar todos os dígitos ao mesmo tempo. Neste estudo, a estatística
para testar o fator de distorção mediante a utilização da fómula deduzida por
Nigrini (1996):
Zcálculado = FD
√
N / 0,638253Para avaliar a conformidade dos dados à LB, a todos os dígitos, é usado o
valor Chi quadrado de 112,02, a um nível de significância de 5% e com 894
graus de liberdade, sendo o valor calculado da seguinte forma:
K
Chi quadradocálculado =
Σ
(Fobsi – Fespi) / Fespii=1
O problema identificado na utilização destas medidas é o excesso de poder da
dimensão (N) dos dados analisados, originando que em séries de dados
(amostras) muito grandes mesmo pequenas diferenças originam a classificação
dos dados como não conformes, sendo que não existe uma definição concreta
do que é grande. No entanto, Nigrini (2011) considera estes testes adequados
para amostras de 2500 observações (também usado pelo IDEA), sendo neste
estudo o valor utilizado na dimensão das amostras.
Existe, contudo, uma media que não é afetada por este problema que é a
média absoluta dos desvios (MAD), calculada da seguinte forma:
K
MAD=
Σ
|Fobsi – Fespi| / Ki=1
Em que: Fobs é a frequência observada dos dígitos;
Fesp é a frequência esperada, frequência de Benford; e
4 Existem 90 primeiros dois dígitos (do 10 ao 99), os graus de liberdade são
K é o número de dígitos diferentes (para os dois primeiros é 90).
No entanto esta média, também tem associado a dificuldade de não existirem
valores de referência, validados estatisticamente, que permitam classificar os
dados em análise em conformes ou não. Drake e Nigrini (2000) foram os
primeiros a construir uma tabela de referência para esta classificação, tendo
por base a experiencia acumulada ao longo de anos a analisar séries de
dados. Neste estudo é usada uma nova tabela5, elaborada por Nigrini (2011)
tendo por base os resultados da análise a 25 séries de dados distintas. No
entanto, na avaliação dos testes de segunda ordem, Nigrini (2012) refere que
devem ser considerados valores de referência significativamente superiores.
3 ; - &'
Para a análise das duas séries de dados, procedeu se à seleção de oito
amostras aleatórias, quatro para cada setor de atividade, cada amostra com
2500 observações (faturas).
Mediante a utilização de ferramenta disponível no sítio www.random.org, foram,
em duas fases distintas, geradas quatro séries de 2500 números aleatórios,
considerando a dimensão da população de cada setor de atividade, ordenada
entre 1 (a primeira fatura) e o último registo (última fatura).
5 Tabela II – Valores referência para a MAD – dois primeiros dígitos, incluída na
Utilizando o EXCEL, para cada ficheiro com os dados de cada um dos dois
setores de atividade, previamente ordenados sequencialmente, procedeu se à
identificação do valor correspondente que fará parte da amostra, sendo este
valor multiplicado por dez para trabalharmos em cêntimos de euro. Obtendo se
assim as amostras aleatórias de todas as faturas dos dois setores de atividade.
Para análise dos contribuintes empresariais, a seleção aleatória destes, bem
como as amostras aleatórias das faturas de cada um deles, foi efetuada nos
mesmos moldes.
Relativamente aos testes de segunda ordem e do fator de distorção, utilizaram
se todos os dados.
3 < &' " &'
3 < -5
Trata se de um setor de atividade económica, ao qual são atribuídas as
práticas de manipulação dos registos informáticos (OCDE 2013). Dependendo
da técnica, o resultado que os perpetuadores pretendem atingir é uma dupla
redução dos impostos a pagar, sobre a despesa e sobre o rendimento.
Analisados os dados constata se que, ao contrário do esperado, as amostras
aleatórias das faturas emitidas no setor da restauração (cerca de 750.000), não
existe conformidade com a LB.
Os dois primeiros dígitos foram analisados, como proposto, e obtiveram se,
para todas as amostras, resultados que, em termos estatísticos, rejeitam a
Podemos assim afirmar que o padrão dos dois primeiros dígitos dos dados do
setor da restauração não é semelhante ao padrão dos dois primeiros dígitos da
série de Benford, como se constata pela análise gráfica da figura 2.
FIGURA 2 – Gráficos das amostras com melhor e pior conformidade do setor
da restauração.
O valor calculado do Chi quadrado é, na média das amostras, de 3.763,48,
portanto muito superior ao valor esperado (112,02) considerando um nível de
0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
LB freq obs limite inf limite sup
0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070 0,080 0,090 0,100
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
significância de 5% e 89 graus de liberdade. O valor mínimo é o obtido pela
amostra R_11 (3.172,93) e o máximo é o da amostra R_4 (4.126,89).
O fator de distorção apresenta o valor de 1,15%, a MAD de todos os dados é
de 0,00607 e o teste de segunda ordem apresenta uma MAD de 0,00614.
Todos corroboram a rejeição da hipótese nula, i. e. que a série de dados do
setor da restauração não é conforme com a LB, estamos portanto perante a
situação da hipótese HB.
3 = &' 5 #
3 = -5
Analisados os dados constata se que, como era esperado, as amostras
aleatórias retiradas do universo de todas as faturas emitidas no setor do
comércio a retalho de carne, apresentam conformidade com a LB.
Os dois primeiros dígitos foram analisados, como proposto, e obtiveram se
para todas as amostras resultados que, em termos estatísticos, não rejeitam a
hipótese nula, i. e. estamos perante dados que são conformes com a LB.
Podemos afirmar que, o padrão dos dois primeiros dígitos dos dados do setor
do comércio a retalho de carne é semelhante ao padrão dos dois primeiros
dígitos da série de Benford, como se constata pela análise gráfica da figura 3.
Os limites superior e inferior representam o valor da estatística de Z, para um
nível de significância de 5%. O valor da frequência observada, à exceção de
dois picos em cada uma das amostras, comporta se dentro dos limites de
FIGURA 3 – Gráficos das amostras com melhor e pior conformidade do setor
do comércio a retalho de carne.
O valor calculado do Chi quadrado é, na média das quatro amostras, de 86,97,
portanto significativamente inferior ao valor esperado (112,02) considerando
um nível de significância de 5% e 89 graus de liberdade. O valor mínimo foi a
amostra T4 (69,57) e o máximo foi a amostra T1 (103,46).
0,000 0,010 0,020 0,030 0,040 0,050 0,060
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
LB freq obs limite inf limite sup
0,000 0,010 0,020 0,030 0,040 0,050 0,060
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
O fator de distorção apresenta o valor de 0,82%, a MAD é de 0,0005 e o teste
de segunda ordem apresenta uma MAD de 0,0029, sendo que todos eles
corroboram a não rejeição da hipótese nula, i. e. que a série de dados do setor
do comércio de carne é conforme com a LB.
3 = -5 )"
Analisadas as quatro amostras dos dados relativos a cada um dos contribuintes
empresariais, que se dedicam ao comércio a retalho de carne (comummente
designados de talhos), constata se que os resultados dos testes são variados,
apresentando valores que se coadunam desde a conformidade próxima até à
não conformidade, como se pode verificar pela tabela IV.
TABELA IV Resultados da análise aos talhos
!"
Talho1 Talho2 Talho3 Talho4 Talho5 Amostra 1 130,16 213,21 97,68 101,20 87,59 Amostra 2 153,02 195,36 112,80 142,18 91,14 Amostra 3 129,21 197,89 130,80 133,83 88,34 Amostra 4 154,52 202,09 127,07 115,56 86,98
#$i %& % &% ' % ' ((%)
DF 1,97% 2,31% 2,13% 1,47% 1,91% Z calculado 2,01 2,02 4,69 2,19 2,77
MAD 0,0018 0,0026 0,0009 0,0013 0,0009
* !
O talho 5, apresenta valores que o permitem classificar como conforme com a
LB, como se constata pela análise da figura 4, apenas um e dois pico fora dos
limites (até três picos é de aceitar a conformidade segundo Nigrini (2012)).
Para as quatro amostras os valores de Chi quadrado variam entre 86,98 e
91,14, portanto muito inferior ao valor referência de 112,02 (nível de
significância de 5% e 89 graus de liberdade), a MAD de todos os dados é de
0,00091 (conformidade próxima).
FIGURA 4 Gráficos das amostras com melhor e pior conformidade do talho 5.
0,000 0,010 0,020 0,030 0,040 0,050 0,060
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
)
LB freq obs limite inf limite sup
0,000 0,010 0,020 0,030 0,040 0,050 0,060
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
)
Por outro lado o talho 2, apresenta valores que o permitem classificar como
não conforme com a LB, como se constata pela análise da figura 5, mais de
três picos fora dos limites. Para as quatro amostras os valores de Chi quadrado
variam entre 195,36 e 213,21, portanto muito superior ao valor referência de
112,02 (nível de significância de 5% e 89 graus de liberdade), sendo a MAD de
0,0025 (não conformidade).
FIGURA 5 Gráficos das amostras com melhor e pior conformidade do talho 2.
0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
LB freq obs limite inf limite sup
0,000 0,010 0,020 0,030 0,040 0,050 0,060 0,070
10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95
O fator de distorção apresenta valores muito semelhantes que rondam os 2%.
Relativamente aos testes de segunda ordem, a quantidade de diferenças entre
as observações são muito poucas, isto é, existem muitos valores iguais, o que
redunda em muitas diferenças de valor zero.
5 Conclusões
Não obstante, não ter sido possível obter séries de dados de grande dimensão
e com muitos contribuintes empresarias, os dados com que se efetuou este
trabalho são dados reais, que permitem retirar conclusões sobre a
aplicabilidade da análise digital, nomeadamente da LB, como um critério, de
preferência conjugado com outros de cariz contabilístico e financeiro, a ser
utilizado na seleção de contribuintes empresarias para auditorias tributárias.
Os testes realizados aos dois primeiros dígitos por via de amostragem
aleatória, ao fator de distorção relativo a todos os dados de cada uma das
séries e os de segunda ordem (dois primeiros dígitos), avaliados pelos valores
calculados (amostras) da estatística de chi quadrado e da MAD (totalidade dos
dados), são consistentes entre si.
Ressalva ao setor do comércio a retalho de carne, nomeadamente no que
respeita ao fator de distorção, que apresenta valores que rondam os 2%, muito
baixos e semelhantes, e que não permitem seriar a classificação dos dados
como conformes ou não, possivelmente por os dados não se adequarem a este
tipo de teste, mais adequado para detetar manipulações de valores dentro da
permitem retirar conclusões, em virtude da quantidade de diferenças entre as
observações serem muito poucas (rondam as duas centenas) isto é existem
muitos valores iguais, o que redunda em muitas diferenças de valor zero.
Verificou se, pelas amostras retiradas de um universo de cerca de 70.000
faturas do setor do comércio a retalho de carne e de 750.000 faturas do setor
da restauração, apresentam um padrão de conformidade para as primeiras e
não conformidade para as últimas.
Quando analisados individualmente as faturas dos contribuintes individuais,
verificou se claramente que o talho 2 apresenta um padrão de não
conformidade e que, por outro lado, o talho 5 apresenta um elevado grau de
conformidade. Numa ótica de seleção de contribuintes a serem auditados
sinaliza claramente o talho 2, sendo o melhor critério de seleção o teste de
CHI QUADRADO e a MAD.
Os resultados obtidos não significam, e muito menos provam, por si só a
existência de manipulação de dados e fuga aos impostos. Significam apenas
que o setor de atividade de comércio a retalho de carne segue um padrão
muito semelhante ao da LB, e que alguns dos contribuintes empresariais
apresentam um padrão que não a segue.
As razões para tal ocorrer podem ser várias e entre elas pode efetivamente
estar a manipulação de dados com o intuito de fuga aos impostos, pelo que
esta análise dos dígitos relevantes não é um fim em si mesmo, mas antes
como é o portal e fatura, podendo ser utilizado como critério para sinalizar
contribuintes empresariais a serem auditados.
Conclui se que a análise das faturas emitidas no setor do comércio a retalho de
carne, constantes do portal e fatura, podem ser avaliadas quanto à
conformidade com a LB pelos dois primeiros dígitos, sendo pertinente nessa
avaliação quantificar a conformidade através dos testes CHI QUADRADO e da
MAD.
Futuramente, seria útil efetuar um estudo de caso, em que um conjunto de
contribuintes empresariais fosse selecionado para auditar, utilizando a análise
digital aos dois primeiros dígitos, e no âmbito do planeamento da auditoria
fosse também utilizada esta abordagem para identificar as faturas a investigar,
com a frequência anormal dos dígitos, avaliando os resultados das auditorias
quanto à eficiência e eficácia dos procedimentos, i. e. se a abordagem usando
a LB contribui ou não para um aumento de eficácia e eficiência nas auditorias.
Por outro lado, seria também interessente analisar mais aprofundadamente o
setor da restauração, com o intuito de identificar um padrão, que como se
constata na figura 2 ele aparentemente existe (picos crescentes para os dois
primeiros dígitos 50, 55, 60 e 65), que possa ser usado como uma lei própria
Bibliografia
Autoridade tributária e aduaneira (2013a). Estatísticas Tributárias [Base de
dados], Setembro 2013. Lisboa: AT. Disponível em
http://www.portaldasfinancas.gov.pt/pt/main.jsp?body=/portal dgci/Stats.jsp.
[Acesso em 2013/09/04].
Autoridade tributária e aduaneira (2013b). E fatura [Em linha]. Disponível em
https://faturas.portaldasfinancas.gov.pt/home.action. [Acesso em 2013/09/02].
Benford, F (1938). The law of anomalous numbers. Proceedings of the
American Philosophical Society 78, 551 572.
Carlos Gomes da Silva and Pedro M. R. Carreira (2013) Selecting Audit
Samples Using Benford's Law. AUDITING: A Journal of Practice & Theory: May
2013, Vol. 32, No. 2, pp. 53 65.
Carslaw, CAPN (1988). Anomalies in Income Numbers: Evidence of Goal
Oriented Behavior. The Accounting Review 63, No. 2, 321 327.
Cho, Wendy K. Tam and Gaines, Brian J. (2007). Breaking the (Benford) Law:
Statistical Fraud Detection in Campaign Finance. The American Statistician,
Vol. 61 (3), 218 223.
Cleary, R and Thibodeau, JC (2005). Applying Digital Analysis Using Benford‘s
Law to Detect Fraud: The Dangers of Type I Errors. Auditing A Journal of
Practice & Theory 24(1), 77 81. ISSN:0278 0380.
Decreto Lei 197 (2012a). Diário da Republica, 1ªSerie Nº 164 de 24 de Agosto
http://www.dre.pt/pdf1s/2012/08/16400/0465604666.pdf. [Acesso em:
2013/09/02].
Decreto Lei 198 (2012b). Diário da Republica, 1ªSerie Nº 164 de 24 de Agosto
[Em linha]. Disponível em:
http://www.dre.pt/pdf1s/2012/08/16400/0466604677.pdf. [Acesso em:
2013/09/02].
Drake, P. D., Nigrini, MJ (2000). Computer assisted analytical procedures using
Benford’s Law, Journal of Accounting Education, 18, 127 146.
Durtschi, C, Hillison, W and Pacini, C (2004). The effective use of Benford’s law
to assist in detecting fraud in accounting data. Journal of Forensic Accounting
1524 5586/Vol. V, 17 34.
Hill, TP (1995). The Significant Digit Phenomenon. American Mathematical
Monthly 102(4), 322 327. ISSN:0002 9890.
Hill, TP (1999). The difficulty of faking data. Chance 12(3), 27 31.
Hill, TP, Berguer, A (2013). Benford online bibliography (2013) [Em linha].
Disponível em: http://www.benfordonline.net/. [Acesso em: 2013/08/02].
Ministério das Finanças (2013). Maior ação de fiscalização externa da
autoridade tributária e aduaneira [Em linha]. Disponível em:
http://www.portugal.gov.pt/pt/os ministerios/ministerio das financas/mantenha
se atualizado/20130527 seaf faturas.aspx [Acesso em 2013/09/02].
Newcomb, S (1881). Note on the frequency of use of the different digits in
natural numbers. American Journal of Mathematics 4(1), 39 40. ISSN:0002
Nigrini, MJ (1996). A taxpayer compliance application of Benford’s law. Journal
of the American Taxation Association 18(1), 72 91.
Nigrini, MJ and Mittermaier, LJ (1997). The use of Benford's Law as an aid in
analytical procedures. Auditing A Journal of Practice & Theory 16(2), 52 67.
ISSN:0278 0380.
Nigrini, MJ and Miller, SJ (2009). Data Diagnostics Using Second Order Tests
of Benford's Law. Auditing: A Journal of Practice & Theory 28(2), 305 324.
Nigrini, MJ (2011). Forensic analytics: methods and techniques for forensic
accounting investigations, New Jersey: John Wiley & Sons, Inc.
Nigrini, MJ (2012). Benford's Law: Applications for Forensic Accounting,
Auditing, and Fraud Detection, New Jersey: John Wiley & Sons, Inc.
Organização para a Cooperação e Desenvolvimento Económico (2013)
Electronic sales suppression: a threat to tax revenues © OECD 2013 [Em linha].
Disponível em: http://www.oecd.org/ctp/crime/ElectronicSalesSuppression.pdf.
[Acesso em 2013/08/21].
Observatório de Economia e Gestão de Fraude (2013). Actualização do índice
de Economia Não Registada para Portugal. Disponível em:
http://www.gestaodefraude.eu/images/gf_upload/APIT_Lisboa2013.pdf.
[Acesso em 2013/08/21].
Silva, Carlos Gomes da e Carreira, Pedro M. R. (2013). Selecting Audit
Samples Using Benford's Law. AUDITING: A Journal of Practice & Theory: May
Varma, Tej N. P, Khan, Da (2012). Fraud Detection in Supply Chain using
Benford Distribution. International Journal of Research in management 2, Vol 5,
90 96.
Watrin, C, Struffert, R and Ullmann, R (2008). Benford’s Law: an instrument for