• Nenhum resultado encontrado

Os Microdados da IES ao Nível do Estabelecimento: O Anexo R

N/A
N/A
Protected

Academic year: 2021

Share "Os Microdados da IES ao Nível do Estabelecimento: O Anexo R"

Copied!
81
0
0

Texto

(1)

OS MICRODADOS DA IES AO NÍVEL DO ESTABELECIMENTO: O

ANEXO R

Ana Filipa Fonseca Leite

Dissertação

Mestrado em Economia

Orientado por

Paulo de Freitas Guimarães

Marta Alexandra da Palma Curado Silva

(2)
(3)

i

Agradecimentos

Ao terminar esta dissertação resta deixar o meu sincero agradecimento a todos aqueles que me apoiaram ao longo desta etapa, já que não tracei este percurso sozinha.

A todos os professores da Faculdade de Economia da Universidade do Porto pelos conhecimentos que me transmitiram ao longo da licenciatura e do mestrado.

Um espacial agradecimento aos meus orientadores, Paulo Guimarães e Marta Silva, pelo acompanhamento, compreensão e disponibilidade que demonstraram ao longo de todo o trabalho.

À restante equipa do Laboratório de Investigação em Microdados do Banco de Portugal (BPLIM), pelo acolhimento no decorrer do estágio curricular que desenvolvi. Apresento ainda o meu agradecimento à Marina Teixeira e ao Miguel Araújo, pela ajuda que me deram durante os respetivos estágios.

Aos meus pais, pelo apoio incondicional ao longo desta etapa e de todo o caminho que me levou até ela.

(4)

ii

Resumo

O reporte de informação de natureza estatística pelas unidades económicas fornece dados indispensáveis, quer a nível de investigação, quer no processo de tomada de decisões de política económica. A maior parte da informação disponibilizada para efeitos de investigação consiste em informação ao nível da empresa. No entanto, existem questões que são tratadas de forma mais rigorosa com informação mais fina, ao nível do estabelecimento.

A Informação Empresarial Simplificada (IES) constitui uma declaração anual, obrigatória desde 2007, que contém um conjunto alargado de microdados relativos à situação económico-financeira das empresas em Portugal. As empresas não financeiras reportam o Anexo R da IES que, embora com menor detalhe, permite aceder a informação contabilística e económica relativa aos estabelecimentos da empresa.

Apesar do reconhecido valor desta informação, desagregada por estabelecimento, até agora a informação do Anexo R nunca foi disponibilizada para fins de investigação. Um dos objetivos principais deste trabalho é dar a conhecer aos investigadores o potencial da informação contida no Anexo R. Para além disso, documentar a metodologia utilizada para criar uma base de dados em painel com variáveis harmonizadas ao longo do período 2007-2016. Fornece-se também uma primeira análise descritiva deste painel comparando a informação ao nível da empresa com a do estabelecimento. Por fim, identificam-se as principais limitações à utilização dos dados do Anexo R.

Códigos JEL

: C81, R12

Palavras-chave:

Microdados, Dados em Painel, Informação Empresarial Simplificada, Estabelecimento

(5)

iii

Abstract

The reporting of information of statistical nature by economic units supplies indispensable data for researchers as well as for all decision-makers involved in economic policy. Most data made available for research purposes consists of company level information. Nonetheless, there are questions that are addressed more rigorously, with finer information, at the establishment level.

The Simplified Corporate Information (SCI), Informação Empresarial Simplificada (IES) in Portuguese, consists of an annual report, mandatory since 2007, which includes a large set of microdata characterizing the economic and financial situation of companies in Portugal. Non-financial companies report the Annex R of the SCI, which allows access to the accounting and economic information relative to the companies' establishments, although for a much smaller number of variables.

In spite of the recognized value of this information, broken down by establishment, until now the information in Annex R was never made available for research purposes. One of the main goals of this dissertation is to draw researcher’s attention to the potential of the information contained in the Annex R. Furthermore, the methodology used to create the panel database with harmonized variables over the period between 2007 and 2016 is described and documented. A first descriptive analysis of the panel, comparing information at company and establishment level, is also provided. Lastly, some of the main limitations to the use of the Annex R are identified.

JEL Codes:

C81, R12

(6)

iv

Índice Geral

Agradecimentos ... i Resumo ... ii Abstract ... iii Índice de Quadros ... vi

Índice de Tabelas ... vii

Índice de Figuras ... ix

Abreviaturas e Siglas ... x

1. Introdução ... 1

2. Enquadramento ... 4

2.1. A Importância da Informação ao Nível do Estabelecimento ... 5

2.2. O Anexo R da IES ... 7

2.3. Alteração ao Sistema Contabilístico ... 9

3. Identificação de Estabelecimento ... 12 3.1. Conceito de Estabelecimento ... 12 3.2. Identidade do Estabelecimento ... 12 3.2.1. Casos Internacionais ... 13 3.2.2. Caso Português ... 14 4. Metodologia ... 16

4.1. Criação do Painel de Estabelecimentos ... 16

4.1.1. Harmonização das variáveis ... 16

4.1.2. Preenchimento de Informação Não Reportada ... 18

4.2. Verificação e Correção dos Identificadores dos Estabelecimentos ... 18

4.2.1. Critérios de Correção dos Identificadores ... 20

(7)

v

5. Análise da Base de Dados ... 25

5.1. Descrição da Base de Dados ... 25

5.1.1. Análise dos Dados ao Nível da Empresa ... 26

5.1.2. Análise dos Dados ao Nível do Estabelecimento ... 38

5.1.3. Estabelecimentos no Estrangeiro ... 48

5.2. Comparação Entre Dados Reportados por Empresa e por Estabelecimentos ... 51

6. Conclusões e Limitações ... 54

Referências Bibliográficas... 56

(8)

vi

Índice de Quadros

Quadro 1 - Variáveis disponíveis no Anexo R ____________________________________ 10 Quadro 2 - Correspondência das variáveis em POC e SNC ____________________________ 17 Quadro 3 - Correspondência entre variáveis da empresa e dos estabelecimentos _________________ 18

(9)

vii

Índice de Tabelas

Tabela 1 - Número de identificadores do estabelecimento por preencher, por ano ________________ 19 Tabela 2 - Exemplo de correção de identificador do estabelecimento ________________________ 21 Tabela 3 - Exemplo de identificação de mudança de morada ____________________________ 22 Tabela 4 - Correções efetuadas ao identificador dos estabelecimentos, por ano __________________ 23 Tabela 5 - Eliminação de duplicados ___________________________________________ 24 Tabela 6 - Número e distribuição de empresas (2007-2016) ____________________________ 26 Tabela 7 - Distribuição espacial das empresas, em 2007 e 2016 _________________________ 27 Tabela 8 - Distribuição por categoria de empresas, por distrito, em 2016 ____________________ 28 Tabela 9 - Distribuição espacial por categoria de empresas e coeficientes de especialização, em 2016 ___ 29 Tabela 10 - Distribuição setorial das empresas, em 2016 ______________________________ 31 Tabela 11 - Distribuição por categoria de empresas, por setor, em 2016 _____________________ 32 Tabela 12 - Taxas de natalidade e mortalidade das empresas (2008-2016) __________________ 34 Tabela 13 - Taxas de natalidade e mortalidade para empresas com sempre apenas 1 estabelecimento (2008-2016) ___________________________________________________________ 35 Tabela 14 - Taxas de natalidade e mortalidade para empresas com 2 ou mais estabelecimentos, pelo menos um ano (2008-2016) _____________________________________________________ 35 Tabela 15 - Distribuição por idades (2007-2016) __________________________________ 36 Tabela 16 - Distribuição por idade de empresas, segundo o seu número de estabelecimentos, em 2016 __ 37 Tabela 17 - Número e distribuição de estabelecimentos (2007-2016) ______________________ 38 Tabela 18 - Distribuição por categoria de estabelecimentos, por distrito, em 2016 ______________ 39 Tabela 19 - Distribuição espacial por categoria de estabelecimentos e coeficientes de especialização, em 2016 ____________________________________________________________________ 40 Tabela 20 - Distribuição setorial dos estabelecimentos, em 2016__________________________ 42 Tabela 21 - Distribuição por categorias de estabelecimentos, por setor, em 2016 _______________ 43 Tabela 22 - Taxas de natalidade e mortalidade dos estabelecimentos (2008-2016) _____________ 44

(10)

viii

Tabela 23 - Taxas de natalidade e mortalidade para estabelecimentos pertencentes a empresas com sempre apenas 1 estabelecimento (2008-2016) __________________________________________ 44 Tabela 24 -Taxas de natalidade e mortalidade para estabelecimentos pertencentes a empresas com 2 ou mais estabelecimentos, pelo menos um ano (2008-2016) _______________________________ 45 Tabela 25 - Número de estabelecimentos por empresa ________________________________ 47 Tabela 26 - Distribuição dos estabelecimentos no estrangeiro, por países, 2016 ________________ 48 Tabela 27 - Empresas por número de estabelecimentos no estrangeiro, 2016 __________________ 49 Tabela 28 - Número de estabelecimentos das empresas com presença no estrangeiro, 2016 _________ 49 Tabela 29 - Distribuição setorial das empresas com presença no estrangeiro, 2016 ______________ 50 Tabela 30 - Número de empresas com erros de preenchimento, por ano (2007-2016) ____________ 51 Tabela 31 - Empresas com erros de preenchimento por número de estabelecimentos (%), 2007 e 2016 _ 53

(11)

ix

Índice de Figuras

Figura 1 - Distribuição dos nascimentos de estabelecimentos, 2015 ________________________ 46 Figura 2 - Distribuição das mortes de estabelecimentos, 2015 ___________________________ 46 Figura 3 - Distribuição espacial da totalidade das empresas, 2016 ________________________ 64 Figura 4 - Distribuição espacial das empresas 1 Estab, 2016 ___________________________ 64 Figura 5 – Distribuição espacial das empresas Multi Nac, 2016 _________________________ 64 Figura 6 - Distribuição espacial das empresas Multi Est, 2016 __________________________ 64 Figura 7 - Distribuição espacial da totalidade dos estabelecimentos, 2016 ___________________ 67 Figura 8 - Distribuição espacial de estabelecimentos 1 Estab, 2016 _______________________ 67 Figura 9 - Distribuição espacial de estabelecimentos Multi, 2016 _________________________ 67

(12)

x

Abreviaturas e Siglas

BPLIM – Laboratório de Investigação em Microdados do Banco de Portugal CAE – Classificação Portuguesa das Atividades Económicas

CB – Central de Balanços

CEE – Comunidade Económica Europeia

CMVMC – Custo das Mercadorias Vendidas e das Matérias Consumidas FSE – Fornecimentos e Serviços Externos

IES – Informação Empresarial Simplificada INE – Instituto Nacional de Estatística

NIPC – Número de Identificação de Pessoa Coletiva NPS – Número Médio de Pessoas ao Serviço

OCDE – Organização para a Cooperação e Desenvolvimento Económico POC – Plano Oficial de Contabilidade

SNC – Sistema de Normalização Contabilística QP – Quadros de Pessoal

(13)

1

1. Introdução

O reporte de informação de natureza estatística pelas unidades económicas tem uma importância indiscutível, fornecendo dados indispensáveis, quer a nível de investigação, quer no processo de tomada de decisões de política económica. Assim, ao longo dos últimos anos, tem sido notório um aumento do reconhecimento da importância dos microdados.

Microdados são dados relativos a determinada unidade de observação (como indivíduos, famílias ou empresas). Normalmente, estão associados a um elevado volume de informação. Por reconhecer a importância dos microdados e da sua utilização para fins de investigação e na tomada de decisões políticas, em 2011, o Eurostat criou o European Statistics Code of Practice para promover e facilitar o acesso a microdados, nos países europeus (Eurostat, 2011). Também a OCDE, propôs a criação de um comité dedicado ao estudo de New Approaches to

Economic Challenges, cujo relatório apresentado em 2015 inclui a formulação de políticas de

forma integrada, recorrendo em particular a uma maior utilização de microdados (OCDE, 2015).

Em 2014, uma iniciativa no mesmo sentido teve lugar a nível nacional, tendo sido celebrado um protocolo entre o Instituto Nacional de Estatística (INE), Fundação para a Ciência e Tecnologia (FCT) e Direção-Geral de Estatísticas da Educação e Ciência (DGEEC), com o intuito de promover o acesso a bases de microdados e assim contribuir para o avanço do conhecimento científico e tecnológico (INE, 2015).

Também em 2014, o Banco de Portugal criou o Laboratório de Investigação em Microdados (BPLIM) com a missão de apoiar a produção de investigação e estudos sobre a economia portuguesa, concedendo a investigadores internos e externos acesso a microdados documentados e anonimizados, personalizados segundo as necessidades específicas de cada investigador. Como o BPLIM permite um acesso remoto aos dados, tem também atraído investigadores internacionais.

Uma fonte importante para as bases de microdados ao nível da empresa, sobre a economia portuguesa é a Informação Empresarial Simplificada (IES). Tanto o INE como o BPLIM disponibilizam aos investigadores bases de microdados baseados na IES. A IES constitui uma declaração anual, obrigatória desde 2007, contendo um conjunto alargado de informação relativa à situação económico-financeira das empresas em Portugal. No entanto, a IES permite também aceder a informação contabilística e económica ao nível do

(14)

2

estabelecimento das empresas não financeiras portuguesas, através da informação reportada no Anexo R. O objeto deste trabalho incidirá, essencialmente, sobre este Anexo.

Apesar do reconhecido valor desta informação desagregada por estabelecimento, até agora a informação do Anexo R nunca foi disponibilizada para fins de investigação, tendo sido esse subaproveitamento que motivou a escolha da questão da dissertação, uma vez que os microdados ao nível do estabelecimento têm subjacente um enorme potencial por permitirem um nível de análise mais refinado. Tanto quanto se sabe, não existe um único trabalho que tenha como foco a informação reportada ao nível dos estabelecimentos contida no referido Anexo R, em Portugal.

Mas a disponibilização destes dados exige o tratamento prévio de uma série de questões. É necessário catalogar e, se possível, tratar problemas como quebras de série (nomeadamente a provocada pela alteração do normativo contabilístico em 2010), inconsistências, e erros de preenchimento por parte das empresas. Particularmente importante é a necessidade de correção do identificador do estabelecimento atribuído pela empresa, que apresenta incorreções que inviabilizam o acompanhamento dos estabelecimentos ao longo do tempo. Assim, este trabalho tem vários objetivos. Pretende-se dar a conhecer a informação relevante sobre o Anexo R, e documentar a construção de uma base de dados em painel com variáveis harmonizadas ao longo de todo o período, que engloba informação económico-financeira dos estabelecimentos das empresas não financeiras em Portugal (permitindo assim que estes sejam devidamente acompanhados ao longo dos anos). Também se discute alguns problemas que permanecem na base de dados e que devem ser tomados em consideração. Espera-se que uma vez ultrapassados estes problemas estes dados possam vir ser disponibilizados pelo BPLIM para fins de investigação.

Foi possível aceder aos dados reportados na IES no contexto de um estágio curricular desenvolvido no BPLIM.

Em termos de estrutura, esta dissertação divide-se em 6 capítulos.

Após o presente capítulo introdutório, segue-se um capítulo dedicado ao enquadramento da especificidade do Anexo R da IES, em particular no contexto da informação de natureza estatística ao nível do estabelecimento e da sua importância. São ainda destacadas as principais alterações introduzidas neste domínio. No terceiro capítulo apresentam-se várias perspetivas sobre o conceito de estabelecimento, com especial enfoque no caso português.

(15)

3

Os aspetos de natureza metodológica são descritos no quarto capítulo, sendo exposto em detalhe as etapas da construção da base de dados da Central de Balanços ao nível do estabelecimento. No capítulo seguinte, procede-se à caracterização da referida base de dados, mediante a análise de estatísticas descritivas relativas aos dados ao nível da empresa e do estabelecimento. São também neste ponto abordadas questões de controlo da consistência no reporte dos dados, nomeadamente pela comparação dos dados reportados ao nível da empresa e do estabelecimento.

Por último, são alinhadas no capítulo final as principais conclusões e limitações deste trabalho assim como um conjunto de sugestões para investigação futura.

(16)

4

2. Enquadramento

O Decreto-Lei n.º 8/2007, de 17 de janeiro, veio introduzir a IES, que constitui uma declaração anual obrigatória para as empresas portuguesas contendo um conjunto alargado de microdados relativos a informação económico-financeira. A IES está em vigor desde 2007 permitindo assim a obtenção de informação relativa aos anos de 2006 e seguintes.

A introdução da IES trouxe vantagens para as empresas, que passaram a reportar toda a informação necessária num só momento, de forma desmaterializada, facilitando assim o cumprimento das obrigações de reporte, e para as entidades recetoras da informação, tanto a nível de cobertura como ao nível do detalhe (Banco de Portugal, 2008).

Através de um único formulário as empresas passaram a cumprir um conjunto de obrigações que até então tinham de realizar separadamente, em momentos distintos:

- Entrega da declaração anual de dados contabilísticos e fiscais ao Ministério das Finanças;

- Registo da prestação de contas na conservatória do registo comercial;

- Entrega de informação anual ao Instituto Nacional de Estatística (Inquérito Anual às Empresas);

- Comunicação de dados contabilísticos ao Banco de Portugal (Inquérito Anual da Central de Balanços).

As entidades sujeitas à obrigação de reporte da IES são: as sociedades comerciais e as sociedades civis sob forma comercial; as sociedades anónimas europeias; as empresas públicas; as sociedades com sede no estrangeiro e representação permanente em Portugal (apenas a parte respeitante à representação permanente e não à sociedade estrangeira); e os estabelecimentos individuais de responsabilidade limitada (Autoridade Tributária, Instituto dos Registos e do Notariado I.P., Instituto Nacional de Estatística, Banco de Portugal, 2015). Os microdados da IES alimentam diversas bases de dados, como a Central de Balanços (CB) do Banco de Portugal, o Sabi da Bureau van Dijk e o Sistema de Contas Integradas das Empresas (SCIE) do Instituto Nacional de Estatística (Oliveira, 2016).1 Todas estas bases de

(17)

5

dados podem ser acedidas para fins de investigação sendo uma importante fonte de informação sobre a economia portuguesa à disposição dos investigadores.

A IES é composta por 21 Anexos: 11 referentes ao Imposto sobre o Rendimento das Pessoas Coletivas (IRC), 1 respeitante ao Imposto sobre o Rendimento das Pessoas Singulares (IRS), 5 relativos ao Imposto sobre o Valor Acrescentado (IVA), 1 relativo ao Imposto de Selo (IS) e 3 associados a Informação Estatística (Autoridade Tributária, 2015a).2

Cada entidade tem de entregar uma folha de rosto acompanhada do(s) Anexo(s) necessário(s) para o cumprimento das suas obrigações legais. As empresas não financeiras em Portugal estão sujeitas à obrigação de reporte dos Anexos A e R, respeitantes a informação das contas anuais não consolidadas (informações contabilísticas e demonstrações financeiras) e informação relativa aos estabelecimentos da empresa, respetivamente. No entanto, a informação que consta das bases de microdados acima referidas (CB, Sabi e SCIE) apenas diz respeito ao Anexo A, ou seja, compreende apenas informação ao nível da empresa. No entanto, a IES disponibiliza também informação ao nível do estabelecimento através do Anexo R.

2.1. A Importância da Informação ao Nível do Estabelecimento

Em 2017, a OCDE realizou um estudo3 sobre como a criação de novas empresas pode afetar

o desenvolvimento e prosperidade regional (associada à criação de emprego e à inovação). Optou por comparar as abordagens por empresas e por estabelecimentos. A utilização de dados ao nível da empresa permitiu a utilização de dados mais harmonizados e para um maior número de países da OCDE. Em contrapartida, a abordagem ao nível do estabelecimento oferece a vantagem de considerar uma localização mais precisa, nomeadamente para a distribuição do emprego.

Esse trabalho permitiu constatar que a utilização de dados ao nível da empresa pode ser uma fonte de enviesamento significativa quando estes são usados para concluir sobre a localização do emprego. As grandes empresas, com vários estabelecimentos, que têm tendência a ter sedes em grandes cidades, podem ter uma quantidade substancial de estabelecimentos e de trabalhadores fora da região onde se encontra localizada a sede. Caso todos os trabalhadores

2 A listagem dos anexos pode ser encontrada no Anexo 1.

(18)

6

dessas empresas sejam atribuídos à região da sede, a distribuição geográfica do emprego representa um “enviesamento das sedes”. Segundo a OCDE, o “enviesamento das sedes” corresponde a um desvio do peso real da região no total do emprego nacional de 1,4 pontos percentuais, em média. As regiões das cidades-capital têm tendência a concentrar as sedes das grandes empresas. Em média, controlam 7 pontos percentuais a mais da força de trabalho, do que a que se localiza de facto na região (OCDE, 2017).

Com a utilização de indicadores ao nível dos estabelecimentos, as regiões correspondem à localização física real da unidade de produção e dos seus trabalhadores, logo oferecem uma valiosa perspetiva da distribuição geográfica real das unidades de produção no território. Uma atribuição incorreta de uma fração do emprego, tem o potencial de introduzir um enviesamento significativo na análise da distribuição regional de emprego, dado a magnitude geral da mão-de-obra associada a empresas com vários estabelecimentos. Será de esperar que este tipo de enviesamento afete também outras variáveis que caracterizam a empresa. Da mesma forma, uma análise ao nível setorial poderá beneficiar da utilização de informação ao nível do estabelecimento. Por vezes as empresas têm diversos estabelecimentos que operam em diferentes atividades económicas. No entanto, tipicamente é atribuída uma classificação única de atividade à empresa, o que pode levar a uma distorção no que concerne a uma análise da distribuição setorial.

Para além do estudo citado existem outros estudos ao nível do emprego que utilizam microdados dos estabelecimentos. Exemplo disso é o trabalho de Davis e Haltiwanger (1990) que consideram os dados reportados por estabelecimento para estudar a criação e destruição de emprego, nos Estados Unidos. Estes autores consideraram não só a criação (ou destruição) bruta de emprego, que tem em conta os dados agregados, mas também os fluxos de deslocações de trabalhadores. Os autores constataram que há grandes fluxos de trabalhadores resultantes da realocação de empregos entre estabelecimentos. É também realçado o peso considerável que os nascimentos e mortes de estabelecimentos têm na criação e destruição de emprego local, contribuindo para 20% da criação bruta e 25% da destruição bruta de emprego, respetivamente.

Bases de dados com este detalhe (microdados ao nível do estabelecimento) permitem ainda estudar a distribuição espacial dos estabelecimentos, bem como a distribuição estratégica de empresas com vários estabelecimentos, por exemplo, Gumpert, Steimer e Antoni (2018) concluíram que quanto maior a distância de determinado estabelecimento à sede da empresa,

(19)

7

menor será a dimensão desse estabelecimento (sendo o tamanho do estabelecimento definido tendo em conta as suas vendas e número de trabalhadores).

Também para Portugal existem vários estudos baseados em microdados ao nível do estabelecimento. Estes estudos baseiam-se na base de dados dos Quadros de Pessoal (QP). Esta base de microdados é a única disponível para efeitos de investigação com informação ao nível do estabelecimento sobre Portugal.4 A base de dados dos QP contém um

identificador ao nível do estabelecimento, informação sobre a localização e a atividade económica, e ainda informação sobre a força de trabalho no estabelecimento.

Os QP têm sido utilizados para estudar as decisões de localização de estabelecimentos (eg: Guimarães, Figueiredo, Woodward, 2000), a relocalização de estabelecimentos já existentes (eg: Holl, 2004) ou a deslocação de trabalhadores entre estabelecimentos ou postos de trabalho, para diferentes regiões (eg: Tavares, Carneiro, Varejão, 2017). Este tipo de estudos apenas é possível com recurso a bases de dados que permitem o acompanhamento do mesmo estabelecimento ao longo do tempo. Mas perceber se um estabelecimento é ou não o mesmo ao longo do tempo é uma questão complexa. Adiante haverá oportunidade de revisitar essa questão.

2.2. O Anexo R da IES

O Anexo R deve ser entregue pelas empresas não financeiras que têm a obrigação de entrega do Anexo A. As empresas que preenchem o Anexo R têm de disponibilizar informação qualitativa e quantitativa por cada estabelecimento em território nacional até 2009, e por cada estabelecimento em território nacional ou estrangeiro desde 2010 (até essa data as empresas reportavam a informação quantitativa de todos os estabelecimentos no estrangeiro de forma agregada).

O Anexo é constituído pelos seguintes quadros: 5

- Quadro 01: N.º de Identificação Fiscal;

4 Esta base de dados tem um universo diferente da IES pois contempla todas as empresas públicas e privadas

(incluindo empresários em nome individual) em Portugal com pelo menos um trabalhador. Atualmente constituem uma obrigação anual de reporte por parte dos empregadores através do preenchimento do Relatório Único (desde 2010).

5 O Anexo R pode ser consultado no Anexo 2. Anteriormente a 2010 o Anexo R não continha o Quadro

(20)

8

- Quadro 02: Exercício/ Período Fiscal;

- Quadro 03: Número de estabelecimentos da empresa (em território nacional e fora de território nacional);

- Quadro 04: Estabelecimentos localizados no território nacional (Exercícios de 2009 e anteriores);

- Quadro 04-A: Estabelecimentos da empresa (Períodos de 2010 e seguintes);

- Quadro 05: Estabelecimentos localizados fora do território nacional (Exercícios de 2009 e anteriores).

Nos Quadros 04 e 04-A as empresas têm de indicar um conjunto de informações qualitativas relativas ao estabelecimento, como morada, contactos, atividade, situação, se o estabelecimento é ou não sede e ainda atribuir um número de ordem ao estabelecimento. A cada estabelecimento a empresa deve atribuir um número de ordem único, sendo que ao estabelecimento sede deve ser atribuído o número de ordem igual a um. Segundo as indicações de preenchimento, “o número de ordem atribuído deve ser mantido em futuras IES. Nestas,

se o estabelecimento em causa cessar a actividade, não deve voltar a utilizar o número de ordem que lhe estava atribuído em novos estabelecimentos. A estes deve ser atribuído o número de ordem imediatamente a seguir ao do último número atribuído.” (Autoridade Tributária, 2015, p.4). Nesses Quadros é ainda pedido

um conjunto de variáveis quantitativas relativas ao estabelecimento, como o número de pessoas ao serviço e variáveis da demonstração de resultados. No Quadro 05 são apenas pedidas variáveis quantitativas relativas à informação agregada de todos os estabelecimentos da empresa no estrangeiro, até 2010.

Todas as empresas não financeiras devem entregar o Anexo R e preencher, pelo menos, um Quadro 04-A, visto que a sede é considerada um estabelecimento. Empresas que detêm só um estabelecimento apenas devem preencher os campos 1 a 15 dos Quadros 04 ou 04-A, para exercícios de 2009 e anteriores ou 2010 e seguintes, respetivamente. Ou seja, empresas com apenas um estabelecimento, correspondente à sede, não têm de preencher informação quantitativa desse estabelecimento, por se assumir que essa informação é idêntica à informação quantitativa reportada pela empresa (informação que consta no Anexo A). Para as restantes empresas, que têm dois ou mais estabelecimentos, a soma dos valores reportados neste Anexo deve coincidir com o total reportado nas contas da empresa.

(21)

9 2.3. Alteração ao Sistema Contabilístico

O Anexo A e o Anexo R da IES foram reformulados em 2010 para acomodar a alteração do normativo contabilístico. Até 2009, as empresas preenchiam a informação financeira de acordo com o Plano Oficial de Contabilidade (POC). A partir de 2010, foi introduzido o Sistema de Normalização Contabilística. Esta alteração teve impacto na comparabilidade de algumas variáveis financeiras ao longo do tempo. Nomeadamente, algumas rubricas da IES foram descontinuadas e outras foram introduzidas.

No Anexo A, em 2010 foram também introduzidos reportes diferenciados de acordo com a dimensão da empresa. Estes são:

- as Normas Internacionais de Contabilidade (NIC’s);

- as Normas Contabilísticas e de Relato Financeiro (NCRF’s);

- a Norma Contabilística e de Relato Financeiro para Pequenas Entidades (NCRF-PE); - a Norma Contabilística para Microentidades (NC-ME).

Como tal, as empresas classificadas como Pequenas Entidades e Microentidades reportam algumas variáveis do Balanço e da Demonstração de Resultados com um maior nível de agregação e estão dispensadas do reporte de algumas tabelas introduzidas em 2010.

Esta alteração não representou qualquer impacto a nível do Anexo R. No entanto, ao nível deste Anexo, existem duas alterações a assinalar: 1) Em 2010, foi introduzido o Quadro 04-A (Estabelecimentos da empresa - Exercícios de 2010 e seguintes) que solicita informação mais desagregada. Neste Quadro, a informação referente às Vendas e Prestações de Serviços passou a ser reportada de forma desagregada em duas rubricas distintas. A informação referente ao Custo das Mercadorias Vendidas e das Matérias Consumidas e Fornecimentos e Serviços

Externos passou também a ser reportada separadamente. Adicionalmente, passou a ser

solicitado o reporte de sete novas rubricas: Compras; Aquisições em ativos biológicos; Aquisições em

ativos fixos tangíveis; Aquisições em ativos fixos tangíveis em edifícios e outras construções; Aquisições em propriedades de investimento; Aquisições em propriedades de investimento em edifícios e outras construções e Capitais próprios ou equiparados. 2) O Quadro 05 (Estabelecimentos localizados fora do

território nacional - Exercícios 2009 e anteriores) foi descontinuado a partir de 2010, uma vez que é introduzida a obrigatoriedade de reportar informação para cada um dos estabelecimentos que a empresa possua em território estrangeiro. Consequentemente, no

(22)

10

Quadro 04-A é introduzido o campo referente ao país onde o estabelecimento se encontra localizado.

No Quadro 1, são apresentadas todas as variáveis reportadas no Anexo R. A coluna Plano Contabilístico permite distinguir a informação reportada antes de 2009, de acordo com o POC, da informação reportada a partir de 2010. Como se pode verificar, a alteração do normativo contabilístico tem impacto no reporte de toda a informação, uma vez que a introdução de novos Quadros levou à renomeação das rubricas da IES.

Quadro 1 - Variáveis disponíveis no Anexo R

Rubrica Descritivo Contabilístico Plano

VF6014 Morada Estabelecimento Localizado no Território Nacional POC

VF6015 Situação Perante a Atividade Estabelecimento Localizado no Território Nacional POC

VF6016 Atividade Principal Estabelecimento Localizado no Território Nacional POC

VF6017 CAE Rev.3 Estabelecimento Localizado no Território Nacional POC

VF6019 Estabelecimento sede? Sim/Não POC

VF6021 Distrito Estabelecimento Localizado no Território Nacional POC

VF6022 Concelho Estabelecimento Localizado no Território Nacional POC

VF6023 Freguesia Estabelecimento Localizado no Território Nacional POC

VF6035 Código Postal (4 dígitos) Estabelecimento Localizado no Território

Nacional POC

VF6036 Código Postal (3 dígitos) Estabelecimento Localizado no Território Nacional POC

VF6247 Localidade Estabelecimento Localizado no Território Nacional POC

VF6024 FAX POC

VF6025 Telefone POC

VF6026 Email POC

VF17980 Nº de Ordem do Estabelecimento localizado no território nacional (TN) POC

VF17981 Nº médio de pessoas ao serviço durante o ano (TN) POC

VF17982 CMV e das matérias Consumidas e FSE´s (TN) POC

VF17983 Custos com Pessoal (TN) POC

VF17984 Remunerações (TN) POC

VF17985 Vendas e Prestações de Serviços (TN) POC

VF17986 Variação da produção (TN) POC

VF17987 Aumentos de imobilizado corpóreo (TN) POC

VF17988 Dos quais: Aumentos em edifícios e outras construções (TN) POC

VF17972 Estab Estrangeiros - Número médio de pessoas ao serviço durante o ano POC

VF17973 Estab Estrangeiros - CMVMC e FSE POC

VF17974 Estab Estrangeiros - Custos com o pessoal POC

VF17975 Estab Estrangeiros – Remunerações POC

(23)

11

Rubrica Descritivo Contabilístico Plano

VF17977 Estab Estrangeiros - Variação da produção POC

VF17978 Estab Estrangeiros - Aumentos de imobilizado corpóreo POC

VF17979 Estab Estrangeiros - Dos quais: Aumentos em edifícios e outras construções POC

VF53547 País (Define se é Estabelecimento Localizado fora ou no Território

Nacional) SNC

VF53548 Morada SNC

VF53549 Código Postal (4 dígitos) SNC

VF53550 Código Postal (3 dígitos) SNC

VF53551 Localidade SNC

VF53552 Distrito SNC

VF53553 Concelho SNC

VF53554 Freguesia SNC

VF53558 Situação Perante a Atividade SNC

VF53559 Atividade Principal SNC

VF53560 CAE Rev.3 SNC

VF53562 Estabelecimento sede? Sim/Não SNC

VF53555 FAX SNC

VF53556 Telefone SNC

VF53557 Email SNC

VF18009 Nº de Ordem do Estabelecimento SNC

VF18010 Nº médio de pessoas ao serviço durante o ano SNC

VF18011 Vendas SNC

VF18012 Prestação de Serviços SNC

VF18013 Variações nos Inventários da Produção SNC

VF18014 CMV e das matérias Consumidas SNC

VF18015 FSEs SNC

VF18016 Gastos com o pessoal SNC

VF18017 Remunerações SNC

VF18018 Compras SNC

VF18019 Aquisições em Ativos Biológicos SNC

VF18020 Aquisições em Ativos Fixos Tangíveis SNC

VF18021 Dos quais: Em edifícios e outras construções SNC

VF18022 Aquisições em propriedades de Investimento SNC

VF18023 Dos quais: Em edifícios e outras construções SNC

VF18024 Capitais Próprios ou Equiparados SNC

(24)

12

3. Identificação de Estabelecimento

3.1. Conceito de Estabelecimento

Para o trabalho a desenvolver é importante perceber qual é a definição de estabelecimento utilizada na IES. No Anexo R da IES (Autoridade Tributária, 2015), consta a seguinte definição de estabelecimento: “Estabelecimento – corresponde a uma empresa ou parte de uma empresa

(fábrica, oficina, mina, armazém, loja, escritório, entreposto, sucursal, filial, agência, etc.) situada num local topograficamente identificado. Nesse local ou a partir dele exercem-se actividades económicas para as quais, regra geral, uma ou várias pessoas trabalham (eventualmente a tempo parcial), por conta de uma mesma empresa. A sede da empresa deve ser considerada como um estabelecimento.” (p.3)

Esta é a mesma definição de estabelecimento utilizada pelo INE, que por sua vez é coincidente com a definição da Comunidade Económica Europeia (CEE, 1993). Essa definição identifica um estabelecimento como um “local topograficamente definido”, ou seja, cada estabelecimento está associado a uma e só uma morada.

Já a definição das Nações Unidas é um pouco mais abrangente. Para esta organização, o conceito de estabelecimento engloba uma dimensão de localização e uma dimensão de tipo de atividade. No entanto, está sempre presente a ideia da ligação de um estabelecimento a um local específico (Nações Unidas, 2008).

3.2. Identidade do Estabelecimento

Embora seja relativamente consensual a identificação de um estabelecimento, mais complexo se torna acompanhar um estabelecimento ao longo do tempo. Para que se possa fazer este acompanhamento é necessário que exista um identificador único atribuído a cada estabelecimento que permaneça o mesmo para diferentes reportes ao longo do tempo. Idealmente esse identificador deverá ser atribuído pela firma pois esta, melhor que ninguém, conhece o estabelecimento.6

Na ausência de um número identificador do estabelecimento atribuído pela empresa torna-se necessário a criação do mesmo. Uma possibilidade é admitir, batorna-seado no conceito de estabelecimento acima discutido, que o estabelecimento é o mesmo enquanto permanece na

6 Este problema não é tão relevante para bases de dados ao nível da empresa pois estas geralmente dispõem de

(25)

13

mesma morada. Na prática, o identificador da empresa, em conjunto com a morada, permite a criação de um identificador único para o estabelecimento. Esta forma de identificar os estabelecimentos não admite a ideia de que possa existir relocalização de estabelecimentos pois o estabelecimento está associado ao local onde se encontra. Note-se, no entanto, que de acordo com a definição das Nações Unidas, mesmo que o estabelecimento permanecesse na mesma morada, seria considerado um estabelecimento diferente caso ocorresse uma alteração da atividade económica.

3.2.1. Casos Internacionais

Uma visão alternativa foi introduzida pela criação do painel de dados National Establishment

Time Series (NETS) que contém informação sobre os estabelecimentos de empresas nos

Estados Unidos da América. A NETS considera que um estabelecimento pode alterar a morada e manter-se o mesmo, se outros indicadores, como o email, o contacto e o número de pessoas ao serviço se mantenham os mesmos. Nesse caso a alteração de morada é considerada como uma relocalização de um estabelecimento e não como uma alteração de estabelecimento (Neumark, Zhang e Wall, 2005).

Esta base de dados foi criada em parceria da Walls & Associates com a Dun and Bradstreet, com o objetivo de descrever, de forma mais precisa, a dinâmica da economia americana. Acompanha mais de 52 milhões de estabelecimentos e contém ainda informação detalhada sobre relocações de estabelecimentos, nomeadamente a origem e o destino da mudança, emprego e vendas no ano da mudança, distância da mudança e se é a primeira vez que o estabelecimento muda de localização. A Walls & Associates utiliza a base de dados NETS para condução de investigação própria e licencia a base de dados a investigadores (Walls & Associates, 2013).

Na Alemanha, o Painel de Estabelecimentos do Instituto de Pesquisas sobre Emprego (IAB), que resulta de uma investigação anual de estabelecimentos, representa todas as indústrias e dimensões de estabelecimentos do país. Todos os anos são inquiridos cerca de 16.000 estabelecimentos. A cada estabelecimento é atribuído um número diferente. O número não se altera por haver mudança de morada, no entanto altera-se se ocorrer uma mudança do proprietário do estabelecimento ou do setor de atividade do estabelecimento, mesmo mantendo a sua morada (Fischer, Janik, Müller e Schmucker, 2009).

(26)

14 3.2.2. Caso Português

Como já anteriormente referido, em Portugal existe uma importante base de dados ao dispor dos investigadores com informação ao nível do estabelecimento: os Quadros de Pessoal. Os Quadros de Pessoal são uma base de dados administrativa recolhida com periodicidade anual pelo Ministério do Trabalho, Solidariedade e Segurança Social desde 1982. Através desta base de dados é possível obter informação acerca da localização (distrito, concelho e freguesia), da atividade económica principal e do número de trabalhadores dos estabelecimentos de todas as entidades empregadoras em Portugal. Os QP disponibilizam também um identificador único para cada estabelecimento.

O conceito de estabelecimento utilizado nos Quadros de Pessoal é semelhante ao do Anexo R. No entanto, a metodologia de atribuição de um identificador de estabelecimento nos Quadros de Pessoal sofreu modificações ao longo do tempo. Infelizmente, não existe qualquer documentação disponível a explicar essas alterações. De facto, até 2010 o identificador era atribuído de forma sequencial a cada um dos estabelecimentos da empresa. Isto significa que a identificação única do estabelecimento se faz através da combinação desse identificador com o da empresa. No entanto, em 1991 a atribuição do identificador do estabelecimento foi alterada inviabilizando o acompanhamento dos estabelecimentos das empresas com mais que um estabelecimento. A partir de 2010 passou a existir um identificador único por estabelecimento dispensando a necessidade de utilização do identificador da empresa. Este novo identificador é único para cada morada da empresa. Ou seja, a identificação do estabelecimento coincide com a sua localização. Anteriormente a 2010, era possível que um estabelecimento mantivesse o mesmo identificador mesmo que mudasse de morada. Esta alteração metodológica é mais grave pois tem por base uma alteração na forma de atribuição do identificador do estabelecimento.

Diferenças entre os QP e os dados do Anexo R

O âmbito da análise que é possível realizar recorrendo aos Quadros de Pessoal é bastante diferente do que seria possível recorrendo à informação reportada na IES, por variadas razões. A título de exemplo:

- As bases de dados não dizem respeito à mesma população. Os Quadros de Pessoal englobam informação sobre todas as empresas com trabalhadores assalariados, enquanto a

(27)

15

IES reporta informação para sociedades não financeiras a operar em Portugal. Adicionalmente, nos Quadros de Pessoal, as empresas reportam informação maioritariamente para os estabelecimentos localizados em território nacional, enquanto a IES disponibiliza informação de estabelecimentos nacionais e estrangeiros de empresas portuguesas;

- As variáveis disponíveis constituem outra diferença relevante entre as bases de dados. A IES reporta variáveis contabilísticas como o volume de negócios e custos por estabelecimento, enquanto os Quadros de Pessoal permitem identificar e caraterizar os trabalhadores de cada estabelecimento;

- Os dados reportam a períodos de referência diferentes. Enquanto os Quadros de Pessoal reportam ao mês de outubro, os dados da IES dizem respeito a todo o período fiscal.7

Por esta razão pode haver diferenças no número de trabalhadores reportados para a mesma entidade em ambas as bases de dados, por exemplo.

Torna-se, por isso, extremamente relevante dar a conhecer os dados ao nível do estabelecimento reportados na IES. Para além de problemas comuns como a dificuldade de acesso aos dados, devido à sua disponibilização estar condicionada, por questões de confidencialidade, uma importante razão que leva ao subaproveitamento desta informação é o facto de os dados não estarem ainda organizados de modo a serem explorados nem sujeitos a qualquer controlo, pelo que precisam de ser harmonizados, tratados e corrigidos.

7 Desde 1994, os dados dos Quadros de Pessoal reportam ao mês de outubro. Até 1993, os dados tinham como

(28)

16

4. Metodologia

Para a análise descrita abaixo, foram considerados os dados do Anexo R referentes à extração de junho de 2018 disponibilizados pelo BPLIM, com informação para o período compreendido entre 2007 e 2016,8 perfazendo um total de 4.162.599 observações/

estabelecimentos-ano.9 Estes dados foram cruzados com a informação ao nível da empresa

disponível no painel harmonizado da Central de Balanços (extração de junho de 2018). Com o propósito de verificar se o identificador do estabelecimento atribuído pela empresa permitia acompanhar os estabelecimentos ao longo do tempo, foi necessário construir um painel com todos os estabelecimentos reportados.

A construção do painel dos estabelecimentos envolveu duas etapas: a harmonização das variáveis e o preenchimento de informação não reportada (variáveis quantitativas para empresas com um estabelecimento e falta de preenchimento de identificadores dos estabelecimentos).

4.1. Criação do Painel de Estabelecimentos

4.1.1. Harmonização das Variáveis

Como foi referido anteriormente, a alteração do normativo contabilístico em 2010 levou à reformulação dos Quadros nos quais as empresas reportam a informação qualitativa e quantitativa para cada um dos estabelecimentos e à alteração dos nomes das rubricas. Para que seja possível utilizar esta informação torna-se necessária a construção de um painel com variáveis harmonizadas ao longo de todo o período. No Quadro 2 estão listadas essas variáveis, assim como as correspondências entre as rubricas em POC e em SNC.

Uma das variáveis criadas foi o identificador do estabelecimento (id_estab), que corresponde ao identificador atribuído pela empresa. Este identificador é único dentro de cada empresa, ou seja, para identificar um estabelecimento é necessário conjugar o seu identificador com o número de identificação fiscal da empresa (NIPC).

8 Os dados para o ano de 2006, o primeiro ano fiscal a ser reportado, não foram considerados, uma vez que

uma grande proporção da informação, incluindo os identificadores dos estabelecimentos, não foi reportada.

(29)

17

Criou-se ainda um conjunto de variáveis relativas à localização do estabelecimento (morada,

distrito, concelho, freguesia, cod_post4, cod_post3, localidade e pais), à atividade do estabelecimento

(situacao,10 atividade e cae), aos contactos do estabelecimento (fax, telefone e email) e variáveis

quantitativas do estabelecimento (nps, cmvmc_fse, gastos_pessoal, remuneracoes, vn e var_producao). Adicionalmente, criou-se a variável sede, uma variável binária que identifica se o estabelecimento é ou não sede da empresa.

Quadro 2 - Correspondência das variáveis em POC e SNC

Variável Descritivo Rubrica POC Rubrica SNC

id_estab Identificador do Estabelecimento VF17980 VF18009

morada Morada do Estabelecimento VF6014 VF53548

situacao Situação Perante a Atividade VF6015 VF53558

atividade Atividade Principal do Estabelecimento VF6016 VF53559

cae CAE VF6017 VF53560

sede Estabelecimento sede VF6019 VF53562

distrito Distrito VF6021 VF53552

concelho Concelho VF6022 VF53553

freguesia Freguesia VF6023 VF53554

cod_post4 Código Postal (4 dígitos) VF6035 VF53549

cod_post3 Código Postal (3 dígitos) VF6036 VF53550

localidade Localidade VF6247 VF53551

fax FAX VF6024 VF53555

telefone Telefone VF6025 VF53556

email Email VF6026 VF53557

pais País na VF53547

nps Nº médio de pessoas ao serviço durante o ano VF17981 VF18010

cmvmc_fse CMVMC e Fornecimentos e Serviços Externos VF17982 VF18014

VF18015

gastos_pessoal Gastos com o pessoal VF17983 VF18016

remuneracoes Remunerações VF17984 VF18017

vn Vendas e Prestações de Serviços (TN) VF17985 VF18011

VF18012

var_producao Variações nos Inventários da Produção VF17986 VF18013

Fonte: Laboratório de Investigação em Microdados do Banco de Portugal

10 Variável que indica se o estabelecimento aguarda início de atividade, está em atividade, tem atividade suspensa

(30)

18 4.1.2. Preenchimento de Informação Não Reportada

De acordo com as instruções de preenchimento do Anexo R, as empresas constituídas por um único estabelecimento têm apenas de preencher as variáveis qualitativas, uma vez que as variáveis contabilísticas devem corresponder às reportadas ao nível da empresa. Assim, foi necessário substituir os valores missing das variáveis quantitativas ao nível do estabelecimento pelos valores reportados ao nível da empresa. Para esse fim, foi necessário definir a correspondência direta entre as variáveis disponíveis no painel harmonizado da CB e as rubricas reportadas no Anexo R, como ilustrado no Quadro 3.

Quadro 3 - Correspondência entre variáveis da empresa e dos estabelecimentos Descritivo Variável da empresa

Variável do estabelecimento POC SNC Vendas D002 VF17985 VF18011 Prestações de serviços DL017 VF18012 CMVMC D025 VF17982 VF18014 FSE D026 VF18015

Número de pessoas ao serviço E001 VF17981 VF18010

Gastos com pessoal D029 VF17983 VF18016

Remunerações D030 VF17984 VF18017

Variação de produção D006 VF17986 VF18013

Fonte: Laboratório de Investigação em Microdados do Banco de Portugal

4.2. Verificação e Correção dos Identificadores dos Estabelecimentos

Depois de criar a base de dados em painel, importa verificar se o identificador permite acompanhar o estabelecimento ao longo do tempo. Para tal, foi previamente necessário preencher o número de identificação dos estabelecimentos sempre que estes não foram reportados. Na base de dados, existiam 6.380 observações sem número de identificação atribuído, especialmente nos primeiros anos de reporte (aproximadamente 82% em 2007), como se constata pela Tabela 1.

(31)

19 Tabela 1 - Número de identificadores do estabelecimento por preencher, por ano

Ano Número de identificadores por preencher Peso (%)

2007 5.244 82,19

2008 330 5,17

2009 103 1,61

2010 199 3,12

2011 504 7,90

Fonte: Elaboração própria, com base nos dados reportados na IES

Torna-se, então, necessário o seu preenchimento manual, como explicado abaixo.

Para empresas com apenas um estabelecimento num determinado ano, assume-se que esse estabelecimento corresponde à sede. Como tal, de acordo com as instruções de preenchimento dever-se-á atribuir um identificador igual a um.

Para empresas com mais do que um estabelecimento, sem identificador preenchido e sem informação para os outros anos, confirmou-se qual das moradas dos estabelecimentos corresponde à morada da empresa (preenchida na folha de rosto) e assumiu-se que esse estabelecimento corresponde à sede. Logo, atribuiu-se um identificador igual a 1 a esse estabelecimento e o(s) número(s) seguinte(s) ao(s) restante(s).

Nos casos em que a morada da empresa não corresponde à morada de nenhum dos estabelecimentos, recorreu-se a outras variáveis reportadas para cada estabelecimento, como as relacionadas com a sua localização, com o intuito de verificar qual se aproxima mais da localização reportada pela empresa.

Ao preencher o identificador para determinado estabelecimento teve-se sempre em atenção a informação reportada para outros anos, mantendo assim coerência na atribuição dos identificadores, segundo o critério da morada.

Ao longo deste processo, foi possível verificar que existiam inconsistências na atribuição do identificador do estabelecimento que impossibilitavam acompanhar o mesmo estabelecimento ao longo do tempo. Como tal, todos os identificadores foram verificados e corrigidos, quando necessário, de acordo com os critérios apresentados de seguida.

(32)

20 4.2.1. Critérios de Correção dos Identificadores

No procedimento de correção dos identificadores, admitiu-se que o número de identificação foi corretamente atribuído se um estabelecimento em anos consecutivos é identificado como sendo o mesmo pela empresa e a sua morada se mantém inalterada. Ou seja, assume-se que a cada morada corresponde apenas um identificador ao longo do tempo.

Este processo seria facilitado se cada morada fosse escrita de maneira idêntica ao longo dos anos, permitindo assim automatizar o processo de verificação de consistência dos identificadores. Ao analisar os dados, facilmente se percebeu que as empresas reportam uma mesma morada de variadas maneiras: moradas com recurso a abreviaturas, mais ou menos completas, por vezes com erros ortográficos ou escritas por outra ordem.

Para tentar minimizar essas diferenças, as moradas foram corrigidas e harmonizadas, eliminando a utilização de abreviaturas, os erros ortográficos e moradas sem informação relevante para a análise (como moradas preenchidas com o nome da empresa). O Anexo 3 ilustra alguns exemplos de abreviaturas que foram substituídas pela sua versão por extenso. Após este passo, foi possível implementar um processo semiautomático de verificação dos identificadores. Numa primeira fase, recorreu-se ao Stata e ao programa dtalink para identificar moradas consideradas idênticas. O programa dtalink recorre a fuzzy match, através do método de ligação probabilística (probabilistic linkage method) e considerou a similitude da morada, código postal, localidade e concelho, por empresa (Kranker, 2018). Este procedimento gerou um código único para todas as observações com informação de localização semelhante. Sempre que a cada código gerado esteja associado um e só um identificador de estabelecimento, assume-se que este último foi corretamente atribuído pela empresa e que não é necessária verificação manual. Para os restantes casos, foi feita uma verificação manual de acordo com os critérios detalhados abaixo.

Nos casos em que a empresa atribui o mesmo identificador a estabelecimentos com moradas diferentes é necessário confirmar se existe uma incoerência na atribuição do identificador do estabelecimento ou se o estabelecimento é considerado o mesmo, mas ocorreu uma alteração de morada. Para tal, criou-se uma variável adicional que identifica todas as mudanças de moradas dos estabelecimentos. Esta nova variável torna possível aos investigadores optarem por considerar as alterações de morada como a criação de um novo estabelecimento ou como a relocalização de um estabelecimento já existente. Identificam-se, portanto, dois cenários diferentes:

(33)

21

1. Quando um estabelecimento tem uma morada que corresponde à de um outro estabelecimento, é provável que a empresa tenha trocado os identificadores que atribuiu a ambos os estabelecimentos. Nesse caso, não se considera que os estabelecimentos mudaram de morada, apenas se corrigem os identificadores, passando a morada a ser consistente para cada estabelecimento ao longo dos anos. Uma breve ilustração desta situação, para uma empresa fictícia, encontra-se na Tabela 2, onde se optou por corrigir os identificadores no ano de 2008.

Tabela 2 - Exemplo de correção de identificador do estabelecimento Ano Morada id_estab original corrigido id_estab

2007 Rua A 1 1 2008 Rua B 1 2 2009 Rua A 1 1 2010 Rua A 1 1 2011 Rua A 1 1 2012 Rua A 1 1 2007 Rua B 2 2 2008 Rua A 2 1 2009 Rua B 2 2 2010 Rua B 2 2 2011 Rua B 2 2 2012 Rua B 2 2

Pode ainda acontecer que o reporte esteja de acordo com as regras de preenchimento, mas haja lugar a correção de identificadores. O estabelecimento sede da empresa é um desses casos. Tal como referido anteriormente, ao estabelecimento sede é atribuído o identificador 1. No entanto, um estabelecimento pode deixar de ser sede e, por consequência, o seu identificador muda de 1 para outro número de ordem, o que impede que esse estabelecimento seja acompanhado ao longo dos anos. Assim, a correção do identificador passa a permitir o seu acompanhamento sem perda de informação, já que existe uma variável

dummy que indica se cada estabelecimento é ou não a sede da empresa.

2. Quando a morada do estabelecimento em análise não está associada a nenhum outro identificador, importa identificar se um estabelecimento é o mesmo ou não ao longo do tempo recorrendo a outras variáveis para além das referentes à localização do estabelecimento. Nomeadamente, considerou-se que o estabelecimento é o mesmo e muda

(34)

22

de morada sempre que se mantém a consistência temporal da atividade económica do estabelecimento (cae, atividade e situacao), assim como do número de pessoas ao serviço (nps) e do volume de negócios (vn). Quando se trata de uma potencial alteração de morada no caso do estabelecimento sede, recorre-se ao Portal da Justiça11 para confirmar tal alteração. Esta

situação encontra-se ilustrada na Tabela 3.

Tabela 3 - Exemplo de identificação de mudança de morada Ano Morada id_estab original mud_morada

2007 Rua A 1 2008 Rua A 1 2009 Rua A 1 2010 Rua C 1 1 2011 Rua C 1 2012 Rua C 1 2007 Rua B 2 2008 Rua B 2 2009 Rua B 2 2010 Rua B 2 2011 Rua B 2 2012 Rua B 2

Por último, importa salientar que devido à maior complexidade da análise dos dados para as empresas com 3 ou mais estabelecimentos em determinado ano, utilizou-se o software

OpenRefine para agilizar o processo de identificação de identificadores mal atribuídos. O

ganho de utilização deste software é crescente no número de estabelecimentos. O OpenRefine é uma ferramenta desenvolvida pela Google que contribui para a exploração e limpeza de bases de dados de grande dimensão. Foi possível, dentro de cada empresa, organizar as observações por concelho, facilitando assim a identificação de moradas semelhantes com diferentes identificadores para diferentes anos. Foi ainda possível, corrigir as moradas através de clustering (agrupar dados diferentes, mas semelhantes), juntando assim moradas iguais, mas escritas de maneiras distintas. A criação de um cluster tem por base um de dois métodos: Key

collision e Nearest neighbor, sendo que o primeiro tem a vantagem de ser mais rápido e originar

menos falsos positivos (por ter parâmetros mais exigentes), no entanto o segundo método

(35)

23

pode ser capaz de agrupar moradas idênticas que não são identificadas pelo primeiro (OpenRefine, 2018).

Corrigiram-se, no total, 93.771 identificadores de estabelecimentos, distribuídos de forma relativamente uniforme ao longo dos anos (ver Tabela 4). Ao todo, 7.604 empresas necessitaram de correção nos identificadores, para que estes se tornassem consistentes.

Tabela 4 - Correções efetuadas ao identificador dos estabelecimentos, por ano Ano Número de empresas Número de observações

2007 2.841 11.815 2008 2.369 10.492 2009 2.261 9.856 2010 2.082 8.600 2011 2.130 8.400 2012 2.302 8.940 2013 2.413 8.946 2014 2.561 8.556 2015 2.690 9.042 2016 2.924 9.124 Total 7.604 93.771 4.3. Eliminação de Duplicados

Ao longo deste processo considerou-se que quando existem dois estabelecimentos, para um mesmo ano, com as variáveis qualitativas exatamente iguais e as variáveis quantitativas apenas preenchidas para um desses estabelecimentos (e o segundo estabelecimento apresenta valores missing), um desses estabelecimentos consiste num duplicado. Para a observação sem informação nas variáveis quantitativas, atribui-se valor 1 à variável dummy dup, o que implica que mais tarde a observação será eliminada.

Em alguns desses casos, se um estabelecimento x tem apenas o nps (e mais nenhuma variável quantitativa preenchida) e existe um outro estabelecimento y (para o mesmo ano) com a mesma morada e com as restantes variáveis qualitativas iguais, que possui todas as variáveis quantitativas preenchidas (incluindo remunerações) à exceção do nps, considera-se necessário corrigir o nps, atribuindo o valor preenchido ao estabelecimento y com as restantes variáveis preenchidas e eliminando o estabelecimento x, que tem essas variáveis missing (dup=1).

(36)

24 Tabela 5 - Eliminação de duplicados

Ano Número de observações duplicadas Número de empresas com duplicados 2007 73 72 2008 44 44 2009 26 26 2010 3 3 2011 1 1 2012 1 1 2013 3 3 2014 2 2 2015 2 2 2016 0 0 Total 155 93

Ao todo, foram eliminadas 155 observações, de 93 empresas diferentes, por cumprirem os critérios necessários para serem consideradas duplicados. Através da análise da Tabela 512 é

notória a persistência temporal de estabelecimentos sem informação quantitativa preenchida, principalmente nos primeiros anos de reporte da IES, entre 2007 e 2009.

12 O número total de empresas com duplicados é inferior ao somatório do número de empresas por ano o que

(37)

25

5. Análise da Base de Dados

5.1. Descrição da Base de Dados

O objetivo deste capítulo é fazer uma breve caracterização da base de dados, que engloba informação económico-financeira das empresas não financeiras em Portugal, bem como dos seus estabelecimentos.

A primeira parte desta análise incidirá sobre os dados reportados ao nível da empresa; segue-se a análisegue-se da informação reportada ao nível dos estabelecimentos, com maior ênfasegue-se no que respeita a estabelecimentos localizados em território nacional e complementada, de modo mais sucinto, com dados relativos a estabelecimentos localizados no estrangeiro. Cada observação corresponde, para um dado ano, a um estabelecimento, contendo não só informação relativa a esse estabelecimento, mas também informação agregada da empresa que o reportou. Por consequência, nos casos de empresas com apenas um estabelecimento, a informação é coincidente.

Estas observações podem ser classificadas segundo várias dimensões, sendo as seguintes consideradas na presente dissertação:

- Cronológica, segundo o ano a que dizem respeito;

- Segundo o número de estabelecimentos;

- Espacial, distribuição por distrito;

- Demográfica, analisando taxas de natalidade e mortalidade e a idade de empresas; - Por setor de atividade, segundo a CAE.

Cada dimensão pode ainda ser dividida considerando os dados reportados pela empresa ou os dados reportados por estabelecimento. Por outro lado, é por vezes interessante poder aliar várias dimensões, para perceber, por exemplo, de que forma a localização ou o tipo de atividade pode influenciar o número de estabelecimentos de uma empresa.

(38)

26 5.1.1. Análise dos Dados ao Nível da Empresa

A base de dados em painel que engloba as empresas não financeiras em Portugal é composta por 3.803.622 observações.13 Durante a década considerada (2007-2016) foram identificadas

634.494 empresas distintas, divididas ao longo do período de análise do modo que se apresenta na Tabela 6. Para cada ano, as empresas foram divididas entre três categorias: empresas com apenas um estabelecimento – “1 Estab”, empresas com dois ou mais estabelecimentos (mas exclusivamente em território nacional) – “Multi Nac” - e empresas com, pelo menos, um estabelecimento no estrangeiro – “Multi Est”. A Tabela 6 apresenta o número de empresas não financeiras em Portugal, por ano, bem como a percentagem das mesmas que pertence a cada uma das categorias acima referidas.

Tabela 6 - Número e distribuição de empresas (2007-2016)

Ano Empresas 1 Estab (%) Multi Nac (%) Multi Est (%)

2007 358.978 96,14 3,82 0,045 2008 369.207 96,44 3,51 0,051 2009 369.244 96,58 3,37 0,048 2010 369.968 96,90 3,05 0,041 2011 378.637 96,98 2,98 0,039 2012 379.189 97,18 2,78 0,042 2013 384.157 97,31 2,65 0,045 2014 389.994 97,36 2,60 0,043 2015 399.357 97,41 2,55 0,042 2016 404.891 97,50 2,46 0,042

Fonte: Elaboração própria, com base nos dados reportados na IES

Pode-se verificar que, de 2007 a 2016, o número de empresas registou um aumento líquido de cerca de 46 mil, em termos absolutos, ou 12,8%, o que equivale a uma taxa média anual de crescimento de 1,35%. Constata-se que mais de 95% das empresas reportaram apenas um estabelecimento sede, tendo essa percentagem aumentado mais de um ponto percentual ao longo da década considerada, atingindo os 97,5%, em 2016. É ainda possível concluir que a peso de empresas com presença no estrangeiro apenas em 2008 excede, e ligeiramente, os 0,05%.

13 Foram ainda eliminadas 1.542 empresas-ano por, pelo menos um período, não preencherem o Anexo R da

(39)

27 Distribuição espacial das empresas

Não só é importante perceber como evoluiu o número de empresas, mas também como evoluiu a sua distribuição espacial, aferindo quais os distritos que registaram um aumento do seu peso relativo ao longo desta década. Neste ponto, foi considerado o distrito que é reportado pelas empresas no Anexo A, o qual deve corresponder ao distrito onde se localizam as respetivas sedes. Os valores na Tabela 7 representam o peso relativo das empresas por cada distrito para os anos de 2007 e 2016 e a taxa de crescimento do número de empresas para cada distrito (e para todo o país), ao longo do período considerado.

Tabela 7 - Distribuição espacial das empresas, em 2007 e 2016 Distrito das empresas 2007 2016 Var %

Aveiro 6,43 6,32 10,8% Beja 0,99 1,16 32,8% Braga 7,20 7,92 24,1% Bragança 0,82 0,94 29,5% Castelo Branco 1,42 1,44 14,9% Coimbra 3,48 3,44 11,5% Évora 1,37 1,44 18,8% Faro 4,94 4,86 11,1% Guarda 1,09 1,09 12,7% Leiria 5,31 4,99 5,9% Lisboa 29,10 28,33 9,9% Portalegre 0,80 0,85 19,8% Porto 17,35 17,98 16,9% Santarém 3,95 3,70 5,8% Setúbal 6,23 5,87 6,3% Viana do Castelo 1,71 1,88 23,8% Vila Real 1,23 1,35 23,8% Viseu 2,60 2,73 18,5% Angra do Heroísmo 0,30 0,33 27,0% Horta 0,15 0,21 64,1% Ponta Delgada 0,65 0,76 32,9% Funchal 2,91 2,39 -7,1% Total 100 100 12,8%

Fonte: Elaboração própria, com base nos dados reportados na IES

Os distritos de Lisboa, Porto e, em menor escala, Braga, dominam a distribuição espacial das empresas, perfazendo no seu conjunto mais de metade do total.

(40)

28

Por sua vez, no que respeita à dinâmica de crescimento do período em análise destacam-se os distritos de Horta, Ponta Delgada, Beja, Bragança e Angra do Heroísmo, que foram os que registaram um maior crescimento do seu peso relativo no total das empresas. Qualquer um destes distritos registou uma taxa de crescimento do número de empresas (última coluna da Tabela 7) de, pelo menos, o dobro da taxa média a nível nacional (12,8%). Destaque ainda para o Funchal, por se tratar do único distrito que registou uma diminuição do número de empresas no período em análise.

Considerando agora apenas o ano de 2016, procedeu-se à divisão das empresas nas três categorias 1 Estab, Multi Nac e Multi Est, conforme anteriormente descrito. Apresenta-se na Tabela 8 as proporções de cada categoria por distrito.

Tabela 8 - Distribuição por categoria de empresas, por distrito, em 2016 Distrito da empresa 1 Estab Multi Nac Multi Est

Aveiro 98,08 1,88 0,04 Beja 98,36 1,64 0,00 Braga 98,12 1,81 0,06 Bragança 98,34 1,63 0,03 Castelo Branco 97,13 2,87 0,00 Coimbra 97,13 2,86 0,01 Évora 96,97 3,01 0,02 Faro 96,59 3,39 0,03 Guarda 98,03 1,92 0,05 Leiria 97,84 2,14 0,01 Lisboa 97,31 2,63 0,06 Portalegre 97,11 2,86 0,03 Porto 97,45 2,50 0,05 Santarém 97,54 2,42 0,05 Setúbal 97,51 2,47 0,01 Viana do Castelo 98,39 1,59 0,01 Vila Real 98,36 1,64 0,00 Viseu 97,97 1,98 0,05 Angra do Heroísmo 94,60 5,40 0,00 Horta 97,23 2,77 0,00 Ponta Delgada 93,58 6,42 0,00 Funchal 97,69 2,28 0,03

Fonte: Elaboração própria, com base nos dados reportados na IES

Pela análise da tabela, constata-se que em todos os distritos mais de 95% das empresas têm apenas um estabelecimento, com a exceção de Angra do Heroísmo e Ponta Delgada, que

Referências

Documentos relacionados

Av. de 10% à vista em dinheiro, 5% de desconto à vista no cartão de débito. Parcela-se nos cartões de crédito. de 10% mediante carteirinha. especiais para associados. de 10%

Eu me senti totalmente desperta e cheia de energia, como quando se tem que pular para fora da cama e começar a fazer coisas porque você tem um dia cheio à

No entanto, a cultura predominante na gestão das unidades produtivas sucroalcooleiras, influenciada pelas altas taxas de rentabilidade dos mercados de etanol e de açúcar,

Acreditamos que a determinação dos marcadores tumorais CEA, CYFRA 21-1 e CA 15-3 em líquido pleural e sangue de pacientes portadores de derrame pleural é útil como método

Mova a alavanca de acionamento para frente para elevação e depois para traz para descida do garfo certificando se o mesmo encontrasse normal.. Depois desta inspeção, se não

1.1.12 Demonstração de que possui, o PROPONENTE, em seu quadro permanente de pessoal, na data da entrega das propostas, profissional(is) de nível superior, a

Durante a assistência e prestação de cuidados no contexto da colonoscopia, algumas meto- dologias de ações educativas podem ser utilizadas pela equipe de enfermagem a fim de

Lobo e Mahmoud (1989) e Shores (1990) constataram uma relação negativa entre as reações do mercado ao anúncio dos lucros e proxies do volume de informações pré-divulgadas,