Parte I Análise Multivariada de Dados Qualitativos
2. Investigação por inquérito
2.2. As variáveis envolvidas
O inquérito inclui diversas variáveis, na sua maioria qualitativas com escalas nominais ou ordinais, categorizadas numericamente, agrupadas em 4 secções. As variáveis quantitativas são maioritariamente discretas.
A Tabela 2.1 descreve as variáveis socioeconómicas, a escala de medida e sua descrição. A natureza das variáveis é mista: 2 quantitativas discretas e 4 qualitativas nominais ou ordinais.
Tabela 2.1: Caracterização das variáveis socioeconómicas
Questão Variável Escala de medida Descrição da escala
1 Género Qualitativa nominal 1) Feminino; 2) Masculino
2 Estado civil Qualitativa nominal 1) Casado/união de facto; 2) Divorciado; 3) Solteiro; 4) Viúvo
3 Idade Quantitativa discreta Número inteiro 4 Habilitações escolares Qualitativa ordinal
1) 1.ºciclo; 2) 2.ºciclo; 3) 3.ºciclo; 4) Secundário; 5) Bacharelato ou licenciatura; 6) Mestrado; 7) Doutoramento
5 Rendimento mensal Qualitativa ordinal 1) Menos de 1000 €; 2) 1 000€ a 2 000€; 3) 2 000€ a 3 000€; 4) Mais de 3000€
6 Dimensão familiar Quantitativa discreta Número inteiro
A avaliação dos benefícios económicos dos residentes com a chancela UNESCO obtém-se na primeira secção. Este tópico envolve 8 questões, com 15 variáveis: quantitativas discretas; qualitativas nominais e ordinais (Tabela 2.2).
Tabela 2.2: Caracterização das variáveis relativas ao benefício económico
Questão Variável Escala de medida Descrição da escala
1 Residência Qualitativa nominal 1) Cima Corgo; 2) Baixo Corgo; 3)
Douro Superior
2 Tempo na atual morada (anos) Quantitativa discreta Número de anos
3 Naturalidade Qualitativa nominal 1)Dentro do ADV; 2) Fora
4
Situação profissional Qualitativa nominal 1) Empregado; 2) Desempregado; 3) Doméstica; 4) Reformado; 5) Estudante; 6) Outro
5 Profissão principal
Duração no atual emprego (anos)
Qualitativa nominal Quantitativa discreta
1)Sector primário; 2) Sector secundário; 3) Sector terciário.
6 Local de trabalho Qualitativa nominal 1) Dentro do ADV; 2) Fora do ADV
7
Influência do estatuto: na escolha da residência; no exercício da profissão; no retorno económico.
Qualitativa nominal 1)Sim; 2) Não
8
Setor de atividade
Situação Qualitativa nominal
1) Vitivinicultura; 2) Comércio;3) Turismo; 4) Outros
1) Proprietário; 2) Por conta de outrem Perceção do proprietário: Retorno
económico Oferta
Qualitativa ordinal 1) Muito menor; 2) Menor; 3) O mesmo; 4) Maior; 5) Muito maior
73
Procura
A análise dos gastos e investimentos devidos à chancela que o residente efetuou no período 2001-2014 (secção II - Custos) é constituída por 4 questões com 4 variáveis cada, 3 quantitativas contínuas e 1 qualitativa nominal dicotómica, conforme a Tabela 2.3.
Tabela 2.3: Caracterização das variáveis relativas aos Custos com a chancela
Questão Variável Escala de medida Descrição da escala
1 Muros de xisto
- Gastos próprios
- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do
investimento com a chancela Qualitativa nominal 1) Sim; 2) Não
2 Imóveis
- Gastos próprios
- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do
investimento com a chancela Qualitativa nominal 1) Sim; 2) Não
3 Plantação/ Replantação de
vinha
- Gastos próprios
- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do
investimento com a chancela
Qualitativa nominal
1) Sim; 2) Não
4 Outros gastos
- Gastos próprios
- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do
74
A Tabela 2.4 apresenta as variáveis da secção 3, correspondentes a duas questões (os benefícios com 10 e os problemas com 6 variáveis). As variáveis são todas qualitativas ordinais, traduzem o grau de concordância dos residentes sobre os indicadores relativos ao impacto da inclusão do ADV na lista da UNESCO.
Tabela 2.4: Caraterização das variáveis relativas à perceção dos residentes sobre benefícios e problemas que
trouxe a inclusão do ADV
Questão Variável Acrónimo Escala de medida Descrição da escala
1 Benefícios
- Oportunidades para a família desfrutar - Boa imagem para a região
- Maior envolvimento da comunidade - Orgulho na região
- Preservação do património cultural - Entrada de capital para a região - Novos visitantes - Investimento na região - Criação de emprego - Valorização imobiliária B1 a B10 Qualitativa ordinal 1) Discordo completamente; 2) Discordo; 3) Nem concordo nem discordo; 4) Concordo; 5) Concordo plenamente
2 Problemas
- Aumento da sazonalidade - Aumento do custo de vida - Congestionamento - Pessoas estranhas - Segurança nas ruas - Restrições de uso importantes
75
3. Amostragem
O estudo recai nos residentes do ADV. Dada a impossibilidade de conhecer a opinião de todos os elementos da população alvo, considera-se uma parte representativa da população alvo, uma amostra.
A constituição desta é uma opção assertiva, porém a sua seleção exige cautela, é fundamental a intervenção do acaso (Martins, 2005). Para ocorrer uma generalização viável, com resultados
robustos é fundamental respeitar a representatividade51 da população alvo. Uma representação
“honesta” da população conduz à estimação das caraterísticas da população alvo com grande precisão.
A Figura 3.1 descreve as etapas de seleção da amostra ou plano amostral (Vicente, 2012), para descrever com fiabilidade a totalidade da população alvo.
Figura 3.1: Plano amostral
Fonte: Vicente (2012)
3.1. População alvo
A população alvo é o conjunto de elementos que verificam determinadas especificações e a respeito da qual se pretende conhecer uma ou mais caraterísticas (Vicente, 2012).
Os elementos (ou indivíduos) da população em estudo são os residentes do ADV, sendo considerada a totalidade dos 13 concelhos. De acordo com os Censos de 2011, nos 13 concelhos
51 A representatividade implica que os resultados obtidos pela amostra e a população em estudo sejam semelhantes. Uma amostra ideal deve
ser um microcosmo do Universo (Hill e Hill, 2005).
1 • Definir a população alvo 2 • Especificar a base de sondagem 3 • Escolher o método de amostragem 4 • Determinar a dimensão da amostra 5 • Selecionar os elementos da amostra
76
do ADV, residem 168 542 habitantes que representam 82% da população duriense, 4,6% do norte e 1,6% de Portugal. O concelho com maior número de residentes é o de Vila Real (51 850) e com menor número é o de Mesão Frio (4 433 residentes), conforme Tabela 3.1.
Tabela 3.1: Número de habitantes por concelho do ADV
Concelho Número de habitantes
Alijó 11 942 Armamar 6 297 Carrazeda de Ansiães 6 373 Lamego 26 691 Mesão Frio 4 433 Peso da Régua 17 131
São João da Pesqueira 7 874
Sabrosa 6 361
Santa Marta de Penaguião 7 356
Tabuaço 6 350
Torre de Moncorvo 8 572 Vila Nova de Foz Côa 7 312
Vila Real 51 850
Total 168 542
Fonte: Elaboração própria com dados dos Censos 2011
No universo de 168 542 habitantes, 80 462 são do género masculino, representando 48% da população do ADV.
A distribuição etária é desigual nas diversas faixas52: 13% dos residentes têm menos de 15 anos;
11% têm entre 15 e 24 anos; 53% entre 25 e 64 anos e 23% têm mais de 64 anos. Como o estudo recai sobre os residentes com mais de 18 anos, a dimensão da população em estudo diminui 11%, sendo constituída por 150 000 indivíduos, aproximadamente.
Quanto à escolaridade dos residentes, com mais de 15 anos, destaca-se que a maioria tem habilitações até ao 3.ºciclo (60%) e ainda existem 15% de residentes sem qualquer nível de instrução (Tabela 3.2).
Tabela 3.2: Distribuição dos residentes do ADV com mais de 15 anos por nível de escolaridade completo mais
elevado
Nível de escolaridade N.º de habitantes Frequência relativa (%)
Nenhum 22 149 15,2% 1.ºciclo 46 838 32,2% 2.ºciclo 17 570 12,1% 3.ºciclo 23 362 16,1% Ensino Secundário 19 231 13,2% Ensino Superior 16 302 11,2% Total 146 365 100%
52 Facto justificado pelo problema demográfico nacional, designadamente o agravamento do envelhecimento da população (Em Portugal cerca
de 19% da população tem 65 ou mais anos de idade), e pela diferente amplitude dos intervalos, levando a uma maior concentração de residentes na faixa com maior amplitude, 25 a 64 anos. (INE, Censos, 2011)
77
Fonte: Elaboração própria com dado dos censos 2011 e do PORDATA (junho de 2015)
Segundo os Censos (2011), nos concelhos do ADV a população ativa é de 70 987 indivíduos, representando 42% dos residentes. Os residentes empregados (62 278) distribuem-se pelos três setores de atividade: 14% primário, 19% secundário e 67% terciário. Para este valor contribui o peso dos serviços nos centros urbanos, nomeadamente Vila Real com 41%.
Analisando o concelho mais representativo no ADV, São João da Pesqueira, verifica-se uma distribuição diferente: 41% primário, 16% secundário e 43% terciário. Neste, a atividade
económica predominante é a agricultura53, concretamente a vitivinicultura, como referencia o
Recenseamento Nacional da Agricultura (2009).
3.2. Base da sondagem
A base da sondagem é uma representação da população (Vicente, 2012) que nos auxilia na seleção da amostra, formulando uma listagem com todos os elementos da população em estudo. Na presente investigação, o registo de toda a população duriense numa listagem seria uma tarefa difícil, com tempo e custo excessivos, na medida em que não existe o registo dos indivíduos ou
agregados familiares disponíveis em Portugal54. Dada esta impossibilidade, a seleção das
unidades da amostra (residentes) passa a ser um trabalho de terreno, que acontece em simultâneo com a última etapa do plano amostral, o contacto com os inquiridos.
3.3. Processo de amostragem
O método de amostragem vem dar resposta a uma das questões que surge no início do plano amostral: “como selecionar a amostra?”. A adoção de um método de amostragem, para a escolha dos elementos que constituem a amostra, é vantajosa, permite minimizar os erros associados, evitando o enviesamento, e potencia maior rapidez no apuramento dos resultados. Decide-se quais e como devem ser recolhidos os dados, tendo presente o princípio da
aleatoriedade55 (Martins, 2005), reunindo assim uma amostra aleatória. Mas, na prática, muitas
vezes é difícil prezar todas as condições teóricas subjacentes.
53 Os Censos não contabilizam os trabalhadores agrícolas, classificados como domésticas, reformados e ativos que possuem outra atividade
profissional, tornando o peso real do setor primário muito superior.
54 O Recenseamento da Geral da População, realizado pelo Instituto Nacional de Estatística, permite fazer este levantamento, mas este tipo
dados não é disponibilizado para este tipo de estudos.
78
O método de amostragem aleatória é o que permite obter uma amostra com as caraterísticas
referidas, de onde subsistem várias técnicas56. Um exemplo é a amostragem aleatória simples57,
é contemplada em diversos planos amostrais, trata-se da técnica mais simples, mas pode ser inviável devido às condições de aplicabilidade, a inexistência de uma listagem com o nome dos residentes do ADV ou a presença de todos os elementos da população no momento da inquirição.
As condições de aplicabilidade das diversas técnicas na amostragem aleatória tornam difícil a sua implementação, portanto teve-se em conta a sensibilidade e a experiência do entrevistador sobre a temática e a população alvo em estudo, não intervindo no fenómeno “ao acaso”.
Garantiu-se a representatividade58 da população tendo em atenção os seguintes aspetos: evitou-
se a resposta voluntária; considerou-se a estratificação do ADV por concelho, dando preferência aos mais representativos; escolheram-se os melhores pontos de amostragem.
Nesta sequência, considera-se que na seleção das unidades amostrais se preservou a aleatoriedade, no sentido em que todos os elementos da população tiveram alguma probabilidade de serem selecionados.
3.4. Dimensão da amostra
Dimensionar a amostra é definir o número mínimo de elementos necessários à validade das conclusões do estudo. Não há uma resposta simples, existindo diversas abordagens sobre este tema. Neste tópico, são referidas algumas das abordagens sugeridas na literatura, por diversos autores.
Para o cálculo do valor mínimo da amostra são ponderadas: a) caraterísticas da população (heterogeneidade e dimensão); b) o rigor pretendido para os resultados; c) regra do polegar.
a) Caraterísticas da população alvo
A heterogeneidade e a dimensão da população influenciam o tamanho da amostra. Quanto mais heterogéneas forem as caraterísticas da população maior terá de ser a dimensão da amostra, para que seja captada a diversidade das caraterísticas em estudo.
56 São exemplos a Amostragem aleatória simples, sistemática, estratificada, com reposição e por grupos (Clusters). Para mais detalhe remete-
se para Eugénia Martins (2009).
57 Dada uma população, uma amostra aleatória simples de dimensão 𝑛 é um conjunto de 𝑛 unidades da população, tal que qualquer outro
conjunto de 𝑛 unidades teria igual probabilidade de ser selecionado (Martins, 2005 e 2009)
79
Martins (2009, p. 17) reforça a ideia: “A dimensão da amostra depende muito da variabilidade da população.”. Não obstante, o tamanho da população não é preponderante no dimensionamento da amostra.
Por outro lado, Vicente (2012) apresenta as frações amostrais pretendidas, de acordo com a dimensão da população. Para uma população com 150000 (N) elementos é necessária uma fração amostral (𝑓) de 0,01, sugere-se então 1500 residentes como o tamanho da amostra.
Por conseguinte, é certo que cada residente é único e diferente de todos os outros, mas existem limites nesta diversidade, portanto é possível descrever a população com um tamanho amostral mais reduzido.
b) Rigor pretendido
O cálculo do valor mínimo do tamanho da amostra (𝑛) pode ser obtido de acordo com o rigor desejado da estimativa. Quanto maior for o rigor pretendido maior terá de ser a dimensão da amostra, mas não à mesma proporção.
Existem várias formas de calcular o valor mínimo da amostra (𝑛), uma delas, recomendada por Hill e Hill (2005), envolve a seleção de uma variável do estudo, tendo em atenção a sua natureza.
Escolhendo uma variável do estudo, por exemplo, a influência da chancela no retorno
económico do residente59 (𝑋), permite estimar a proporção de residentes (𝑝) que foram
influenciados pela chancela UNESCO no seu retorno económico. É possível obter uma estimativa pontual para 𝑝, ou seja, 𝑝̂, conhecida a amostra e a sua dimensão da amostra
e a margem de erro ou precisão60.
Para estimar o valor de 𝑝, Thompson (2012), num cenário de amostragem aleatória
simples, descreve a forma de obter um valor mínimo para a dimensão da amostra (𝑛):
59 Variável dicotómica: 𝑋 = {1 𝑎𝑠𝑠𝑢𝑚𝑒 𝑎 𝑖𝑛𝑓𝑙𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐ℎ𝑎𝑛𝑐𝑒𝑙𝑎
0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑠𝑡𝑟á𝑟𝑖𝑜 . Um estimador da proporção (p) de residentes da amostra que afirmam sentir a influência do Estatuto do ADV, no seu retorno económico, define-se como 𝑝̂ =𝑟
𝑛, onde 𝑟 indica no número de residentes que assume
a influência do estatuto e 𝑛 a dimensão da amostra.
60 Margem de erro e a precisão (grau de variação de resultados) são conceitos relacionados: uma margem de erro elevada traduz um nível de
precisão baixo. Igualmente a margem de erro, o nível de confiança e tamanho da amostra caminham lado a lado. Para obter uma margem de erro e um nível de confiança é preciso conhecer o tamanho mínimo da amostra. Modificar qualquer um dos 3 parâmetros, altera os restantes: reduzir a margem de erro obriga a aumentar o tamanho da amostra; aumentar o nível de confiança obriga a aumentar o tamanho da amostra; aumentar o tamanho da amostra, reduz a margem de erro e incrementa o nível de confiança.
80
𝑛 ≥𝑧
2× 𝑝(1 − 𝑝)
𝑑2
(𝑑 a margem de erro ou 1 − 𝑑 o nível de confiança).
O valor de 𝑧 obtém-se de forma que: 𝑃(|𝑍| > 𝑧) = 𝑑, a probabilidade de o intervalo ter o verdadeiro valor da proporção (p) seja igual à margem de erro (d). Z é a variável
fulcral para 𝑝, com aproximação de 𝑍 à distribuição Normal61, 𝑍~𝑁(0,1), Tabela 3.4.
Tabela 3.4: Valores de 𝑧 mediante a margem de erro 𝑑
𝒅 (margem de erro) 0,01 0,05 0,1
𝒛 (quantis) 2,576 1,96 1,645
A Tabela 3.5 mostra a dimensão mínima da amostra com diferentes margens de erro e
várias proporções62. Constata-se que para margens de erro mais pequenas a dimensão
da amostra terá de ser muito elevada, mas para dados reais margens de erro muito pequenas são descartadas.
Tabela 3.5: Dimensão da amostra segundo margens de erro e proporções diferentes
Margem de erro Proporções 𝑑 p = 0,05 p=0,1 p=0,2 p=0,5 0,01 3152 5973 10 618 16 590 0,05 73 139 246 385 0,1 13 25 44 68 c) Regra do polegar
Esta regra permite estimar o tamanho mínimo da amostra de acordo com a análise estatística pretendida (Hill e Hill, 2005). No presente estudo é necessário recorrer a diversas técnicas de análise multivariada, obtendo-se vários tamanhos mínimos, devendo selecionar-se, sempre que possível, o maior deles.
Em todas as técnicas multivariadas referenciadas por Hill e Hill (2005) o número de variáveis envolvidas influencia o tamanho da amostra. Consideram a regra do polegar:
n=5k, onde 𝑛 representa o tamanho da amostra e 𝑘 o número de variáveis independentes.
61Sendo 𝑋
𝑖= "𝑅𝑒𝑠𝑖𝑑𝑒𝑛𝑡𝑒 𝑖𝑛𝑓𝑙𝑢𝑒𝑛𝑐𝑖𝑎𝑑𝑜 𝑐𝑜𝑚 𝑎 𝑐ℎ𝑎𝑛𝑐𝑒𝑙𝑎", tem-se 𝑋𝑖~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝), ∑𝑛𝑖=1𝑋𝑖~𝐵(𝑝, 𝑛), 𝑝 ∈]0,1[, para n elevado
(geralmente n>100), pelo Teorema do Limite Central tem-se, 𝑍 = 𝑋𝑛̅̅̅̅−𝑝
√𝑝(1−𝑝)𝑛
~𝑁(0,1).
81
Na presente dissertação, estando envolvidas cerca de 50 variáveis, descritas na secção 2.2, o tamanho mínimo é de:
𝑛 = 5 × 50 = 250.
Após o levantamento e análise das diferentes abordagens e em concordância com o objetivo do estudo, aplicação de técnicas multivariadas, optou-se pelo tamanho sugerido pela regra do polegar. A dimensão mínima da amostra é então de 250 residentes. Adicionalmente, com esta dimensão é possível obter uma estimativa segundo a proporção de residentes, com uma margem de erro de 0,05 (5%).
Para a aplicação de técnicas estatísticas simples o tamanho da amostra é suficiente para conseguir uma margem de erro aceitável, visto existir uma relação entre o tamanho da amostra e a margem de erro, como descrito em b).
3.5. Seleção da amostra
Entre setembro e novembro de 2014, procedeu-se à seleção da amostra pelos diversos concelhos que constituem o ADV, cada residente foi selecionado ao acaso. A recolha de dados foi morosa e complexa, contando com o apoio do Gabinete Técnico da Missão Douro, inserido na estrutura da sub-região de Vila Real da Comissão de Coordenação e Desenvolvimento Regional do Norte (CCDRN) para se criar um elo entre o entrevistador e o inquirido, viabilizando a seriedade do estudo.
82