• Nenhum resultado encontrado

Parte I Análise Multivariada de Dados Qualitativos

2. Investigação por inquérito

2.2. As variáveis envolvidas

O inquérito inclui diversas variáveis, na sua maioria qualitativas com escalas nominais ou ordinais, categorizadas numericamente, agrupadas em 4 secções. As variáveis quantitativas são maioritariamente discretas.

A Tabela 2.1 descreve as variáveis socioeconómicas, a escala de medida e sua descrição. A natureza das variáveis é mista: 2 quantitativas discretas e 4 qualitativas nominais ou ordinais.

Tabela 2.1: Caracterização das variáveis socioeconómicas

Questão Variável Escala de medida Descrição da escala

1 Género Qualitativa nominal 1) Feminino; 2) Masculino

2 Estado civil Qualitativa nominal 1) Casado/união de facto; 2) Divorciado; 3) Solteiro; 4) Viúvo

3 Idade Quantitativa discreta Número inteiro 4 Habilitações escolares Qualitativa ordinal

1) 1.ºciclo; 2) 2.ºciclo; 3) 3.ºciclo; 4) Secundário; 5) Bacharelato ou licenciatura; 6) Mestrado; 7) Doutoramento

5 Rendimento mensal Qualitativa ordinal 1) Menos de 1000 €; 2) 1 000€ a 2 000€; 3) 2 000€ a 3 000€; 4) Mais de 3000€

6 Dimensão familiar Quantitativa discreta Número inteiro

A avaliação dos benefícios económicos dos residentes com a chancela UNESCO obtém-se na primeira secção. Este tópico envolve 8 questões, com 15 variáveis: quantitativas discretas; qualitativas nominais e ordinais (Tabela 2.2).

Tabela 2.2: Caracterização das variáveis relativas ao benefício económico

Questão Variável Escala de medida Descrição da escala

1 Residência Qualitativa nominal 1) Cima Corgo; 2) Baixo Corgo; 3)

Douro Superior

2 Tempo na atual morada (anos) Quantitativa discreta Número de anos

3 Naturalidade Qualitativa nominal 1)Dentro do ADV; 2) Fora

4

Situação profissional Qualitativa nominal 1) Empregado; 2) Desempregado; 3) Doméstica; 4) Reformado; 5) Estudante; 6) Outro

5 Profissão principal

Duração no atual emprego (anos)

Qualitativa nominal Quantitativa discreta

1)Sector primário; 2) Sector secundário; 3) Sector terciário.

6 Local de trabalho Qualitativa nominal 1) Dentro do ADV; 2) Fora do ADV

7

Influência do estatuto: na escolha da residência; no exercício da profissão; no retorno económico.

Qualitativa nominal 1)Sim; 2) Não

8

Setor de atividade

Situação Qualitativa nominal

1) Vitivinicultura; 2) Comércio;3) Turismo; 4) Outros

1) Proprietário; 2) Por conta de outrem Perceção do proprietário: Retorno

económico Oferta

Qualitativa ordinal 1) Muito menor; 2) Menor; 3) O mesmo; 4) Maior; 5) Muito maior

73

Procura

A análise dos gastos e investimentos devidos à chancela que o residente efetuou no período 2001-2014 (secção II - Custos) é constituída por 4 questões com 4 variáveis cada, 3 quantitativas contínuas e 1 qualitativa nominal dicotómica, conforme a Tabela 2.3.

Tabela 2.3: Caracterização das variáveis relativas aos Custos com a chancela

Questão Variável Escala de medida Descrição da escala

1 Muros de xisto

- Gastos próprios

- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do

investimento com a chancela Qualitativa nominal 1) Sim; 2) Não

2 Imóveis

- Gastos próprios

- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do

investimento com a chancela Qualitativa nominal 1) Sim; 2) Não

3 Plantação/ Replantação de

vinha

- Gastos próprios

- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do

investimento com a chancela

Qualitativa nominal

1) Sim; 2) Não

4 Outros gastos

- Gastos próprios

- Gastos provenientes de fundos Quantitativa contínua Número (valor em euros) - Avaliação da ligação do

74

A Tabela 2.4 apresenta as variáveis da secção 3, correspondentes a duas questões (os benefícios com 10 e os problemas com 6 variáveis). As variáveis são todas qualitativas ordinais, traduzem o grau de concordância dos residentes sobre os indicadores relativos ao impacto da inclusão do ADV na lista da UNESCO.

Tabela 2.4: Caraterização das variáveis relativas à perceção dos residentes sobre benefícios e problemas que

trouxe a inclusão do ADV

Questão Variável Acrónimo Escala de medida Descrição da escala

1 Benefícios

- Oportunidades para a família desfrutar - Boa imagem para a região

- Maior envolvimento da comunidade - Orgulho na região

- Preservação do património cultural - Entrada de capital para a região - Novos visitantes - Investimento na região - Criação de emprego - Valorização imobiliária B1 a B10 Qualitativa ordinal 1) Discordo completamente; 2) Discordo; 3) Nem concordo nem discordo; 4) Concordo; 5) Concordo plenamente

2 Problemas

- Aumento da sazonalidade - Aumento do custo de vida - Congestionamento - Pessoas estranhas - Segurança nas ruas - Restrições de uso importantes

75

3. Amostragem

O estudo recai nos residentes do ADV. Dada a impossibilidade de conhecer a opinião de todos os elementos da população alvo, considera-se uma parte representativa da população alvo, uma amostra.

A constituição desta é uma opção assertiva, porém a sua seleção exige cautela, é fundamental a intervenção do acaso (Martins, 2005). Para ocorrer uma generalização viável, com resultados

robustos é fundamental respeitar a representatividade51 da população alvo. Uma representação

“honesta” da população conduz à estimação das caraterísticas da população alvo com grande precisão.

A Figura 3.1 descreve as etapas de seleção da amostra ou plano amostral (Vicente, 2012), para descrever com fiabilidade a totalidade da população alvo.

Figura 3.1: Plano amostral

Fonte: Vicente (2012)

3.1. População alvo

A população alvo é o conjunto de elementos que verificam determinadas especificações e a respeito da qual se pretende conhecer uma ou mais caraterísticas (Vicente, 2012).

Os elementos (ou indivíduos) da população em estudo são os residentes do ADV, sendo considerada a totalidade dos 13 concelhos. De acordo com os Censos de 2011, nos 13 concelhos

51 A representatividade implica que os resultados obtidos pela amostra e a população em estudo sejam semelhantes. Uma amostra ideal deve

ser um microcosmo do Universo (Hill e Hill, 2005).

1 • Definir a população alvo 2 • Especificar a base de sondagem 3 • Escolher o método de amostragem 4 • Determinar a dimensão da amostra 5 • Selecionar os elementos da amostra

76

do ADV, residem 168 542 habitantes que representam 82% da população duriense, 4,6% do norte e 1,6% de Portugal. O concelho com maior número de residentes é o de Vila Real (51 850) e com menor número é o de Mesão Frio (4 433 residentes), conforme Tabela 3.1.

Tabela 3.1: Número de habitantes por concelho do ADV

Concelho Número de habitantes

Alijó 11 942 Armamar 6 297 Carrazeda de Ansiães 6 373 Lamego 26 691 Mesão Frio 4 433 Peso da Régua 17 131

São João da Pesqueira 7 874

Sabrosa 6 361

Santa Marta de Penaguião 7 356

Tabuaço 6 350

Torre de Moncorvo 8 572 Vila Nova de Foz Côa 7 312

Vila Real 51 850

Total 168 542

Fonte: Elaboração própria com dados dos Censos 2011

No universo de 168 542 habitantes, 80 462 são do género masculino, representando 48% da população do ADV.

A distribuição etária é desigual nas diversas faixas52: 13% dos residentes têm menos de 15 anos;

11% têm entre 15 e 24 anos; 53% entre 25 e 64 anos e 23% têm mais de 64 anos. Como o estudo recai sobre os residentes com mais de 18 anos, a dimensão da população em estudo diminui 11%, sendo constituída por 150 000 indivíduos, aproximadamente.

Quanto à escolaridade dos residentes, com mais de 15 anos, destaca-se que a maioria tem habilitações até ao 3.ºciclo (60%) e ainda existem 15% de residentes sem qualquer nível de instrução (Tabela 3.2).

Tabela 3.2: Distribuição dos residentes do ADV com mais de 15 anos por nível de escolaridade completo mais

elevado

Nível de escolaridade N.º de habitantes Frequência relativa (%)

Nenhum 22 149 15,2% 1.ºciclo 46 838 32,2% 2.ºciclo 17 570 12,1% 3.ºciclo 23 362 16,1% Ensino Secundário 19 231 13,2% Ensino Superior 16 302 11,2% Total 146 365 100%

52 Facto justificado pelo problema demográfico nacional, designadamente o agravamento do envelhecimento da população (Em Portugal cerca

de 19% da população tem 65 ou mais anos de idade), e pela diferente amplitude dos intervalos, levando a uma maior concentração de residentes na faixa com maior amplitude, 25 a 64 anos. (INE, Censos, 2011)

77

Fonte: Elaboração própria com dado dos censos 2011 e do PORDATA (junho de 2015)

Segundo os Censos (2011), nos concelhos do ADV a população ativa é de 70 987 indivíduos, representando 42% dos residentes. Os residentes empregados (62 278) distribuem-se pelos três setores de atividade: 14% primário, 19% secundário e 67% terciário. Para este valor contribui o peso dos serviços nos centros urbanos, nomeadamente Vila Real com 41%.

Analisando o concelho mais representativo no ADV, São João da Pesqueira, verifica-se uma distribuição diferente: 41% primário, 16% secundário e 43% terciário. Neste, a atividade

económica predominante é a agricultura53, concretamente a vitivinicultura, como referencia o

Recenseamento Nacional da Agricultura (2009).

3.2. Base da sondagem

A base da sondagem é uma representação da população (Vicente, 2012) que nos auxilia na seleção da amostra, formulando uma listagem com todos os elementos da população em estudo. Na presente investigação, o registo de toda a população duriense numa listagem seria uma tarefa difícil, com tempo e custo excessivos, na medida em que não existe o registo dos indivíduos ou

agregados familiares disponíveis em Portugal54. Dada esta impossibilidade, a seleção das

unidades da amostra (residentes) passa a ser um trabalho de terreno, que acontece em simultâneo com a última etapa do plano amostral, o contacto com os inquiridos.

3.3. Processo de amostragem

O método de amostragem vem dar resposta a uma das questões que surge no início do plano amostral: “como selecionar a amostra?”. A adoção de um método de amostragem, para a escolha dos elementos que constituem a amostra, é vantajosa, permite minimizar os erros associados, evitando o enviesamento, e potencia maior rapidez no apuramento dos resultados. Decide-se quais e como devem ser recolhidos os dados, tendo presente o princípio da

aleatoriedade55 (Martins, 2005), reunindo assim uma amostra aleatória. Mas, na prática, muitas

vezes é difícil prezar todas as condições teóricas subjacentes.

53 Os Censos não contabilizam os trabalhadores agrícolas, classificados como domésticas, reformados e ativos que possuem outra atividade

profissional, tornando o peso real do setor primário muito superior.

54 O Recenseamento da Geral da População, realizado pelo Instituto Nacional de Estatística, permite fazer este levantamento, mas este tipo

dados não é disponibilizado para este tipo de estudos.

78

O método de amostragem aleatória é o que permite obter uma amostra com as caraterísticas

referidas, de onde subsistem várias técnicas56. Um exemplo é a amostragem aleatória simples57,

é contemplada em diversos planos amostrais, trata-se da técnica mais simples, mas pode ser inviável devido às condições de aplicabilidade, a inexistência de uma listagem com o nome dos residentes do ADV ou a presença de todos os elementos da população no momento da inquirição.

As condições de aplicabilidade das diversas técnicas na amostragem aleatória tornam difícil a sua implementação, portanto teve-se em conta a sensibilidade e a experiência do entrevistador sobre a temática e a população alvo em estudo, não intervindo no fenómeno “ao acaso”.

Garantiu-se a representatividade58 da população tendo em atenção os seguintes aspetos: evitou-

se a resposta voluntária; considerou-se a estratificação do ADV por concelho, dando preferência aos mais representativos; escolheram-se os melhores pontos de amostragem.

Nesta sequência, considera-se que na seleção das unidades amostrais se preservou a aleatoriedade, no sentido em que todos os elementos da população tiveram alguma probabilidade de serem selecionados.

3.4. Dimensão da amostra

Dimensionar a amostra é definir o número mínimo de elementos necessários à validade das conclusões do estudo. Não há uma resposta simples, existindo diversas abordagens sobre este tema. Neste tópico, são referidas algumas das abordagens sugeridas na literatura, por diversos autores.

Para o cálculo do valor mínimo da amostra são ponderadas: a) caraterísticas da população (heterogeneidade e dimensão); b) o rigor pretendido para os resultados; c) regra do polegar.

a) Caraterísticas da população alvo

A heterogeneidade e a dimensão da população influenciam o tamanho da amostra. Quanto mais heterogéneas forem as caraterísticas da população maior terá de ser a dimensão da amostra, para que seja captada a diversidade das caraterísticas em estudo.

56 São exemplos a Amostragem aleatória simples, sistemática, estratificada, com reposição e por grupos (Clusters). Para mais detalhe remete-

se para Eugénia Martins (2009).

57 Dada uma população, uma amostra aleatória simples de dimensão 𝑛 é um conjunto de 𝑛 unidades da população, tal que qualquer outro

conjunto de 𝑛 unidades teria igual probabilidade de ser selecionado (Martins, 2005 e 2009)

79

Martins (2009, p. 17) reforça a ideia: “A dimensão da amostra depende muito da variabilidade da população.”. Não obstante, o tamanho da população não é preponderante no dimensionamento da amostra.

Por outro lado, Vicente (2012) apresenta as frações amostrais pretendidas, de acordo com a dimensão da população. Para uma população com 150000 (N) elementos é necessária uma fração amostral (𝑓) de 0,01, sugere-se então 1500 residentes como o tamanho da amostra.

Por conseguinte, é certo que cada residente é único e diferente de todos os outros, mas existem limites nesta diversidade, portanto é possível descrever a população com um tamanho amostral mais reduzido.

b) Rigor pretendido

O cálculo do valor mínimo do tamanho da amostra (𝑛) pode ser obtido de acordo com o rigor desejado da estimativa. Quanto maior for o rigor pretendido maior terá de ser a dimensão da amostra, mas não à mesma proporção.

Existem várias formas de calcular o valor mínimo da amostra (𝑛), uma delas, recomendada por Hill e Hill (2005), envolve a seleção de uma variável do estudo, tendo em atenção a sua natureza.

Escolhendo uma variável do estudo, por exemplo, a influência da chancela no retorno

económico do residente59 (𝑋), permite estimar a proporção de residentes (𝑝) que foram

influenciados pela chancela UNESCO no seu retorno económico. É possível obter uma estimativa pontual para 𝑝, ou seja, 𝑝̂, conhecida a amostra e a sua dimensão da amostra

e a margem de erro ou precisão60.

Para estimar o valor de 𝑝, Thompson (2012), num cenário de amostragem aleatória

simples, descreve a forma de obter um valor mínimo para a dimensão da amostra (𝑛):

59 Variável dicotómica: 𝑋 = {1 𝑎𝑠𝑠𝑢𝑚𝑒 𝑎 𝑖𝑛𝑓𝑙𝑢ê𝑛𝑐𝑖𝑎 𝑑𝑎 𝑐ℎ𝑎𝑛𝑐𝑒𝑙𝑎

0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑠𝑡𝑟á𝑟𝑖𝑜 . Um estimador da proporção (p) de residentes da amostra que afirmam sentir a influência do Estatuto do ADV, no seu retorno económico, define-se como 𝑝̂ =𝑟

𝑛, onde 𝑟 indica no número de residentes que assume

a influência do estatuto e 𝑛 a dimensão da amostra.

60 Margem de erro e a precisão (grau de variação de resultados) são conceitos relacionados: uma margem de erro elevada traduz um nível de

precisão baixo. Igualmente a margem de erro, o nível de confiança e tamanho da amostra caminham lado a lado. Para obter uma margem de erro e um nível de confiança é preciso conhecer o tamanho mínimo da amostra. Modificar qualquer um dos 3 parâmetros, altera os restantes: reduzir a margem de erro obriga a aumentar o tamanho da amostra; aumentar o nível de confiança obriga a aumentar o tamanho da amostra; aumentar o tamanho da amostra, reduz a margem de erro e incrementa o nível de confiança.

80

𝑛 ≥𝑧

2× 𝑝(1 − 𝑝)

𝑑2

(𝑑 a margem de erro ou 1 − 𝑑 o nível de confiança).

O valor de 𝑧 obtém-se de forma que: 𝑃(|𝑍| > 𝑧) = 𝑑, a probabilidade de o intervalo ter o verdadeiro valor da proporção (p) seja igual à margem de erro (d). Z é a variável

fulcral para 𝑝, com aproximação de 𝑍 à distribuição Normal61, 𝑍~𝑁(0,1), Tabela 3.4.

Tabela 3.4: Valores de 𝑧 mediante a margem de erro 𝑑

𝒅 (margem de erro) 0,01 0,05 0,1

𝒛 (quantis) 2,576 1,96 1,645

A Tabela 3.5 mostra a dimensão mínima da amostra com diferentes margens de erro e

várias proporções62. Constata-se que para margens de erro mais pequenas a dimensão

da amostra terá de ser muito elevada, mas para dados reais margens de erro muito pequenas são descartadas.

Tabela 3.5: Dimensão da amostra segundo margens de erro e proporções diferentes

Margem de erro Proporções 𝑑 p = 0,05 p=0,1 p=0,2 p=0,5 0,01 3152 5973 10 618 16 590 0,05 73 139 246 385 0,1 13 25 44 68 c) Regra do polegar

Esta regra permite estimar o tamanho mínimo da amostra de acordo com a análise estatística pretendida (Hill e Hill, 2005). No presente estudo é necessário recorrer a diversas técnicas de análise multivariada, obtendo-se vários tamanhos mínimos, devendo selecionar-se, sempre que possível, o maior deles.

Em todas as técnicas multivariadas referenciadas por Hill e Hill (2005) o número de variáveis envolvidas influencia o tamanho da amostra. Consideram a regra do polegar:

n=5k, onde 𝑛 representa o tamanho da amostra e 𝑘 o número de variáveis independentes.

61Sendo 𝑋

𝑖= "𝑅𝑒𝑠𝑖𝑑𝑒𝑛𝑡𝑒 𝑖𝑛𝑓𝑙𝑢𝑒𝑛𝑐𝑖𝑎𝑑𝑜 𝑐𝑜𝑚 𝑎 𝑐ℎ𝑎𝑛𝑐𝑒𝑙𝑎", tem-se 𝑋𝑖~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝), ∑𝑛𝑖=1𝑋𝑖~𝐵(𝑝, 𝑛), 𝑝 ∈]0,1[, para n elevado

(geralmente n>100), pelo Teorema do Limite Central tem-se, 𝑍 = 𝑋𝑛̅̅̅̅−𝑝

√𝑝(1−𝑝)𝑛

~𝑁(0,1).

81

Na presente dissertação, estando envolvidas cerca de 50 variáveis, descritas na secção 2.2, o tamanho mínimo é de:

𝑛 = 5 × 50 = 250.

Após o levantamento e análise das diferentes abordagens e em concordância com o objetivo do estudo, aplicação de técnicas multivariadas, optou-se pelo tamanho sugerido pela regra do polegar. A dimensão mínima da amostra é então de 250 residentes. Adicionalmente, com esta dimensão é possível obter uma estimativa segundo a proporção de residentes, com uma margem de erro de 0,05 (5%).

Para a aplicação de técnicas estatísticas simples o tamanho da amostra é suficiente para conseguir uma margem de erro aceitável, visto existir uma relação entre o tamanho da amostra e a margem de erro, como descrito em b).

3.5. Seleção da amostra

Entre setembro e novembro de 2014, procedeu-se à seleção da amostra pelos diversos concelhos que constituem o ADV, cada residente foi selecionado ao acaso. A recolha de dados foi morosa e complexa, contando com o apoio do Gabinete Técnico da Missão Douro, inserido na estrutura da sub-região de Vila Real da Comissão de Coordenação e Desenvolvimento Regional do Norte (CCDRN) para se criar um elo entre o entrevistador e o inquirido, viabilizando a seriedade do estudo.

82