• Nenhum resultado encontrado

Colecção de dados, população e amostra 19

3. MÉTODOS DA ESTATÍSTICA

3.1. Conceitos básicos

3.1.1. Colecção de dados, população e amostra 19

Os dados passíveis de tratamento pelos métodos quantitativos da Estatística encontram-se, em geral, agrupados por alguma característica ou substância comum ou por alguma similitude.

O conceito porventura mais básico da Estatística – e, seguramente, mais ge-ral na sua abrangência – remete para colecção de dados. Fala-se vagamente de colecção de dados para significar um conjunto de valores similares qual-quer que seja a forma como foram recolhidos (Murteira, 1993, p. 4). Trata-se de uma definição intrinsecamente vaga, podendo uma colecção de dados apresentar graus muito diferentes de características comuns, de homogenei-dade ou de interesse para o estudo ou para um processo de tomada de deci-são.

Outro conceito importante em Estatística refere-se a população (ou univer-so), que designa um conjunto de elementos com alguma característica co-mum e com potencial interesse para o estudo ou para a tomada de decisão.

Exemplos de população são o conjunto das empresas ou dos agregados fami-liares de determinada região e em determinado ponto no tempo ou os alunos do Ensino Superior frequentando, em determinado ano lectivo, um curso de engenharia em Portugal.

Uma população pode ser real (conjunto das idades dos referidos alunos de engenharia) ou hipotética (cotação de um título em bolsa amanhã).

Parale-Página 20 RESERVADO

lamente, pode ser finita (o caso dos alunos) ou infinita (o caso das cotações possíveis amanhã). (Murteira, 1993, p. 6)

Outra distinção importante remete para população objectivo e população in-quirida. Designa-se por população objectivo a totalidade dos elementos que estão sob estudo e para os quais se deseja obter determinado tipo de infor-mação. No entanto, por razões pragmáticas, nem sempre é possível inquirir essa população, tendo-se de incidir a investigação sobre outra população – a população inquirida – de alguma forma relacionada com a primeira. (Mur-teira, 1993, p. 6)

Por exemplo, o Inquérito ao Emprego promovido pelo Instituto Nacional de Estatística (INE) tem como população objectivo a população residente no es-paço nacional e como população inquirida os agregados domésticos e respec-tivos indivíduos residentes em alojamentos privados no espaço nacional (INE, 1999, pp. 31-32, 39).

Os elementos de uma população designam-se por unidades estatísticas. No exemplo anterior, cada residente no espaço nacional é uma unidade estatís-tica da população objectivo do Inquérito ao Emprego; por outro lado, cada agregado familiar residente em alojamento privado no espaço nacional, bem como todo o residente pertencente a um agregado nessas condições, consti-tuem as unidades estatísticas da respectiva população inquirida.

Quando os elementos, isto é, unidades estatísticas de uma população (inqui-rida) são, pelo seu reduzido número e/ou características, facilmente observá-veis, o trabalho de observação incide, muitas vezes, sobre todos os elementos da população. Por outro lado, mesmo quando a dimensão da população in-quirida é substancial e o trabalho de recolha de dados particularmente difí-cil, os propósitos da investigação (e os orçamentos previstos) podem prever a observação de todas as unidades estatísticas. Este tipo de investigação de-signa-se habitualmente por censo ou indagação completa, sendo os

Recense-RESERVADO Página 21

amentos Gerais da População (CENSOS) efectuados em todos os inícios de década pelo INE um bom exemplo.

No entanto, nem sempre por razões quer operatórias quer de propósitos (e orçamento) da investigação, a recolha de dados incide sobre todos os elemen-tos da população inquirida. Neste caso, o estudo das propriedades da popu-lação tem de ser feito sobre o seu subconjunto finito que se supõe ser repre-sentativo e se designa por amostra (Murteira, 1993, p. 8).

Evidentemente, a questão da representatividade é fulcral para que um sub-conjunto finito de uma população possa ser considerado como uma amostra.

Quando um determinado subconjunto não é representativo, ou seja, quando dá preferência a determinados elementos da população, o mesmo designa-se por amostra viciada ou enviesada e os resultados dele extraídos não espe-lham, evidentemente, as verdadeiras características da população inquirida (Murteira, 1993, pp. 8-9).

A questão da representatividade da amostra está, desta forma, intimamente relacionada com os critérios de selecção dos seus elementos a partir das uni-dades estatísticas da população inquirida. Amostras enviesadas pressu-põem, em geral, processos de escolha nos quais intervém o critério subjectivo do investigador. No entanto, o enviesamento pode resultar apenas do acaso, ou seja, pode estar presente em amostras construídas dando igual possibili-dade a todos os elementos da população em serem seleccionados. Uma amos-tra casual, isto é, seleccionada de acordo com o último critério, pode, eviden-temente, resultar representativa. (Murteira, 1993, p. 9.)

No referido exemplo do Inquérito ao Emprego do INE, a amostra (represen-tativa) é constituída por um subconjunto de 20747 alojamentos familiares privados, seleccionados a partir de uma “amostra-mãe” criada, por sua vez, a partir de dados recolhidos através do último Recenseamento Geral da Popu-lação (o CENSOS 91) (INE, 1999, p. 29). Notar que, por compromisso entre a redução do enviesamento, provocado pela manutenção dos mesmos

aloja-Página 22 RESERVADO

mentos na amostra durante um período prolongado de tempo, e o rápido es-gotamento da amostra, que poderia resultar da renovação da maioria dos alojamentos em cada período de inquirição (trimestre), são renovados 1/6 dos alojamentos em cada trimestre (INE, 1999, p. 39). Este tipo de renovação – comum em inquéritos que se prolongam por períodos sucessivos – designa-se rotação da amostra.

3.1.2. Variáveis

Uma variável é uma representação quantitativa de caracteres quantitativos ou qualitativos de uma colecção de dados.

Por exemplo, a variável “taxa de mortalidade infantil” é uma representação quantitativa do caracter quantitativo “número de óbitos” referente à colec-ção de dados nados-vivos nascidos em determinado ano e em determinado(s) espaço(s), expressa, em geral, em permilagem (1 por 1000).

A variável binária assumindo os valores 0 e 1 pode ser uma representação quantitativa do caracter qualitativo sexo dessa mesma colecção de dados (0 para as meninas, 1 para os meninos).

Este último exemplo é particularmente elucidativo do seguinte: independen-temente da natureza quantitativa ou qualitativa do caracter representado por uma determinada variável (qualitativa, no caso do exemplo), a mesma pode assumir valores quer quantitativos quer qualitativos: em vez de 0 e 1, o sexo poderia ser simplesmente representado pelas expressões qualitativas:

“Menina”/“Menino”, “Homem”/“Mulher”, “Feminino”/“Masculino” ou outras.

Transversalmente, as variáveis podem ainda ser classificadas como discre-tas ou contínuas. Uma variável discreta só pode assumir um número finito ou uma infinidade numerável de valores (trata-se do caso do último exemplo e, nomeadamente, de todas as variáveis assumindo qualidades). Em contra-ponto, uma variável contínua pode assumir qualquer valor dentro de um

in-RESERVADO Página 23

tervalo de números reais (o caso da taxa de mortalidade infantil, que assu-me habitualassu-mente qualquer valor no intervalo entre 1 e 1000).

Outra classificação igualmente importante do conceito de variável remete para o seu eventual carácter dependente ou independente. Esta classificação é usada quando se pretende explicar o comportamento de uma variável (ou seja, as suas variações de intensidade ou de valor) em função do comporta-mento de outra(s) variável(eis). A variável a explicar é designada como vari-ável dependente porque depende – é uma consequência – de outra(s). Parale-lamente, cada variável explicativa é designada como variável independente no sentido em que não depende de outras variáveis mas, de forma isolada ou em conjunto com outras eventuais variáveis independentes, assume-se como causa de outro fenómeno (operacionalizado através da variável dependente).

A referência anterior ao “comportamento” de uma variável sugere a distin-ção entre dois conceitos muitas vezes confundidos, erradamente: variável e observação. Este último, apesar de se referir sempre a uma determinada va-riável, espelha uma intensidade ou um valor do caracter da colecção de da-dos operacionalizado pela variável. Ou, dito de outro modo, as observações de uma variável destacam as variações de intensidade ou de valor existentes entre os caracteres quantitativos ou qualitativos representados pela variá-vel.

Por exemplo, as observações da variável “taxa de mortalidade infantil” refe-rente aos países da União Europeia (UE) e a 1995 encontram-se na segunda coluna do quadro seguinte:

Página 24 RESERVADO Países Taxa de Mortalidade Infantil

Unidade: Permilagem (1/1000)

UE – 15 5,6

Bélgica 6,1

Dinamarca 5,1

Alemanha 5,3

Grécia 8,1

Espanha 5,6

França 4,9

Irlanda 6,4

Itália 6,1

Luxemburgo 5,5

Holanda 5,5

Áustria 5,4

Portugal 7,5

Finlândia 3,9

Suécia 4,1

Reino Unido 6,2

Fonte: EUROSTAT

Quadro 1 – Taxas de mortalidade infantil na UE (1995)

RESERVADO Página 25

3.2. C

LASSIFICAÇÃO E REPRESENTAÇÃO GRÁFICA DE DADOS

Documentos relacionados