Manual_Analise_Dados_Quantitativos_Martins (1).pdf

(1)

Este Manual constitui-se como uma ferr~mc•n+' ajuda a colocar em marcha o processo de análise quantitativos, tomando como ponto de partida questõ investigação pré-formuladas e culminando com a atvutcJac científica dos resultados obtidos.

É, portanto, seu objetivo ajudar alunos, investigadores e profissionais das Áreas das Ciências Sociais e Humanas a Saber Decidir qual a técnica de análise de dados adequada para a hipótese de investigação em questão, bem como para as variáveis que a integram, Saber Fazer a técnica de análise escolhida recurso ao IBM SPSS; Saber Interpretar os resultados o

à

luz da hipótese de investigação em causa; Saber resultados obtidos no contexto de um artigo uma monografia, ou dissertação de mestrado seguindo as normas da 6a Edição do Man

n Psychological Association

~ PSIQI,JILIBRIOS V'EDIÇOES

MANUAL DE ANÁLISE DE

DADOS QUANTITATIVOS

COM RECURSO AO IBM®SPSS®

SABER DECIDIR, FAZER, INTERPRETAR E REDIGIR

~ PSIQI,JILIBRIOS V'EDIÇOES

(2)

ANUAL DE ANÁLISE DE

ADOS QUANTITATIVOS

OM RECURSO AO IBM

PSS

ABER DECIDIR, FAZER,

TERPRETAR E REDIGIR

arla Martins é doutorada em Psicologia

la Universidade de Reading (Inglaterra]. de previamente fez o seu Mestrado em

é todos de Investigação e Análise de Dados

antitativos.

Professora Auxiliar no Departamento de icologia Básica da Escola de Psicologia da

iversidade do Minha. onde, desde o ano tivo de 2003/2001,, leciona várias Unidades Jrriculares nos domínios da Metodologia

Investigação e Análise de Dados antitativos a alunos de Mestrado Integrado Doutoramento em Psicologia.

ra além da investiga~ão no domínio da

icologia do Desenvolvimento, apeia vários

ojetos de investigação noutras áreas ao

el da análise de dados quantitativos.

'\:'~ PSIQVILIBRIOS '\; EDIÇOES

MANUAL DE ANÁLISE DE

DADOS QUANTITATIVOS

COM RECURSO AO IBM·spss·:

SABER DECIDIR, FAZER, INTERPRETAR E REDIGIR

~ PSIQVILIBRIOS

"\?'

EDIÇOES

(3)

Coleção Título Autora Coordenação da Coleção Copyright Revisão Composição, impressão e acabamentos Capa Distribuição e Encomendas la Edição ISBN Depósito Legal FICHA TÉCNICA . Investigação em Psicologia

Manual de Análise de Dados Quantitativos com recurso ao IBM0 _SPSS0_:_{Saber decidir, fazer,}

interpretar e redigir Carla Martins Leandro S. Almeida

© Psiquilíbrios Edições Silvia Fernandes Candeias Artes Gráficas Braga I www.candeiasag.com Miguel Candeias Psiquilíbrios Edições Braga I Portugal Tel. 253 284 517 I 964 145 134 I 936 602 041 editora@psiquilibrios.pt www.psiquilibrios.pt Julho de 2011 978-989-8333-08-7 330389/11

A PSE na qualidade de representante para Portugal da SPSS Inc. autorizou a utilização dos elementos SPSS na produção deste livro.

IBM®SPSS® é uma marca registada da IBM Corporation.

Nenhuma parte desta publicação pode ser

reproduzida por qualquer meio sem prévia autorização da editora por escrito.

Respeite os direitos de autor. A fotocópia é crime.

'

Indice

Introdução ... .

Capítulo 1. Metodologia de Investigação e Análise de Dados Quantitativos

1.1. Introdução ... .. 1.2. Metodologia de Investigação e Análise de Dados ... . 1.3. Variáveis ... , 1.4. Técnicas de Análise de Dados Quantitativos ... . 1.5. Conclusão e Próximo Capítulo ...

4 . : ...•.••.•.•.. · · · Capítulo 2. Construção de Ficheiros de Dados de' Qualidade no IBM' SPSS•

2.1. Introdução ... . 2.2. Data Editor, Data View e Variable View . ... .

2.3. Construção de um Ficheiro de Dados.. .. . . .. .. .. . .. .. .. . .. .. .. .. .. ... .

2.4. Introdução à Análise de Dados no IBM• SPSS0 : Output e Syntax . ....

2.5. Conclusão e Próximo Capítulo . . . . ... .

Capítulo 3. Estatística Descritiva

3.1. Introdução ... .

3.2. Medidas de Tendência Central e de Dispersão ... .

3.2.1. Medidas de Tendência Central e de Dispersão para Variáveis Nominais: Moda (Mode) e Frequências (Frequencies) ... . 3.2.2. Medidas de Tendência Central e de Dispersão para Variáveis Ordinais:

Mediana (Median) e Intervalo Interquartfiico (Interquartile Range) ... . 3.2.3. Medidas de Tendência Central e de Dispersão para Variáveis Intervalares: Média (Mean) e Desvio-padrão (Standard Deviation) ... .

3.3. Representação Gráfica ... .

3.3.1. Gráfico Circular (Pie Chart) ... .

3.3.2. Gráfico de Barras (Bar Chart) ... .

3.3.3. Histograma (Histogram) ... ..

3.4. O Papel das Medidas Descritivas na Construção de Ficheiros de

Dados de Qualidade ... .. 3.5. Conclusão e Próximo Capítulo ... .

Capítulo 4. Estatística Inferencial

4.1. Introdução ... .. 4.2. Probabilidades Estatísticas ... .. 4.3. Erros Estatísticos ... . 4.4. Questões de Investigação e Processo de Tomada de Decisão na Seleção do

Teste Estatístico a Utilizar ... . 4.4.1. Testes de Associação ... .

4.4.1.1. Coeficiente de Correlação de Pearson (Pearson Correlation

Coefficient, r) (2 variáveis intervalares) no IBM• SPSS• ... . 4.4.1.2. Coeficiente de Correlação de Spearman (Spearman Correlation

Coefficíent, rs) (2 variáveis ordinais ou 1 variável ordinal e

1 intervalar) no IBM• SPSS• ... . 3 5 11 11 16 20 21 25 25 29 40 41 45 45 48 55 58 65 66 76 81 86 87 91 91 96 97 99 102 111

(4)

4.4.1.3. Coeficiente de Correlação Ponto~Bisserial (Point~Biserial Correlation Coefficient, rpv) (1 variável intervalar e 1 variável nominal)

no IBM® SPSS0 ....

4.4.1.4. Teste de Qui-Quadrado (Chi-Square Test,

x')

(2 variáveis nominais

ou 1 variável nominal e 1 ordinal) no IBM0 _SPSS_{0 ... .} 4.4.2._ Testes de Diferenças . . . . ... .

4.4.2.1. Testes de Diferenças em Contexto de Design Inter~Sujeitos ... .

4.4.2.1.1. Teste T para Amostras Independentes (t test for independent

samples, t) (Design inter-sujeitos, 2 grupos independentes, variável dependente intervalar} no IBM0 _{SPSS® ... .}

4.4.2.1.2. Teste de Mann-Whitney (Mann-Whitney Test, U) (Design

inter~sujeitos, 2 grupos independentes, variável

dependente ordinal) no IBM® SPSS® . . . . . ... .

4.4.2.1.3. Análise de Variância (ANOVA) Unifactorial (One-Way

Analysis of Variance, F} (Design inter-sujeitos, 3 ou mais grupos independentes, variável dependente intervalar)

no IBM0 _SPSS_{0 .. .} _{.. . . ..}

4.4.2.1.4. Teste de Kruskal-Wallis (Kruskal-Wallis Test,

x')

(Design

inter~sujeitos, 3 ou mais grupos independentes, variável

dependente ordinal) no IBM• SPSS0 ... .

4.4.2.2. Testes de Diferenças em Contexto de Design Intra-Sujeitos

4.4.2.2.1. Teste T para amostras emparelhadas (t test for paired

samples, f) (Design intra-sujeitos, 2 momentos temporais, variável dependente intervalar) no IBM® SPSS® ... .

4.4.2.2.2. Teste de Wilcoxon (Wilcoxon Test, Z) (Design intra-sujeitos,

2 momentos temporais, variável dependente ordinal)

no IBM0 _SPSS0 _{. . . .} 4.4.2.2.3. Análise de Variância (ANOVA) para Medidas Repetidas

(Repeated Mensures Analysis of Variance, F) (Desígn

intra~sujeitos, 3 ou mais momentos temporais, variável

dependente intervalar) no IBM0 _SPSS0 _{. . . .}

4.4.2.2.4. Teste de Friedman (Fríedman Test,

x')

(Desígn intra-sujeitos,

3 ou mais momentos temporais, variável dependente

ordinal) no IBM• SPSS• 4.5. Nota Final. ....

4.6. Conclusão e Próximo Capítulo .... Capítulo 5. Análise Exploratória de Dados

5.1. Introdução . .. . . .. .. .. .. . . . . . ... .

5.2. A Importância da Análise da Distribuição das Variáveis Intervalares

na Amostra em Estudo . . . . . ... .

5.3. Pressupostos Subjacentes à Utilização de Testes Paramétricas . . . . . ... .

5.3.1. Normalidade da(s) Distribuição(ões) .... .

5.3.2. Homogeneidade das Variâncias . . . ... . 5.3.3. Transformação de Variáveis Intervalares no IBM0 _SPSS® 5.4. Conclusão ... . Capítulo 6. Conclusão ... . Bibliografia ... 116 121 132 134 135 141 150 161 173 175 180 185 197 208 208 211 211 218 221 229 234 240 241 245

,,

INTRODUÇÃO

Este Manual nasce da conjunção de três fatores: desafio, desejo e vontade.

Desafio lançado, há cerca de 10 anos, pela minha colega e amiga Carla Machado para que, em parceria, escrevêssemos um manual sobre metodologia de investigação e análise de dados qualitativos e quantitativos para alu,nos de graduação e pós-graduação.

Por variados motivos, esse manual não foi produzido ... No entanto, a "semente" ficou,

nascendo agora este, centrado unicamente na análise de dados quantitativos.

Desejo pessoal, que foi crescendo durante os últimos cinco anos, de escrever um manual que fosse distinto dos seus congêneres. Um manual que ensinasse, não apenas análise de dados com recurso ao IBM® SPSS®, mas que, e acima de tudo, colmatasse duas áreas em que, ao longo dos últimos anos, me fui apercebendo que os alunos do 1 ", 2°, e até 3" ciclos apresentam dificuldades e vulnerabilidades: a transição das hipó-teses de investigação para a seleção dos testes estatísticos adequados para a sua testagem, e, ainda, a tradução dos outputs do IBM® SPSS® no relato científico dos resultados ob-tidos. Este Manual foi pensado e concebido para preencher essas duas lacunas.

Vontade, por parte do Psiquilíbrios Edições, de publicar um manual sobre análise de dados que, de alguma forma, fosse a consequência natural do "Metodologia de Investigação em Psicologia e Educação", dos meus colegas Professor Doutor Leandro de Almeida e Doutora Teresa Freire.

Este Manual inicia com dois capítulos que organizam os alicerces para o seu objetivo principal. No Capítulo 1, são apresentados os conceitos centrais de metodologia de investigação fundamentais para a compreensão do processo de análise de dados quan-titativos. Por sua vez, o Capítulo 2 constitui a introdução ao software estatístico que serve de veículo para a transmissão dos conhecimentos - o IBM® SPSS®, atualmente

disponível na versão 19.0. Nos três capítulos seguintes, apresentamos o cerne deste

Manual- Estatística Descritiva (Capítulo 3), Estatística lnferencial (Capítulo 4) e Análise Exploratória de Dados (Capítulo 5). O Capítulo 6 finaliza o Manual com uma série de reflexões e sugestões para estudantes e investigadores.

Como o próprio nome indica, este Manual constitui-se como uma ferramenta

prá-tica que ajuda a colocar em marcha o processo de análise de dados quantitativos, à luz

das questões de investigação pré-formuladas, culminando com a divulgação científica dos resultados obtidos.

(5)

Manual de Análise de Dados Quantitativos com recurso ao IBM® SPS$0

Termino com os agradecimentos, por ordem cronológica, às pessoas que me apoia-ram na subida dos diversos degraus que me permitiapoia-ram chegar hoje ao produto final que é este Manual.

À Professora Doutora Isabel Soares, pelo incentivo para seguir o meu sonho de estudar Estatística aplicada à Psicologia.

To Dr. Elizabeth Gaffan, my Stats Lecturer at the University of Reading and, most of all, a role model in the quantitative research area.

Ao Professor Doutor Leandro de Almeida, responsável científico pela Coleção In-vestigação em Psicologia do Psiquilíbrios Edições e meu eterno Mestre na área da meto-dologia de investigação e análise de dados quantitativos.

À Dra. Vera Ramalho, responsável pelo Psiquilíbrios Edições, por me propor e me dar total liberdade para desenvolver este Manual nos moldes em que eu o queria escre-ver.

À IBM• SPSS• Internacional, na pessoa do seu Representante Nacional, Dr. João Pequito, pela resposta célere ao meu pedido de licença para utilizar os

screen shots

de menus,

syntaxes

e

outputs

dos IBM• SPSS•, bem como pelo esclarecimento de todas as dúvidas que me foram surgindo ao longo da preparação deste Manual.

À Doutora Carla Machado, pela leitura atenta e críticas construtivas aos vários capítulos.

À Doutora Ana Osório e à Dra. Marisa Fonseca, pela generosidade com que fize-ram uma revisão tão cuidada e minuciosa do Manual da primeira à última palavra.

Aos meus alunos, pelas dúvidas que, ao longo da última década, me foram colo-cando e me fizeram pensar em formas alternativas de transmissão de conceitos e conhe-cimentos.

A todos os leitores que, futuramente, me fizerem chegar comentários ou sugestões relativas a este Manual. Porque é sempre possível melhorar.

Ao João por me ter proporcionado os meios para ir mais longe e ter amortecido o primeiro confronto com uma nova realidade ... este Manual prova que valeu a pena!

À minha Família, por tudo o que não se consegue colocar em palavras. Em parti-cular, às minhas filhas, Mariana e Catarina, pelo entusiasmo e orgulho com que recebe-ram a notícia de que a mãe tinha acabado de escrever 1

'o livro" ...

6

A

Carla,

Pela Inspiração, Amizade, Saudade

(6)

Capítulo 1

Metodologia da Investigação e

(7)

1.1. Introdução

Na raiz da análise de dados quantitativos, há vários conceitos de metodologia da investigação que se torna necessário definir à partida e aos quais recorreremos ao longo

de todo o Manual. É, desde logo, importante que o leitor interiorize que o domfnio

teórico e prático de conceitos de metodologia da investigação quantitativa é fundamen-tal para que não se cometam erros na seleção e utilização de técnicas de análise de dados e subsequente interpretação dos resultados obtidos.

O objetivo deste capítulo é introduzir os concei.tos de metodologia da investigação relevantes para a análise de dados quantitativos.

1.2. Metodologia da Investigação e Análise de Dados Quantitativos

Metodologia da investigação e análise de dados não são duas áreas independentes, mas sim interdependentes. Se não, vejamos: Numa investigação, há oito passos que devem ser seguidos, desde a definição de um problema até à divulgação dos resultados

obtidos no estudo levado a cabo para o investigar (Almeida & Freire, 2008).

Concreta-mente, os passos são:

1.0 _{Definição de um Problema e/ ou Questão de Investigação;}

Z.O Revisão Bibliográfica;

3.' Formulação das Hipóteses;

4." Definição do Plano ou Design da Investigação;

5.' Recolha dos Dados; 6. o Análise dos Dados;

7. o Interpretação dos Resultados Obtidos e a sua Integração no Respetivo Domínio de

Investigação;

8. o Divulgação dos Resultados.

Assinalados a itálico estão os passos diretamente relacionados com o momento da

análise dos dados (6.' passo). Desde logo, fica claro que a preocupação com a análise dos dados deve começar antes mesmo da sua recolha, mais especificamente no

momen-to da formulação das hipóteses (3.0 _passo).

Para ilustrarmos as estreitas relações entre metodologia da investigação e análise de dados, ao longo deste e dos restantes capítulos, trabalharemos em torno de três exemplos de questões de investigação. A saber:

1. A ansiedade face a exames está relacionada com a dificuldade da matéria em avaliação?

(8)

Manual de Análise de Dados Quantitativos com recurso ao IBM® SPSS®

2. Há diferenças entre alunos de Cursos de Engenharia e alunos de Cursos de Ciências Sociais e Humanas ao nível da ansiedade face a exames?

3. Há diferenças entre a ansiedade sentida uma semana antes de um exame e a ansiedade sentida 24 horas antes do mesmo?

Os primeiros dois passos de qualquer investigação - Definição de um Problema e/ ou Questão de Investigação e Revisão Bibliográfica - constituem fases eminentemente teó-ricas. Será após a definição das questões de investigação (1." passo), as quais nortearão

todo o estudo, e a respetiva revisão bibliográfica (2.0 _{passo), que chegaremos à}

Formu-lação das Hipóteses (3.0

passo). Uma hipótese é uma proposição !estável que estabelece uma

possível relação entre duas variáveis. Por variável entende-se uma característica em estudo que varia de indivíduo para indivíduo e que assume um valor único para cada indivíduo num determinado momento temporal (Almeida & Freire, 2008). As variáveis constituem a base de qualquer investigação quantitativa.

A hipótese, enquanto proposição que define uma possível relação entre duas variá-veis, pode apontar para três tipos de relação entre estas:

a) Associação entre duas variáveis;

b) Diferenças entre dois (ou mais) grupos numa determinada variável;

c) Diferenças entre dois (ou mais) momentos temporais ou condições experimen-tais numa determinada variável.

Retomando as questões de investigação anteriores, poder-se-ão formular as seguin-tes hipóseguin-teses:

Questão de Investigação 1: A ansiedade face a exames está relacionada com a dificuldade da matéria em avaliação?

Hipótese de Investigação 1: A ansiedade face a exames está associada à dificuldade da matéria em avaliação.

Questão de Investigação 2: Há diferenças entre alunos de Cursos de Engenharia e alunos de Cursos de Ciências Sociais e Humanas ao nível da ansiedade face a exames?

Hipótese de Investigação 2: Os alunos de Cursos de Engenharia diferem dos alu-nos de Cursos de Ciências Sociais e Humanas em termos de ansiedade face a exames.

Questão de Investigação 3: Há diferenças entre a ansiedade sentida uma semana antes de um exame e a ansiedade sentida 24 horas antes do mesmo?

Hipótese de Investigação 3: A ansiedade face a exames sentida uma semana antes do exame é diferente daquela sentida 24 horas antes do mesmo.

12

Capítulo 1 · Metodologia da Investigação e Análise de Dados Quantitativos

A formulação das hipóteses condiciona, de imediato, três aspetos:

(i) O design da investigação (4.' passo)

(ii) O estatuto das variáveis na investigação ( 4.' passo)

(iii) As técnicas de análise a utilizar no tratamento dos dados (6.' passo), recolhidos junto da população-alvo e/ou uma amostra (5.' passo)

Utilizando cada uma das hipóteses acima apresentadas, analisaremos o seu impac-to em cada um destes ponimpac-tos anteriores.

Hipótese de Investigação 1: A ansiedade face a <'~ames está associada à dificuldade da matéria em avaliação.

Neste caso, a hipótese aponta para uma associação entre duas variáveis - a 'ansie-dade face a exames' e a 'dificul'ansie-dade da matéria em avaliação'. Estamos, pois, perante um design correlacional, pelo facto de o objetivo do estudo ser avaliar a relação, asso-ciação ou correlação entre as variáveis em questão. A testagem desta hipótese implica,

assim, a utilização de Testes de Associação (cf. Capítulo 4, Ponto 4.4.1.).

Hipótese de Investigação 2: Os alunos de Cursos de Engenharia diferem dos alu-nos de Cursos de Ciências Sociais e Humanas em termos de ansiedade face a exames.

Estamos agora perante uma hipótese que postula diferenças entre dois grupos independentes de indivíduos- os 'alunos de Cursos de Engenharia' e os 'alunos de

Cursos de Ciências Sociais e Humanas1

- ao nível de uma mesma variável- a

/ansie-dade face a exames'. Assim, o design é inter-sujeitos, pelo facto de querermos

com-parar dois grupos independentes (e mutuamente exclusivos) ao nível da ansiedade

face a exames. No caso do design inter-sujeito, faz também sentido distinguirmos dois

tipos de variáveis - variável independente e variável dependente. A variável

inde-pendente é a variável que é manipulada na investigação e cujo efeito numa outra variável

se pretende avaliar (Field, 2009). A variável independente pode ser ativamente

manipu-lada pelo investigador ou não (por exemplo, 'sexo') (Almeida & Freire, 2008). A

va-riável dependente é a variável que sofrerá os efeitos da manipulação da variável

indepen-dente (Field, 2009). Voltando à nossa hipótese, a variável independente é o 'Curso' que

os participantes frequentam - 'Engenharia' versus 'Ciências Sociais e Humanas'. A

variável dependente será a 'ansiedade face a exames'. Finalmente, pela sua formula-ção, esta hipótese implica, para a sua testagem, o recurso a testes de diferenças para

comparação de grupos independentes, os quais são designados por Testes de Diferenças

em Contexto de Design Inter-Sujeitos (isto é, testes de diferenças para amostras

indepen-dentes) (cf. Capítulo 4, Ponto 4.4.2.1.).

(9)

Manual de Análise de Dados Quantitativos com recurso ao IBM0 _SPSS0

Hipótese de Investigação 3: A ansiedade face a exames sentida uma semana antes

do exame é diferente daquela sentida 24 horas antes do mesmo.

Neste último caso, estamos na presença de uma hipótese que aponta para diferenças

entre dois momentos temporais- 'uma semana' versus '24 horas antes de um exame'- ao

nível de uma variável- 'ansiedade face a exames'. O design é, agora, intra-sujeitos, dado

que o grupo de participantes é o mesmo, no seio do qual queremos avaliar se há diferen-ças ao rúvel da ansiedade face aos exames uma semana e 24 horas antes de um exame. Também neste caso, faz sentido distinguir a variável independente da variável dependen-te. A variável independente é o momento temporal - 'uma semana' e '24 horas antes do

exame'- e a variável dependente é a 'ansiedade face a exames'. Finalmente, para a testar,

teremos de recorrer a testes de diferenças para comparação de um grupo único em dois momentos temporais distintos (ou em duas condições experimentais distintas), os quais

se designam por Testes de Diferenças em Contexto de Design Infra-Sujeitos (isto é, testes de

diferenças para amostras emparelhadas) (cf. Capítulo 4, Ponto 4.4.2.2.).

Resta referir que, no caso dos designs inter- e intra-sujeitos, podemos alargar as

comparações a 3 ou mais grupos e 3 ou mais momentos temporais ou condições expe-rimentais, respetivamente.

O Quadro 1 sistematiza as relações entre hipóteses, design de investigação, estatuto

das variáveis na investigação e técnicas de análise de dados.

Quadro 1. Hipóteses, Design da Investigação, Estatuto das Variáveis na Investigação e Técnicas de Análise de Dados Quantitativos

Hipótese Design da Estatuto das Variáveis Análise dos Dados

Investigação

A ansiedade face a exames _{Correlacionai Ansiedade face} _{Testes de}

está associada à dificuldade aos exames Associação

da matéria em avaliação. Dificuldade da matéria

em avaliação

Hipótese-Tipo: A está Variáveis: A e B

associada a B

Os alunos de Cursos de Inter-sujeitos Variável Independente: Testes de Diferenças

Engenharia diferem dos alunos Curso em Contexto de

de Cursos de Ciências Sociais Variável Dependente: Design Inter-Sujeitos

e Humanas em termos de Ansiedade face aos (Testes de diferenças

ansiedade face a exames. exames para amostras

Hipótese-Tipo: Há diferenças _{Variável Independente:} independentes)

entre os grupos X e Y Grupo

ao nível da variável E. Variável Dependente: E

14

Hipótese

A ansiedade face a exames sentida uma semana antes do exame é diferente daquela sentida 24 horas antes do mesmo.

Hipótese-Tipo: Há diferenças

entre os momentos temporais/

I condições 1 e 2 ao nível da variável M.

Capítulo 1 · Metodologia da Investigação e Análise de Dados Quantitativos

Design da Estatuto das Variáveis Investigação

Intra-sujeitos Variável Independente: Momento Temporal Variável Dependente: Ansiedade face aos exames

Variável Independente:

Momento Temporal/ /Concljção Experimental yariável'Dependente: M

Análise dos Dados Testes de Diferenças em Contexto de Design Infra-Sujeitos (Testes de diferenças para amostras emparelhadas)

No caso do design intra-sujeitos, convém referir um caso particular de amostras

emparelhadas. Até aqui, o exemplo utilizado pretende testar as diferenças entre dois momentos temporais ao nível de uma mesma variável dependente e num único grupo de indivíduos que passa pelas duas avaliações- 'uma semana' e '24 horas antes de um exame'. No entanto, há casos de investigações em que temos amostras verdadeiramente emparelhadas. Ou seja, em que estamos perante dois grupos de indivíduos distintos que foram emparelhados no momento do seu recrutamento para o estudo. Como exem-plo, podemos pensar numa investigação que pretende avaliar o efeito do sexo (variável independente) na satisfação conjugal (variável dependente). Há duas formas distintas de testar esta hipótese. Recrutando para a amostra um grupo de homens e outro grupo de mulheres, os quais não têm qualquer tipo de relação entre si. Neste caso, estaremos

perante dois grupos verdadeiramente independentes e, consequentemente, um design

inter-sujeitos. Outra alternativa será recrutar casais para este estudo. Neste caso, tere-mos maridos e mulheres a avaliar a sua relação conjugal. Agora, será mais adequado

trabalharmos estes dados considerando que estamos perante um design intra-sujeitos,

por dois motivos: em primeiro lugar, porque foram incluídos casais na amostra (e não indivíduos sem qualquer relação conjugal entre si) e, em segundo lugar, porque é prová-vel que, neste caso, a satisfação conjugal dos homens e mulheres não seja independente.

Voltando ao 4.0 _{passo da investigação - Definição do Plano ou}_Design_da

Investi-gação - temos ainda de tomar decisões no que toca à seleção dos participantes que irão

participar na investigação. Antes de mais, é necessário decidir qual a população-alvo da

investigação em causa. Por população entende-se o universo de indivíduos que estamos

interessados em estudar (Almeida & Freire, 2008). Uma vez que na maioria dos casos, é impossível um investigador avaliar todos os elementos da população-alvo, opta-se pelo

recrutamento e avaliação de uma amostra dessa população, ou seja, um conjunto mais

(10)

Manual de Análise de Dados Quantitativos com recurso ao IBM0 _SPSS®

restrito de indivíduos pertencente à população-alvo que será estudado na investigação em causa

(Almeida & Freire, 2008). A amostra deverá ser recrutada de forma a que os

participan-tes na investigação sejam representativos da população-alvo.

Voltemos às nossas questões de investigação. Neste caso, a população são todos os alunos portugueses de Cursos de Engenharia e de Ciências Sociais e Humanas e a amostra será uma percentagem, a definir pelo investigador, de todos os alunos dos referidos cursos. Resta acrescentar que o processo através do qual a amostra é selecio-nada a partir da população-alvo se designa por amostragem, a qual pode assumir vá-rios contornos (para uma descrição dos diferentes tipos de amostragem consultar Almeida

& Freire, 2008).

Até este ponto, sabemos que a definição das hipóteses tem implicações diretas no

design, estatuto das variáveis na investigação e técnicas de análise de dados a aplicar para testagern das mesmas. No que toca a este último aspeto, dentro de cada grupo de técnicas apresentado no Quadro 1, há vários testes que podemos selecionar e dos quais falaremos ao longo deste Manual. Por agora, é importante chamar a atenção para o facto das variáveis poderem ser definidas de acordo com o nível de quantificação e que será este nível de quantificação que determinará qual o teste estatístico a selecionar dentro de cada grande grupo.

1.3. Variáveis

Num primeiro nível, as variáveis podem ser qualitativas ou quantitativas, poden-do, estas últimas, ser subdividas em discretas ou continuas. Variáveis qualitativas

de-finem qualidades dos indivíduos (por exemplo, sexo, cor do cabelo), enquanto variáveis

quantitativas são caraterísticas mensuráveis dos indivíduos (por exemplo, número de

fi-lhos, peso) (Almeida & Freire, 2008). Estas últimas podem ser discretas, se assumem

apenas valores inteiros (por exemplo, número de filhos) ou contínuas, se podem assumir qualquer valor, inteiro ou decimal, num determinado intervalo de valores (por exemplo, peso) (Fife-Schaw, 2006).

De acordo com a tipologia proposta por Stevens (1946), as variáveis podem ainda ser classificadas numa das seguintes quatro escalas de medida: nominal, ordinal, intervalar e proporcional ou de razão.

Variáveis nominais são variáveis puramente qualitativas. Por outras palavras,

tradu-zem qualidades dos participantes. O exemplo mais óbvio será a variável 'sexo'. Neste caso, os indivíduos podem ser classificados corno sendo homens ou mulheres, dois

16

Capítulo 1 . Metodologia da Investigação e Análise de Dados Quantitativos

grupos qualitativamente distintos e mutuamente exclusivos. Outros exemplos incluem as variáveis 'estado civil', 'grupo sanguíneo', 'cor dos olhos' ou 'profissão'. A codificação destas variáveis pode ser feita com recurso a letras (M ou F no caso do 'sexo') ou a

números (O e 1). Qualquer codificação numérica (por exemplo, atribuindo o valor O ao

sexo feminino e 1 ao sexo masculino) é totalmente arbitrária (utilizar os valores O e 1

é o mesmo que utilizar os valores 57 e 58) e não tem subjacente qualquer ordem lógica

(sendo, por isso, indiferente codificar o sexo feminino com o valor O e o sexo masculino

com o valor 1 ou fazer a codificação inversa). De facto, no caso das variáveis nominais,

os números representam meras "etiquetas" e nunca~vp.lores realmente numéricos, o que,

consequenternente, invalida, logo à partida, a· realização de qualquer operação aritmé-tica, como a sua soma ou cálculo da média. Apenas urna nota final relativa à codificação de variáveis nominais com duas categorias (dicotômicas): é sempre aconselhável

utili-zar a codificação O e 1 (por oposição aos habituais 1 e 2), dado que há análises

estatís-ticas (por exemplo, análise de regressão) que exigem este tipo de codificação no caso de variáveis dicotómicas.

Variáveis ordinais são variáveis qualitativas em que é possível ordenar, de forma

cres-cente ou decrescres-cente, as suas diversas categorias. Agora, os números atribuídos às categorias representam uma "quantidade" maior ou menor de urna determinada característica qualitativa. Um exemplo de variável ordinal são os 'escalões de IRS'. Atualmente, há oito escalões de IRS, sendo cada um deles delimitado pelos rendimentos anuais de um indivíduo ou agregado familiar. Por outras palavras, há uma ordem crescente (ou de-crescente) dos escalões, em função do rendimento individual ou familiar. No entanto, os intervalos entre diferentes escalões não têm subjacente uma diferença quantitativa cons-tante entre eles. Esta última constitui urna imporcons-tante característica das variáveis ordinais.

Enquanto o 1.0 _{escalão abrange rendimentos até €4.793, o 2.}0

escalão abrande

rendimen-tos superiores a €4.793 e iguais ou inferiores a €7.250 e o 3.0

escalão engloba rendimen-tos que variam entre €7.250 e €17.979. Vemos, por isso, que, subjacente a urna subida

de um ponto em termos de escalão (por exemplo do 1.0

para o 2.0

ou do 2.0 para o 3.0),

não está urna subida quantitativa constante em termos de rendimento. Para além disso, podemos ter no mesmo escalão dois indivíduos com rendimentos anuais muito

distin-tos (por exemplo, apesar de estarem ambos no 1.0

escalão, um indivíduo pode ter tido um rendimento de €4.000 e outro um rendimento de €2.500).

Outros exemplos são o 'nível socioeconómico' ('Elevado', 'Médio', 'Baixo') ou a 'classificação de atletas no pódio' ('Medalha de Ouro', 'Medalha de Prata', 'Medalha de Bronze'). Na área da Psicologia, o exemplo mais evidente serão itens de escalas de

Likert. Neste caso, os indivíduos posicionam-se numa escala de, por exemplo, 5 pontos, em que o valor 1 poderá corresponder à categoria 'discordo totalmente', o valor 2 a

(11)

Manual de Análise de Dados Quantitativos com recurso ao IBM0 _SPS$0

'discordo', o valor 3 a 'não discordo nem concordo', o valor 4 a 'concordo' e o valor 5 a 'concordo totalmente'. Neste caso, os indivíduos podem ser ordenados em função do seu grau de concordância em relação ao assunto em questão, o que mostra que estas variáveis são já, de certo modo, quantitativas. No entanto, não se pode inferir que a

diferença qualitativa entre dois indivíduos com respostas de 1 ('discordo totalmente') e

2 ('discordo') seja exatamente a mesma que entre outros dois indivíduos com respostas de 4 ('concordo') e 5 ('concordo totalmente'), apesar de haver apenas um ponto de diferença em ambos os exemplos. Como implicação, não podemos trabalhar estes valo-res como verdadeiras grandezas numéricas, sendo necessário recorrer a análises de dados não-paramétricas, isto é, baseadas em ordens e acerca das quais voltaremos a falar no Capítulo 4.

Variáveis intervalares são variáveis naturalmente quantitativas ou numéricas, como,

por exemplo, a 'idade'. Agora podemos assumir intervalos idênticos em diferentes pontos da escala, pelo que as variáveis intervalares permitem o recurso a operações aritméticas, como, por exemplo, o cálculo da média.

Finalmente, as variáveis proporcionais ou de razão diferem das intervalares,

ape-nas pelo facto de possuírem, ao contrário das anteriores, um zero absoluto. Assim, neste

quarto tipo de variáveis, um O (zero) representa a total ausência da característica. Este tipo de variável é frequente em Física (por exemplo, 'peso', 'comprimento', 'resistência elétrica'), sendo muito raro em Psicologia (em que dimensão psicológica podemos afir-mar que O representa ausência de característica?).

Pelas definições das quatro escalas de medida é possível verificar que estas se encontram numa hierarquia, onde as variáveis nominais (puramente qualitativas) não permitem qualquer tipo de quantificação até às variáveis proporcionais/ de razão, em que estamos perante variáveis que permitem o máximo de quantificação (Quadro 2).

Quadro 2. Escala de Medida de Variáveis

Nominais Categorias qualitativas mutuamente exclusivas

Ordinais Ordenação das categorias qualitativas

Intemalares Intervalos idênticos em diferentes pontos da escala

Proporcionais/ Zero absoluto

/de Razão

18

Capítulo 1 · Metodologia da Investigaçiio e Anâlíse de Dados Quantitativos

À medida que vamos descendo no Quadro 2, as variáveis vão acumulando as

características apresentadas nas linhas anteriores. Por exemplo, as variáveis ordinais, para além de permitirem a ordenação das categorias qualitativas, caracterizam-se tam-bém pelo facto de integrarem categorias mutuamente exclusivas (característica das variáveis nominais).

Qual a importância de saber distinguir corretamente os diferentes tipos de variá-veis presentes numa investigação? Nas palavras de Stevens (1946), "( ... )lhe statistical

manipulations that can legitimately be applied to empírica! data depend upon lhe type

of scale against which lhe data are ordered" (p. 677, it~lico nosso). Tal significa que: (i)

diferentes escalas de medida têm propriedades matemáticas distintas e (ii) as operações

estatísticas aplicáveis a cada uma das escalas de medida diferem (Stevens, 1946). Por

outras palavras, qualquer decisão acerca de que medida descritiva (cf. Capítulo 3) ou

teste inferencial (cf. Capítulo 4) utilizar depende da escala de medida subjacente às

variáveis em jogo. Assim, testes que são adequados para variáveis intervalares são proibitivos no caso de variáveis nominais ou ordinais.

Uma última nota importante. Há variáveis que podem ser recolhidas segundo dife-rentes escalas de medida. Tomemos como exemplo a 'escolaridade' (Ver Quadro 3). Se

optarmos por questionar: "Tem a escolaridade mínima obrigatória?", devendo o indivíduo

responder 'Sim' ou 'Não', estaremos perante uma variável nominaL No entanto, caso

coloquemos a questão sob a forma "Que nível de escolaridade completou?" e

apresentar-mos várias opções de resposta (por exemplo, '1.' Ciclo', '2.° Ciclo', '3.° Ciclo', 'Ensino

Secundário', 'Ensino Superior'), a variável daqui decorrente será ordinal. A escolarida-de poescolarida-de ainda assumir uma escala escolarida-de medida intervalar se perguntarmos aos

indiví-duos: "Excluindo reprovações, quantos anos de escolaridade completos tem?". Neste último

caso, o indivíduo deverá referir o número de anos de escolaridade que possui, excluin-do um eventual número de reprovações.

Sendo possível, uma variável deverá ser recolhida sob a forma intervalar, por dois motivos. Em primeiro lugar, a partir de uma variável intervalar é sempre possível che-garmos a uma variável ordinal ou mesmo nominal, a partir da recodificação da variável original. O movimento inverso (de nominal ou ordinal para intervalar) não é possível. No Quadro 3 apresenta-se um exemplo de um indivíduo com 9 anos de escolaridade completos (variável intervalar) e como este valor é recodificado de modo a obtermos

uma variável ordinal ou nominal. Este indivíduo ficará integrado na categoria '3.0

Ci-clo', no caso da variável ordinal correspondente e na categoria 'Não', no caso da variá-vel nominal equivalente. Ao perguntarmos ao indivíduo se tem a escolaridade obriga-tória, não há forma de, a partir da sua resposta ('Não'), saber se ele está no nível de escolaridade correspondente ao 3.° Ciclo ou se tem 9 anos de escolaridade completos.

(12)

Manual de Análise de Dados Quantitativos com recurso ao lBM0 _SPSS0

Quadro 3. Exemplo da Variável 'Escolaridade' Recolhida Segundo Diferentes Escalas de Medida

Questão Resposta(s) possível( eis) Exemplo Intervalar/Proporcional "Excluindo reprovações, quantos anos de escolaridade completos tem?" Número de anos de escolaridade '9 anos' Ordinal "Que nível de escolaridade completou?" '1.° Ciclo' '2.° Ciclo' '3.' Ciclo' 'Ensino Secundário' 'Ensino Superior' '3.° Ciclo' Nominal "Tem a escolaridade mínima obrigatória?" 'Não' 'Sim' 'Não'

O segundo motivo prende-se com o facto das variáveis intervalares serem bastante

mais flexíveis em termos da sua análise, permitindo o recurso a testes paramétricas ( cf.

Capítulo 4). No caso das variáveis ordinais e nominais, apenas podemos recorrer a

testes não-paramétricos ( cf. Capítulo 4), os quais são mais rígidos e menos robustos do

que os testes paramétricas.

1.4. Técnicas de Análise de Dados Quantitativos

Depois de recolhidos os dados, entramos no 6.' passo, o qual consiste na sua (por vezes, temida) análise. Dentro das técnicas de análise de dados quantitativos, há dois ramos a considerar: Estatística Descritiva e Estatística Inferencial.

A Estatística Descritiva engloba um conjunto de medidas - de tendência central e de

dispersão - e de representações gráficas que nos permitem descrever, de uma forma sumária, um conjunto de dados (Howell, 2010) (cf. Capítulo 3). O recurso à Estatística Descritiva far--se-á numa primeira fase de análise dos dados recolhidos. Por sua vez, a Estatística

Inferencial permitir-nos-á retirar conclusões acerca da população-alvo, com base nos

resulta-dos obtiresulta-dos na amostra daí recrutada (Howell, 2010). O ramo da Estatística Inferencial engloba, pois, todos os testes estatísticos - de associações e de diferenças - que nos permitirão concluir, recorrendo a probabilidades estatísticas, se as associações ou

dife-ren~as encontradas na amostra estarão ou não presentes na população-alvo (cf. Capítulo 4). E o ramo da Estatística Inferencial que nos permite testar as hipóteses formuladas no 3.' passo do processo de investigação.

Um passo intermédio importante entre a descrição inicial dos dados, com recurso à Estatística Descritiva e à Estatística Inferencial, é o estudo das características da dis-tribuição das variáveis na amostra em questão. Esse estudo é feito através da Análise

20

Capítulo 1 · Metodologia da Investigação e Análise de Dados Quantitativos

Exploratória de Dados, a qual se traduz num conjunto de procedimentos que nos permitem

decidir com segurança a que tipo de teste estatístico - paramétrica ou não-paramétrica - deve-remos recorrer para testar as hipóteses de investigação (Howell, 2010) (cf. Capítulo 5).

Ao longo dos próximos capítulos serão apresentadas várias técnicas de análise de dados quantitativos com recurso ao IBM® SPSS• (Versão 19.0), provavelmente o software de análise estatística mais popular entre os alunos, docentes e profissionais da área das

Ciências Sociais e Humanas. O próximo capítulo (cf. Capítulo 2) é, pois, dedicado à

apresentação do IBM• SPSS• e cuidados a ter na construção de uma base de dados de qualidade, a qual deverá constituir um alicerce sqlido para a fase posterior de análise

dos dados. ·

No que diz respeito às técnicas de análise de dados propriamente ditas (cf.

Capí-tulos 3, 4 e 5), será adotada a seguinte abordagem: partindo de uma das hipóteses de

investigação anteriormente apresentadas, começaremos por conduzir o leitor pelo

pro-cesso de seleção de qual a técnica de análise de dados é adequada para a hipótese em

questão, bem como para as variáveis que a integram (Saber Decidir). Após a tomada de

decisão, prosseguiremos para a execução da técnica de análise escolhida no IBM• SPSS•

(Saber Fazer). No seguimento da execução da respetiva técnica, procederemos à interpre-tação dos resultados, à luz da hipótese de investigação em causa (7.' passo do processo

de investigação) (Saber Interpretar). Por fim, apresentaremos a forma como os resultados

obtidos devem ser redigidos no contexto de um artigo científico (ou de uma monografia,

ou dissertação de mestrado ou doutoramento) (8.' passo) (Saber Redigir). A redação dos

resultados seguirá as normas da 6.' Edição do Manual de Publicação da American

Psychological Association (APA, 2010).

1.5. Conclusão e Próximo Capítulo

Este capítulo teve como objetivo enfatizar os conceitos de metodologia de investi-gação imprescindíveis para o momento da análise de dados (para um aprofundamento

dos mesmos consultar Almeida & Freire, 2008).

O próximo capítulo centra-se no IBM• SPSS• e na sua utilização, ficando, desde já, um alerta: o IBM• SPSS• é uma ferramenta de trabalho preciosa nos dias de hoje ... para quem souber decidir o que fazer, como fazer e como interpretar os resultados obtidos. Por outras palavras, para quem tiver conhecimentos sólidos na área das técni-cas de análise de dados quantitativos. Contribuir para a consolidação dos conhecimen-tos nesta área e promover a segurança na tomada de decisão e subsequente interpreta-ção e redainterpreta-ção dos resultados obtidos, são os objetivos centrais dos próximos capítulos.

(13)

Capítulo 2

Construção de Ficheiros de Dados de Qualidade

no IBM® SPSS®

(14)

2.1. Introdução

Após a recolha dos dados (5° passo da investigação), chega o momento de os inserir no IBM® SPSS®, de modo a criar o ficheiro que permita o seu tratamento quan-titativo.

A construção de um ficheiro de dados de qualidade no IBM® SPSS® é fundamental

para o manuseamento fácil, intuitivo, correto e seguro das variáveis no momento da

realização da análise quantitativa. No entanto, desenvolver ficheiros ou bases de dados de qualidade requer conhecimentos e, sobretudo, jnvestimento de tempo.

É objetivo deste capítulo ensinar a con;;truir

é;

ou promover a consolidação de conhecimentos relativos à construção de ficheiros de dados no IBM® SPSS®.

2.2. Data Editor, Data View e Variable View

Ao abrimos o programa (fazendo duplo clique no símbolo

8

IBM SPSSStatistics19

no ambiente de trabalho ou procurando-o na lista dos programas instalados no compu-tador), deparamo-nos com a seguinte janela (Imagem 1).

25

íl

0Rll:IIIMMotl$

ii

Q~llldatl>

(15)

Manual de Análise de Dados Quantitativos com recurso ao IBMe SPSS0

Para construir um novo ficheiro de dados, deveremos escolher Type in data (segun-da opção do lado direito) e carregar em OK no canto inferior direito da janela de abertura.

Chegamos então ao Data Editor do IBM• SPSS®, o qual tem duas panorâmicas: Data View (Imagem 2) e Variable View (Imagem 3). Para alternar entre ambas, deveremos carregar nos separadores que se encontram no canto inferior esquerdo, sendo possível, em qualquer uma das panorâmicas, acrescentar, alterar ou apagar informação contida no ficheiro de dados.

No momento de abertura do IBM• SPSS• para criação de um novo ficheiro de dados, tanto a Data View como a Variable View são meras páginas quadriculadas em branco.

A Data View (Imagem 2), panorâmica que aparece de imediato quando o IBM• SPSS• abre, permitirá a visualização dos dados, após a sua inserção. Nesta panorâmica:

(i) cada linha representa um caso ou participante; (ii) cada coluna representa uma variável;

(iii) cada célula representa o valor que cada variável assume para cada participan-te. Trata-se, portanto, da interseção de cada caso com cada variável.

Imagem 2. Panorâmica Data View do IBM• SPSS•

26

Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS

Por seu turno, a Variable View (Imagem 3) mostra as caraterísticas e informação relativas a todas as variáveis contidas no ficheiro de dados. Nesta panorâmica:

(i) cada linha representa uma variável;

(ii) cada coluna representa uma caraterística da variável, havendo 11 campos sob os quais uma variável pode ser caraterizada, os quais serão explicados no Quadro 4.

Imagem 3. Panorâmica Variable View do IBM• SPSS•

O Quadro 4 descreve os campos presentes na Variable View, incluindo ainda cuida-dos a ter e/ ou recomendações específicas para cada um deles.

(16)

Manual de Análise de Dados Quantitativos com recurso ao IBM0 _SPSS0

Quadro 4. Descrição dos Campos da Variable View Campo Name Type Width Decimais La bel Values Descrição

Designação breve da variável

Tipo de variável

Default': Numeric (Numérica)

Número de dígitos permitidos em cada célula da variável Default: 8

Número de casas decimais da variável

Default: 2

Designação mais alargada da variável

Codificação dos valores numéricos que as variáveis nominais e ordinais podem assumir Default: Nane (Nenhum)

Cuidados a ter/Recomendações

Cada variável tem de ter um nome único, não poden~

do existir duplicados no ficheiro de dados.

Permitidos até 64 caracteres- maiúsculos e/ ou minús~ culos - em qualquer combinação de letras, dígitos, outros caracteres, ponto final (.) ou underscore (J, não sendo, no entanto, possível começar o nome de uma variável com um _dígito.

Aconselhável a utilização de . ou _ para· separação de palavras, dado que os espaços não são permitidos.

Há nomes que o IBM• SPSS• impede que sejam utili-zados (por exemplo, BY ou GE), surgindo, nestes

ca-sos, uma mensagem de erro.

Recomendável criar designações breves, mas inequí-vocas.

Aconselhável utilizar apenas variáveis numéricas. Variáveis String que admitem a inserção de dados sob a forma de nomes não permitem qualquer tipo de tra~

tamento estatístico.

Datas devem ser utilizadas apenas para registo da recolha e não para efeitos de cálculo.

Raramente é necessário modificar intencionalmente este campo, pelo que não voltará a ser referido ao longo deste Manual.

No caso de variáveis que só assumem valores inteiros, pode definir-se este campo como O (zero).

No caso de variáveis contínuas, é imperativo garantir que o número de casas decimais é igual ou superior a 1. Permitidos até 256 caracteres, espaços entre palavras e as designações que não são permitidas no campo Name. Quanto mais descritivo o Label de uma variável, mais fácil será ler os Outputs, os quais utilizarão o Label (e não o Name) como descritor de cada variável. Permitidos até 120 caracteres por Value Label. Quando há Values definidos, serão estes os apresenta~

dos nos Outputs (e não os valores com que as respe~

tivas categorias foram codificadas).

1 _Por_Default_entende~se_{a definição automática atribuída}_à_{categoria em causa pelo JBM® SPSS}_{0 .}

28

Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS

Quadro 4. Descrição dos Campos da Variable View (continuação)

Campo Missing Columns Align Measure Role Descrição

Valor a atribuir à ausência de resposta ou resposta inválida

Default: Nane (Nenhum)

Número de caracteres permitidos no nome (Name) da variável tal como é apresentado na Data View Default: 8

Alinhamento dos dados na Data View

Default: Right (Direita) Escala de medida da variável Default: Unknown

(Desconhecido)

Papel da variável

Default: Input (Variável

Independente)

Cuidados a ter/Recomendações

O valor definido como Missing não pode coincidir com qualquer valor válido que a variável possa assumir. Possível definir até 3 valores de Missing, por exemplo, para distinguir a ausência de resposta, da resposta inválida, da categoria "não aplicável".

Aconselhável utilizar 99, 999, ou 9999.

Raramente é necessário modificar intencionalmente este campo, pelo~q?e não voltará a ser referido ao longo deste o/fanual.

Raramente é necessário modificar intencionalmente este campo, pelo que não voltará a ser referido ao longo deste Manual.

Recomendável que a definição da escala de medida das variáveis - nominal; ordinal ou· interválar (sCale) - seja efetuada, uma vez que consciencializa o inves-tigador, desde logo, para o tipo de variável com que

trabalhará.

Em determinados menus de análises do IBM0 _{SPSS®, a} definição do papel da variável (por exemplo, como

variável independente ou dependente) fará com que o próprio IBM0 _SPSS®_{pré~selecione}_{as variáveis}_adequa~ das em função do papel previamente definido neste campo.

Aconselhável que o Input a utilizar seja o de Nane, dado que há variáveis que podem assumir o papel da variável independente num momento da análise, pas-sando a dependente no momento seguinte.

Uma vez definidos, todos os campos ficam gravados no ficheiro de dados, não sendo necessário voltar a defini-los na próxima sessão de trabalho.

2.3. Construção de um Ficheiro de Dados

A primeira variável de qualquer ficheiro de dados deverá ser sempre uma variável numérica que identifique inequivocamente os participantes. Por outras palavras, deve existir no início do ficheiro de dados, uma variável que, através de um código numérico único, identifique cada um dos participantes da amostra. Para além disso, este mesmo

(17)

Manual de Ar1álíse de Dados Quantitativos com recurso ao IBM» SPSS®

código deverá ser registado no questionário ou registo em papel desse mesmo indiví-duo. Tal estratégia permite que haja uma correspondência entre cada linha do ficheiro de dados e o respetivo suporte em papel através do qual foram recolhidos os dados junto dos participantes. A vantagem de se utilizarem códigos numéricos no ficheiro de dados é o de preservar o anonimato dos dados.

Embora não seja objetivo trabalhar com esta variável, esta poder-se-á tornar muito útil quando, por exemplo, quisermos selecionar algum(ns) participante(s) do ficheiro de dados. Comecemos então por criar a variável que podemos designar por 'Participante' (ou 'Identificação' ou 'Caso', ou outra designação que o leitor prefira).

Ao preencher o campo Name com a designação 'Participante', todos os outros cam-pos são automaticamente preenchidos com as definições default (Imagem 4).

Imagem 4. Panorâmica Variable View da Variável 'Participante'

30

Capítulo 2 -Construção de Bases de Dados de Qualidade no IBM SPSS

Pelas características da variável 'Participante', há campos da sua definição que não sofrerão alterações, havendo outros que deverão ser modificados.

Assim, a variável 'Participante' é uma variável numérica (campo Type a manter), que não necessita de casas decimais pelo facto de assumir apenas números inteiros (campo Decimais a modificar) e cujo Label poderá ser também 'Participante' (campo

Label a preencher). Neste caso, Name e Label coincidem, o que nem sempre acontecerá, como veremos em variáveis a definir ao longo deste capítulo. Esta variável não neces-sita de Values (campo Values a manter), já que não há nenhuma codificação subjacente. Quanto ao campo Missing, e por uma questão de prJncípio, deveremos sempre definir um valor a ser atribuído à não-resposta ou re'iPosta i;,válida (por exemplo, 999), caso não haja informação relativa a um qualquer participante (campo Missing a modificar). A escala de medida da variável 'Participante' será Nominal (campo Measure a modificar), uma vez que estamos perante uma variável que identifica os participantes, tal como o nome próprio de cada um deles o faria. Por fim, pelas razões apontadas no Quadro 4, definiremos o campo Role como None (campo Role a modificar).

Para introduzir as alterações mencionadas em cada um dos campos corresponden-tes, devemos carregar no lado direito da célula correspondente ao campo a modificar.

Comecemos pelo campo Decimais. Para reduzirmos o número de casas decimais de 2 para O, carregando no lado direito desta célula, aparecem duas setas que nos permi-tem aumentar ou diminuir o número de casas decimais (Imagem 5).

Imagem 5. Modificação do Campo Decímals da Variável 'Participante'

' '

.

jl!!!l!i!!i,ILJ~

!B;,21,Jll.im=l

li ..

!llllilLIJ4'411lll ..

:'l ..

~~,

~

r,..,-"f;;:O':'N~. Widlli.J o!l{:imatn ~

.

~~-~.~-~!Pc:~:~--"~::~~c-~---!!

...

--:P· ..

'Laoo! ~GS' -~: Mis$inq ii <:Oiumn:tjl · Align iL Me~uro !i RoiQ

_:.__________ r--- ~ ..

--No campo Labél, escrévemos a designação mais alargada da variável (neste caso coincidente com o Nome). Passando ao campo Missing, carregando no lado direito desta célula, surge uma pequena janela. Devemos mudar a opção de No missing values para

Discrete missing values, colocar na célula abaixo o valor 999 e carregar em OK (Imagem 6).

(18)

Manual de Análise de Dados Quantitativos com recurso 110 IBM" SPSS0

Imagem 6. Modificação do Campo Missing da Variável 'Participante'

Para modificarmos o campo Measure, carregamos no lado direito desta célula e aparece um menu que nos permite seleccionar Nominal (Imagem 7).

Por fim, no campo Role, carregamos no lado direito da célula e aparece o menu da Imagem 8, o qual nos permite selecionar Nane. Fica assim concluída a definição da variável 'Participante'.

lmag~m 8. Modificação do Campo Role da Variável 'Participante' file · g<it· !{low Qala · !faMfOflll .611#e · Dil'lK:If!imtio~ Qr.li>IÍ$ ,!!lilllles Add-Qns· -~<IOW ijtlp

i(l§ll.~

•.

!l ...

l;!li;l· .. ":' ••.

~

•.. ·

..

l!lim ...

IJJ$ .•..

111~

ill ••

~t~

..

~

•.

:f!\i

Name ·r rr Wídth f lk!cimal$, Lsbel í -V~s - • Missi ~ eólumli.s • f.J' M&l1$1Mll

Capítulo 2 - Construção de Bases de Dados de Qualidade no IBM SPSS

Passemos agora à variável 'Sexo'. Neste caso, o Name e Label coincidirão e, tal como na variável anterior, não serão necessárias casas decimais. No entanto, no caso da va-riável 'Sexo', teremos de introduzir no ficheiro de dados a informação relativa à codificação atribuída ao sexo masculino e ao sexo feminino (por exemplo, O e 1, respetivamente). Tal como foi já discutido no Capítulo 1, estes valores funcionarão como

meras 11 _{etiquetas" com as quais não poderemos fazer análises. Esta codificação será}

inserida no campo Values. Assumiremos, uma vez mais, o valor 999 como Missing e também a variável 'Sexo' será uma variável Nominal e classificada como Nane na última

coluna. ₁₁

Para modificarmos o campo Values, carregamo's no lado direito desta célula, o que faz aparecer uma janela onde colocaremos a respetiva codificação desta variável (Ima-gem 9).

Imagem 9. Modificação do Campo Va/ues da Variável 'Sexo'

'

····+- ._, ... "f

. ... L

No Value colocamos o valor '0', no Label a designação 'Masculino' e carregamos em

Add, o que faz com que a codificação deste grupo passe para o quadro abaixo. Fazemos o mesmo para o sexo feminino: Value '1', Label 'Feminino' (Imagem 10). Carregamos em

(19)

Manual de Análise de Dados Quantitativos com recurso ao JBM® SPSS®

Imagem 10. Modificação do Campo Values da Variável 'Sexo'

Está compl~ta a caracterização da variável 'Sexo'.

Esta é uma boa altura para gravarmos o ficheiro de dados, o que fazemos recorren-do ao menu File - Save As (Imagem 11).

Imagem 11. Gravação do Ficheiro de Dados

'+'Mh!MP!ibid"i!Mfi&MPB +fid# ·

• filé-" JgdU YJow Qata· !rinsloriÍl '&jálml O~&dfo!:a!tilttng

·~ "'"" OpcnDai:!J!;ase @I RM,!lT$l!Mlll ... -eig~-;~---···---·--c~;:;:;---irl§.:MI Cb1•$ ~ E:Qlcr!loOal:!baso .. ,

O!SPI~yOala FliO l!lfMI'latto~

;j'cat!J.oOata...

Q SIOP PIIIC!lSSQI

l\ii~$$Mll .. ,

34

Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS

Após selecionarmos o local do computador onde queremos gravar o ficheiro de dados, devemos atribuir-lhe uma designação. Neste caso, o ficheiro foi nomeado com 'Ficheiro de Dados (11 Março)' (Imagem 12).

É uma boa prática colocar, no próprio nome do ficheiro, a data em que este foi criado e/ ou modificado. É inevitável, à medida que o trabalho progride, começarmos a ter várias versões do ficheiro de dados, pelo que a inclusão da data evita que se utilize outro tipo de designações (por exemplo, 'Ficheiro de dados Final' ou 'Ficheiro de dados Finalíssimo') que rapidamente ficam desatualizadas.

Imagem 12. Atribuição de uma Designação ao Fiçheiro de Dados

L~Ji

...

I! .•.•

JÇil;) .••...

~.·

..

?'

...

llll.lm.d·ll1l·,·•··it.lll.4'4..ool.m~~,~

•.•.

~.

~~:~~_j_Qeci!lÍnb f; . LabeJ.... Values : M!;lsín!J · ~ C<tlumns f • Ali Menure Role

. . "'"'"'""'····

... L. ... 1

File name:

Kooplng 2 of2wrlablos • /Flcllelro do Dados {11 MafÇ<))

li )yrile ""'iatle nam~s IQ spr~adshe~l

flll Sa•Je value l3~~1s wMm dMinea instoad oi dMav<~lues

l!lil s;.,·~ v<~lu~ la~~ls ln!Q a .sas fM

As Imagens 13 e 14 apresentam o ficheiro de dados finalizado, depois de inseridas todas as variáveis de uma hipotética investigação que servirá de base aos capítulos subsequentes deste Manual.

Como podemos ver, este contém 15 variáveis no total, todas elas numéricas (Type),

todas elas com O (zero) decimais (Decimais). O Label (o qual aparece em maior destaque na Imagem 14) apresenta as designações alargadas das variáveis presentes neste ficheiro de dados. Para todas as variáveis, foi definido o valor 999 como o valor a atribuir à informação em falta (Missing). No caso das variáveis nominais e ordinais, procedeu-se à sua codificação (Values). Os campos Width, Columns e Align não foram intencionalmente alterados. Em alguns casos, os valores diferem do default, porque o IBM• SPSS• procedeu à alteração automática destes campos (por exemplo, relativamente à variável 'Idade', o

(20)

Manual de Análise de Dados Quantitativos com recurso ao IBM® SPSS"'

campo Width passou a 11 e o campo Columns alterou para 5). Estas alterações em nada afetam o ficheiro de dados. Finalmente, para cada variável foi definida a respetiva escala de medida (Measure) e para todas foi definido como Nane o seu papel na investigação (Role).

No que diz respeito aos Labels, chamamos a atenção para a importância de incluirmos designações alargadas para as variáveis do ficheiro de dados (Imagem 14). Enquanto em algumas variáveis o Label é um duplicado do Name (por exemplo, 'Participante', 'Sexo', 'Idade'), noutras o Label transmite informação que não está explícita no Name da variável. Veja-se o exemplo da variável 13, denominada 'Ansiedade_1semana'. Ao lermos o Label,

ficamos a saber que esta variável traduz a ansiedade dos participantes uma semana antes de um exame e que, valores mais elevados, correspondem a maior ansiedade.

36

Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS

Depois de criadas e definidas todas as variáveis do ficheiro de dados, chega o momento de inserir os dados propriamente ditos na Data View, a qual, neste momento, contém apenas todas as designações das variáveis, tal como foram definidas na Variable View (Imagem 15).

A tarefa da inserção dos dados no ficheiro agora criado é igualmente exigente, em termos de investimento de tempo e de concentração por parte do investigador, de modo a que se reduza ao mínimo a probabilidade de erro. É, por isso, uma tarefa que não pode ser encarada de ânimo leve nem ser entregue a alguém que não tenha experiência de investigação.

A Imagem 16 apresenta a primeira linha preenchida.

(21)

Manual de Análíse de Dados Quantitativos com recurso ao IBM0 SPSS®

Uma vez que inserimos Value Labels para as variáveis nominais e ordinais codifi-cadas, podemos beneficiar da utilização de uma opção que permite visualizar as cate-gorias de cada variável em vez dos seus valores numéricos. Por exemplo, inserir os dados na variável 'Sexo' poderá ser mais fácil se pudermos escolher entre 'Masculino' e 'Feminino', em vez de 'O' e '1'. Para tal, temos de ativar a opção que aparece em View - Value Labels (Imagem 17).

Imagem 17. Opção View - Value Labels

i I :

Agora, podemos inserir os dados das variáveis nominais e ordinais escolhendo entre as categorias possíveis (por exemplo, 'Masculino' versus 'Feminino') (Imagem 18).

Imagem 18. Inserção dos Dados com a Opção Value Labels Activada

Na Imagem 19, apresenta-se a Data View do ficheiro já com os dados de 72

parti-cipantes inseridos.

38

Capítulo 2 · Construção de Bases de Dados de Qualídade no IBM SPSS

Imagem 19. Data View do Ficheiro de Dados (11 Março) com 72 Participantes com a Opção Value Labels Ativada

Caso se prefira ver os números e não os Value Labels (Imagem 20), apenas temos de ir de novo a View - Value Labels e desativar a opção anteriormente ativada.

Imagem 20. Data View do Ficheiro de Dados (11 Março) com 72 Participantes com a Opção Value Labels Desativada