Este Manual constitui-se como uma ferr~mc•n+' ajuda a colocar em marcha o processo de análise quantitativos, tomando como ponto de partida questõ investigação pré-formuladas e culminando com a atvutcJac científica dos resultados obtidos.
É, portanto, seu objetivo ajudar alunos, investigadores e profissionais das Áreas das Ciências Sociais e Humanas a Saber Decidir qual a técnica de análise de dados adequada para a hipótese de investigação em questão, bem como para as variáveis que a integram, Saber Fazer a técnica de análise escolhida recurso ao IBM SPSS; Saber Interpretar os resultados o
à
luz da hipótese de investigação em causa; Saber resultados obtidos no contexto de um artigo uma monografia, ou dissertação de mestrado seguindo as normas da 6a Edição do Mann Psychological Association
~ PSIQI,JILIBRIOS V'EDIÇOES
MANUAL DE ANÁLISE DE
DADOS QUANTITATIVOS
COM RECURSO AO IBM®SPSS®
SABER DECIDIR, FAZER, INTERPRETAR E REDIGIR
~ PSIQI,JILIBRIOS V'EDIÇOES
ANUAL DE ANÁLISE DE
ADOS QUANTITATIVOS
OM RECURSO AO IBM
PSS
ABER DECIDIR, FAZER,
TERPRETAR E REDIGIR
arla Martins é doutorada em Psicologia
la Universidade de Reading (Inglaterra]. de previamente fez o seu Mestrado em
é todos de Investigação e Análise de Dados
antitativos.
Professora Auxiliar no Departamento de icologia Básica da Escola de Psicologia da
iversidade do Minha. onde, desde o ano tivo de 2003/2001,, leciona várias Unidades Jrriculares nos domínios da Metodologia
Investigação e Análise de Dados antitativos a alunos de Mestrado Integrado Doutoramento em Psicologia.
ra além da investiga~ão no domínio da
icologia do Desenvolvimento, apeia vários
ojetos de investigação noutras áreas ao
el da análise de dados quantitativos.
'\:'~ PSIQVILIBRIOS '\; EDIÇOES
MANUAL DE ANÁLISE DE
DADOS QUANTITATIVOS
COM RECURSO AO IBM·spss·:
SABER DECIDIR, FAZER, INTERPRETAR E REDIGIR
~ PSIQVILIBRIOS
"\?'
EDIÇOESColeção Título Autora Coordenação da Coleção Copyright Revisão Composição, impressão e acabamentos Capa Distribuição e Encomendas la Edição ISBN Depósito Legal FICHA TÉCNICA . Investigação em Psicologia
Manual de Análise de Dados Quantitativos com recurso ao IBM0 SPSS0: Saber decidir, fazer,
interpretar e redigir Carla Martins Leandro S. Almeida
© Psiquilíbrios Edições Silvia Fernandes Candeias Artes Gráficas Braga I www.candeiasag.com Miguel Candeias Psiquilíbrios Edições Braga I Portugal Tel. 253 284 517 I 964 145 134 I 936 602 041 editora@psiquilibrios.pt www.psiquilibrios.pt Julho de 2011 978-989-8333-08-7 330389/11
A PSE na qualidade de representante para Portugal da SPSS Inc. autorizou a utilização dos elementos SPSS na produção deste livro.
IBM®SPSS® é uma marca registada da IBM Corporation.
Nenhuma parte desta publicação pode ser
reproduzida por qualquer meio sem prévia autorização da editora por escrito.
Respeite os direitos de autor. A fotocópia é crime.
'
Indice
Introdução ... .
Capítulo 1. Metodologia de Investigação e Análise de Dados Quantitativos
1.1. Introdução ... .. 1.2. Metodologia de Investigação e Análise de Dados ... . 1.3. Variáveis ... , 1.4. Técnicas de Análise de Dados Quantitativos ... . 1.5. Conclusão e Próximo Capítulo ...
4 . : ...•.••.•.•.. · · · Capítulo 2. Construção de Ficheiros de Dados de' Qualidade no IBM' SPSS•
2.1. Introdução ... . 2.2. Data Editor, Data View e Variable View . ... .
2.3. Construção de um Ficheiro de Dados.. .. . . .. .. .. . .. .. .. . .. .. .. .. .. ... .
2.4. Introdução à Análise de Dados no IBM• SPSS0 : Output e Syntax . ....
2.5. Conclusão e Próximo Capítulo . . . . ... .
Capítulo 3. Estatística Descritiva
3.1. Introdução ... .
3.2. Medidas de Tendência Central e de Dispersão ... .
3.2.1. Medidas de Tendência Central e de Dispersão para Variáveis Nominais: Moda (Mode) e Frequências (Frequencies) ... . 3.2.2. Medidas de Tendência Central e de Dispersão para Variáveis Ordinais:
Mediana (Median) e Intervalo Interquartfiico (Interquartile Range) ... . 3.2.3. Medidas de Tendência Central e de Dispersão para Variáveis Intervalares: Média (Mean) e Desvio-padrão (Standard Deviation) ... .
3.3. Representação Gráfica ... .
3.3.1. Gráfico Circular (Pie Chart) ... .
3.3.2. Gráfico de Barras (Bar Chart) ... .
3.3.3. Histograma (Histogram) ... ..
3.4. O Papel das Medidas Descritivas na Construção de Ficheiros de
Dados de Qualidade ... .. 3.5. Conclusão e Próximo Capítulo ... .
Capítulo 4. Estatística Inferencial
4.1. Introdução ... .. 4.2. Probabilidades Estatísticas ... .. 4.3. Erros Estatísticos ... . 4.4. Questões de Investigação e Processo de Tomada de Decisão na Seleção do
Teste Estatístico a Utilizar ... . 4.4.1. Testes de Associação ... .
4.4.1.1. Coeficiente de Correlação de Pearson (Pearson Correlation
Coefficient, r) (2 variáveis intervalares) no IBM• SPSS• ... . 4.4.1.2. Coeficiente de Correlação de Spearman (Spearman Correlation
Coefficíent, rs) (2 variáveis ordinais ou 1 variável ordinal e
1 intervalar) no IBM• SPSS• ... . 3 5 11 11 16 20 21 25 25 29 40 41 45 45 48 55 58 65 66 76 81 86 87 91 91 96 97 99 102 111
4.4.1.3. Coeficiente de Correlação Ponto~Bisserial (Point~Biserial Correlation Coefficient, rpv) (1 variável intervalar e 1 variável nominal)
no IBM® SPSS0 ....
4.4.1.4. Teste de Qui-Quadrado (Chi-Square Test,
x')
(2 variáveis nominaisou 1 variável nominal e 1 ordinal) no IBM0 SPSS0 ... . 4.4.2._ Testes de Diferenças . . . . ... .
4.4.2.1. Testes de Diferenças em Contexto de Design Inter~Sujeitos ... .
4.4.2.1.1. Teste T para Amostras Independentes (t test for independent
samples, t) (Design inter-sujeitos, 2 grupos independentes, variável dependente intervalar} no IBM0 SPSS® ... .
4.4.2.1.2. Teste de Mann-Whitney (Mann-Whitney Test, U) (Design
inter~sujeitos, 2 grupos independentes, variável
dependente ordinal) no IBM® SPSS® . . . . . ... .
4.4.2.1.3. Análise de Variância (ANOVA) Unifactorial (One-Way
Analysis of Variance, F} (Design inter-sujeitos, 3 ou mais grupos independentes, variável dependente intervalar)
no IBM0 SPSS0 .. . .. . . ..
4.4.2.1.4. Teste de Kruskal-Wallis (Kruskal-Wallis Test,
x')
(Designinter~sujeitos, 3 ou mais grupos independentes, variável
dependente ordinal) no IBM• SPSS0 ... .
4.4.2.2. Testes de Diferenças em Contexto de Design Intra-Sujeitos
4.4.2.2.1. Teste T para amostras emparelhadas (t test for paired
samples, f) (Design intra-sujeitos, 2 momentos temporais, variável dependente intervalar) no IBM® SPSS® ... .
4.4.2.2.2. Teste de Wilcoxon (Wilcoxon Test, Z) (Design intra-sujeitos,
2 momentos temporais, variável dependente ordinal)
no IBM0 SPSS0 . . . . 4.4.2.2.3. Análise de Variância (ANOVA) para Medidas Repetidas
(Repeated Mensures Analysis of Variance, F) (Desígn
intra~sujeitos, 3 ou mais momentos temporais, variável
dependente intervalar) no IBM0 SPSS0 . . . .
4.4.2.2.4. Teste de Friedman (Fríedman Test,
x')
(Desígn intra-sujeitos,3 ou mais momentos temporais, variável dependente
ordinal) no IBM• SPSS• 4.5. Nota Final. ....
4.6. Conclusão e Próximo Capítulo .... Capítulo 5. Análise Exploratória de Dados
5.1. Introdução . .. . . .. .. .. .. . . . . . ... .
5.2. A Importância da Análise da Distribuição das Variáveis Intervalares
na Amostra em Estudo . . . . . ... .
5.3. Pressupostos Subjacentes à Utilização de Testes Paramétricas . . . . . ... .
5.3.1. Normalidade da(s) Distribuição(ões) .... .
5.3.2. Homogeneidade das Variâncias . . . ... . 5.3.3. Transformação de Variáveis Intervalares no IBM0 SPSS® 5.4. Conclusão ... . Capítulo 6. Conclusão ... . Bibliografia ... 116 121 132 134 135 141 150 161 173 175 180 185 197 208 208 211 211 218 221 229 234 240 241 245
,,
INTRODUÇÃO
Este Manual nasce da conjunção de três fatores: desafio, desejo e vontade.
Desafio lançado, há cerca de 10 anos, pela minha colega e amiga Carla Machado para que, em parceria, escrevêssemos um manual sobre metodologia de investigação e análise de dados qualitativos e quantitativos para alu,nos de graduação e pós-graduação.
Por variados motivos, esse manual não foi produzido ... No entanto, a "semente" ficou,
nascendo agora este, centrado unicamente na análise de dados quantitativos.
Desejo pessoal, que foi crescendo durante os últimos cinco anos, de escrever um manual que fosse distinto dos seus congêneres. Um manual que ensinasse, não apenas análise de dados com recurso ao IBM® SPSS®, mas que, e acima de tudo, colmatasse duas áreas em que, ao longo dos últimos anos, me fui apercebendo que os alunos do 1 ", 2°, e até 3" ciclos apresentam dificuldades e vulnerabilidades: a transição das hipó-teses de investigação para a seleção dos testes estatísticos adequados para a sua testagem, e, ainda, a tradução dos outputs do IBM® SPSS® no relato científico dos resultados ob-tidos. Este Manual foi pensado e concebido para preencher essas duas lacunas.
Vontade, por parte do Psiquilíbrios Edições, de publicar um manual sobre análise de dados que, de alguma forma, fosse a consequência natural do "Metodologia de Investigação em Psicologia e Educação", dos meus colegas Professor Doutor Leandro de Almeida e Doutora Teresa Freire.
Este Manual inicia com dois capítulos que organizam os alicerces para o seu objetivo principal. No Capítulo 1, são apresentados os conceitos centrais de metodologia de investigação fundamentais para a compreensão do processo de análise de dados quan-titativos. Por sua vez, o Capítulo 2 constitui a introdução ao software estatístico que serve de veículo para a transmissão dos conhecimentos - o IBM® SPSS®, atualmente
disponível na versão 19.0. Nos três capítulos seguintes, apresentamos o cerne deste
Manual- Estatística Descritiva (Capítulo 3), Estatística lnferencial (Capítulo 4) e Análise Exploratória de Dados (Capítulo 5). O Capítulo 6 finaliza o Manual com uma série de reflexões e sugestões para estudantes e investigadores.
Como o próprio nome indica, este Manual constitui-se como uma ferramenta
prá-tica que ajuda a colocar em marcha o processo de análise de dados quantitativos, à luz
das questões de investigação pré-formuladas, culminando com a divulgação científica dos resultados obtidos.
Manual de Análise de Dados Quantitativos com recurso ao IBM® SPS$0
Termino com os agradecimentos, por ordem cronológica, às pessoas que me apoia-ram na subida dos diversos degraus que me permitiapoia-ram chegar hoje ao produto final que é este Manual.
À Professora Doutora Isabel Soares, pelo incentivo para seguir o meu sonho de estudar Estatística aplicada à Psicologia.
To Dr. Elizabeth Gaffan, my Stats Lecturer at the University of Reading and, most of all, a role model in the quantitative research area.
Ao Professor Doutor Leandro de Almeida, responsável científico pela Coleção In-vestigação em Psicologia do Psiquilíbrios Edições e meu eterno Mestre na área da meto-dologia de investigação e análise de dados quantitativos.
À Dra. Vera Ramalho, responsável pelo Psiquilíbrios Edições, por me propor e me dar total liberdade para desenvolver este Manual nos moldes em que eu o queria escre-ver.
À IBM• SPSS• Internacional, na pessoa do seu Representante Nacional, Dr. João Pequito, pela resposta célere ao meu pedido de licença para utilizar os
screen shots
de menus,syntaxes
eoutputs
dos IBM• SPSS•, bem como pelo esclarecimento de todas as dúvidas que me foram surgindo ao longo da preparação deste Manual.À Doutora Carla Machado, pela leitura atenta e críticas construtivas aos vários capítulos.
À Doutora Ana Osório e à Dra. Marisa Fonseca, pela generosidade com que fize-ram uma revisão tão cuidada e minuciosa do Manual da primeira à última palavra.
Aos meus alunos, pelas dúvidas que, ao longo da última década, me foram colo-cando e me fizeram pensar em formas alternativas de transmissão de conceitos e conhe-cimentos.
A todos os leitores que, futuramente, me fizerem chegar comentários ou sugestões relativas a este Manual. Porque é sempre possível melhorar.
Ao João por me ter proporcionado os meios para ir mais longe e ter amortecido o primeiro confronto com uma nova realidade ... este Manual prova que valeu a pena!
À minha Família, por tudo o que não se consegue colocar em palavras. Em parti-cular, às minhas filhas, Mariana e Catarina, pelo entusiasmo e orgulho com que recebe-ram a notícia de que a mãe tinha acabado de escrever 1
'o livro" ...
6
A
Carla,
Pela Inspiração, Amizade, Saudade
Capítulo 1
Metodologia da Investigação e
1.1. Introdução
Na raiz da análise de dados quantitativos, há vários conceitos de metodologia da investigação que se torna necessário definir à partida e aos quais recorreremos ao longo
de todo o Manual. É, desde logo, importante que o leitor interiorize que o domfnio
teórico e prático de conceitos de metodologia da investigação quantitativa é fundamen-tal para que não se cometam erros na seleção e utilização de técnicas de análise de dados e subsequente interpretação dos resultados obtidos.
O objetivo deste capítulo é introduzir os concei.tos de metodologia da investigação relevantes para a análise de dados quantitativos.
1.2. Metodologia da Investigação e Análise de Dados Quantitativos
Metodologia da investigação e análise de dados não são duas áreas independentes, mas sim interdependentes. Se não, vejamos: Numa investigação, há oito passos que devem ser seguidos, desde a definição de um problema até à divulgação dos resultados
obtidos no estudo levado a cabo para o investigar (Almeida & Freire, 2008).
Concreta-mente, os passos são:
1.0 Definição de um Problema e/ ou Questão de Investigação;
Z.O Revisão Bibliográfica;
3.' Formulação das Hipóteses;
4." Definição do Plano ou Design da Investigação;
5.' Recolha dos Dados; 6. o Análise dos Dados;
7. o Interpretação dos Resultados Obtidos e a sua Integração no Respetivo Domínio de
Investigação;
8. o Divulgação dos Resultados.
Assinalados a itálico estão os passos diretamente relacionados com o momento da
análise dos dados (6.' passo). Desde logo, fica claro que a preocupação com a análise dos dados deve começar antes mesmo da sua recolha, mais especificamente no
momen-to da formulação das hipóteses (3.0 passo).
Para ilustrarmos as estreitas relações entre metodologia da investigação e análise de dados, ao longo deste e dos restantes capítulos, trabalharemos em torno de três exemplos de questões de investigação. A saber:
1. A ansiedade face a exames está relacionada com a dificuldade da matéria em avaliação?
Manual de Análise de Dados Quantitativos com recurso ao IBM® SPSS®
2. Há diferenças entre alunos de Cursos de Engenharia e alunos de Cursos de Ciências Sociais e Humanas ao nível da ansiedade face a exames?
3. Há diferenças entre a ansiedade sentida uma semana antes de um exame e a ansiedade sentida 24 horas antes do mesmo?
Os primeiros dois passos de qualquer investigação - Definição de um Problema e/ ou Questão de Investigação e Revisão Bibliográfica - constituem fases eminentemente teó-ricas. Será após a definição das questões de investigação (1." passo), as quais nortearão
todo o estudo, e a respetiva revisão bibliográfica (2.0 passo), que chegaremos à
Formu-lação das Hipóteses (3.0
passo). Uma hipótese é uma proposição !estável que estabelece uma
possível relação entre duas variáveis. Por variável entende-se uma característica em estudo que varia de indivíduo para indivíduo e que assume um valor único para cada indivíduo num determinado momento temporal (Almeida & Freire, 2008). As variáveis constituem a base de qualquer investigação quantitativa.
A hipótese, enquanto proposição que define uma possível relação entre duas variá-veis, pode apontar para três tipos de relação entre estas:
a) Associação entre duas variáveis;
b) Diferenças entre dois (ou mais) grupos numa determinada variável;
c) Diferenças entre dois (ou mais) momentos temporais ou condições experimen-tais numa determinada variável.
Retomando as questões de investigação anteriores, poder-se-ão formular as seguin-tes hipóseguin-teses:
Questão de Investigação 1: A ansiedade face a exames está relacionada com a dificuldade da matéria em avaliação?
Hipótese de Investigação 1: A ansiedade face a exames está associada à dificuldade da matéria em avaliação.
Questão de Investigação 2: Há diferenças entre alunos de Cursos de Engenharia e alunos de Cursos de Ciências Sociais e Humanas ao nível da ansiedade face a exames?
Hipótese de Investigação 2: Os alunos de Cursos de Engenharia diferem dos alu-nos de Cursos de Ciências Sociais e Humanas em termos de ansiedade face a exames.
Questão de Investigação 3: Há diferenças entre a ansiedade sentida uma semana antes de um exame e a ansiedade sentida 24 horas antes do mesmo?
Hipótese de Investigação 3: A ansiedade face a exames sentida uma semana antes do exame é diferente daquela sentida 24 horas antes do mesmo.
12
Capítulo 1 · Metodologia da Investigação e Análise de Dados Quantitativos
A formulação das hipóteses condiciona, de imediato, três aspetos:
(i) O design da investigação (4.' passo)
(ii) O estatuto das variáveis na investigação ( 4.' passo)
(iii) As técnicas de análise a utilizar no tratamento dos dados (6.' passo), recolhidos junto da população-alvo e/ou uma amostra (5.' passo)
Utilizando cada uma das hipóteses acima apresentadas, analisaremos o seu impac-to em cada um destes ponimpac-tos anteriores.
Hipótese de Investigação 1: A ansiedade face a <'~ames está associada à dificuldade da matéria em avaliação.
Neste caso, a hipótese aponta para uma associação entre duas variáveis - a 'ansie-dade face a exames' e a 'dificul'ansie-dade da matéria em avaliação'. Estamos, pois, perante um design correlacional, pelo facto de o objetivo do estudo ser avaliar a relação, asso-ciação ou correlação entre as variáveis em questão. A testagem desta hipótese implica,
assim, a utilização de Testes de Associação (cf. Capítulo 4, Ponto 4.4.1.).
Hipótese de Investigação 2: Os alunos de Cursos de Engenharia diferem dos alu-nos de Cursos de Ciências Sociais e Humanas em termos de ansiedade face a exames.
Estamos agora perante uma hipótese que postula diferenças entre dois grupos independentes de indivíduos- os 'alunos de Cursos de Engenharia' e os 'alunos de
Cursos de Ciências Sociais e Humanas1
- ao nível de uma mesma variável- a
/ansie-dade face a exames'. Assim, o design é inter-sujeitos, pelo facto de querermos
com-parar dois grupos independentes (e mutuamente exclusivos) ao nível da ansiedade
face a exames. No caso do design inter-sujeito, faz também sentido distinguirmos dois
tipos de variáveis - variável independente e variável dependente. A variável
inde-pendente é a variável que é manipulada na investigação e cujo efeito numa outra variável
se pretende avaliar (Field, 2009). A variável independente pode ser ativamente
manipu-lada pelo investigador ou não (por exemplo, 'sexo') (Almeida & Freire, 2008). A
va-riável dependente é a variável que sofrerá os efeitos da manipulação da variável
indepen-dente (Field, 2009). Voltando à nossa hipótese, a variável independente é o 'Curso' que
os participantes frequentam - 'Engenharia' versus 'Ciências Sociais e Humanas'. A
variável dependente será a 'ansiedade face a exames'. Finalmente, pela sua formula-ção, esta hipótese implica, para a sua testagem, o recurso a testes de diferenças para
comparação de grupos independentes, os quais são designados por Testes de Diferenças
em Contexto de Design Inter-Sujeitos (isto é, testes de diferenças para amostras
indepen-dentes) (cf. Capítulo 4, Ponto 4.4.2.1.).
Manual de Análise de Dados Quantitativos com recurso ao IBM0 SPSS0
Hipótese de Investigação 3: A ansiedade face a exames sentida uma semana antes
do exame é diferente daquela sentida 24 horas antes do mesmo.
Neste último caso, estamos na presença de uma hipótese que aponta para diferenças
entre dois momentos temporais- 'uma semana' versus '24 horas antes de um exame'- ao
nível de uma variável- 'ansiedade face a exames'. O design é, agora, intra-sujeitos, dado
que o grupo de participantes é o mesmo, no seio do qual queremos avaliar se há diferen-ças ao rúvel da ansiedade face aos exames uma semana e 24 horas antes de um exame. Também neste caso, faz sentido distinguir a variável independente da variável dependen-te. A variável independente é o momento temporal - 'uma semana' e '24 horas antes do
exame'- e a variável dependente é a 'ansiedade face a exames'. Finalmente, para a testar,
teremos de recorrer a testes de diferenças para comparação de um grupo único em dois momentos temporais distintos (ou em duas condições experimentais distintas), os quais
se designam por Testes de Diferenças em Contexto de Design Infra-Sujeitos (isto é, testes de
diferenças para amostras emparelhadas) (cf. Capítulo 4, Ponto 4.4.2.2.).
Resta referir que, no caso dos designs inter- e intra-sujeitos, podemos alargar as
comparações a 3 ou mais grupos e 3 ou mais momentos temporais ou condições expe-rimentais, respetivamente.
O Quadro 1 sistematiza as relações entre hipóteses, design de investigação, estatuto
das variáveis na investigação e técnicas de análise de dados.
Quadro 1. Hipóteses, Design da Investigação, Estatuto das Variáveis na Investigação e Técnicas de Análise de Dados Quantitativos
Hipótese Design da Estatuto das Variáveis Análise dos Dados
Investigação
A ansiedade face a exames Correlacionai Ansiedade face Testes de
está associada à dificuldade aos exames Associação
da matéria em avaliação. Dificuldade da matéria
em avaliação
Hipótese-Tipo: A está Variáveis: A e B
associada a B
Os alunos de Cursos de Inter-sujeitos Variável Independente: Testes de Diferenças
Engenharia diferem dos alunos Curso em Contexto de
de Cursos de Ciências Sociais Variável Dependente: Design Inter-Sujeitos
e Humanas em termos de Ansiedade face aos (Testes de diferenças
ansiedade face a exames. exames para amostras
Hipótese-Tipo: Há diferenças Variável Independente: independentes)
entre os grupos X e Y Grupo
ao nível da variável E. Variável Dependente: E
14
Hipótese
A ansiedade face a exames sentida uma semana antes do exame é diferente daquela sentida 24 horas antes do mesmo.
Hipótese-Tipo: Há diferenças
entre os momentos temporais/
I condições 1 e 2 ao nível da variável M.
Capítulo 1 · Metodologia da Investigação e Análise de Dados Quantitativos
Design da Estatuto das Variáveis Investigação
Intra-sujeitos Variável Independente: Momento Temporal Variável Dependente: Ansiedade face aos exames
Variável Independente:
Momento Temporal/ /Concljção Experimental yariável'Dependente: M
Análise dos Dados Testes de Diferenças em Contexto de Design Infra-Sujeitos (Testes de diferenças para amostras emparelhadas)
No caso do design intra-sujeitos, convém referir um caso particular de amostras
emparelhadas. Até aqui, o exemplo utilizado pretende testar as diferenças entre dois momentos temporais ao nível de uma mesma variável dependente e num único grupo de indivíduos que passa pelas duas avaliações- 'uma semana' e '24 horas antes de um exame'. No entanto, há casos de investigações em que temos amostras verdadeiramente emparelhadas. Ou seja, em que estamos perante dois grupos de indivíduos distintos que foram emparelhados no momento do seu recrutamento para o estudo. Como exem-plo, podemos pensar numa investigação que pretende avaliar o efeito do sexo (variável independente) na satisfação conjugal (variável dependente). Há duas formas distintas de testar esta hipótese. Recrutando para a amostra um grupo de homens e outro grupo de mulheres, os quais não têm qualquer tipo de relação entre si. Neste caso, estaremos
perante dois grupos verdadeiramente independentes e, consequentemente, um design
inter-sujeitos. Outra alternativa será recrutar casais para este estudo. Neste caso, tere-mos maridos e mulheres a avaliar a sua relação conjugal. Agora, será mais adequado
trabalharmos estes dados considerando que estamos perante um design intra-sujeitos,
por dois motivos: em primeiro lugar, porque foram incluídos casais na amostra (e não indivíduos sem qualquer relação conjugal entre si) e, em segundo lugar, porque é prová-vel que, neste caso, a satisfação conjugal dos homens e mulheres não seja independente.
Voltando ao 4.0 passo da investigação - Definição do Plano ou Design da
Investi-gação - temos ainda de tomar decisões no que toca à seleção dos participantes que irão
participar na investigação. Antes de mais, é necessário decidir qual a população-alvo da
investigação em causa. Por população entende-se o universo de indivíduos que estamos
interessados em estudar (Almeida & Freire, 2008). Uma vez que na maioria dos casos, é impossível um investigador avaliar todos os elementos da população-alvo, opta-se pelo
recrutamento e avaliação de uma amostra dessa população, ou seja, um conjunto mais
Manual de Análise de Dados Quantitativos com recurso ao IBM0 SPSS®
restrito de indivíduos pertencente à população-alvo que será estudado na investigação em causa
(Almeida & Freire, 2008). A amostra deverá ser recrutada de forma a que os
participan-tes na investigação sejam representativos da população-alvo.
Voltemos às nossas questões de investigação. Neste caso, a população são todos os alunos portugueses de Cursos de Engenharia e de Ciências Sociais e Humanas e a amostra será uma percentagem, a definir pelo investigador, de todos os alunos dos referidos cursos. Resta acrescentar que o processo através do qual a amostra é selecio-nada a partir da população-alvo se designa por amostragem, a qual pode assumir vá-rios contornos (para uma descrição dos diferentes tipos de amostragem consultar Almeida
& Freire, 2008).
Até este ponto, sabemos que a definição das hipóteses tem implicações diretas no
design, estatuto das variáveis na investigação e técnicas de análise de dados a aplicar para testagern das mesmas. No que toca a este último aspeto, dentro de cada grupo de técnicas apresentado no Quadro 1, há vários testes que podemos selecionar e dos quais falaremos ao longo deste Manual. Por agora, é importante chamar a atenção para o facto das variáveis poderem ser definidas de acordo com o nível de quantificação e que será este nível de quantificação que determinará qual o teste estatístico a selecionar dentro de cada grande grupo.
1.3. Variáveis
Num primeiro nível, as variáveis podem ser qualitativas ou quantitativas, poden-do, estas últimas, ser subdividas em discretas ou continuas. Variáveis qualitativas
de-finem qualidades dos indivíduos (por exemplo, sexo, cor do cabelo), enquanto variáveis
quantitativas são caraterísticas mensuráveis dos indivíduos (por exemplo, número de
fi-lhos, peso) (Almeida & Freire, 2008). Estas últimas podem ser discretas, se assumem
apenas valores inteiros (por exemplo, número de filhos) ou contínuas, se podem assumir qualquer valor, inteiro ou decimal, num determinado intervalo de valores (por exemplo, peso) (Fife-Schaw, 2006).
De acordo com a tipologia proposta por Stevens (1946), as variáveis podem ainda ser classificadas numa das seguintes quatro escalas de medida: nominal, ordinal, intervalar e proporcional ou de razão.
Variáveis nominais são variáveis puramente qualitativas. Por outras palavras,
tradu-zem qualidades dos participantes. O exemplo mais óbvio será a variável 'sexo'. Neste caso, os indivíduos podem ser classificados corno sendo homens ou mulheres, dois
16
Capítulo 1 . Metodologia da Investigação e Análise de Dados Quantitativos
grupos qualitativamente distintos e mutuamente exclusivos. Outros exemplos incluem as variáveis 'estado civil', 'grupo sanguíneo', 'cor dos olhos' ou 'profissão'. A codificação destas variáveis pode ser feita com recurso a letras (M ou F no caso do 'sexo') ou a
números (O e 1). Qualquer codificação numérica (por exemplo, atribuindo o valor O ao
sexo feminino e 1 ao sexo masculino) é totalmente arbitrária (utilizar os valores O e 1
é o mesmo que utilizar os valores 57 e 58) e não tem subjacente qualquer ordem lógica
(sendo, por isso, indiferente codificar o sexo feminino com o valor O e o sexo masculino
com o valor 1 ou fazer a codificação inversa). De facto, no caso das variáveis nominais,
os números representam meras "etiquetas" e nunca~vp.lores realmente numéricos, o que,
consequenternente, invalida, logo à partida, a· realização de qualquer operação aritmé-tica, como a sua soma ou cálculo da média. Apenas urna nota final relativa à codificação de variáveis nominais com duas categorias (dicotômicas): é sempre aconselhável
utili-zar a codificação O e 1 (por oposição aos habituais 1 e 2), dado que há análises
estatís-ticas (por exemplo, análise de regressão) que exigem este tipo de codificação no caso de variáveis dicotómicas.
Variáveis ordinais são variáveis qualitativas em que é possível ordenar, de forma
cres-cente ou decrescres-cente, as suas diversas categorias. Agora, os números atribuídos às categorias representam uma "quantidade" maior ou menor de urna determinada característica qualitativa. Um exemplo de variável ordinal são os 'escalões de IRS'. Atualmente, há oito escalões de IRS, sendo cada um deles delimitado pelos rendimentos anuais de um indivíduo ou agregado familiar. Por outras palavras, há uma ordem crescente (ou de-crescente) dos escalões, em função do rendimento individual ou familiar. No entanto, os intervalos entre diferentes escalões não têm subjacente uma diferença quantitativa cons-tante entre eles. Esta última constitui urna imporcons-tante característica das variáveis ordinais.
Enquanto o 1.0 escalão abrange rendimentos até €4.793, o 2.0
escalão abrande
rendimen-tos superiores a €4.793 e iguais ou inferiores a €7.250 e o 3.0
escalão engloba rendimen-tos que variam entre €7.250 e €17.979. Vemos, por isso, que, subjacente a urna subida
de um ponto em termos de escalão (por exemplo do 1.0
para o 2.0
ou do 2.0 para o 3.0),
não está urna subida quantitativa constante em termos de rendimento. Para além disso, podemos ter no mesmo escalão dois indivíduos com rendimentos anuais muito
distin-tos (por exemplo, apesar de estarem ambos no 1.0
escalão, um indivíduo pode ter tido um rendimento de €4.000 e outro um rendimento de €2.500).
Outros exemplos são o 'nível socioeconómico' ('Elevado', 'Médio', 'Baixo') ou a 'classificação de atletas no pódio' ('Medalha de Ouro', 'Medalha de Prata', 'Medalha de Bronze'). Na área da Psicologia, o exemplo mais evidente serão itens de escalas de
Likert. Neste caso, os indivíduos posicionam-se numa escala de, por exemplo, 5 pontos, em que o valor 1 poderá corresponder à categoria 'discordo totalmente', o valor 2 a
Manual de Análise de Dados Quantitativos com recurso ao IBM0 SPS$0
'discordo', o valor 3 a 'não discordo nem concordo', o valor 4 a 'concordo' e o valor 5 a 'concordo totalmente'. Neste caso, os indivíduos podem ser ordenados em função do seu grau de concordância em relação ao assunto em questão, o que mostra que estas variáveis são já, de certo modo, quantitativas. No entanto, não se pode inferir que a
diferença qualitativa entre dois indivíduos com respostas de 1 ('discordo totalmente') e
2 ('discordo') seja exatamente a mesma que entre outros dois indivíduos com respostas de 4 ('concordo') e 5 ('concordo totalmente'), apesar de haver apenas um ponto de diferença em ambos os exemplos. Como implicação, não podemos trabalhar estes valo-res como verdadeiras grandezas numéricas, sendo necessário recorrer a análises de dados não-paramétricas, isto é, baseadas em ordens e acerca das quais voltaremos a falar no Capítulo 4.
Variáveis intervalares são variáveis naturalmente quantitativas ou numéricas, como,
por exemplo, a 'idade'. Agora podemos assumir intervalos idênticos em diferentes pontos da escala, pelo que as variáveis intervalares permitem o recurso a operações aritméticas, como, por exemplo, o cálculo da média.
Finalmente, as variáveis proporcionais ou de razão diferem das intervalares,
ape-nas pelo facto de possuírem, ao contrário das anteriores, um zero absoluto. Assim, neste
quarto tipo de variáveis, um O (zero) representa a total ausência da característica. Este tipo de variável é frequente em Física (por exemplo, 'peso', 'comprimento', 'resistência elétrica'), sendo muito raro em Psicologia (em que dimensão psicológica podemos afir-mar que O representa ausência de característica?).
Pelas definições das quatro escalas de medida é possível verificar que estas se encontram numa hierarquia, onde as variáveis nominais (puramente qualitativas) não permitem qualquer tipo de quantificação até às variáveis proporcionais/ de razão, em que estamos perante variáveis que permitem o máximo de quantificação (Quadro 2).
Quadro 2. Escala de Medida de Variáveis
Nominais Categorias qualitativas mutuamente exclusivas
Ordinais Ordenação das categorias qualitativas
Intemalares Intervalos idênticos em diferentes pontos da escala
Proporcionais/ Zero absoluto
/de Razão
18
Capítulo 1 · Metodologia da Investigaçiio e Anâlíse de Dados Quantitativos
À medida que vamos descendo no Quadro 2, as variáveis vão acumulando as
características apresentadas nas linhas anteriores. Por exemplo, as variáveis ordinais, para além de permitirem a ordenação das categorias qualitativas, caracterizam-se tam-bém pelo facto de integrarem categorias mutuamente exclusivas (característica das variáveis nominais).
Qual a importância de saber distinguir corretamente os diferentes tipos de variá-veis presentes numa investigação? Nas palavras de Stevens (1946), "( ... )lhe statistical
manipulations that can legitimately be applied to empírica! data depend upon lhe type
of scale against which lhe data are ordered" (p. 677, it~lico nosso). Tal significa que: (i)
diferentes escalas de medida têm propriedades matemáticas distintas e (ii) as operações
estatísticas aplicáveis a cada uma das escalas de medida diferem (Stevens, 1946). Por
outras palavras, qualquer decisão acerca de que medida descritiva (cf. Capítulo 3) ou
teste inferencial (cf. Capítulo 4) utilizar depende da escala de medida subjacente às
variáveis em jogo. Assim, testes que são adequados para variáveis intervalares são proibitivos no caso de variáveis nominais ou ordinais.
Uma última nota importante. Há variáveis que podem ser recolhidas segundo dife-rentes escalas de medida. Tomemos como exemplo a 'escolaridade' (Ver Quadro 3). Se
optarmos por questionar: "Tem a escolaridade mínima obrigatória?", devendo o indivíduo
responder 'Sim' ou 'Não', estaremos perante uma variável nominaL No entanto, caso
coloquemos a questão sob a forma "Que nível de escolaridade completou?" e
apresentar-mos várias opções de resposta (por exemplo, '1.' Ciclo', '2.° Ciclo', '3.° Ciclo', 'Ensino
Secundário', 'Ensino Superior'), a variável daqui decorrente será ordinal. A escolarida-de poescolarida-de ainda assumir uma escala escolarida-de medida intervalar se perguntarmos aos
indiví-duos: "Excluindo reprovações, quantos anos de escolaridade completos tem?". Neste último
caso, o indivíduo deverá referir o número de anos de escolaridade que possui, excluin-do um eventual número de reprovações.
Sendo possível, uma variável deverá ser recolhida sob a forma intervalar, por dois motivos. Em primeiro lugar, a partir de uma variável intervalar é sempre possível che-garmos a uma variável ordinal ou mesmo nominal, a partir da recodificação da variável original. O movimento inverso (de nominal ou ordinal para intervalar) não é possível. No Quadro 3 apresenta-se um exemplo de um indivíduo com 9 anos de escolaridade completos (variável intervalar) e como este valor é recodificado de modo a obtermos
uma variável ordinal ou nominal. Este indivíduo ficará integrado na categoria '3.0
Ci-clo', no caso da variável ordinal correspondente e na categoria 'Não', no caso da variá-vel nominal equivalente. Ao perguntarmos ao indivíduo se tem a escolaridade obriga-tória, não há forma de, a partir da sua resposta ('Não'), saber se ele está no nível de escolaridade correspondente ao 3.° Ciclo ou se tem 9 anos de escolaridade completos.
Manual de Análise de Dados Quantitativos com recurso ao lBM0 SPSS0
Quadro 3. Exemplo da Variável 'Escolaridade' Recolhida Segundo Diferentes Escalas de Medida
Questão Resposta(s) possível( eis) Exemplo Intervalar/Proporcional "Excluindo reprovações, quantos anos de escolaridade completos tem?" Número de anos de escolaridade '9 anos' Ordinal "Que nível de escolaridade completou?" '1.° Ciclo' '2.° Ciclo' '3.' Ciclo' 'Ensino Secundário' 'Ensino Superior' '3.° Ciclo' Nominal "Tem a escolaridade mínima obrigatória?" 'Não' 'Sim' 'Não'
O segundo motivo prende-se com o facto das variáveis intervalares serem bastante
mais flexíveis em termos da sua análise, permitindo o recurso a testes paramétricas ( cf.
Capítulo 4). No caso das variáveis ordinais e nominais, apenas podemos recorrer a
testes não-paramétricos ( cf. Capítulo 4), os quais são mais rígidos e menos robustos do
que os testes paramétricas.
1.4. Técnicas de Análise de Dados Quantitativos
Depois de recolhidos os dados, entramos no 6.' passo, o qual consiste na sua (por vezes, temida) análise. Dentro das técnicas de análise de dados quantitativos, há dois ramos a considerar: Estatística Descritiva e Estatística Inferencial.
A Estatística Descritiva engloba um conjunto de medidas - de tendência central e de
dispersão - e de representações gráficas que nos permitem descrever, de uma forma sumária, um conjunto de dados (Howell, 2010) (cf. Capítulo 3). O recurso à Estatística Descritiva far--se-á numa primeira fase de análise dos dados recolhidos. Por sua vez, a Estatística
Inferencial permitir-nos-á retirar conclusões acerca da população-alvo, com base nos
resulta-dos obtiresulta-dos na amostra daí recrutada (Howell, 2010). O ramo da Estatística Inferencial engloba, pois, todos os testes estatísticos - de associações e de diferenças - que nos permitirão concluir, recorrendo a probabilidades estatísticas, se as associações ou
dife-ren~as encontradas na amostra estarão ou não presentes na população-alvo (cf. Capítulo 4). E o ramo da Estatística Inferencial que nos permite testar as hipóteses formuladas no 3.' passo do processo de investigação.
Um passo intermédio importante entre a descrição inicial dos dados, com recurso à Estatística Descritiva e à Estatística Inferencial, é o estudo das características da dis-tribuição das variáveis na amostra em questão. Esse estudo é feito através da Análise
20
Capítulo 1 · Metodologia da Investigação e Análise de Dados Quantitativos
Exploratória de Dados, a qual se traduz num conjunto de procedimentos que nos permitem
decidir com segurança a que tipo de teste estatístico - paramétrica ou não-paramétrica - deve-remos recorrer para testar as hipóteses de investigação (Howell, 2010) (cf. Capítulo 5).
Ao longo dos próximos capítulos serão apresentadas várias técnicas de análise de dados quantitativos com recurso ao IBM® SPSS• (Versão 19.0), provavelmente o software de análise estatística mais popular entre os alunos, docentes e profissionais da área das
Ciências Sociais e Humanas. O próximo capítulo (cf. Capítulo 2) é, pois, dedicado à
apresentação do IBM• SPSS• e cuidados a ter na construção de uma base de dados de qualidade, a qual deverá constituir um alicerce sqlido para a fase posterior de análise
dos dados. ·
No que diz respeito às técnicas de análise de dados propriamente ditas (cf.
Capí-tulos 3, 4 e 5), será adotada a seguinte abordagem: partindo de uma das hipóteses de
investigação anteriormente apresentadas, começaremos por conduzir o leitor pelo
pro-cesso de seleção de qual a técnica de análise de dados é adequada para a hipótese em
questão, bem como para as variáveis que a integram (Saber Decidir). Após a tomada de
decisão, prosseguiremos para a execução da técnica de análise escolhida no IBM• SPSS•
(Saber Fazer). No seguimento da execução da respetiva técnica, procederemos à interpre-tação dos resultados, à luz da hipótese de investigação em causa (7.' passo do processo
de investigação) (Saber Interpretar). Por fim, apresentaremos a forma como os resultados
obtidos devem ser redigidos no contexto de um artigo científico (ou de uma monografia,
ou dissertação de mestrado ou doutoramento) (8.' passo) (Saber Redigir). A redação dos
resultados seguirá as normas da 6.' Edição do Manual de Publicação da American
Psychological Association (APA, 2010).
1.5. Conclusão e Próximo Capítulo
Este capítulo teve como objetivo enfatizar os conceitos de metodologia de investi-gação imprescindíveis para o momento da análise de dados (para um aprofundamento
dos mesmos consultar Almeida & Freire, 2008).
O próximo capítulo centra-se no IBM• SPSS• e na sua utilização, ficando, desde já, um alerta: o IBM• SPSS• é uma ferramenta de trabalho preciosa nos dias de hoje ... para quem souber decidir o que fazer, como fazer e como interpretar os resultados obtidos. Por outras palavras, para quem tiver conhecimentos sólidos na área das técni-cas de análise de dados quantitativos. Contribuir para a consolidação dos conhecimen-tos nesta área e promover a segurança na tomada de decisão e subsequente interpreta-ção e redainterpreta-ção dos resultados obtidos, são os objetivos centrais dos próximos capítulos.
Capítulo 2
Construção de Ficheiros de Dados de Qualidade
no IBM® SPSS®
2.1. Introdução
Após a recolha dos dados (5° passo da investigação), chega o momento de os inserir no IBM® SPSS®, de modo a criar o ficheiro que permita o seu tratamento quan-titativo.
A construção de um ficheiro de dados de qualidade no IBM® SPSS® é fundamental
para o manuseamento fácil, intuitivo, correto e seguro das variáveis no momento da
realização da análise quantitativa. No entanto, desenvolver ficheiros ou bases de dados de qualidade requer conhecimentos e, sobretudo, jnvestimento de tempo.
É objetivo deste capítulo ensinar a con;;truir
é;
ou promover a consolidação de conhecimentos relativos à construção de ficheiros de dados no IBM® SPSS®.2.2. Data Editor, Data View e Variable View
Ao abrimos o programa (fazendo duplo clique no símbolo
8
IBM SPSSStatistics19no ambiente de trabalho ou procurando-o na lista dos programas instalados no compu-tador), deparamo-nos com a seguinte janela (Imagem 1).
25
íl
0Rll:IIIMMotl$ii
Q~llldatl>Manual de Análise de Dados Quantitativos com recurso ao IBMe SPSS0
Para construir um novo ficheiro de dados, deveremos escolher Type in data (segun-da opção do lado direito) e carregar em OK no canto inferior direito da janela de abertura.
Chegamos então ao Data Editor do IBM• SPSS®, o qual tem duas panorâmicas: Data View (Imagem 2) e Variable View (Imagem 3). Para alternar entre ambas, deveremos carregar nos separadores que se encontram no canto inferior esquerdo, sendo possível, em qualquer uma das panorâmicas, acrescentar, alterar ou apagar informação contida no ficheiro de dados.
No momento de abertura do IBM• SPSS• para criação de um novo ficheiro de dados, tanto a Data View como a Variable View são meras páginas quadriculadas em branco.
A Data View (Imagem 2), panorâmica que aparece de imediato quando o IBM• SPSS• abre, permitirá a visualização dos dados, após a sua inserção. Nesta panorâmica:
(i) cada linha representa um caso ou participante; (ii) cada coluna representa uma variável;
(iii) cada célula representa o valor que cada variável assume para cada participan-te. Trata-se, portanto, da interseção de cada caso com cada variável.
Imagem 2. Panorâmica Data View do IBM• SPSS•
26
Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS
Por seu turno, a Variable View (Imagem 3) mostra as caraterísticas e informação relativas a todas as variáveis contidas no ficheiro de dados. Nesta panorâmica:
(i) cada linha representa uma variável;
(ii) cada coluna representa uma caraterística da variável, havendo 11 campos sob os quais uma variável pode ser caraterizada, os quais serão explicados no Quadro 4.
Imagem 3. Panorâmica Variable View do IBM• SPSS•
O Quadro 4 descreve os campos presentes na Variable View, incluindo ainda cuida-dos a ter e/ ou recomendações específicas para cada um deles.
Manual de Análise de Dados Quantitativos com recurso ao IBM0 SPSS0
Quadro 4. Descrição dos Campos da Variable View Campo Name Type Width Decimais La bel Values Descrição
Designação breve da variável
Tipo de variável
Default': Numeric (Numérica)
Número de dígitos permitidos em cada célula da variável Default: 8
Número de casas decimais da variável
Default: 2
Designação mais alargada da variável
Codificação dos valores numéricos que as variáveis nominais e ordinais podem assumir Default: Nane (Nenhum)
Cuidados a ter/Recomendações
Cada variável tem de ter um nome único, não poden~
do existir duplicados no ficheiro de dados.
Permitidos até 64 caracteres- maiúsculos e/ ou minús~ culos - em qualquer combinação de letras, dígitos, outros caracteres, ponto final (.) ou underscore (J, não sendo, no entanto, possível começar o nome de uma variável com um _dígito.
Aconselhável a utilização de . ou _ para· separação de palavras, dado que os espaços não são permitidos.
Há nomes que o IBM• SPSS• impede que sejam utili-zados (por exemplo, BY ou GE), surgindo, nestes
ca-sos, uma mensagem de erro.
Recomendável criar designações breves, mas inequí-vocas.
Aconselhável utilizar apenas variáveis numéricas. Variáveis String que admitem a inserção de dados sob a forma de nomes não permitem qualquer tipo de tra~
tamento estatístico.
Datas devem ser utilizadas apenas para registo da recolha e não para efeitos de cálculo.
Raramente é necessário modificar intencionalmente este campo, pelo que não voltará a ser referido ao longo deste Manual.
No caso de variáveis que só assumem valores inteiros, pode definir-se este campo como O (zero).
No caso de variáveis contínuas, é imperativo garantir que o número de casas decimais é igual ou superior a 1. Permitidos até 256 caracteres, espaços entre palavras e as designações que não são permitidas no campo Name. Quanto mais descritivo o Label de uma variável, mais fácil será ler os Outputs, os quais utilizarão o Label (e não o Name) como descritor de cada variável. Permitidos até 120 caracteres por Value Label. Quando há Values definidos, serão estes os apresenta~
dos nos Outputs (e não os valores com que as respe~
tivas categorias foram codificadas).
1 Por Default entende~se a definição automática atribuída à categoria em causa pelo JBM® SPSS0 .
28
Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS
Quadro 4. Descrição dos Campos da Variable View (continuação)
Campo Missing Columns Align Measure Role Descrição
Valor a atribuir à ausência de resposta ou resposta inválida
Default: Nane (Nenhum)
Número de caracteres permitidos no nome (Name) da variável tal como é apresentado na Data View Default: 8
Alinhamento dos dados na Data View
Default: Right (Direita) Escala de medida da variável Default: Unknown
(Desconhecido)
Papel da variável
Default: Input (Variável
Independente)
Cuidados a ter/Recomendações
O valor definido como Missing não pode coincidir com qualquer valor válido que a variável possa assumir. Possível definir até 3 valores de Missing, por exemplo, para distinguir a ausência de resposta, da resposta inválida, da categoria "não aplicável".
Aconselhável utilizar 99, 999, ou 9999.
Raramente é necessário modificar intencionalmente este campo, pelo~q?e não voltará a ser referido ao longo deste o/fanual.
Raramente é necessário modificar intencionalmente este campo, pelo que não voltará a ser referido ao longo deste Manual.
Recomendável que a definição da escala de medida das variáveis - nominal; ordinal ou· interválar (sCale) - seja efetuada, uma vez que consciencializa o inves-tigador, desde logo, para o tipo de variável com que
trabalhará.
Em determinados menus de análises do IBM0 SPSS®, a definição do papel da variável (por exemplo, como
variável independente ou dependente) fará com que o próprio IBM0 SPSS® pré~selecione as variáveis adequa~ das em função do papel previamente definido neste campo.
Aconselhável que o Input a utilizar seja o de Nane, dado que há variáveis que podem assumir o papel da variável independente num momento da análise, pas-sando a dependente no momento seguinte.
Uma vez definidos, todos os campos ficam gravados no ficheiro de dados, não sendo necessário voltar a defini-los na próxima sessão de trabalho.
2.3. Construção de um Ficheiro de Dados
A primeira variável de qualquer ficheiro de dados deverá ser sempre uma variável numérica que identifique inequivocamente os participantes. Por outras palavras, deve existir no início do ficheiro de dados, uma variável que, através de um código numérico único, identifique cada um dos participantes da amostra. Para além disso, este mesmo
Manual de Ar1álíse de Dados Quantitativos com recurso ao IBM» SPSS®
código deverá ser registado no questionário ou registo em papel desse mesmo indiví-duo. Tal estratégia permite que haja uma correspondência entre cada linha do ficheiro de dados e o respetivo suporte em papel através do qual foram recolhidos os dados junto dos participantes. A vantagem de se utilizarem códigos numéricos no ficheiro de dados é o de preservar o anonimato dos dados.
Embora não seja objetivo trabalhar com esta variável, esta poder-se-á tornar muito útil quando, por exemplo, quisermos selecionar algum(ns) participante(s) do ficheiro de dados. Comecemos então por criar a variável que podemos designar por 'Participante' (ou 'Identificação' ou 'Caso', ou outra designação que o leitor prefira).
Ao preencher o campo Name com a designação 'Participante', todos os outros cam-pos são automaticamente preenchidos com as definições default (Imagem 4).
Imagem 4. Panorâmica Variable View da Variável 'Participante'
30
Capítulo 2 -Construção de Bases de Dados de Qualidade no IBM SPSS
Pelas características da variável 'Participante', há campos da sua definição que não sofrerão alterações, havendo outros que deverão ser modificados.
Assim, a variável 'Participante' é uma variável numérica (campo Type a manter), que não necessita de casas decimais pelo facto de assumir apenas números inteiros (campo Decimais a modificar) e cujo Label poderá ser também 'Participante' (campo
Label a preencher). Neste caso, Name e Label coincidem, o que nem sempre acontecerá, como veremos em variáveis a definir ao longo deste capítulo. Esta variável não neces-sita de Values (campo Values a manter), já que não há nenhuma codificação subjacente. Quanto ao campo Missing, e por uma questão de prJncípio, deveremos sempre definir um valor a ser atribuído à não-resposta ou re'iPosta i;,válida (por exemplo, 999), caso não haja informação relativa a um qualquer participante (campo Missing a modificar). A escala de medida da variável 'Participante' será Nominal (campo Measure a modificar), uma vez que estamos perante uma variável que identifica os participantes, tal como o nome próprio de cada um deles o faria. Por fim, pelas razões apontadas no Quadro 4, definiremos o campo Role como None (campo Role a modificar).
Para introduzir as alterações mencionadas em cada um dos campos corresponden-tes, devemos carregar no lado direito da célula correspondente ao campo a modificar.
Comecemos pelo campo Decimais. Para reduzirmos o número de casas decimais de 2 para O, carregando no lado direito desta célula, aparecem duas setas que nos permi-tem aumentar ou diminuir o número de casas decimais (Imagem 5).
Imagem 5. Modificação do Campo Decímals da Variável 'Participante'
' '
.
jl!!!l!i!!i,ILJ~
!B;,21,Jll.im=l
li ..
!llllilLIJ4'411lll ..
:'l ..
~~,
~
r,..,-"f;;:O':'N~. Widlli.J o!l{:imatn ~
.
~~-~.~-~!Pc:~:~--"~::~~c-~---!!...
--:P· ..
'Laoo! ~GS' -~: Mis$inq ii <:Oiumn:tjl · Align iL Me~uro !i RoiQ
_:.__________ r--- ~ ..
--No campo Labél, escrévemos a designação mais alargada da variável (neste caso coincidente com o Nome). Passando ao campo Missing, carregando no lado direito desta célula, surge uma pequena janela. Devemos mudar a opção de No missing values para
Discrete missing values, colocar na célula abaixo o valor 999 e carregar em OK (Imagem 6).
Manual de Análise de Dados Quantitativos com recurso 110 IBM" SPSS0
Imagem 6. Modificação do Campo Missing da Variável 'Participante'
Para modificarmos o campo Measure, carregamos no lado direito desta célula e aparece um menu que nos permite seleccionar Nominal (Imagem 7).
Por fim, no campo Role, carregamos no lado direito da célula e aparece o menu da Imagem 8, o qual nos permite selecionar Nane. Fica assim concluída a definição da variável 'Participante'.
lmag~m 8. Modificação do Campo Role da Variável 'Participante' file · g<it· !{low Qala · !faMfOflll .611#e · Dil'lK:If!imtio~ Qr.li>IÍ$ ,!!lilllles Add-Qns· -~<IOW ijtlp
i(l§ll.~
•.
!l ...
l;!li;l· .. ":' ••.
~•.. ·
..
l!lim ...
IJJ$ .•..
111~ill ••
~t~..
~•.
:f!\i
Name ·r rr Wídth f lk!cimal$, Lsbel í -V~s - • Missi ~ eólumli.s • f.J' M&l1$1Mll
Capítulo 2 - Construção de Bases de Dados de Qualidade no IBM SPSS
Passemos agora à variável 'Sexo'. Neste caso, o Name e Label coincidirão e, tal como na variável anterior, não serão necessárias casas decimais. No entanto, no caso da va-riável 'Sexo', teremos de introduzir no ficheiro de dados a informação relativa à codificação atribuída ao sexo masculino e ao sexo feminino (por exemplo, O e 1, respetivamente). Tal como foi já discutido no Capítulo 1, estes valores funcionarão como
meras 11 etiquetas" com as quais não poderemos fazer análises. Esta codificação será
inserida no campo Values. Assumiremos, uma vez mais, o valor 999 como Missing e também a variável 'Sexo' será uma variável Nominal e classificada como Nane na última
coluna. 11
Para modificarmos o campo Values, carregamo's no lado direito desta célula, o que faz aparecer uma janela onde colocaremos a respetiva codificação desta variável (Ima-gem 9).
Imagem 9. Modificação do Campo Va/ues da Variável 'Sexo'
'
····+- ._, ... "f
. ... L
No Value colocamos o valor '0', no Label a designação 'Masculino' e carregamos em
Add, o que faz com que a codificação deste grupo passe para o quadro abaixo. Fazemos o mesmo para o sexo feminino: Value '1', Label 'Feminino' (Imagem 10). Carregamos em
Manual de Análise de Dados Quantitativos com recurso ao JBM® SPSS®
Imagem 10. Modificação do Campo Values da Variável 'Sexo'
Está compl~ta a caracterização da variável 'Sexo'.
Esta é uma boa altura para gravarmos o ficheiro de dados, o que fazemos recorren-do ao menu File - Save As (Imagem 11).
Imagem 11. Gravação do Ficheiro de Dados
'+'Mh!MP!ibid"i!Mfi&MPB +fid# ·
• filé-" JgdU YJow Qata· !rinsloriÍl '&jálml O~&dfo!:a!tilttng
·~ "'"" OpcnDai:!J!;ase @I RM,!lT$l!Mlll ... -eig~-;~---···---·--c~;:;:;---irl§.:MI Cb1•$ ~ E:Qlcr!loOal:!baso .. ,
O!SPI~yOala FliO l!lfMI'latto~
;j'cat!J.oOata...
Q SIOP PIIIC!lSSQI
l\ii~$$Mll .. ,
34
Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS
Após selecionarmos o local do computador onde queremos gravar o ficheiro de dados, devemos atribuir-lhe uma designação. Neste caso, o ficheiro foi nomeado com 'Ficheiro de Dados (11 Março)' (Imagem 12).
É uma boa prática colocar, no próprio nome do ficheiro, a data em que este foi criado e/ ou modificado. É inevitável, à medida que o trabalho progride, começarmos a ter várias versões do ficheiro de dados, pelo que a inclusão da data evita que se utilize outro tipo de designações (por exemplo, 'Ficheiro de dados Final' ou 'Ficheiro de dados Finalíssimo') que rapidamente ficam desatualizadas.
Imagem 12. Atribuição de uma Designação ao Fiçheiro de Dados
L~Ji
...
I! .•.•
JÇil;) .••...~.·
..?'
...
llll.lm.d·ll1l·,·•··it.lll.4'4..ool.m~~,~
•.•.
~.
~~:~~_j_Qeci!lÍnb f; . LabeJ.... Values : M!;lsín!J · ~ C<tlumns f • Ali Menure Role
. . "'"'"'""'····
... L. ... 1
File name:
Kooplng 2 of2wrlablos • /Flcllelro do Dados {11 MafÇ<))
li )yrile ""'iatle nam~s IQ spr~adshe~l
flll Sa•Je value l3~~1s wMm dMinea instoad oi dMav<~lues
l!lil s;.,·~ v<~lu~ la~~ls ln!Q a .sas fM
As Imagens 13 e 14 apresentam o ficheiro de dados finalizado, depois de inseridas todas as variáveis de uma hipotética investigação que servirá de base aos capítulos subsequentes deste Manual.
Como podemos ver, este contém 15 variáveis no total, todas elas numéricas (Type),
todas elas com O (zero) decimais (Decimais). O Label (o qual aparece em maior destaque na Imagem 14) apresenta as designações alargadas das variáveis presentes neste ficheiro de dados. Para todas as variáveis, foi definido o valor 999 como o valor a atribuir à informação em falta (Missing). No caso das variáveis nominais e ordinais, procedeu-se à sua codificação (Values). Os campos Width, Columns e Align não foram intencionalmente alterados. Em alguns casos, os valores diferem do default, porque o IBM• SPSS• procedeu à alteração automática destes campos (por exemplo, relativamente à variável 'Idade', o
Manual de Análise de Dados Quantitativos com recurso ao IBM® SPSS"'
campo Width passou a 11 e o campo Columns alterou para 5). Estas alterações em nada afetam o ficheiro de dados. Finalmente, para cada variável foi definida a respetiva escala de medida (Measure) e para todas foi definido como Nane o seu papel na investigação (Role).
No que diz respeito aos Labels, chamamos a atenção para a importância de incluirmos designações alargadas para as variáveis do ficheiro de dados (Imagem 14). Enquanto em algumas variáveis o Label é um duplicado do Name (por exemplo, 'Participante', 'Sexo', 'Idade'), noutras o Label transmite informação que não está explícita no Name da variável. Veja-se o exemplo da variável 13, denominada 'Ansiedade_1semana'. Ao lermos o Label,
ficamos a saber que esta variável traduz a ansiedade dos participantes uma semana antes de um exame e que, valores mais elevados, correspondem a maior ansiedade.
36
Capítulo 2 · Construção de Bases de Dados de Qualidade no IBM SPSS
Depois de criadas e definidas todas as variáveis do ficheiro de dados, chega o momento de inserir os dados propriamente ditos na Data View, a qual, neste momento, contém apenas todas as designações das variáveis, tal como foram definidas na Variable View (Imagem 15).
A tarefa da inserção dos dados no ficheiro agora criado é igualmente exigente, em termos de investimento de tempo e de concentração por parte do investigador, de modo a que se reduza ao mínimo a probabilidade de erro. É, por isso, uma tarefa que não pode ser encarada de ânimo leve nem ser entregue a alguém que não tenha experiência de investigação.
A Imagem 16 apresenta a primeira linha preenchida.
Manual de Análíse de Dados Quantitativos com recurso ao IBM0 SPSS®
Uma vez que inserimos Value Labels para as variáveis nominais e ordinais codifi-cadas, podemos beneficiar da utilização de uma opção que permite visualizar as cate-gorias de cada variável em vez dos seus valores numéricos. Por exemplo, inserir os dados na variável 'Sexo' poderá ser mais fácil se pudermos escolher entre 'Masculino' e 'Feminino', em vez de 'O' e '1'. Para tal, temos de ativar a opção que aparece em View - Value Labels (Imagem 17).
Imagem 17. Opção View - Value Labels
i I :
Agora, podemos inserir os dados das variáveis nominais e ordinais escolhendo entre as categorias possíveis (por exemplo, 'Masculino' versus 'Feminino') (Imagem 18).
Imagem 18. Inserção dos Dados com a Opção Value Labels Activada
Na Imagem 19, apresenta-se a Data View do ficheiro já com os dados de 72
parti-cipantes inseridos.
38
Capítulo 2 · Construção de Bases de Dados de Qualídade no IBM SPSS
Imagem 19. Data View do Ficheiro de Dados (11 Março) com 72 Participantes com a Opção Value Labels Ativada
Caso se prefira ver os números e não os Value Labels (Imagem 20), apenas temos de ir de novo a View - Value Labels e desativar a opção anteriormente ativada.
Imagem 20. Data View do Ficheiro de Dados (11 Março) com 72 Participantes com a Opção Value Labels Desativada