• Nenhum resultado encontrado

Conjuntos de múltiplas

No documento IBM SPSS Custom Tables 24 IBM (páginas 83-91)

Tabelas Customizadas e o Construtor de Gráfico suportam um tipo especial de "variável" chamado

conjunto de múltiplas respostas. Os conjuntos de múltiplas respostas não são na realidade "variáveis" no sentido normal. Não é possível vê-los no Editor de Dados, e outros procedimentos não os reconhecem. Os conjuntos de múltiplas respostas utilizam diversas variáveis para registrar respostas para perguntas em que o respondente pode fornecer mais de uma resposta. Os conjuntos de múltiplas respostas são tratados como variáveis categóricas, e a maioria das coisas que podem ser feitas com as variáveis categóricas também pode ser feita com conjuntos de múltiplas respostas.

Os conjuntos de múltiplas respostas são construídos a partir de diversas variáveis no arquivo de dados. Um conjunto de múltiplas respostas é uma construção especial dentro de um arquivo de dados. É

possível definir e salvar conjuntos de múltiplas respostas em arquivos de dados IBM®SPSS Statistics, mas não é possível importar ou exportar conjuntos de múltiplas respostas de/para outros formatos de

arquivo. É possível copiar conjuntos de múltiplas respostas a partir de outros arquivos de dados do IBM SPSS Statistics utilizando Copiar Propriedades de Dados, que é acessado a partir do menu Dados na janela Editor de Dados.

Arquivo de dados de amostra

Os exemplos nesse capítulo usam o arquivo de dados survey_sample.sav. Consulte o tópico arquivos de dados para obter mais informações

Todos os exemplos fornecidos aqui exibem rótulos de variáveis em caixas de diálogo, ordenados em ordem alfabética. As propriedades de exibição da lista de variáveis são especificadas na guia Geral na caixa de diálogo Opções (menu Editar, Opções).

Contagens, respostas, porcentagens e totais

Todas as estatísticas de sumarização disponíveis para variáveis categóricas também estão disponíveis para conjuntos de múltiplas respostas. Algumas estatísticas adicionais também estão disponíveis para

conjuntos de múltiplas respostas.

1. Nos menus, escolha:

Analisar > Tabelas > Tabelas Customizadas...

2. Arraste e solte Fontes de notícias (esse é o rótulo descritivo para o conjunto de múltiplas respostas

$mltnews) da lista de variáveis para a área Linhas da área de janela de tela.

O ícone próximo à "variável" na lista de variáveis identifica-a como um conjunto de múltiplas dicotomias.

Para um conjunto de múltiplas dicotomias, cada "categoria" é, na verdade, uma variável separada, e os rótulos de categoria são os rótulos de variáveis (ou nomes de variáveis para variáveis sem rótulos de variáveis definidos). Nesse exemplo, as contagens que serão exibidas representam o número de casos com uma resposta Sim para cada variável no conjunto.

3. Clique com o botão direito em Fontes de notícias na visualização da tabela na área de janela de tela e selecione Categorias e totais no menu pop-up.

4. Selecione (clique) Total na caixa de diálogo Categorias e totais e, em seguida, clique em Aplicar. Figura 65. Ícone do conjunto de múltiplas dicotomias

5. Clique com o botão direito em Fontes de notícias novamente e selecione Estatísticas de sumarização no menu pop-up.

6. Na caixa de diálogo Estatísticas de sumarização, selecione % de N da coluna na lista Estatísticas e clique na seta para incluí-la na lista Exibição.

7. Clique em Aplicar à seleção e, em seguida, clique em OK para criar a tabela.

Totais que não correspondem

Se você examinar os números na tabela, poderá observar que há uma grande discrepância entre os "totais" e os valores que supostamente estão sendo totalizados -- especificamente, os totais parecem ser muito menores do que deveriam ser. Isso ocorre porque a contagem para cada "categoria" na tabela é o número de casos com um valor 1 (uma resposta Sim) para essa variável, e o número total de respostas

Sim para todas as cinco variáveis no conjunto de múltiplas dicotomias pode facilmente exceder o número

total de casos no arquivo de dados.

No entanto, a "contagem" total é o número total de casos com uma resposta Sim para pelo menos uma variável no conjunto, que nunca pode exceder o número total de casos no arquivo de dados. Neste exemplo, a contagem total de 2.081 é quase 800 mais baixa do que o número total de casos no arquivo de dados. Se nenhuma dessas variáveis tiver valores omissos, isso significa que quase 800 respondentes da pesquisa de opinião indicaram que não recebem notícias de nenhuma dessas fontes. A contagem total é a base para as porcentagens da coluna; portanto, as porcentagens da coluna nesse exemplo somam mais que os 100% exibidos para o total da porcentagem da coluna.

Totais que correspondem

Embora "contagem" geralmente seja um termo bastante inequívoco, o exemplo acima demonstra como ele pode ser confuso no contexto de totais para conjuntos de múltiplas respostas, para os quais as respostas geralmente são a estatística de sumarização realmente desejada.

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Clique com o botão direito em Fontes de notícias na visualização da tabela na área de janela de tela e selecione Estatísticas de sumarização no menu pop-up.

3. Na caixa de diálogo Estatísticas de sumarização, selecione Respostas na lista Estatísticas e clique na seta para incluí-la na lista Exibição.

4. Selecione % de respostas da coluna na lista Estatísticas e clique na seta para incluí-la na lista Exibição.

5. Clique em Aplicar à seleção e, em seguida, clique em OK para criar a tabela. Figura 66. Contagens de dicotomias múltiplas e porcentagens da coluna

Para cada "categoria" no conjunto de múltiplas dicotomias, as Respostas são idênticas à Contagem -- e esse sempre será o caso para conjuntos de múltiplas dicotomias. No entanto, os totais são muito diferentes. O número total de respostas é de 3.594 -- mais de 1.500 maior que a contagem total e mais de 700 maior que o número total de casos no arquivo de dados.

Para porcentagens, os totais para % de N da coluna e % de respostas da coluna são de 100% -- mas as porcentagens para cada categoria no conjunto de múltiplas dicotomias são muito menores para porcentagens de respostas da coluna. Isso ocorre porque a base de porcentagem para porcentagens de respostas da coluna é o número total de respostas que, nesse caso, é 3.594, resultando em porcentagens muito menores que a base de porcentagem da coluna de 2.081.

Porcentagens totais maiores que 100%

As porcentagens da coluna e as porcentagens de respostas da coluna resultam em porcentagens totais de 100% mesmo que, em nosso exemplo, os valores individuais na coluna % N da coluna somem mais de 100%. Mas, e se você desejar mostrar porcentagens com base na contagem total em vez do total de respostas, mas também desejar que a porcentagem "total" reflita de forma precisa a soma das porcentagens de categorias individuais?

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Clique com o botão direito em Fontes de notícias na visualização da tabela na área de janela de tela e selecione Estatísticas de sumarização no menu pop-up.

3. Na caixa de diálogo Estatísticas de sumarização, selecione % de respostas da coluna (Base:

Contagem) na lista Estatísticas e clique na seta para incluí-la na lista Exibição.

4. Clique em Aplicar à seleção e, em seguida, clique em OK para criar a tabela.

Usando conjuntos de múltiplas respostas com outras variáveis

Em geral, é possível usar conjuntos de múltiplas respostas assim como variáveis categóricas. Por exemplo, é possível fazer a tabulação cruzada de um conjunto de múltiplas respostas com uma variável categórica ou aninhar um conjunto de múltiplas respostas em uma variável categórica.

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Arraste e solte Gênero da lista de variáveis do lado esquerdo da área Linhas na área de janela de visualização, aninhando as Origens de notícias do conjunto de múltiplas respostas em categorias de gênero.

Figura 67. Respostas de múltiplas dicotomias e porcentagens de respostas da coluna

Figura 68. Porcentagens de respostas da coluna com contagem como a base de porcentagem

3. Clique com o botão direito em Gênero na visualização da tabela na área de janela de tela e cancele a seleção de Mostrar rótulo de variáveis no menu pop-up.

4. Faça o mesmo para Origens de notícias.

Isso removerá as colunas com os rótulos de variáveis da tabela (pois elas de fato não são necessárias nesse caso).

5. Clique em OK para criar a tabela.

Variável de origem estatística e Estatísticas de sumarização

disponíveis

Na ausência de uma variável de escala em uma tabela, as variáveis categóricas e conjuntos de múltiplas respostas são tratados da mesma forma com relação à variável de origem estatística: A variável aninhada mais interna na dimensão de origem estatística é a variável de origem estatística. Como há algumas estatísticas de sumarização que podem ser designadas apenas a conjuntos de múltiplas respostas, isso significa que o conjunto de múltiplas respostas deve ser a variável aninhada mais interna na dimensão de origem estatística, se você desejar alguma das estatísticas de sumarização de múltiplas respostas especiais.

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Na visualização da tabela na área de janela de tela, arraste e solte Fontes de notícias à esquerda de

Gênero, mudando a ordem de aninhamento.

Todas as estatísticas de sumarização especiais de múltiplas respostas -- respostas, porcentagens de respostas da coluna -- são removidas da visualização da tabela porque a variável categórica Gênero agora é a variável aninhada mais interna e, portanto, a variável de origem estatística.

Felizmente, o construtor de tabela "lembra" essas configurações. Se você mover Fontes de notícias de volta para sua posição anterior, aninhado em Gênero, todas as estatísticas de sumarização relacionadas à resposta serão restauradas para a visualização da tabela.

Conjuntos de categorias múltiplas e respostas duplicadas

Os conjuntos de categorias múltiplas fornecem um recurso não disponível para conjuntos de múltiplas dicotomias: a capacidade de contar respostas duplicadas. Em muitos casos, as respostas duplicadas em conjuntos de categorias múltiplas representam erros de codificação. Por exemplo, para uma pergunta de pesquisa de opinião, como "Em sua opinião, quais são os três países que fabricam os melhores carros?", uma resposta de Suécia, Alemanha e Suécia provavelmente não é válida.

No entanto, em outros casos, respostas duplicadas podem ser perfeitamente válidas. Por exemplo, se a pergunta fosse: "Onde foram fabricados seus três últimos carros?", uma resposta de Suécia, Alemanha e

Suécia faz todo o sentido.

As Tabelas customizadas fornecem uma opção para respostas duplicadas em conjuntos de categorias múltiplas. Por padrão, as respostas duplicadas não são contadas, mas é possível solicitar que elas sejam incluídas.

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Clique em Reconfigurar para limpar as configurações anteriores.

3. Arraste e solte Fabricante de automóveis, automóveis mais recentes da lista de variáveis para a área Linhas da área de janela de tela.

O ícone próximo à "variável" na lista de variáveis identifica-a como um conjunto de categorias múltiplas.

Para conjuntos de categorias múltiplas, as categorias exibidas representam o conjunto comum de rótulos de valor definidos para todas as variáveis no conjunto (enquanto para conjuntos de múltiplas dicotomias, as "categorias" são, na verdade, os rótulos de variável para cada variável no conjunto).

4. Clique com o botão direito em Fabricante de automóveis, automóveis mais recentes na visualização da tabela, na área de janela de tela, e selecione Categorias e totais no menu pop-up.

5. Selecione (clique) Total na caixa de diálogo Categorias e totais e, em seguida, clique em Aplicar.

6. Clique com o botão direito em Fabricante de automóveis, automóveis mais recentes novamente e selecione

Estatísticas de sumarizaçãono menu pop-up.

7. Na caixa de diálogo Estatísticas de sumarização, selecione Respostas na lista Estatísticas e clique na seta para incluí-la na lista Exibição.

8. Clique em Aplicar à seleção e, em seguida, clique em OK para criar a tabela.

Por padrão, as respostas duplicadas não são contadas; portanto, nesta tabela, os valores para cada categoria nas colunas Contagem e Respostas são idênticos. Apenas os totais diferem.

9. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

10. Clique na guia Opções.

11. Clique em (marque) Contar respostas duplicadas para conjuntos de categorias múltiplas.

12. Clique em OK para criar a tabela. Figura 70. Ícone Conjunto de categorias múltiplas

Figura 71. Conjunto de categorias múltiplas: Contagens e respostas sem duplicatas

Nessa tabela, há uma diferença muito notável entre os valores nas colunas Contagem e Respostas, principalmente para carros norte-americanos, indicando que muitos respondentes tiveram vários carros norte-americanos.

Teste de significância com conjuntos de múltiplas respostas

É possível usar conjuntos de múltiplas respostas em testes de significância basicamente da mesma forma que você usaria variáveis categóricas.

v Para testes de independência (qui-quadrado) ou comparação de proporções da coluna (testes z), os testes são executados em contas, e a Contagem deve ser uma das estatísticas de sumarização exibidas na tabela.

v Para conjuntos de categorias múltiplas, os testes de comparação de proporções da coluna ou de médias de coluna (testes t) não serão executados se Contar respostas duplicadas para conjuntos de categorias

múltiplasestiver selecionado na guia Opções. Consulte o tópico “Tabelas customizadas: Guia Opções” na página 16 para obter mais informações

Testes de independência com conjuntos de múltiplas respostas

Esse exemplo cria uma tabulação cruzada de uma variável categórica e um conjunto de múltiplas respostas e executa um teste qui-quadrado de independência na tabulação cruzada.

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Clique em Reconfigurar para limpar as configurações anteriores.

3. Arraste e solte Fontes de notícias (esse é o rótulo descritivo para o conjunto de múltiplas dicotomias

$mltnews) da lista de variáveis para a área Colunas da área de janela de tela.

4. Arraste e solte Gênero da lista de variáveis para a área Linhas da área de janela de tela.

5. Clique na guia Estatística de teste.

6. Selecione (marque) Testes de independência (qui-quadrado).

7. Se ainda não estiver selecionado, selecione Incluir variáveis de múltiplas respostas no teste.

8. Clique em OK para executar o procedimento.

O nível de significância de 0,068 para o teste qui-quadrado indica que homens e mulheres provavelmente não diferem de forma significativa em suas escolhas de fontes de notícias (supondo que você usa um valor de significância de 0,05 ou inferior como seu critério para determinar a significância estatística). Figura 72. Conjunto de categorias múltiplas com respostas duplicadas incluídas

Comparando médias de coluna com conjuntos de múltiplas respostas

Esse exemplo calcula médias de uma variável de escala em categorias definidas por um conjunto de múltiplas respostas e compara cada média de categoria com cada uma das outras médias de categoria para diferenças significativas.

1. Abra o construtor de tabela (menu Analisar, Tabelas, Tabelas customizadas).

2. Clique em Reconfigurar para limpar as configurações anteriores.

3. Arraste e solte Fontes de notícias (esse é o rótulo descritivo para o conjunto de múltiplas dicotomias

$mltnews) da lista de variáveis para a área Colunas da área de janela de tela. 4. Arraste e solte Idade do respondente na área Linhas da área de janela de tela.

5. Clique na guia Estatística de teste.

6. Selecione (marque) Comparar médias de coluna (testes t).

7. Se ainda não estiver selecionado, selecione Incluir variáveis de múltiplas respostas no teste.

8. Clique em OK para executar o procedimento.

v Cada categoria do conjunto de múltiplas respostas é identificada por uma letra (A, B, C, D, E), e para cada categoria para a qual a média de outra categoria é inferior e difere significativamente da média dessa categoria, a letra que representa a categoria com a média inferior é exibida.

v Obter notícias de jornais (A) tem a média de idade mais alta e todas as outras médias de categoria

diferem significativamente dela.

v Obter notícias da televisão (C) tem a próxima média de idade mais alta, e todas as médias de categoria

restantes (B, D e E) diferem significativamente dela. (C também difere significativamente de A, conforme indicado anteriormente.)

v As médias de idades para Obter notícias de revistas (B), Obter notícias do rádio (D) e Obter notícias da

Internet (E) não diferem significativamente umas das outras.

Figura 74. Resultados de teste de significância

No documento IBM SPSS Custom Tables 24 IBM (páginas 83-91)