3.4. Representação de dados qualitativos em tabelas e gráficos
Para a representação de dados qualitativos em tabelas e gráficos
vamos precisar definir algumas quantidades:
n = tamanho da amostra ou frequência absoluta total;
k = número de categorias ou classes;
n
i= frequência absoluta da i-ésima categoria ou classe, i = 1, 2, ...,
k;
n
n
k i i
1f
i= frequência relativa da i-ésima categoria ou classe, i = 1, 2, ..., k;
n
n
f
i
i,
tal que:
1
1 1
k i i k i in
n
f
3.4.1. Tabelas de frequências de variáveis qualitativas
Representação das frequências das categorias da variável
qualitativa numa tabela com as frequências absolutas e relativas.
Categorias
Freq. absolutas
Freq. relativas
Categoria 1
n
1f
1= n
1/ n
⁞
⁞
⁞
Categoria i
n
if
i= n
i/ n
⁞
⁞
⁞
Categoria k
n
kf
k= n
k/ n
Totais
n
1
Exemplo 1: Causas mais comuns de intoxicação e envenenamento
em crianças de 1 a 5 anos.
Tabela 1: Causas mais
comuns
de intoxicação e envenenamento emcrianças de 1 a 5 anos. Causas (categorias) Valores Absolutos Valores Relativos Medicamentos 152 0.380 Produtos Domésticos 49 0.123 Produtos Químicos 45 0.113 Animais Peçonhentos 34 0.085 Pesticidas Domésticos 26 0.065 Plantas 23 0.058 Outros 71 0.178 Total 400 1.00
Fonte: Adaptado do livro Bioestatística, Arango, H.G.
A tabela pode, ainda, ser representada com os valores relativos
e/ou as respectivas porcentagens:
Tabela 2: Causas mais comuns de intoxicação e envenenamento em
crianças de 1 a 5 anos (valores percentuais).
Causas (categorias) Valores Absolutos Valores Relativos Valores Percentuais Medicamentos 152 0.380 38.00 Produtos Domésticos 49 0.123 12.25 Produtos Químicos 45 0.113 11.25 Animais Peçonhentos 34 0.085 8.50 Pesticidas Domésticos 26 0.065 6.50 Plantas 23 0.058 5.75 Outros 71 0.178 17.75 Total 400 1.00 100.00
Exemplo 2: Número de declarações de imposto de renda por pessoa
física no ano de 2012.
Tabela 3: Declarações de imposto de renda em 2012 por faixas de renda.
Faixas de renda Valores absolutos Valores relativos
Até 5 mil reais 10.578.893 0.4130
De 5 a 50 mil reais 4.986.451 0.1946
De 50 a 100 mil reais 2.690.803 0.1050
De 100 a 300 mil reais 4.255.263 0.1661
De 300 a 500 mil reais 1.336.082 0.0522
De 500 a 1000 mil reais 1.061.113 0.0414
Acima 1500 mil reais 708.948 0.0277
Totais 25.617.553 1.0000
Fonte: Receita Federal - http://www.receita.fazenda.gov.br
A tabela pode, ainda, ser representada com os valores relativos em
porcentagens:
Tabela 4: Declarações de imposto de renda em 2012 por faixas de renda (valores percentuais).
Faixas de renda Valores absolutos
Valores relativos
Valores percentuais
Até 5 mil reais 10.578.893 0.4130 41.30
De 5 a 50 mil reais 4.986.451 0.1946 19.46
De 50 a 100 mil reais 2.690.803 0.1050 10.50
De 100 a 300 mil reais 4.255.263 0.1661 16.61
De 300 a 500 mil reais 1.336.082 0.0522 5.22
De 500 a 1000 mil reais 1.061.113 0.0414 4.14
Acima 1500 mil reais 708.948 0.0277 2.77
Totais 25.617.553 1.0000 100.00
Fonte: Receita Federal - http://www.receita.fazenda.gov.br
Obs: Existe uma norma especifica do IBGE para a construção de
tabelas que pode ser observada.
3.4.2. Representação gráfica de variáveis qualitativas
A representação gráfica de variáveis qualitativas é feita
basicamente de gráficos de barras (ou colunas) ou gráficos de
setores (pizza), com suas diversas variações. Podem, também, ser
utilizados gráficos pictóricos, que, na prática são variações dos
gráficos de barras.
A seguir são apresentados os gráficos de barras e setores para as
Tabelas 1 e 2.
I)
Gráfico de barras verticais ou colunas:
Gráficos do exemplo 1:
Causas
comunsde intoxicação e
envenenamento em crianças de 1 a 5 anos.
a)
Gráfico de barras verticais ou colunas:
Figura 1:
Causas mais comuns de intoxicação e envenenamento em crianças de 1 a 5, anos em valores absolutos.Figura 2:
Causas mais comuns de intoxicação e envenenamento em crianças de 1 a 5, anos em valores percentuais.b)
Gráfico de barras horizontais:
Figura 3:
Causas mais comuns de intoxicação e envenenamento em crianças de 1 a 5, anos em valores absolutos.Gráficos do exemplo 2: Número de declarações do IRPF por faixas
de renda (2012).
a)
Gráfico de barras verticais ou colunas:
Figura 4:
Número de declarações de IRPF (mil unidades), por faixas de renda, ano base 2012.b)
Gráfico de barras horizontais:
Figura 5:
Número de declarações de IRPF, em valores percentuais, por faixas de renda, ano base 2012.II)
Gráfico de setores (pizza):
Figura 6: Gráfico de setores (pizza) para causas mais frequentes de intoxicação e envenenamento em crianças de 1 a 5, anos em valores percentuais.
Variação: gráfico de pizza 3D
Figura 7: Gráfico de setores (pizza) 3D para causas mais frequentes de intoxicação e envenenamento em crianças de 1 a 5.
Variação do gráfico de pizza, o gráfico de rosca
Figura 8: Gráfico tipo rosca para causas mais frequentes de intoxicação e envenenamento em crianças de 1 a 5, anos em valores
3.4.3. Representações gráfica: o que se deve evitar:
a)
Barras (ou colunas) muito afinadas e compridas:
Figura 9: Origem dos alunos da turma de Bioestatística por distância, em km.
b)
Barras (ou colunas) muito largas e baixas, com cores
distintas:
Figura 10: Origem dos alunos da turma de Bioestatística por distância, em km.
c)
Gráfico muito pequeno num espaço grande:
Figura 11: Origem dos alunos da turma de Bioestatística por distância, em km.
d)
Gráfico muito grande para o espaço:
Figura 12: Origem dos alunos da turma de Bioestatística por distância, em km.
e)
Gráfico fora de escala (propositalmente):
Tabela 5: Intenção de votos Candidato Votos (%) Candidato A 29.5 Candidato B 26.3 Candidato C 25.2 Candidato D 19.0 Total Geral 100
Figura 13: Intenção de votos para os 4 candidatos
Figura 15: Intenção de votos para os 4 candidatos, lado a lado.
f)
Gráfico muito muitas categorias:
g)
Interpretação equivocada:
Os limites atuais da distribuição de renda e riqueza no Brasil
Os 0,9% mais ricos do País detêm entre 59,9% e 68,5% da riqueza, sendo as principais fontes de acumulação de riqueza os fluxos de renda e heranças. (Blog Carta Maior, 16/12/2014 )
Tabela 6: Distribuição de bens e direitos - 2006 e 2012.
Figura 14: Repartição da riqueza no Brasil pertencente aos percentuais da população - 20121.
3.5. Variáveis qualitativas em tabelas com dupla classificação
Muitas vezes as variáveis são apresentadas em tabelas com duas
classificações, conforme esquema.
Tabela 7: Tabela de dupla entrada l
c: medalhas em Pequim 2008.Continente Classificação A: Medalha Totais
das linhas
Ouro Prata Bronze
América Latina1
3
12
10
25
América do Norte
93
79
46
218
África e Oceania
15
12
21
48
Ásia
32
24
34
90
Europa
83
92
132
307
Totais das colunas
226
219
243
688
1
América Latina = América do Sul, Central e México.
A
Classificação A
tem
c = 3 categorias
(colunas da tabela).
A
Classificação B
tem
l = 5
categorias
(linhas da tabela).
A tabela assim constituída pode ser identificada como:
tabela de dupla entrada
(
tabela
l
c
);
tabela cruzada
ou
tabela de contingência
.
A tabela acima é uma tabela
53
.
Clas
sificação
3.5.1. Caso especial
l
= c = 2, tabelas 2
2.
Tabela 8: Representação de uma tabela de dupla entrada 2
2.A
1A
2Totais das linhas
B
1n
11n
12Total da linha 1
B
2n
21n
22Total da linha 2
Totais das
colunas
Total da
coluna 1
Total da
coluna 2
n
Exemplo 3: Crianças expostas à violência doméstica do pai contra a
mãe, variáveis situação civil da mãe e grupo (tabela 22).
Tabela 9: Tabela com dupla classificação segundo situação civil da mãe por grupo.
Vive com o
companheiro
Separada
Totais
Expostos
11
4
15
Não Expostos
14
1
15
Totais
25
5
30
Assim temos:
n
11= 11 n
12= 4 n
21=14 n
22=1
Total da linha 1 = 15
Total da linha 2 = 15
Total da coluna 1 = 25
Total da coluna 2 = 5
Total geral: n = 30
Representação gráfica de uma tabela 22:
Figura 15: Representação gráfica da dupla classificação situação civil da mãe por grupo.
3.5.2. Caso especial, tabelas em porcentagens.
A tabela de dupla classificação pode, ainda, ser construída levando
em consideração os percentuais em relação às colunas. Desta
forma, no exemplo acima teremos:
Tabela 10: Tabela situação civil da mãe por grupo, em valores percentuais
Vive com o
companheiro (%)
Separada (%)
Totais
Expostos
44
80
50
Não Expostos
56
20
50
Neste caso, a representação gráfica deve acompanhar a ordem de
grandeza.
Figura 16: Representação gráfica da situação civil da mãe por grupo, em valores percentuais
Obs:
quando se tem uma tabela com dupla classificação para se
comparar diferentes perfis é prudente que essa comparação
seja realizada considerando-se os valores percentuais.
Exemplo 4: Condições clínicas do periodonto de pacientes
atendidos na Clínica de Graduação da Faculdade de Odontologia
de Araraquara - UNESP, no período de 1994 a 1999 (tabela 43).
Tabela 11: Presença de doença por idade (anos). Presença de
Doença
Faixa etária do paciente (anos)
Contagens Porcentagens 19-40 41-60 60 ou + 19-40 41-60 60 ou + Diabete 11 11 3 30.6 17.7 15.8 Hipertensão 10 34 11 27.8 54.8 57.9 Discr. Sanguineas 5 1 3 13.9 1.6 15.8 Alt. Hormonais 10 16 2 27.8 25.8 10.5 Total 36 62 19 100.0 100.0 100.0
Idade x Presença de Doença
30.6 17.7 15.8 27.8 13.9 1.6 15.8 27.8 25.8 10.5 57.9 54.8 0 16 32 48 64
19-40 anos 41-60 anos 60 anos ou+
%
Diabete Hipetensão Discr.Sanguineas Alt.Hormonais
Exemplo 5: Distribuição das medalhas das Olimpíadas de Pequim
(2008) segundo os continentes (tabela 53).
Tabela 12: Medalhas em Pequim 2008.
Continente Medalha Totais
das linhas
Ouro Prata Bronze
América Latina1
3
12
10
25
América do Norte
93
79
46
218
África e Oceania
15
12
21
48
Ásia
32
24
34
90
Europa
83
92
132
307
Totais das colunas
226
219
243
688
1
América Latina = América do Sul, Central e México.