MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Exerc´ıcio 1.
(2,0 pontos). Um pesquisador pretende comparar o tempo de rea¸c˜ao (segundos) para dois tipos diferentes de est´ımulos visuais, A e B. Na tabela abaixo, esses tempos foram obtidos para 20 e 19 indiv´ıduos (de mesma faixa et´aria) submetidos aos est´ımulos visuais A e B, respectivamente.
Tempos de Rea¸c˜ao Est´ımulo A Est´ımulo B (20 indiv´ıduos) (19 indiv´ıduos)
55 2 13 20 7 6
11 23 13 5 3 25
2 15 1 5 3 3
12 14 7 10 8
28 12 5 1
45 19 35 9
30 16 8 12
12 7 2 26
(a) (1,0 pontos). Obtenha m´edia, mediana, variˆancia, desvio padr˜ao e coeficiente de varia¸c˜ao dos tempos de rea¸c˜ao para cada est´ımulo (A e B). Para qual est´ımulo o tempo de rea¸c˜ao ´e mais r´apido? Compare os est´ımulos quanto `a varia¸c˜ao dos tempos de rea¸c˜ao.
Resposta:
Est´ımulo A:
M´edia (¯x),
¯
x =
Pn
i=1xi
n
= 55 + 11 + 2 +· · ·+ 1 + 7 20
= 337
20 = 16,85.
Mediana (Md),
Primeiro ordenamos os dados: 1, 2, 2, 7, 7, 11, 12, 12, 12,13, 13, 14, 15, 16, 19, 23, 28, 30, 45, 55; e calculamos a posi¸c˜ao da mediana como n+12 = 20+12 = 11,5, Neste caso como n ´e par ent˜ao a mediana ´e a m´edia dos dados nas duas posi¸c˜oes centrais, os seja, nas posi¸c˜oes
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
s2 = Pn
i=1(xi−x¯)2 n−1
= (x1−x¯)2+ (x2−x¯)2+· · ·+ (xn−x¯)2 n−1
= (55−16,85)2+ (11−16,85)2+ (2−16,85)2+· · ·+ (1−16,85)2+ (7−16,85)2 20−1
= 3620,55 19
= 190,5552632.
De outra forma,
s2 = Pn
i=1x2i −n¯x2 n−1
= x21+x22+· · ·+x215−n¯x2 n−1
= 552+ 112+ 22+· · ·+ 12+ 72−(20)(16,85)2 20−1
= 9299−(20)(16,85)2 19
= 190,5552631579.
Desvio padr˜ao (s2),
s =√
s2 =p
190,5552632 = 13,8041755697.
Coeficiente de varia¸c˜ao (CV = (s/x)¯ ×100%), CV = 13,8041755697
16,85 ×100% = 81,923890621%.
Est´ımulo B:
M´edia (¯x),
¯
x =
Pn
i=1xi
n
= 20 + 5 + 5 +· · ·+ 25 + 3 19
= 193
19 = 10,1578947368.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Mediana (Md),
Primeiro ordenamos os dados: 1, 2, 3, 3, 3, 5, 5, 5, 6, 7, 8, 8, 9, 10, 12, 20, 25, 26, 35; e calculamos a posi¸c˜ao da mediana como n+12 = 19+12 = 10, e dado que n ´e ´ımpar ent˜ao a mediana ´e o dado ordenado na posi¸c˜ao 10, isto ´e, Md = 7.
Variˆancia (s2),
s2 = Pn
i=1(xi−x)¯ 2 n−1
= (x1−x)¯ 2+ (x2−x)¯ 2+· · ·+ (xn−x)¯ 2 n−1
= (20−10,1579)2+ (5−10,1579)2+ (5−10,1579)2+· · ·+ (25−10,1579)2+ (3−10,1579)2 19−1
= 1610,5263 18
= 89,4737.
De outra forma,
s2 = Pn
i=1x2i −n¯x2 n−1
= x21+x22+· · ·+x215−n¯x2 n−1
= 552+ 112+ 22+· · ·+ 12+ 72−(19)(10,157)2 19−1
= 3571−(19)(16,85)2 18
= 89,4737.
Desvio padr˜ao (s2),
s =√
s2 =p
89,4737 = 9,45905.
Coeficiente de varia¸c˜ao (CV = (s/x)¯ ×100%),
CV = 9,4590510,1579 ×100% = 93,1202%.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Tabela 1: Medidas descritivas para o tempo de rea¸c˜ao segundo o est´ımulo visual.
Tempos de rea¸c˜ao Medidas descritivas Est´ımulo A Est´ımulo B
M´edia (¯x) 16,85 10,16
Mediana (Md) 13 7
Variˆancia (s2) 190,56 89,47
Desvio padr˜ao (s) 13,80 9,46
Coef. Varia¸c˜ao (CV) 81,92% 93,12%
Segundo os resultados da Tabela 1, o est´ımulo B ´e mais r´apido que o est´ımulo A, pois o est´ımulo B apresentou tempos m´edios de rea¸c˜ao menor (10,16) que o est´ımulo A (16,85).
Pode-se observar tamb´em que a mediana dos tempos de rea¸c˜ao do est´ımulo A (13) ´e quase duas vezes a mediana dos tempos de rea¸c˜ao do estimulo B (7). Al´em disso, os tempos de rea¸c˜ao do est´ımulo A s˜ao mais homogˆeneos que os tempos de rea¸c˜ao do est´ımulo B, pois o est´ımulo A apresentou coeficiente de varia¸c˜ao um pouco menor (81,92%) que o est´ımulo B (93,12%).
(b) (1,0 pontos). Construa (`a m˜ao), em um mesmo gr´afico, o boxplot do tempo de rea¸c˜ao para cada um dos est´ımulos. Comente a dispers˜ao, pontos extremos e simetria dos dados, em cada caso.
Resposta:
Est´ımulo A: Dados ordenados:
1, 2, 2, 7, 7, 11, 12, 12, 12, 13, 13, 14, 15, 16, 19, 23, 28, 30, 45,55;
• Quartil 1:
Q1 =Percentil 25 = dado ordenado na posi¸c˜ao0,25(20 + 1) = 5,25; neste caso, m´edia dos dados nas posi¸c˜oes 5 e 6→Q1 = 7+112 = 9.
• Quartil 2:
Q2 =Percentil 50 = Mediana =dado ordenado na posi¸c˜ao0,50(20 + 1) = 10,5; neste caso, m´edia dos dados nas posi¸c˜oes 10 e 11 →Q2 = 13+132 = 13.
• Quartil 3:
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Q3 = Percentil 75 = dado ordenado na posi¸c˜ao 0,75(20 + 1) = 15,75; neste caso, m´edia dos dados nas posi¸c˜oes 15 e 16 →Q3 = 19+232 = 21.
• LI =Q1−1,5×(Q3−Q1) = 9−1,5×(21−9) = −9.
• LS =Q3+ 1,5×(Q3−Q1) = 21 + 1,5×(21−9) = 39.
• M´ınimo: ´e o menor valor maior queLI, → M´ınimo=1.
• M´aximo: ´e o maior valor menor que LS,→ M´aximo=30.
Est´ımulo B: Dados ordenados:
1, 2, 3, 3, 3, 5, 5, 5, 6,7, 8, 8, 9, 10,12, 20, 25, 26, 35;
• Quartil 1:
Q1 =Percentil 25 = dado ordenado na posi¸c˜ao 0,25(19 + 1) = 5; ent˜ao Q1 = 3.
• Quartil 2:
Q2 =Percentil 50 = Mediana =dado ordenado na posi¸c˜ao 0,50(19 + 1) = 10; ent˜ao, Q2 = 7.
• Quartil 3: Q3 = Percentil 75 = dado ordenado na posi¸c˜ao 0,75(19 + 1) = 15; ent˜ao Q3 = 12.
• LI =Q1−1,5×(Q3−Q1) = 3−1,5×(12−3) = −10,5, ent˜ao LI = 0.
• LS =Q3+ 1,5×(Q3−Q1) = 12 + 1,5×(12−3) = 25,5.
• M´ınimo: ´e o menor valor maior queLI, → M´ınimo=1.
• M´aximo: ´e o maior valor menor que LS,→ M´aximo=25.
A Tabela 2 apresenta o resumo das estat´ısticas descritivas ´uteis para a constru¸c˜ao do gr´afico boxplot para os dois grupos.
A Figura 1 apresenta os gr´aficos boxplot para o tempo de rea¸c˜ao para cada est´ımulo. Pode- se observar nos gr´aficos que os tempos de rea¸c˜ao para o est´ımulo B s˜ao mais homogˆeneos que os tempos de rea¸c˜ao de est´ımulo A, pois o retˆangulo para o estimulo B ´e menor do que o est´ımulo A. H´a dois tempos de rea¸c˜ao discrepantes `a direita para o est´ımulo A, e dois tempos de rea¸c˜ao discrepantes a direita para o est´ımulo B. Tamb´em pode-se observar que distribui¸c˜ao dos tempos de rea¸c˜ao para os dois est´ımulos parecem ser assim´etricas a direita,
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Tabela 2: Medidas descritivas para a constru¸c˜ao do boxplot.
Tempos de rea¸c˜ao Medidas descritivas Est´ımulo A Est´ımulo B
M´ınimo 1 1
Quartil 1 (Q1) 9 3
Mediana (Md) 13 7
Quartil 3 (Q3) 21 12
M´aximo 30 25
M´edia ¯x 16,85 10,16
0 10 20 30 40 50 60
bcbc
Est´ımulo A
bcbc
Est´ımulo A Est´ımulo B
Tempoderea¸c˜ao bcbc
Figura 1: Gr´aficos boxplot para o tempo de rea¸c˜ao para os est´ımulos.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Exerc´ıcio 2.
(1,0 pontos). Considere os dados abaixo sobre distribui¸c˜ao de sal´ario (em reais) num grupo de 1000 indiv´ıduos.
Classe de Sal´ario Total Frequˆencia 500 |— 1000 400 0,40 1000 |— 1500 200 0,20 1500 |— 2000 150 0,15 2000 |— 3000 150 0,15 3000 |— 5000 100 0,10
Construa os histogramas pelos m´etodos de frequˆencia e densidade. Qual deve ser utilizado?
Justifique.
Resposta:
A Tabela 3 apresenta a distribui¸c˜ao do sal´ario dos 1000 indiv´ıduos. A densidade para cada classe ´e obtida a dividindo-se a frequˆencia da cada classe por sua respectiva amplitude.
Tabela 3: Distribui¸c˜ao do sal´ario (em reais) dos 1000 indiv´ıduos.
Classe de Sal´ario Frequˆencia Densidade 500 |— 1000 0,40 0,40/500=0,00080 1000|— 1500 0,20 0,20/500=0,00040 1500|— 2000 0,15 0,15/500=0,00030 2000|— 3000 0,15 0,15/1000=0,00015 3000|— 5000 0,10 0,10/2000=0,00005
Na Figura 2 s˜ao apresentados os histogramas para os sal´arios dos 1000 indiv´ıduos baseados no m´etodo de frequˆencia e no m´etodo de densidade. O histograma que deve ser utilizado ´e o baseado no m´etodo de densidade, pois as classes tˆem comprimento desiguais, e portanto para que a representa¸c˜ao seja correta, as ´areas dos retˆangulos tˆem que ser proporcionais `as frequˆencias das classes.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Método de frequência
Salário (em reais)
Frequência
1000 2000 3000 4000 5000
0100200300400
Método de densidade
Salário (em reais)
Densidade
1000 2000 3000 4000 5000
0e+002e−044e−046e−048e−04
Figura 2: Histogramas dos sal´ario usando o m´etodo de frequˆencia (esquerda) e densidade (direita).
Exerc´ıcio 3.
(2,5 pontos). Uma ind´ustria, desejando melhorar o n´ıvel de seus funcion´arios em cargos de chefia, montou um curso experimental e indicou 25 funcion´arios para a primeira turma. Os dados referentes `a se¸c˜ao a que pertencem, notas e graus obtidos no curso est˜ao na tabela 4.
Tabela 4: Dados para os 25 funcion´arios.
Funcion´ario Se¸c˜ao Direito Pol´ıtica Estat´ıstica Inglˆes Metodologia
1 Pessoal 9 9 9 B A
2 Pessoal 9 6,5 9 B C
3 Pessoal 9 9 8 D B
4 Pessoal 9 6 8 D C
5 Pessoal 9 6,5 9 A A
6 Pessoal 9 6,5 10 B A
7 Pessoal 9 9 8 D C
8 T´ecnica 9 6 8 B C
9 T´ecnica 9 10 9 B B
10 T´ecnica 9 9 8 B C
11 T´ecnica 9 10 10 C B
12 T´ecnica 9 6,5 7 D B
13 T´ecnica 9 6 7 B C
14 T´ecnica 9 10 9 A B
15 Vendas 9 10 9 C B
16 Vendas 9 9 7 A A
17 Vendas 9 10 8 D C
18 Vendas 9 6 9 C C
19 Vendas 9 6 1 D C
20 Vendas 9 6 7 C B
21 Vendas 9 6,5 7 D B
22 Vendas 9 6 8 C A
23 Vendas 9 9 10 C C
24 Vendas 9 6,5 9 A A
25 Vendas 9 9 9 B A
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
(a) (0,5 pontos). Classifique as vari´aveis listadas.
Resposta:
Se¸c˜ao a que pertencem os funcion´arios (Se¸c˜ao): Qualitativa nominal.
Nota obtida no curso (Direito, Pol´ıtica e Estat´ıstica): Quantitativa cont´ınua.
Grau obtido no curso (Inglˆes e metodologia): Qualitativa ordinal.
(b) (0,5 pontos). Calcule m´edia, moda, mediana e desvio padr˜ao das vari´aveis Direito, Pol´ıtica e Estat´ıstica.
Resposta:
Usaremos o R-commander no desenvolvimento deste exerc´ıcio. Para isto vamos a carregar arquivo INDUSTRIA.xls.
Os passos para obter as medidas descritivas s˜ao os seguintes:
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Passo 1: Carregar os dados escolhendo as op¸c˜oes:
Dados →Importar arquivo de dados → from Excel file...
Passo 2: Dar um nome ao conjunto de dados, INDUSTRIA
Passo 3: Carregar o arquivo INDUSTRIA.xls,
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Passo 4: Escolher as op¸c˜oes,
Estat´ısticas →Resumos →Resumos num´ericos
Passo 5: Escolher as vari´aveis de interesse em Dados(Direito, Estat´ıstica e Pol´ıtica),
Passo 6: Escolher as estat´ısticas de interesse emEstat´ısticas(M´edia, Desvio Padr˜ao e Quan- tis),
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Os resultados s˜ao os seguintes:
mean sd 0% 25% 50% 75% 100% n
Direito 9.00 0.000000 9 9 9.0 9 9 25 Estat´ıstica 8.12 1.763519 1 8 8.0 9 10 25 Pol´ıtica 7.76 1.671576 6 6 6.5 9 10 25
A Tabela 6 apresenta as estat´ısticas descritivas para as vari´aveis direito, estat´ıstica e pol´ıtica.
Tabela 5: Medidas descritivas.
Estat´ısticas Descritivas
Vari´avel M´edia DP Q1 Q2 (Mediana) Q3
Direito 9,00 0,000 9,00 9,00 9,00
Estat´ıstica 8,12 1,764 8,00 8,00 9,00
Pol´ıtica 7,76 1,672 6,00 6,50 9,00
(c) (0,75 pontos). Compare e indique as diferen¸cas existentes entre as distribui¸c˜oes das vari´aveis Direito, Pol´ıtica e Estat´ıstica, utilizando o “boxplot” e as medidas calculadas em (b).
Resposta:
O gr´afico boxplot para as vari´aveis Direito, Pol´ıtica e Estat´ıstica pode ser obtido no R- commander usando as seguintes op¸c˜oes:
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Passo 1: Escolher as op¸c˜oes, Gr´aficos → Boxplot
Passo 2: Escolher as var´aveis para as quais vamos obter o gr´afico boxplot (Direito, Es- tat´ıstica e Pol´ıtica ),
Na Figura 3 s˜ao apresentados os gr´aficos boxplot para as vari´aveis Direito, Pol´ıtica e Es- tat´ıstica. Pode-se observar o seguinte:
• A vari´avel Direito n˜ao apresentou variabilidade, enquanto que a vari´avel Pol´ıtica apre-
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
• H´a uma observa¸c˜ao discrepante na vari´avel Estat´ıstica, enquanto que nas vari´aveis Direito e Pol´ıtica n˜ao h´a.
• A m´edia e a mediana das notas das vari´aveis Direito, Estat´ıstica e Pol´ıtica parecem ser diferentes.
Direito Política Estatística
246810
Curso
Nota
Figura 3: Gr´aficos boxplot para as notas dos cursos Direito, Pol´ıtica e Estat´ıstica.
(d) (0,75 pontos). Compare o aproveitamento dos funcion´arios na disciplina Estat´ıstica segundo a se¸c˜ao a que eles pertencem.
Resposta:
O gr´afico boxplot pode ser obtido seguindo o mesmo procedimento do exerc´ıcio anterior escolhendo as seguintes op¸c˜oes:
Gr´aficos → Boxplot → Dados (Estat´ıstica)→ Grupos (se¸c˜ao)
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
A Figura 4 apresenta o gr´afico boxplot para a disciplina Estat´ıstica segundo a se¸c˜ao a que pertencem.
Pessoal Técnica Vendas
246810
Seção
Estatística
19
Figura 4: Gr´aficos boxplot para a disciplina Estat´ıstica segundo a se¸c˜ao a que pertencem.
• A mediana das notas dos funcion´arios nas se¸c˜oes t´ecnica e vendas ´e igual, enquanto que a mediana da se¸c˜ao pessoal parece ser um pouco maior.
• H´a uma observa¸c˜ao discrepante na se¸c˜ao de vendas, enquanto nas demais se¸c˜oes tipos n˜ao existem.
• As notas dos funcion´arios na se¸c˜ao pessoal ´e mais homogˆenea, enquanto que a se¸c˜ao vendas apresentou maior variabilidade.
• As distribui¸c˜oes das notas nas se¸c˜oes pessoal e t´ecnica parecem ser assim´etricas.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Exerc´ıcio 4.
(4,5 pontos). Considere o arquivo Dados-CEA09P08.xls, que cont´em dados de 890 pacientes com insuficiˆencia card´ıaca, referente ao estudo “Fra¸c˜ao de eje¸c˜ao do ventr´ıculo esquerdo em pacientes com insuficiˆencia card´ıaca”. O cora¸c˜ao ´e constitu´ıdo por uma musculatura estriada card´ıaca e divide-se em: ´atrio direito, ´atrio esquerdo, ventr´ıculo direito e ventr´ıculo esquerdo.
Nos movimentos de contra¸c˜ao, o cora¸c˜ao ejeta o sangue dos ventr´ıculos e, nos movimentos de relaxamento, ocorre o preenchimento dos mesmos. A fra¸c˜ao de eje¸c˜ao ´e a porcentagem de sangue bombeado pelo ventr´ıculo esquerdo a cada batimento card´ıaco. Em pacientes com diagn´ostico de insuficiˆencia card´ıaca, a fra¸c˜ao de eje¸c˜ao do ventr´ıculo esquerdo pode estar tanto preservada como diminu´ıda e o principal objetivo do estudo era avaliar a fra¸c˜ao de eje¸c˜ao em pacientes com insuficiˆencia card´ıaca. Considere apenas as vari´aveis Fra¸c˜ao de eje¸c˜ao (frej) e diagn´ostico (diag). A vari´avel diagn´ostico est´a codificada da seguinte forma: 1 – doen¸ca de chagas; 2 - doen¸ca card´ıaca hipertensiva; 3 - miocardiopatia isquˆemica; 4 – insuficiˆencia card´ıaca n˜ao especificada; 5 – outras doen¸cas.
(a) (0,5 pontos). Construa o histograma com a distribui¸c˜ao da vari´avel fra¸c˜ao de eje¸c˜ao.
Resposta:
O procedimento para carregar os dados ´e o mesmo que o utilizado no exerc´ıcio anterior.
Para a constru¸c˜ao do histrograma, seguimos os seguintes passos:
Passo 1: Gr´aficos → Histograma..
Passo 2: Dados → (frej) → Op¸c˜oes ...
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
A Figura 5 apresenta o histrograma para a vari´avel fra¸c˜ao de eje¸c˜ao.
Histograma para a fração de ejeção
Fração de ejeção
Percentagem
20 40 60 80
051015
Figura 5: Histograma para a fra¸c˜ao de eje¸c˜ao dos pacientes.
(b) (1,0 pontos). Considere a vari´avel diagn´ostico (diag). Converta essa vari´avel para uma vari´avel categorizada com as categorias descritas no enunciado. Obtenha uma representa¸c˜ao gr´afica desta vari´avel, bem como uma tabela de distribui¸c˜ao de frequˆencias.
Resposta:
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Passo 1:
Passo 2:
Passo 3:
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
A tabela de frequˆencias ´e obtida usando as op¸c˜oes:
Estat´ısticas →Resumos →Distribui¸c˜oes de frequˆencias (Escolher a vari´avel novo diag).
Passo 1:
Passo 2:
Os resultados obtidos s˜ao os seguintes:
.Table # counts for novo_diag
Chagas Hipertensiva Isqu^emica N~ao especificada Outras doen¸cas
119 187 417 96 71
round(100*.Table/sum(.Table), 2) # percentages for novo_diag
Chagas Hipertensiva Isqu^emica N~ao especificada Outras doen¸cas
13.37 21.01 46.85 10.79 7.98
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Tabela 6: Distribui¸c˜ao de frequˆencias para a vari´avel categ´orica novo diag Diagn´ostico Total Frequˆencia (percentagem)
Doen¸ca de Chagas 119 13,37%
Card´ıaca hipertensiva 187 21,01%
Miocardiopatia isquˆemica 417 46,85%
Insuficiˆencia Card´ıaca 96 10,79%
Outras doen¸cas 71 7,98%
Representa¸c˜oes gr´aficas podem ser obtidas no R-commander como:
Os gr´aficos de barra e de setores s˜ao apresentados na Figura 6.
Chagas Hipertensiva Isquêmica Não Especi Outras Gráfico de barras para o diagnóstico
Diagnóstico Frequência 0100200300400
Chagas Hipertensiva
Isquêmica
Nâo_Especifica Outras doenças Gráfico de setores para o diagnóstico
Diagnóstico
Figura 6: Gr´afico de barras e de setores para a vari´avel diagn´ostico.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
(c) (0,5 pontos). Construa o boxplot da fra¸c˜ao de eje¸c˜ao para cada diagn´ostico. Comente.
Resposta:
A Figura 7 apresenta o boxplot para a nova vari´avel categ´orica diagn´ostico. Coment´arios:
Chagas Hipertensiva Isquêmica Não Especi Outras
20406080
Diagnóstico
Fração de ejeção
56 160 242465
12 283642 857 858
25 32
Figura 7: Boxplot para a fra¸c˜ao de eje¸c˜ao segundo o diagn´ostico diagn´ostico.
• A mediana da fra¸c˜ao de eje¸c˜ao para pacientes com miocardiopatia isquˆemica parece ser um pouco maior do que a mediana das demais doen¸cas, que parecem ser muito pr´oximas.
• H´a observa¸c˜oes discrepantes nas fra¸c˜oes de eje¸c˜ao dos pacientes com doen¸ca card´ıaca hipertensiva, doen¸cas n˜ao especificadas e outras doen¸cas.
• As fra¸c˜oes de eje¸c˜ao dos pacientes com miocardiopatia isquˆemica apresentaram maior variabilidade do que as demais.
• As distribui¸c˜oes das fra¸c˜oes de eje¸c˜ao para os pacientes parecem ser assim´etricas, mas a assimetria nos pacientes com doen¸ca card´ıaca hipertensiva, doen¸cas n˜ao especificadas e outras doen¸cas parece ser um pouco menor.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
(d) (0,5 pontos). Obtenha medidas resumo (m´edia, mediana, quartis, desvio padr˜ao) para a fra¸c˜ao de eje¸c˜ao para cada diagn´ostico. Comente.
Resposta:
A Tabela 7 apresenta as estat´ısticas descritivas para a vari´avel fra¸c˜ao de eje¸c˜ao para cada diagn´ostico.
Tabela 7: Medidas descritivas.
Estat´ısticas Descritivas
Diagn´ostico M´edia DP Q1 Q2 (Mediana) Q3
Doen¸ca de Chagas 40,252 17,841 26,5 34,0 52,5 Card´ıaca hipertensiva 37,802 15,329 25,5 33,0 45,0 Miocariopatia isquˆemica 44,249 18,115 29,0 40,0 60,0 Insuficiˆencia Card´ıaca 35,510 15,005 24,0 33,5 43,0
Outras doen¸cas 36,746 16,504 25,0 31,0 44,0
Coment´arios:
• Os pacientes com miocardiopatia isquˆemica apresentaram maior m´edia e mediana nas fra¸c˜oes de eje¸c˜ao, e as m´edias e medianas das fra¸c˜oes de eje¸c˜ao dos pacientes com doen¸ca card´ıaca hipertensiva, insuficiˆencia Card´ıaca e Outras doen¸cas parecem ser iguais.
• As fra¸c˜oes de eje¸c˜ao dos pacientes com miocardiopatia isquˆemica apresentaram maior variabilidade, e os pacientes com insuficiˆencia Card´ıaca e doen¸ca card´ıaca hipertensiva parecem ser mais homogˆeneas.
(e) (0,75 pontos). A vari´avel FrejCod ´e uma modifica¸c˜ao da vari´avel Fra¸c˜ao de eje¸c˜ao, feita da seguinte forma: os pacientes com fra¸c˜ao de eje¸c˜ao menores do que 55% foram codificados como “Diminu´ıda” e como “Preservada” os pacientes com fra¸c˜ao de eje¸c˜ao maior ou igual a 55%. Construa uma tabela de distribui¸c˜ao de frequˆencias para a vari´avel FrejCod e represente graficamente a distribui¸c˜ao dessa vari´avel.
Resposta:
A distribui¸c˜ao de frequˆencias e a representa¸c˜ao gr´afica de vari´avel FrejCod pode ser obtida no R-commander seguindo os mesmos passos como no item b). A Tabela 8 apresenta a distribui¸c˜ao de frequˆencias.
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Tabela 8: Distribui¸c˜ao de frequˆencias para a vari´avel FrejCod Fra¸c˜ao de eje¸c˜ao Total Frequˆencia Percentagem
Diminu´ıda 231 0,2596 25,96%
Preservada 659 0,7404 74,04%
Os respectivos gr´aficos de barra e de setores s˜ao apresentados na Figura 8.
Diminuida Preservada
Gráfico de barras para a variável FejCod
Fração de ejeção Frequência 0100200300400500600
Diminuida
Preservada
Gráfico de setores para a variável FrejCod
Fração de ejeção
Figura 8: Gr´afico de barras e de setores para a vari´avel fra¸c˜ao de eje¸c˜ao.
(f) (0,75 pontos). Considerando a vari´avel FrejCod, obtenha a distribui¸c˜ao de frequˆencias dessa vari´avel para cada diagn´ostico separadamente. Dica: No menu “Estat´ısticas”, clicar em
“Tabelas de contingˆencia”, depois em “Tabela de dupla entrada”. Escolher a vari´avel diag na vari´avel linha e a vari´avel FrejCod na vari´avel coluna. Clicar na op¸c˜ao “sem percentual”.
Repetir o mesmo procedimento clicando na op¸c˜ao “percentual nas linhas”.
Resposta:
Os resultados obtidos usando o R-commander s˜ao os seguintes:
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
Table
FrejCod
novo_diag Diminuida Preservada
Chagas 29 90
Hipertensiva 35 152
Isqu^emica 145 272
N~ao Especi 9 87
Outras 13 58
FrejCod
novo_diag Diminuida Preservada Total Count
Chagas 24.4 75.6 100 119
Hipertensiva 18.7 81.3 100 187 Isqu^emica 34.8 65.2 100 417
N~ao Especi 9.4 90.6 100 96
Outras 18.3 81.7 100 71
Usando os resultados anteriores podemos obter as seguintes tabelas de distribui¸c˜oes de frequˆencias para cada diagn´ostico separadamente:
Tabela 9: Distribui¸c˜ao de frequˆencias para as categorias da vari´avel diagn´ostico Diagn´ostico Fra¸c˜ao de eje¸c˜ao Total Frequˆencia Percentagem
Doen¸ca de Chagas Diminu´ıda 29 0,244 24,4%
Preservada 90 0,756 75,6%
Card´ıaca hipertensiva Diminu´ıda 35 0,187 18,7%
Preservada 152 0,813 81,3%
Miocariopatia isquˆemica Diminu´ıda 145 0,348 34,8%
Preservada 272 0,652 65,2%
Insuficiˆencia Card´ıaca Diminu´ıda 9 0,094 9,4%
Preservada 87 0,906 90,6%
Outras doen¸cas Diminu´ıda 13 0,183 18,3%
Preservada 58 0,817 81,7%
MAE116 – No¸c˜ oes de Estat´ıstica
Grupo A - I semestre de 2014
Lista de exerc´ıcios 2 - Introdu¸c˜ao `a Estat´ıstica Descritiva – C A S A (gabarito)
(g) (0,25 pontos). Dos pacientes com doen¸ca de chagas, qual ´e a propor¸c˜ao com fra¸c˜ao de eje¸c˜ao diminu´ıda? Dos pacientes com miocardiopatia isquˆemica, qual ´e a propor¸c˜ao com fra¸c˜ao de eje¸c˜ao diminu´ıda?
Resposta:
Baseados na Tabela 9 podemos observar que dos pacientes com doen¸ca de chagas, a propor¸c˜ao com fra¸c˜ao de eje¸c˜ao diminu´ıda ´e 24,4%. Dos pacientes com miocardiopatia isquˆemica, a propor¸c˜ao com fra¸c˜ao de eje¸c˜ao diminu´ıda ´e 34,8%.
(h) (0,25 pontos). A fra¸c˜ao de eje¸c˜ao est´a relacionada com o diagn´ostico do paciente?
Resposta:
Segundo os resultados da Tabela 9 podemos concluir que fra¸c˜ao de eje¸c˜ao sim est´a relacio- nada com o diagn´ostico do paciente, pois as distribui¸c˜oes de frequˆencias para as diferentes
categorias do diagn´ostico diferem uma da outra.