1
ANÁLISE DE DADOS: QUARTA LISTA DE EXERCÍCIOS
Humberto José Bortolossi
Os exercícios [17] a [20] referem-se à seguinte estória: o departamento de planejamento da cidade de Cleansburg está tentando determinar qual é o percentual de pessoas da cidade que querem gastar fundos públicos para revitalizar o shopping do centro da cidade. Para fazer isso, o departamento decidiu conduzir uma pesquisa. Cinco entrevistadores profissionais foram contratados. Cada entrevistador foi orientado a escolher uma esquina de uma rua dentro dos limites da cidade e, a cada dia entre 16 h e 18 h, os entrevistadores deveriam abordar os transeuntes e perguntar se eles desejariam participar da pesquisa. Se a resposta fosse um “sim”, os entrevistadores deveriam perguntar em seguida: “você é a favor de que a prefeitura gaste fundos públicos para revitalizar o shopping do centro da cidade?”. Os entrevistadores também foram orientados a retornar à mesma rua tantos dias quantos fossem necessários até que um total de 100 entrevistas sejam realizadas. Os resultados da pesquisa estão indicados na tabela a seguir
Entrevistador Sima Nãob Não respondentesc
A 35 65 321
B 21 79 208
C 58 42 103
D 78 22 87
Ed 12 63 594
aConcorda que a prefeitura gaste fundos públicos para revitalizar o shopping do centro da cidade.
bNão concorda que a prefeitura gaste fundos públicos para revitalizar o shopping do centro da cidade.
cNão aceitou ser entrevistado ou não possui opinião.
dO entrevistador ficou frustrado e abandonou o serviço.
[17] (a) Descreva qual é a população-alvo dessa pesquisa. (b) Compare e contraste a população-alvo com a base de amostragem dessa pesquisa.
[18] (a) Qual é o tamanho da amostra? (b) Calcule a taxa de resposta dessa pesquisa. Esta pesquisa está sujeita a um viés de não-resposta?
[19] (a) Explique as grandes diferenças nos dados obtidos de entrevistador para entrevistador. (b) Um dos entrevistadores conduziu as entrevistas em uma esquina de uma rua no centro da cidade. Qual entrevistador? Explique. (c) Esta pesquisa está sujeito a um viés de seleção? Explique. (d) O método de amostragem usado nesta pesquisa é o método de amostragem por cotas? Explique.
[20] Você acha que esta pesquisa foi bem elaborada? Se você fosse um consultor do departamento de planejamento da cidade de Clensburg, você sugeriria melhorias? Seja específico.
Os exercícios [21] a [24] referem-se à seguinte estória: o representante dos alunos da Universidade Estadual da Tasmânia (UET) quer determinar quantos alunos da UET conhecem o novo programa de auxílio financeiro da universidade. Existem 15000 alunos na UET, de modo que é muito caro conduzir um censo. O seguinte método de amostragem foi usado para escolher uma amostra representativa dos alunos: a partir de uma lista em ordem alfabética de todos os alunos, escolhe-se aleatoriamente um nome entre os 100 primeiros nomes da lista. Feito isto, a partir desse nome, pulam-se 99 nomes e escolhe-se o seguinte, repetindo o processo até que o final da lista seja alcançado. Por exemplo, se o primeiro nome escolhido
2
aleatoriamente for o da posição 73, então escolhem-se os nomes das posições 73, 173, 273 e assim por diante. O método de amostragem ilustrado nesta pesquisa é conhecido como amostragem sistemática. [21] (a) Compare e contraste a base de amostragem e a população-alvo desta pesquisa. (b) Dê o valor-N exato da população.
[22] (a) Calcule a proporção de amostragem. (b) Suponha que a pesquisa tenha uma taxa de resposta de 90%. Encontre o tamanho n da amostra.
[23] (a) Explique por que o método usado para escolher a amostra não é o método de amostragem aleatória simples. (b) Se 100% daqueles que responderam à pesquisa disseram que não conhecem o novo programa de auxílio financeiro oferecido pela universidade, este resultado provavelmente é mais devido a uma variabilidade amostral ou a um viés de amostragem? Explique.
[24] (a) Suponha que a pesquisa tenha uma taxa de resposta de 90% e que 108 estudantes responderam que eles não conheciam o novo programa de auxílio financeiro. Dê uma estatística para o número total de estudante da universidade que não conhecem o novo programa de auxílio financeiro. (b) Você acha que os resultados dessa pesquisa são confiáveis? Explique.
Os exercícios [25] e [26] referem-se à seguinte estória: um produtor de laranjas que calcular a produtividade média de seu pomar. O pomar contém três variedades de árvores: 50% das árvores são da variedade A, 25% da variedade B e 25% da variedade C.
[25] (a) Suponha que o produtor amostre aleatoriamente 300 árvores da variedade A, 150 árvores da variedade B e 150 árvores da variedade C. Que tipo de amostragem estaria sendo usada nessa situação? (b) Suponha que o produtor selecione para a sua amostra uma região retangular de 10 por 30 de 300 árvores da variedade A, uma região retangular de 10 por 15 de 150 árvores da variedade B e uma região retangular de 10 por 15 de 150 árvores da variedade C. Que tipo de amostragem estaria sendo usada nessa situação? [26] (a) Suponha que nesta pesquisa (lembre-se da definição estatística de pesquisa!), o produtor descubra que cada árvore da variedade A produz 100 laranjas em média, que cada árvore da variedade B produz 50 laranjas em média e que cada árvore da variedade C produz 70 laranjas em média. Estime a produtividade média por árvore do pomar. (b) A produtividade calculada no item (a) é um parâmetro ou uma estatística? Explique.
[27] Diga qual é o método de amostragem que melhor descreve cada uma das situações indicadas a seguir. Escolha sua resposta entre os itens da seguinte lista: amostragem aleatória simples, amostragem de conveniência, amostragem por cotas, amostragem estratificada e censo.
(a) George que saber como o resto da classe se saiu no último teste. Ele dá uma olhada em poucos estudantes a sua volta e conclui que ninguém foi muito bem.
(b) Os estudantes da Escola Eureca tem 400 alunos no sexto ano, 300 alunos no sétimo ano, 300 alunos no oitavo ano e 200 alunos no nono ano. O jornal da escola quer conduzir uma pesquisa para saber se os alunos acham que o treinador do time de futebol deveria ser substituído. O jornal da escola escolhe aleatoriamente 20 alunos do sexto ano, 15 alunos do sétimo ano, 15 alunos do oitavo ano e 10 alunos do nono ano.
(c) Para o último jogo de futebol da temporada, o treinador decide escolher quem serão os três atacantes da seguinte maneira: ele coloca os nomes de todos os jogadores em um chapéu e, então, ele retira três nomes (talvez essa seja a razão pela qual ele está querendo ser substituído).
(d) Para o último jogo de futebol da temporada, o treinador escolhe quem serão os atacantes da seguinte maneira: ele coloca os nomes de todos os alunos do sétimo ano em um chapéu e, então, ele retira três nomes.
[28] A turma de estatística do professor Blackbeard tem 120 estudantes (40 do primeiro semestre, 30 do segundo semestre, 30 do terceiro semestre e 20 do quarto semestre). O professor Blackbeard que avaliar
3
como os seus estudantes julgam o desempenho do monitor da turma através de um questionário. Para cada situação indicada a seguir, diga qual é o método de amostragem que melhor descreve o método usado pelo professor Blackbeard para a coleta de dados. Escolha sua resposta entre os itens da seguinte lista: amostragem aleatória simples, amostragem de conveniência, amostragem por cotas, amostragem estratificada e censo.
(a) O professor Blackbeard pede que todos os estudantes da turma (em um dia que em todos os alunos estão presentes) preencham o questionário.
(b) O professor Blackbeard escolhe aleatoriamente 8 estudantes do primeiro semestre, 6 do segundo semestre, 6 do terceiro semestre e 4 do quarto semestre e pede a eles que preencham o questionário.
(c) O professor Blackbeard seleciona 8 estudantes do primeiro semestre, 6 do segundo semestre, 6 do terceiro semestre e 4 do quarto semestre em ordem alfabética da lista de chamada e pede a eles que preencham o questionário.
(d) O professor Blackbeard pede aos 24 estudantes que entraram na sala primeiro, em um certo dia, para que preencham o questionário.
[29] Você é um revendedor de frutas e você acabou de receber 250 caixas de abacaxis: 75 caixas do fornecedor A, 75 caixas do fornecedor B e 100 caixas do fornecedor C. Você quer determinar se os abacaxis estão bons o suficiente para serem enviados para os seus melhores clientes analisando uma amostra de n = 20 caixas. Descreva como você pode fazer essa análise usando os seguintes métodos de amostragem: (a) amostragem aleatória simples, (b) amostragem de conveniência, (c) amostragem estratificada e (d) amostragem por cotas.
[30] Para cada uma das situações indicadas a seguir, determine se a amostra é representativa da população. Explique sua resposta.
(a) Para saber se uma sopa cozinhando em uma panela tem sal suficiente, você prova a sopa com uma colher.
(b) Para determinar se o teste de estatística que você vai fazer está fácil ou difícil, você faz um julgamento lendo os enunciados das três primeiras questões.
(c) Para determinar se você está com uma infecção viral, um médico extrai 10 ml de sangue de seu braço e, então, ele faz um teste de sangue.
(d) Para saber se uma determinada pessoa é popular ou não, você consulta o número de pessoas que “curtem” essa pessoa no facebook.com
O MÉTODO DA CAPTURA-RECAPTURA
[31] Suponha que você queira estimar quantos peixes existem em um pequeno lago. Suponha que você primeiro captura n1 = 500 peixes, marque-os e, então, devolva-os para o lago. Depois de alguns dias, você volta ao lago e captura n2 = 120 peixes, dos quais k = 30 estão marcados. Dê uma estimativa para o valor-N da população de peixes no lago.
[32] Para estimar a população em uma colônia, 4965 otariídeos (leões-marinhos) foram capturados e marcados no início de agosto. No final de agosto, 900 otariídeos foram recapturados. Destes, 218 estavam marcados. Com base nesses dados, estime a população de otariídeos na colônia. Aproxime sua resposta para a centena mais próxima. Fonte: Chapman and Johnson, "Estimation of Fur Seal Pup Populations by Randomized Sampling", Transactions of The American Fisheries Society, 97 (July 1968), 264-270.
4
Os exercícios [33] a [36] referem-se à seguinte estória: você tem um pote grande cheio de moedas de 5, 10 e 25 centavos apenas. Você quer ter uma ideia aproximada de quanto dinheiro você tem, mas quer evitar o trabalho de contar todas as moedas e, assim, você decide usar o método da captura-recaptura. Para a primeira amostra, você chacoalha bem o pote e, dele, retira aleatoriamente 150 moedas. Nessa amostra você encontra 36 moedas de 25 centavos, 45 moedas de 5 centavos e 69 moedas de 10 centavos. Usando uma caneta preta, você marca essas 150 moedas com um pontinho preto e, então, as devolve para o pote. Para a segunda amostra, você chacoalha bem o pote e, dele, retira aleatoriamente outro conjunto de 100 moedas. Nessa segunda amostra, você conta 28 moedas de 25 centavos, 4 das quais estão marcadas; 29 moedas de 5 centavos, 5 das quais estão marcadas; e 43 moedas de 10 centavos, 8 das quais estão marcadas. [33] Estime o número total de moedas de 25 centavos no pote. Dica: ignore as moedas de 5 e 10 centavos. Elas são irrelevantes.
[34] Estime o número total de moedas de 5 centavos no pote. Dica: ignore as moedas de 25 e 10 centavos. Elas são irrelevantes.
[35] Estime a quantidade total de dinheiro no pote. Dica: faça os exercícios [33] e [34] primeiro.
[36] Você acha que o método de captura-recaptura é uma maneira confiável de estimar a quantidade de dinheiro no pote? Explique sua resposta. Discuta alguns problemas e falhas potenciais nesta abordagem.
[37] Com início em 2004, um estudo para determinar o número de esturjões no Rio Chuvoso e no Lago das Florestas na fronteira Estados Unidos-Canadá foi conduzido pelo Ministério de Recursos Naturais do Canadá, pelo Departamento de Recursos Naturais do Estado da Minnesota e pelas Primeiras Nações do Rio Chuvoso. Usando o método de captura-recaptura, o estudo concluiu que o tamanho da população de esturjões no Rio Chuvoso e no Lago das Florestas era de aproximadamente 160000. Na fase de captura, 1700 esturjões foram pegos, marcados e liberados. Dos esturjões marcados, sete foram recapturados durante a fase de recaptura do estudo. Com base nesses dados, estime o número de esturjões pegos na fase de recaptura do estudo. Fonte: Dan Gauthier, "Lake of the Woods Sturgeon Population Recovering", Daily
Miner and News (Kenora, Ont.), June 11, 2005, p. 31.
[38] Um estudo de 2004 conduzido no Lago Utah usando o método de captura-recaptura estimou que a população de carpas no lago era de cerca de 1,1 milhão. Durante um período de 15 dias, trabalhadores capturaram, marcaram e liberaram 24000 carpas. Na fase de recaptura do estudo, 10300 carpas foram recapturadas. Estime quantas carpas que foram recapturadas estavam marcadas. Fonte: Brett Prettyman, "With Carp Cooking Utah Lake, It's Time to Eat", Salt Lake Tribune, July 15, 2004, p. D3.
[39] Uma hipótese implícita quando o método de captura-recaptura é usado para estimar o tamanho de uma população é a de que o processo de captura é realmente aleatório, com todos os indivíduos tendo a mesma chance de serem capturados. Algumas vezes isso não acontece e alguns indivíduos são mais propensos a serem capturados do que outros (pois são mais lentos, menos cautelosos, etc.). Se este for o caso, o método de captura-recaptura provavelmente estimaria para mais ou estimaria para menos o tamanho da população? Explique sua resposta.
[40] Uma hipótese implícita quando o método de captura-recaptura é usado para estimar o tamanho de uma população é a de que quando os indivíduos são marcados no processo de captura, esses indivíduos não são afetados ou prejudicados pelas marcas que receberam. Algumas vezes, contudo, indivíduos marcados são prejudicados tornando-se, por exemplo, presas mais fáceis para predadores (imagine peixes marcados com etiquetas amarelas brilhantes que os fazem se destacar ou um pássaro cuja etiqueta afeta sua forma de voar). Se este for o caso, o método de captura-recaptura provavelmente estimaria para mais ou estimaria para menos o tamanho da população? Explique sua resposta.
5
ESTUDOS CLÍNICOS
Os exercícios [41] a [44] referem-se à seguinte estória: o fabricante de uma nova vitamina (vitamina X) decide financiar um estudo para determinar a eficácia da vitamina na cura do resfriado comum. Quinhentos entre os 50000 estudantes na área de San Diego foram pagos para participarem como sujeitos neste estudo. Todos os sujeitos estavam resfriados no início do estudo. Cada sujeito tomou duas pílulas da vitamina X por dia. Com base nos depoimentos dos próprios sujeitos, 457 dos 500 sujeitos ficaram curados do resfriado em 3 dias. (Um resfriado dura em média 4,87 dias.) Como resultado desse estudo, o fabricante promoveu uma campanha publicitária usando a seguinte afirmação: “a vitamina X é mais que 90% efetiva na cura do resfriado comum”.
[41] (a) Descreva a população-alvo desse estudo. (b) Compare e contraste a população-alvo, a base de amostragem e a amostra do estudo. (c) A amostra está sujeita a um viés de seleção?
[42] (a) O estudo em questão é um estudo controlado? Explique. (b) Liste três causas possíveis além da possível eficácia da vitamina X que poderiam ter confundido os resultados do estudo.
[43] Liste quatro problemas diferentes com o estudo que indicam sua concepção pobre. [44] Dê algumas sugestões que poderiam melhorar a concepção do estudo.
Os exercícios [45] a [48] referem-se a um estudo clínico conduzido pela Administração do Centro Médico de Veteranos de Houston para testar a eficácia de uma cirurgia de joelho para curar artrite degenerativa (osteoporose) do joelho. Dos 324 indivíduos que atendiam o critério de inclusão para o estudo, 144 não aceitaram participar. Os pesquisadores dividiram aleatoriamente os 180 sujeitos restantes em três grupos: um grupo recebeu um tipo de cirurgia de joelho artroscópica chamada debridamento; o segundo grupo recebeu um tipo de cirurgia do joelho artroscópica chamada lavagem; e o terceiro grupo recebeu incisões na superfície dos joelhos para parecer que eles fizeram uma cirurgia de joelho artroscópica mas, de fato, nenhuma cirurgia foi efetuada para os sujeitos desse grupo. Os pacientes neste estudo não sabiam em qual grupo eles estavam e, em particular, eles não sabiam se estavam fazendo uma cirurgia real ou uma cirurgia simulada. Todos os sujeitos que participaram do estudo foram avaliados por dois anos após o procedimento. Nos dois anos seguintes, todos os três grupos disseram que eles tiveram uma ligeira melhora na dor e movimentos melhores do joelho, mas o grupo que fez a cirurgia falsa relatou resultados melhores. Fonte:
New England Journal of Medicine, 347, no. 2 (July 11, 2002): 81-88.
[45] Descreva a população-alvo deste estudo.
[46] (a) Descreva a amostra. (b) Qual foi o tamanho da amostra? (c) A amostra foi escolhida por amostragem aleatória? Explique.
[47] (a) O estudo em questão é um experimento controlado por placebo? Explique. (b) Descreva os grupos de tratamento neste estudo. (c) O estudo em questão pode ser considerado um experimento controlado aleatório? Explique. (d) O experimento é cego, duplo-cego ou nenhum dos dois?
[48] Como um resultado desse estudo, o Departamento de Assuntos de Veteranos emitiu uma nota para seus médicos recomendando que eles parassem com o uso de cirurgia artroscópica para pacientes sofrendo de osteoporose. Você concorda com essa recomendação? Explique.
Os exercícios [49] a [52] referem-se a um estudo clínico denominado APPROVe concebido para determinar se o Vioxx, um medicamento usado para artrite e dor aguda, era eficaz na prevenção da recorrência de pólipos colorretais em pacientes com histórico de adenomas colorretais. O APPROVe foi conduzido entre 2002 e 2003 e ele envolveu 2586 pacientes, todos com uma história de adenomas colorretais. Os participantes foram divididos aleatoriamente em dois grupos: 1287 receberam 25 miligramas de Vioxx diariamente durante a realização do estudo clínico (originalmente, planejado para durar três anos), 1299 pacientes receberam um placebo. Nem os participantes nem os médicos envolvidos no estudo clínico sabiam
6
quem estava em qual grupo. Durante o estudo, 72 dos participantes tiveram eventos cardiovasculares (a maioria tiveram ataques cardíacos). Posteriormente, descobriu-se que 46 dessas pessoas estavam no grupo que estava recebendo o Vioxx e somente 26 estavam no grupo recebendo o placebo. Com base nesses resultados, o estudo clínico parou em 2003 e o Vioxx foi retirado do mercado em 2004.
[49] Descreva a população-alvo para o estudo APPROVe.
[50] (a) Descreva a amostra para o estudo APPROVe. (b) Dê o tamanho n da amostra.
[51] (a) Descreva os grupos de tratamento e de controle no estudo APPROVe. (b) O estudo APPROve pode ser descrito como um experimento controlado por placebo, duplo-cego e aleatório? Explique o porquê de estes termos poderem ser aplicados.
[52] Que conclusões você pode tirar do estudo APPROVe?
Os exercícios [53] a [56] referem-se a um estudo sobre a eficácia de uma vacina contra o VPH (vírus do papiloma humano) conduzido entre outubro de 1998 e novembro de 1999. O VPH é a infecção sexualmente transmissível mais comum – mais de 20 milhões de americanos estão infectados com o VPH – mas a maioria das infecções com o VPH é benigna e a maioria das pessoas infectadas nem mesmo sabem que estão infectadas. (Por outro lado, algumas infecções por VPH podem provocar câncer cervical nas mulheres.) Os pesquisadores recrutaram 2392 mulheres de 16 centros diferentes em todo os Estados Unidos para participar do estudo, sendo que os sujeitos deveriam satisfazer os seguintes critérios: (1) ser do sexo feminino entre 16 e 23 anos de idade, (2) não estar grávida, (3) não ter resultados anormais em testes Papanicolau anteriores e (4) indicar se teve relações sexuais com mais do que cinco homens. Em cada centro, metade das participantes foi aleatoriamente selecionada para receber a vacina contra o VPH e a outra metade recebeu uma injeção de placebo. Depois de 17,4 meses, a incidência de VPH era de 3,8 para cada 100 mulheres-ano em risco no grupo de controle e de 0 para cada 100 mulheres-ano em risco no grupo de tratamento. Todos os nove casos de manifestações de pré-câncer cervical relacionados com o VPH estavam entre os indivíduos do grupo de controle. Fonte: New England Journal of Medicine, 347, no. 21 (November 21, 2002): 1645-1651.
[53] (a) Descreva a população-alvo deste estudo. (b) Compare e contraste a base de amostragem e a população-alvo deste estudo.
[54] (a) Descreva a amostra deste estudo. (b) A amostra foi escolhida por amostragem aleatória? Explique. [55] (a) Descreva o grupo de tratamento deste estudo. (b) O estudo pode ser descrito como um estudo controlado por placebo, duplo-cego e aleatório?
[56] Enuncie com cuidado uma conclusão legítima que pode ser tomada a partir deste estudo.
Os exercícios [57] a [60] referem-se a um estudo de referência conduzido em 1896 na Dinamarca pelo Dr. Johannes Fibiger, que recebeu o Prêmio Nobel de Medicina em 1926. O propósito do estudo era determinar a eficácia de um novo soro para tratamento da difteria, uma doença respiratória muito comum e frequentemente fatal naqueles dias. O Dr. Fibiger conduziu o seu estudo por um período de um ano em um determinado hospital de Copenhague. Pacientes novos com difteria internados no hospital receberam tratamentos diferentes de acordo com o dia da internação. Em um certo conjunto de dias (vamos chamá-los de dias “pares” por conveniência), os paciente eram tratados diariamente com o soro e também recebiam o tratamento padrão. Nos outros dias (os dias “ímpares”), os pacientes internados recebiam apenas o tratamento padrão. No final do período de um ano de estudo, 8 dos 239 pacientes admitidos nos dias “pares’ e tratados com o soro morreram, enquanto que 30 dos 245 pacientes admitidos nos dias “ímpares’ morreram. [57] (a) Descreva a população-alvo do estudo do Dr. Fibiger. (b) Compare e contraste a base de amostragem e a população-alvo deste estudo.
[58] (a) Descreva a amostra do estudo do Dr. Fibiger. (b) O estudo do Dr. Fibiger estava sujeito a um viés de seleção? Explique.
7
[59] (a) Descreva o tratamento e os grupos de controle do estudo do Dr. Fibiger. (b) Que conclusões você pode tirar do estudo do Dr. Fibiger? Explique.
[60] Em um estudo da eficácia do soro conduzido antes do estudo do Dr. Fibiger, pacientes em um hospital de Copenhague foram escolhidos para estarem no grupo de tratamento e foram medicados com o soro, enquanto que pacientes em um outro hospital de Copenhague foram escolhidos para estarem no grupo de controle e foram medicados com o tratamento padrão. O Dr. Fibiger acreditava que os resultados deste estudo anterior não eram confiáveis. Quais são algumas das variáveis de confusão que poderiam ter afetado os resultados deste estudo anterior?
ATIVIDADE ELETRÔNICA (OBRIGATÓRIA)
[01] Na Aula 4 vimos exemplos de como a Estatística tem um papel fundamental em Medicina. A coleção didática que você analisou menciona essa importância ou exemplos de aplicações da Estatística em Áreas de Saúde? Registre sua resposta no campo da “Aula 4” da planilha eletrônica “Análise de Livros Didáticos” do Google Drive.
[02] Faça uma resenha do artigo “Números (Pseudo) Aleatórios, Probabilidade Geométrica, Métodos de Monte Carlo e Estereologia” (disponível em: <https://goo.gl/VzU9XA>) com foco na matemática subjacente ao gerador congruente linear e nas aplicações da geração de números (pseudo) aleatórios.