• Nenhum resultado encontrado

Orientações

N/A
N/A
Protected

Academic year: 2021

Share "Orientações"

Copied!
5
0
0

Texto

(1)

Universidade Federal do Paraná - Departamento de Estatística Disciplina: CE225 – Modelos Lineares Generalizados

Prof. Cesar Augusto Taconeli Orientação - Trabalhos

Os alunos deverão constituir grupos de três. Serão duas rodadas de trabalhos, compostos por (1) elaboração de relatórios de análises de dados (2) apresentação de seminários.

Trabalho 1– Regressão para dados binários (regressão logística)

 Cada grupo deverá realizar a análise da base de dados indicada pelo professor. As bases de dados, bem como as descrições das variáveis, estão disponíveis em https://www.mldata.io/datasets/. A distribuição aos grupos é a seguinte:

o Grupo 1: Heart Disease; o Grupo 2: Mushroom; o Grupo 3: Bank marketing; o Grupo 4: Gender voice; o Grupo 5: Mammogram;

o Grupo 6: Indian liver patient; o Grupo 7: Vehicle Silhouette; o Grupo 8: Contraceptive method;

o Grupo 9: School grades (dicotomizar a resposta).

 Caberá a cada grupo produzir um relatório referente à análise dos dados, com 5 a 8 páginas (descontando elementos como capa e sumário), contemplando os seguintes elementos:

1. Capa: Título do trabalho, nomes e GRRs dos alunos.

2. Resumo, com 10 a 15 linhas, descrevendo brevemente o contexto e o objetivo do estudo, a metodologia, e os resultados principais;

3. Introdução, em que deverá ser apresentado, em linhas gerais, o contexto e informações adicionais sobre os dados e os objetivos da análise. Caso tais informações não estejam disponíveis na fonte dos dados, os próprios alunos podem elaborar uma breve motivação para o problema;

4. Material e métodos, em que deverão ser descritos com maior detalhamento os dados (tamanho da amostra, forma como foi selecionada ou delineado o experimento (se disponível), descrição das variáveis e suas escalas), bem como os recursos computacionais e métodos estatísticos utilizados.

Atenção: Não é necessário escrever na metodologia a teoria referente aos modelos, mas sim mencionar qual (ou quais) modelos foram utilizados e descrever adequadamente o processo de modelagem adotado.

(2)

5. Resultados e discussão, em que deverão ser apresentados os principais resultados da análise e a interpretação\discussão dos mesmos.

Atenção:

o Seja parcimonioso quanto aos resultados incluídos no relatório. Obviamente, nem todos os resultados produzidos na análise precisam ser relatados. Algumas representações fundamentais:

o Gráficos e ou tabelas de análise descritiva\exploratória;

o Os resultados referentes ao(s) modelo(s) ajustado(s) na forma de quadros, gráficos ou tabelas;

o Figuras (que podem ser compostas por múltiplos gráficos) referentes ao diagnóstico do ajuste.

o A depender da análise, figuras, quadros ou tabelas para outros tipos de resultados podem ser necessários. Alguns resultados (como medidas e testes de qualidade de ajuste) podem ser inseridos no próprio texto;

o Todos os quadros, tabelas e figuras deverão ter títulos e numeração. Todos eles deverão ser mencionados em algum momento no texto, com a descrição, ainda que parcial, dos respectivos resultados;

o Os resultados deverão ser devidamente editados. Saídas cruas do R ou de qualquer outro software serão desconsideradas;

o Não incluir códigos de programação! Se desejado, encaminhar os códigos para o professor por e-mail, em arquivo separado.

6. Conclusão, fechamento do trabalho, com um apanhado geral do estudo realizado, destacando limitações e possíveis investigações futuras.

 Ás páginas do relatório deverão ser numeradas.

 Os relatórios deverão ser encaminhados por e-mail para cetaconeli@gmail.com.

(3)

Trabalho 2– Regressão para dados de contagens

 O trabalho de regressão para dados de contagens também constará de um relatório e de apresentação, mas com o tema definido.

 Os dados deverão ser extraídos de da página do Departamento de Informática do Sistema Único de Saúde (DATASUS). O link segue abaixo:

http://tabnet.datasus.gov.br

 Para extração da variável resposta, você deverá clicar no link “Estatísticas vitais – Mortalidade e nascidos vivos”. Clique em “Mortalidade – 1996 a 2017, pela CID10” e depois em “Óbitos por causas externas”;

 Selecione a unidade da federação no Mapa. Selecione “Município” na linha, “Não ativa” na coluna e “Óbitos por ocorrência” no conteúdo, e o ano de 2017;

 Em “Seleções disponíveis”, clique em Grande Grupo CID10”, e selecione a categoria escolhida para o grupo dentre as seguintes:

o Acidentes de transporte; o Agressões;

o Complicações assistência médica e cirúrgica.

 Selecione a opção “Exibir linhas zeradas” e clique em “Mostra”;  Os temas (variáveis respostas) são os seguintes:

o Grupo 1: Mortalidade por acidentes de transporte no Espírito Santo; o Grupo 2: Mortalidade por acidentes de transporte em Goiás;

o Grupo 3: Mortalidade por acidentes de transporte no Pará; o Grupo 4: Mortalidade por agressões no Paraná;

o Grupo 5: Mortalidade por agressões no Mato Grosso; o Grupo 6: Mortalidade por agressões no Amazonas;

o Grupo 7: Mortalidade por complicações de assistência médica e cirúrgica em Santa Catarina;

o Grupo 8 Mortalidade por complicações de assistência médica e cirúrgica em Pernambuco;

o Grupo 9: Mortalidade por complicações de assistência médica e cirúrgica no Rio de Janeiro.

 Como covariáveis, deverão ser selecionadas variáveis demográficas e socioeconômicas, também disponíveis no link do DATASUS. Verifiquem as variáveis disponíveis e escolham, aproximadamente, 4 e 8 delas para a análise;

 Se desejado, algumas das covariáveis podem ser categorizadas para a análise (usando pontos de corte, ou dividindo conforme tercis ou quartis, por exemplo).

(4)

 A elaboração do relatório da análise segue os mesmos passos descritos anteriormente, para o caso de dados binários;

 Como as populações têm tamanhos diferentes, o número de habitantes deverá considerado no ajuste do modelo. Recomenda-se que todas as demais covariáveis sejam inseridas na forma de taxas, para evitar multicolinearidade.

Seminários

 Cada grupo apresentará, na forma de seminário, um dos trabalhos produzidos. Os trabalhos a serem apresentados, bem como as datas de apresentação, serão definidas em sala de aula mediante sorteio;

 As apresentações ocorrerão nas datas especificadas na planilha disponível na página da disciplina;

 A estrutura (sequência) dos slides deverá ser similar à do relatório. O conteúdo, obviamente, será bem mais resumido;

 Cada grupo terá de 10 a 15 minutos para sua apresentação (apresentações com duração fora desse intervalo terão suas notas descontadas);

 Haverá 5 a 10 minutos adicionais para questionamentos por parte de um grupo debatedor e dos demais alunos. O grupo debatedor será selecionado com no mínimo uma aula de antecedência;

 Caso o grupo deseje utilizar o notebook do professor, o arquivo (em formato pdf) deverá ser encaminhado por e-mail com no mínimo 24 horas de antecedência.

Algumas sugestões:

 Utilizar dez a quinze slides, evitando exceder o tempo definido para a apresentação e permitindo apresentar o artigo num ritmo adequado;

(5)

 Inserir pouco texto nas projeções. Utilizar, sempre que possível, tópicos curtos. Complementar as informações projetadas oralmente. Com isso, você atrai a atenção do público;

 Selecionar com parcimônia e bom senso o conteúdo do relatório que será apresentado no seminário;

 Evitar a simples leitura dos slides;

 Ao término da apresentação, responder com boa vontade às questões dos colegas. Participar ativamente das demais apresentações.

Datas

09/10 Data limite para encaminhar por e-mail (cetaconeli@gmail.com) a composição dos grupos. Alunos que não tiverem grupos deverão me informar por e-mail, até esta data;

13/11 Data limite para entrega do relatório sobre regressão para dados binários;

19/11 Data limite para os grupos que vão apresentar seminário sobre a análise de dados binários encaminhar os slides por e-mail. 20/11

e 27/11

Apresentações – regressão para dados binários

24/11 Data limite para entrega do relatório sobre regressão para dados de contagens;

29/11 Data limite para os grupos que vão apresentar seminário sobre a análise de dados de contagens encaminhar os slides por e-mail. 04/12 Apresentações – regressão para dados de contagens

Nota: Ficarei à disposição para o esclarecimento de dúvidas às quartas e sextas, entre 17hs e 18hs30.

Referências

Documentos relacionados

Após 96 horas, houve um aumento no consumo, com o aumento de 100 para 160 ninfas, que não diferiu significativamente da densidade 220; com 280 ninfas disponíveis houve um

Quando contratados, conforme valores dispostos no Anexo I, converter dados para uso pelos aplicativos, instalar os aplicativos objeto deste contrato, treinar os servidores

Os estudos iniciais em escala de bancada foram realizados com um minério de ferro de baixo teor e mostraram que é possível obter um concentrado com 66% Fe e uma

Com base no trabalho desenvolvido, o Laboratório Antidoping do Jockey Club Brasileiro (LAD/JCB) passou a ter acesso a um método validado para detecção da substância cafeína, à

Este trabalho foi realizado com o objetivo de avaliar a quantidade de lodo de esgoto produzido pela ETE Belém, estação que produz lodo aeróbio e utiliza a caleação como método

• Quando o navegador não tem suporte ao Javascript, para que conteúdo não seja exibido na forma textual, o script deve vir entre as tags de comentário do HTML. <script Language

Se a pessoa do marketing corporativo não usar a tarefa Assinatura, todos as pessoas do marketing de campo que possuem acesso a todos os registros na lista de alvos originais

Este campo será habilitado apenas para contribuintes que em pelo menos um período de apuração abrangido pela declaração informarem receita de revendas de