• Nenhum resultado encontrado

Slides - Parte 1

N/A
N/A
Protected

Academic year: 2021

Share "Slides - Parte 1"

Copied!
23
0
0

Texto

(1)

CE062 - Tópicos em Biometria

Silva, J.P; Taconeli, C.A. 06 de agosto, 2019

(2)
(3)

Definição

Biometria

Estudo de características físicas ou comportamentais dos seres vivos usando modelos estatísticos e matemáticos

Etimologia

(4)

Áreas de aplicação

Medicina e saúde humana; Veterinária e Zootecnia;

Agronomia e Ciências Florestais; Genética;

(5)

International Biometric Society (IBS)

(6)

International Biometric Conference (IBC)

(7)

Publicações - IBS

(8)

Região Brasileira da Sociedade Internacional de

Biometria (RBras)

(9)

Alguns desafios na área de Biometria

Necessidade de delineamentos experimentais e desenhos amostrais específicos;

Análise de bases de dados de elevada dimensão;

Possibilidade de combinar resultados de múltiplos estudos previamente realizados;

Disponibilidade de bases de dados irregulares, desbalanceadas e com dados ausentes;

(10)

Alguns desafios na área de Biometria

Dificuldade em se extrair relações de causalidade com base em dados não experimentais;

Extração de padrões e relações entre variáveis em problemas multidimensionais;

(11)

Mas afinal, o que pretendemos com esta disciplina?

(12)

Mas afinal, o que pretendemos com esta disciplina?

Esta não é uma disciplina convencional de Biometria (ou Bioestatística);

O objetivo da disciplina é apresentar e/ou revisitar um compilado de métodos estatísticos com potenciais aplicações em estudos biométricos; Os métodos a serem estudados contemplam o planejamento dos estudos; a extração e manipulação dos dados; análises exploratórias e inferenciais.

Com isso, pretende-se que os alunos possam expandir seu repertório de métodos estatísticos em Biometria, com possíveis aplicações em outras áreas da Ciência.

(13)

Qual a periodização esperada dos alunos?

Disciplinas optativas não tem pré-requisitos, e, portanto, podem ser cursadas por alunos de qualquer período;

No entanto, toda disciplina optativa requer, em maior ou menor medida, conhecimentos de uma ou mais disciplinas obrigatórias; A disciplina de Biometria está na grade do 9º período, mas entendemos que alunos do 5º ou 6º período tenham condições de cursá-la com bom aproveitamento;

Os tópicos apresentados na ementa de Biometria baseiam-se em fundamentos de Probabilidade, Inferência Estatística, Planejamento de Experimentos e Regressão.

(14)

Exemplos de motivação - Expressão gênica e câncer

no intestino

Estudos na área de genética produzem bases de dados de elevada dimensão.

Nesses casos, é comum que informações contidas em centenas, ou milhares de genes sejam coletadas para um conjunto reduzido de indivíduos.

As informações coletadas

É bem conhecido que diversos métodos estatísticos somente se aplicam caso o número de indivíduos seja superior ao de variáveis.

Ainda que o número de variáveis não exceda o de índivíduos, caso o primeiro seja elevado, isso pode ter implicações indesejáveis na análise, como baixa precisão nos resultados, multicolinearidade, entre outros.

(15)

Exemplos de motivação - Expressão gênica e câncer

no intestino

(16)

Exemplos de motivação - Expressão gênica e câncer

no intestino

Neste estudo foram coletados dados de expressão genética de mais de 6500 genes amostras de tecidos de 62 indivíduos.

Das 62 unidades amostrais (tecidos), 40 foram extraídas de órgãos que apresentavam tumor, enquanto as outras 22, de órgãos saudáveis; Vamos considerar aqui a intensidade de marcadores genéticos avaliada em 2000 genes, que apresentaram maior intensidade (expressão gênica). O objetivo aqui é utilizar os dados de expressão gênica para classificar os tecidos conforme a presença ou não de tumor.

(17)

Exemplos de motivação - Expressão gênica e câncer

no intestino

G1 G2 G3 G4 G5 G6 G7 status 1 8589 5468 4263 4065 1998 5282 2170 Tumor 2 9164 6720 4883 3718 2015 5570 3849 Normal 3 3826 6970 5370 4706 1167 1572 1325 Tumor 4 6246 7824 5956 3976 2003 2131 1531 Normal 5 3230 3694 3401 3464 2181 2923 2069 Tumor 6 2510 1961 1566 3073 1810 1674 1290 Normal 7 7127 3779 3706 6595 2461 3776 2621 Tumor 8 4029 3156 2870 4418 1854 2828 1428 Normal 9 9331 7017 4724 9492 5347 1557 1969 Tumor 10 5272 4741 3319 6792 2633 5449 4623 Normal 55 5777 3388 2414 2843 1467 1929 2794 Normal 56 4527 2912 2125 2609 2078 2889 2661 Tumor 57 4653 6252 4947 3764 2737 2793 2006 Tumor 58 4972 4174 3669 1568 1570 3467 2106 Tumor 59 9112 6824 5983 3147 4847 11223 6333 Tumor 60 6731 3472 2559 2625 1596 4373 3799 Normal 61 6235 4005 3094 3183 1795 3941 2020 Tumor 62 7472 3654 2728 3494 2405 5792 2876 Normal

(18)

Exemplos de motivação - Expressão gênica e câncer

no intestino

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● 1000 2000 3000 4000 5000 6000 500 1000 1500 2000 r=0.937 G8 G74 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● 2000 4000 6000 8000 1000 2000 3000 4000 r=0.574 G6 G75 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 1000 3000 5000 7000 1000 2000 3000 4000 r=−0.049 G5 G67

(19)

Exemplos de motivação - Expressão gênica e câncer

no intestino

Correlação Frequência −0.4 −0.2 0.0 0.2 0.4 0.6 0.8 1.0 0 50000 100000 150000

(20)

Exemplos de motivação - Expressão gênica e câncer

no intestino

0 500 1000 1500 2000 0 20 40 60 Tecido Gene 0.0 2.5 5.0 Intensidade

(21)

Exemplos de motivação - Expressão gênica e câncer

no intestino

Tumor 0 500 1000 1500 2000 Gene 0.0 2.5 5.0 Intensidade Normal 0 500 1000 1500 2000 Gene 0.0 2.5 5.0 Intensidade

(22)

Exemplos de motivação - Expressão gênica e câncer

no intestino

Vamos tentar uma regressão para a resposta binária (status). Seguem algumas linhas do resumo do ajuste.

ajuste <-glm(status~.,data =dados,family =binomial) s1 <-summary(ajuste)

data.frame(s1$coefficients)[50:65,]

Estimate Std..Error z.value Pr...z.. G55 0.02328853 1791.7102 1.299793e-05 0.9999896 G56 0.02581551 1572.9634 1.641202e-05 0.9999869 G57 -0.01646155 896.2710 -1.836671e-05 0.9999853 G58 -0.01794637 2353.6459 -7.624924e-06 0.9999939 G59 0.00603631 617.5912 9.773959e-06 0.9999922 G60 -0.04149450 873.5136 -4.750298e-05 0.9999621 G61 0.02404964 857.5152 2.804573e-05 0.9999776 G62 0.02968519 1076.6008 2.757307e-05 0.9999780 G63 -0.09407140 1467.8738 -6.408684e-05 0.9999489 G64 -0.07358468 4081.0390 -1.803087e-05 0.9999856 G65 -0.03675756 1537.1369 -2.391300e-05 0.9999809 G66 0.01316380 1474.7777 8.925957e-06 0.9999929 G67 0.02730442 1251.6737 2.181433e-05 0.9999826 NA NA NA NA NA NA.1 NA NA NA NA NA.2 NA NA NA NA

(23)

Exemplos de motivação - Expressão gênica e câncer

no intestino

Quando o número de variáveis supera o de observações (p>n), a solução para os estimadores dos β’s não é única;

As estimativas disponíveis tem elevado erro padrão (baixa precisão); Uma alternativa nessas situações é obter estimadores incorporando uma penalização atrelada à variância dos estimadores no processo de estimação.

Vamos resolver este problema mais adiante usando métodos que se baseiam em tais penalizações, como os métodos ridge, lasso e elastic

Referências

Documentos relacionados

H6) O exercício de alongamento muscular agudo diminui a expressão gênica do TGFβ-1 nas fibras musculares de ratas idosas;.. A etapa de avaliação da expressão gênica do

Sendo assim, a toxoplasmose, enquanto doença pode ser dividida em quatro formas clínicas: a adquirida em pacientes imunocompetentes; a reativada em indivíduos

RNAs envolvidos na tradução 3’ 5’ Alça-ψU Alça-D Alça do anticódon Alça variável Anticódon.. Sítio de ligação

E se a RNA polimerase interrompesse a transcrição na sequência CCT, qual seria a sequência do RNA transcrito.. Indique a orientação

Você verá que um dado segmento de DNA de Drosophila (e isso é verdade para outros organismos também) contém sequências derivadas de transposons, regiões codificadoras (de proteínas

Esta fosforilação é mediada pelo fator TFIIH, e converte a RNA polimerase em uma enzima altamente processiva, que deixa os fatores de transcrição para trás e começa a fase

- Sem expressão da proteína repressora FljA  expressão da FliC.. Controle da Expressão Gênica em Eucariotos  O tamanho do genoma. 

Fatores gerais de transcrição liberados, exceto TBP Complexo de iniciação da transcrição ou Complexo Aberto Complexo pré-transcricional.  RNA polimerase II de eucariotos