• Nenhum resultado encontrado

Júlia Maria Pavan Soler

N/A
N/A
Protected

Academic year: 2021

Share "Júlia Maria Pavan Soler"

Copied!
54
0
0

Texto

(1)

MAE0540-Genética de Populações

MAE5757-Métodos Estatísticos em

Genética e Genômica

Júlia Maria Pavan Soler

[email protected]

(2)

 O genoma é um sistema estruturado/organizado. Duas importantes leis contribuem para a caracterização e organização do genoma:

 Lei do Equilíbrio de Hardy-Weinberg

 Lei do Equilíbrio de Ligação

 Como o efeito de um “gene” pode ser mensurado?

 Caso: diploide e locos dialélicos

 Modelos de Efeitos fixos

(3)

3

Marcadores Moleculares

Pontos de referência no genoma

variações comuns/raras na sequência

de DNA entre indivíduos

Posição conhecida

Passíveis de Genotipagem

Alu repeat no Chr 8

Padrão de Bandas (eletroforese em gel):

+/+ presença do repeat nos dois alelos (pesado)

-/+ presença do repeat em somente um alelo

-/- ausência do repeat nos dois alelos (leve)

(4)

Marcadores Moleculares - SNPs

Single Nucleotide Polymorphisms

SNP: common variants (MAF>1%)

“Genotype calls” para cada SNP: AA Aa aa Chips de informação de marcadores para cada indivíduo

106 SNPs

Imagem (Scanner)

Capacidade: Placas com 12x8 posições (96 chips por vez)

      AA if 2 Aa if 1 aa if 0 i X

(5)

Genotipagem de SNPs

AA

Aa

aa

Dados da intensidade dos “alelos” A e a para o SNP rs2131259

Amostra da população brasileira Referência (verde): dados HapMap

Os dados (x,y) podem ser transformados para serem melhor representados:

 Coordenadas polares: inclinação e distância à origem

 Rotacionar 45: (x-y) versus ½(x+y) (conhecido como gráfico MA, gráfico de Blend-Altman, semelhante ao gráfico do desvio padrão pela média)

(6)

Genotipagem de SNPs

Organismos Poliplóides: Ploidia k  (k+1) genótipos Ex. Cana de açúcar: SNP com ploidia 5

No gráfico com as intensidades de cada “alelo” (nucleotídeo):

 O número de raios define a ploidia (os genótipos): AAAAA, AAAAa, ..., aaaaa  A posição no raio define o número de réplicas: indivíduo com o genótipo

AAAaa sendo que no loco de SNP pode haver duplicação ou deleção de alelos.

a A

(7)

Genotipagem de SNPs

Transformação de Variáveis

Organismos Poliplóides: Ploidia k  (k+1) genótipos a A y x x k U  

Projeção dos dados na

combinação convexa x+y=1:

Distribuição da variável U: multimodal (dados simulados)

(8)

Leis de Segregação de Alelos

 Equilíbrio de Hardy-Weinberg (EHW)

a ♂ ♀ A ♂ ♀ a A b B

Independência entre alelos dentro do loco. Probabilidade de genótipos é descrita em

termos de probabilidades alélicas. (Falconer e Mackay, 1996)

 Equilíbrio de Ligação (LD): independência entre locos

   

 

   

   

2 2 2 A P AA P a P A P Aa P a P aa P   

    

    

    

a b

    

P a P b P B P a P B a P b P A P b A P B P A P B A P        

Independência entre alelos de locos diferentes (haplótipos)

(9)

9

Equilíbrio de H-W - Sistema MN

(%) MM MN NN Total Greenland 83.5 15.6 0.9 569 Iceland 31.2 51.5 17.3 747 American Whites 29.0 50.0 21.0 6129

Falconer & Mackay, 1996

O sistema MN em Iceland está em equilíbrio de H-W ?

# total de alelos = 2x747=1494 # alelos M = (2x233)+385=851

 p(M)=0.5696 p(N)=0.4304 (estimativa!!) MM MN NN Total O 233 385 129 747 Probab. Estimada 0.3245 0.4903 0.1852 1 E 242.37 366.26 138.37 747

1.9555

0.3762 Pr 22   

p  o sistema está em equilíbrio suportando o modo de herança Mendeliano

Refaça o teste para as demais populações. H0: ?

(10)

Equilíbrio de Hardy-Weinberg

Genótipo aa Aa AA Total Trinomial P(aa) P(Aa) P(AA) 1,0

Distribuição sob Eq. H-W: Simplex Aa

aa AA aa AA

Aa

Gráfico ternário com a região de aceitação do teste 2 em função de n dado

α=5% (à esquerda) e de α dado n=50 (à direita).

Graffelman and Camarena (2008), Human Heredity 65: 77-84. Outras alternativas de teste: - Singer et al., 1991 - FBST(Pereira e Stern, 1999) - J. Graffelman (2008, 2015)

(11)

Equilíbrio de Ligação

bb Bb BB Total aa P(aa,bb) P(aa,Bb) P(aa,BB) P(aa) Aa P(Aa,bb) P(Aa,Bb)* P(Aa,BB) P(Aa) AA P(AA,bb) P(AA,Bb) P(AA,BB) P(AA) Total P(bb) P(Bb) P(BB) 1,0

b B Total a P(ab) P(aB) P(a) A P(Ab) P(AB) P(A) Total P(b) P(B) 1,0

Distribuição dos genótipos – Multinomial (8 g.l) Análise no nível de indivíduos (n)

Distribuição dos haplótipos – Multinomial (3 g.l) Análise no nível cromossômico (2n)

P(AA,BB)=P(AB)2 =[P(A).P(B)+D AB]2 ; DAB=P(AB)-P(A)P(B)

0

:

0

D

AB

H

*: incerteza sobre o arranjo dos haplótipos (em cis ou trans?)

- Teste 2 clássico

(12)

Equilíbrio de Ligação

Distribuição dos genótipos – Multinomial (8 g.l) Distribuição dos haplótipos – Multinomial (3 g.l)

 Modelo Restrito  Equilíbrio de Ligação

2 1 0

~

ln

ln

2

L

L

0

:

0

D

AB

H

 Modelo Saturado 

P

P

D

Dados

L

L

ln

A

,

B

,

AB

0

|

ln

0

P

P

D

Dados

L

L

ln

A

,

B

,

AB

|

ln

(13)

Exemplo: Teste de Desequilíbrio de Ligação

Loco 1 BB Bb bb Total AA 10 15 5 30 Aa 10 50 13 73 aa 3 13 10 26 Total 23 78 28 129 Loco 2

Distribuição de genótipos nos Locos 1 e 2

# haplótipos AB = 2(10)+10+15=45 # haplótipos aB = 10+2(3)+13 =29 # haplótipos Ab = 15+2(5)+13 =38 # haplótipos ab = 13+13+2(10)=46 B b A a 45 (0.2848) 38 (0.2405) 29 (0.1835) 46 (0.2911)

 Estimativas Censuradas dos Parâmetros (eliminando obs AaBb)

03878 . 0 ) 4684 . 0 )( 5253 . 0 ( 2848 . 0 ˆ 4684 . 0 ˆ 5253 . 0 ˆ      AB B A D P P estimativas viciadas

)

05

.

0

(

83

.

3

2 1

p

Teste de Independência Clássico Concl.?

(14)

Teste de Desequilíbrio de Ligação

Loco 1 BB Bb bb Total AA 10 15 5 30 Aa 10 50 13 73 aa 3 13 10 26 Total 23 78 28 129 Loco 2

Distribuição de genótipos nos Locos 1 e 2

 Estimativas dos Parâmetros com Dados Completos

 incorporando a incerteza sobre o arranjo dos haplótipos nos casos duplo heterozigoto  Algoritmo EM ou uso das informações do HapMap

B b A a 0.3277 0.1878 0.1529 0.3316 0799 . 0 ˆ 4806 . 0 ˆ 5155 . 0 129 / ) 2 / 73 30 ( ˆ      AB B A D P P

)

003

.

0

(

89

.

8

2 1

p

Concl.?

89

.

8

)]

,

(

/

)

,

,

(

ln[

2

L

P

A

P

B

D

AB

L

P

A

P

B

(15)

Coeficiente de Desequilíbrio de Ligação

B A AB B A

P

P

P

D

 D é uma Medida de Covariância

    contrário caso 0 presente está se 1 A X     contrário caso 0 presente está se 1 B Y

     

B A B A Y X

E

XY

E

X

E

Y

 

X P X A E 1 ( 1) 

 

Y P Y B E 1 ( 1) 

 

XY P X Y AB E 1 ( 1; 1) 

(16)

Coeficientes de Desequilíbrio de Ligação

0

,

min

0

,

min

'

D

se

D

D

se

D

D

b a B A B a b A

1

0

;

2 2 2

r

D

r

b a B A

1

'

1

D

D’ = r2 = 0: Equilíbrio de ligação (independência entre locos)

B A AB

D

(17)

17

Recombinantes

Sem Ligação (Locos “Distantes”)

Não Recombinantes

Ligação (Locos “Próximos”)

Estrutura do Genoma

Material de 1 indivíduo (meiose) Material de 1 indivíduo (meiose)

(18)

Declínio do Desequilíbrio

theta: fração de Recombinação

Fontes de Desequilíbrio (fuga da independência/associação)

 Ligação Genética

 Variação Amostral (“deriva” em populações finitas)

 Mutação, Seleção

 Efeito de Fundador: pop. isolada com único ancestral

 Estratificação ou Miscigenação (Paradoxo de Simpson): o desequilíbrio pode ocorrer entre locos não ligados (distantes)

(19)

Como definir e estimar o efeito de um

“gene” sobre uma variável de interesse?

(20)

Padrão de Variação Fenotípica

Fenótipo (Y) = Gene (X) + Ambiente (E)

Gene (X)

Fenótipo (Y)

Ambiente

Monogênicos Pleiotropia (Y1,Y2) Epistasia (G1,G2) 1, 2, 12

(21)

Padrão de Variação Fenotípica

1 1

X

G1

G1

Y

n

 1 1 2 2 1 2 12 1 1

X

E E

X

G

X

G

X

G

X

G

Y

n

 1 1 1 1

X

E E

X

G G

Y

n

X

E E

X

G G

X

E

X

G EG

Y

n 1 1 1 1 1

Y

1

Y

2

n2

1

2

X

G1

11

12

 

1

2

Modelos considerando o “gene” como um fator de efeito fixo sobre Y

 Modelos mais gerais podem ser definidos com o “gene”como aleatório!

(22)

Mapeamento de “Genes”

|

|

Y

E Y X

Y

E Y X

Componente Fixo Componente Aleatório

Componente Genético

Mapear variantes (“genes”) comuns na população

Modelado como Efeito Fixo

Modelado como Efeito Aleatório

Mapear variantes raras, que expliquem a covariância entre

(23)

150.00 2 190.00 3 135.46 1 148.72 2 178.00 3 ... ... 126.49 1 164.54 2 168.64 2 179.58 2

Dados de pressão arterial (Y) e genótipo de um marcador SNP1 (X) para uma amostra aleatória de 169 funcionários de

uma empresa.

Delineamento com Indivíduos não relacionados e variável de interesse

quantitativa (delineamento pouco utilizado).

Há evidência de algum efeito do SNP1 sobre o fenótipo Y? Y X

(24)

Efeito Genético – Fator Fixo

Efeito do Gene na Média de Y

Modelos ANOVA : 1 fator em três níveis (genótipo do SNP1=aa, Aa, AA). Temos 2 graus de liberdade para estudar o efeito do “gene” (SNP1)

-1 para aa 0 para Aa 1 para AA 0 para aa 1 para Aa 0 para AA

2

aa AA

a

2

aa AA Aa

d

2

aa AA

i d i a i i

a X

d X

e

y

a i

X

X

d i

 

   

0

:

0 2

d

a

H

e

V

y

V

a

d

a

y

E

e i i AA Aa aa i

Aditivo Dominante(+) Dominante(-)

aa Aa AA aa Aa AA

(25)

a    a   qq  QqQQ 0  d qq Qq QQ 20 30 40 50 60 Média Y

Modo Codominante de Herança

qq Qq QQ 20 30 40 50 60

Modo Dominante de Herança Média Y qq Qq QQ 20 30 40 50 60 Média Y

Modo Recessivo de Herança

a   d   a   qq  QqQQ a   d   a   qq  QqQQ

(26)

Efeito Genético

qq Qq QQ Y qq Qq QQ Y a   d a   qq  QQQq a   d    a qqQq  QQ

(27)

Exemplo

Estimação dos Ef Genéticos

                          d a X e X Y    0 1 1 1 0 1 0 1 1 M1 P S QQ Qq qq 210 200 190 180 170 160 150 140 130 120 Boxplot of PS by M1 PS M1 150.00 2 190.00 3 135.46 1 148.72 2 178.00 3 ... ... 126.49 1 164.54 2 168.64 2 179.58 2 Analysis of Variance Source DF SS MS F p Regression 2 30149 15074 60.49 0.000 Residual Error 166 41366 249 Total 168 71515 62 . 177 ˆ 22 . 154 ˆ 00 . 145 ˆ 309 . 161 ˆ 089 . 7 ˆ 31 . 16 ˆ         MM Mm mm d a     2 mm MM      PS = 161 + 16.3 Xa - 7.09 Xd

Predictor Coef SE Coef T p Constant 161.309 1.486 108.54 0.000 Adit 16.311 1.486 10.98 0.000 Domi -7.089 2.806 -2.53 0.012

(28)

LAB1: Exercício de Simulação de Dados e

Estimação de Efeitos Genéticos

      AA se 2 Aa se 1 aa se 0 i X Xi ~ Binomial

n 2; pP(A)

2 2 2 ) 1 ( 2 1 ) 1 ( 0 p X P p p X P p X P i i i        

 Gerar dados de marcadores SNP em Eq. H-W:

 Gerar variáveis quantitativas Y tal que: Yij ~ N(j , ² ); j =  + a Xa + d Xd

(29)

LAB1: Resultados para n=60, m=1 e 50 runs

Yij ~ N(j , ²=42 )

(30)

LAB1: Efeitos Genéticos (Fixos)

 Ajustar modelos para estimar o efeito do marcador molecular (variável SNP: número de alelos “A” )

yj =  + a Xa + d Xd + e ; eij ~ N(j , ² )

Parametrização 1: modelo com efeito aditivo e de dominância do marcador  Xa = 0 (aa), 1 (Aa), 2 (AA) Xd = 0 (aa), 1 (Aa), 0 (AA)

 E(Y|aa)= aa =  E(Y|Aa)= Aa =  + a + d E(Y|AA)= AA =  + 2a  a = (AA - aa )/2 d = Aa – (AA + aa )/2  = aa

(31)

LAB1: Efeitos Genéticos (Fixos)

 Ajustar modelos para estimar o efeito do marcador molecular (variável SNP: número de alelos “A” )

yj =  + a Xa + d Xd + e ; eij ~ N(j , ² )

Parametrização 2: modelo com efeito aditivo e de dominância do marcador  Xa = -1 (aa), 0 (Aa), 1 (AA) Xd = 0 (aa), 1 (Aa), 0 (AA)

 E(Y|aa)= aa =  - a E(Y|Aa)= Aa =  + d E(Y|AA)= AA =  + a  a = (AA - aa )/2 d = Aa – (AA + aa )/2  = (AA + aa )/2

(32)

LAB1: Efeitos Genéticos (Fixos)

 Ajustar modelos para estimar o efeito do marcador molecular (variável SNP: número de alelos “A” )

yj =  + a Xa + d Xd + e ; eij ~ N(j , ² )

Parametrização 3: modelo com efeito linear e quadrático  Xa = 0 (aa), 1 (Aa), 2 (AA) Xd = 0 (aa), 1 (Aa), 4 (AA)  E(Y|aa)= aa =  E(Y|Aa)= Aa =  + a + d E(Y|AA)= AA =  + 2a + 4d  a = ? d = ? Como os parâmetros a e d estão definidos?

(33)

LAB1: Efeitos Genéticos (Fixos)

 Ajustar modelos para estimar o efeito do marcador molecular (SNP: var. quantitativa discreta – número de alelos de risco) yj =  + a Xa + e ; eij ~ N(j , ² )

Parametrização 4: Modelo com somente o efeito linear/aditivo do marcador  Xa = 0 (aa), 1 (Aa), 2 (AA)

 E(Y|aa)= aa = 

E(Y|Aa)= Aa =  + a E(Y|AA)= AA =  + 2 a

 Solução de mínimos quadrados (ou máxima verossimilhança) Mais usada! a = AA - Aa

a a X a i ai a a a aa AA a Y X s n Y X n Y X Y X X X a      ˆ ˆ ) 1 ( ' ' ˆ ˆ ˆ 2 1       

(34)

LAB1: Efeitos Genéticos (Fixos)

 Ajustar modelos para estimar o efeito do marcador molecular (SNP: 1 fator em 3 níveis de resposta)

yj =  + 1 X1 + 2 X2 + e ; eij ~ N(j , ² )

Parametrização 5: genótipo homozigoto como casela de referência  X1 = 0 (aa), 1 (Aa), 0 (AA) X2 = 0 (aa), 0 (Aa), 1 (AA)

 E(Y|aa)= aa =  E(Y|Aa)= Aa =  + 1 E(Y|AA)= AA =  + 2  1 = Aa - aa 2 = AA – aa  = aa

(35)

Fenótipo (Y) Quantitativo

Efeito Genético de um Marcador Molecular (X)

Modelos de Regressão (ANOVA) Outros modelos a serem testados:

0 0 1 0 1 | : | :

   G Y E H X G Y E H G Modelo AA Aa aa EfeitoDominante 1 1 0 Efeito Recessivo 1 0 0 Efeito Aditivo 2 1 0 Efeito Aditivo 1 0 -1 Efeito Aditivo 1 0,5 0 Genótipo Valores de XG

Testes de H0: 1=0 : Estatística F, Estatística Razão de Verossimilhanças

uso de um grau de liberdade para testar o efeito do “gene”

(36)

Ajuste de Modelos de Regressão para dados de um mapa ou plataforma de marcadores moleculares

0 0 1 0 1 | : : Esporádico M odelo | : Genético M odelo       M g M G Y E H X G Y E H

Efeitos Genéticos

 

 

0 0 1 1 10 ˆ ˆ log    L L Lod

Testar o Efeito Linear do Marcador via Estatísticas F:

Estatística LogScore: mudança de escala na estatística razão de

verossimilhanças

Testes via Estatísticas da Razão de Verossimilhança (Estatísticas Lod Score) gl Mod g l sF s QM QMMod F ~ . . ; . .Re Re 

 

 

 

 

2 0 1 1 0 0 0 1 1 ~ ˆ ˆ ln 2 ˆ ˆ ln 2 p L L L L RV                      

 p: diferença no número de parâmetros sob o modelos completo (H1) e reduzido

(37)

Tabela de ANOVA

F.V. g l SQ QM F p

Modelo k-1

Resíduo N-k

TOTAL N-1

2

)

(

y

y

n

j j

ij j ij

y

y

)

2

(

ij ij

y

y

)

2

(

SQMod / (k-1) SQRes / (N-k) QMMod / QMRes

0

...

1 2 1

k

H:

Suposições clássicas (análise de diagnóstico ?): normalidade, homocedasticidade e independência k N k

F

s

QM

QMMod

F

~

1;

Re

(38)

Modelos Genéticos

Equivalência entre Estatísticas

2 1 2 1 Re

ˆ

      n j j j Total n j j j síduo y y SQ y y SQR 2 / Re n sidual Total SQ SQ        

Estatística Lod Score: Lod log10

 

 

 ln 2  RV

Lod Lod e RV e Lod 61 . 4 log 2 217 . 0 log 2 1 10 10        

1

1 1 / 2 Re Re               n síduo síduo Total k k n SQ SQ SQ k k n F

Estatística Razão de Verossimilhanças:

Estatística F:

Sob condições de regularidade válidas

(39)

Passo 1: Modelos Uni-Locos no Mapeamento Genético Testar o efeito de cada marcador separadamente

0 0 1 0 1 | : : Esporádico M odelo ,..., 1 ; | : Genético M odelo        M g M g G Y E H G g X G Y E H

Mapas e Plataformas de Marcadores

Problemas:

- Definir como o efeito do loco será testado (com 1 ou 2 g.l. no caso de locos bialélicos)

- Adotar um nível de significância global para o conjunto de locos testados: correção para múltiplos testes (Bonferroni, FDR)

- GWAS (Genome Wide Association Studies): adotar αc=10-8

Problema de alta dimensão

(40)

Estatísticas Lod Score (ou F, ou AIC, ou –log(p-valor) ) na ordenada e a posição de marcadores na abscissa

Gráfico Manhattan

Chr4 - Marcador NPY2a Chr11 – Marcadores R561 R1246 Mapeamento da pressão basal: mapa com 300 marcadores Testes com 1 g.l. e dados completos.

Y |G

01 Xg Xg 2,1,0 E  

(41)

Y |G

01 Xg Xg 2,1,0 E   Chr2 MT1PB R360 Chr4 TGFAA

Gráfico Manhattan

Mapeamento da pressão arterial sistólica: mapa com 300 marcadores Testes com 1 g.l. e dados completos.

(42)

Mapeamento Genético

 Ajuste de modelos unilocos para estudar o efeito de milhares de SNPs  Poucos sinais significantes  estudar efeitos mais gerais (multilocos e interação com o ambiente, pleiotropia)

(43)

Modelos para Pares de Locos

Epistasia

Genótipos Conjuntos de Múltiplos Locos

Y |GM

0 1

GM1

2

GM2

12

GM1*M2

E     

Análise por Loco: considerar os efeitos principais de cada loco (aditivo e de dominância) bem como os efeitos de interação entre

pares de locos (“Epistasia”)

Alternativas de Análise:

 Análise por Loco

 Análise por Haplótipo (conhecer/estimar a fase haplotípica) Loco1 Q2Q2 Q2q2 q2q2 Q1Q1 Q1q1 q1q1 Loco2 G00 G10 G20 G01 G11 G21 G02 G12 G22

Gene (X) Fenótipo (Y) Ambiente

(44)

Modelos para Pares de Locos

q

2

q

2

Q

2

q

2

Q

2

Q

2

q

1

q

1

Q

1

q

1

Q

1

Q

1

Q1Q1Q2Q2 2 2 1 1q Q Q Q

q1q1Q2Q2

2 2 1 1Q Q q Q

Q1q1Q2q2 2 2 1 1q Q q q

2 2 1 1Q q q Q

Q1q1q2q2 2 2 1 1q q q q

1 1Q Q

Q1q1 1 1q q

2 2q q

Q2q2

Q2Q2

2

2 2 2 2 2 q q Q Q

a

2

1 1 1 1 1 q q Q Q

a

 

0

:

2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1

Q Q q q Q Q Q Q q q q q q q Q Q Q Q q q Q Q Q Q q q q q q q Q Q

H

Efeitos Aditivos Marginais

(45)

Modelos para Pares de Locos

Como pesquisar o espaço Biloco?

 

 

 

 

 

 

0 2 2 0 2 1 1 0 1 2 2 1 1 0 2 1 12 2 2 1 1 0 | (Nulo) Esporádico M odelo | Loco M odelo | Loco M odelo | (Conjunto) Aditivo M odelo * | ) (Epistasia Completo M odelo                         M M M M M G Y E M G Y E M G Y E M M G Y E M M M M G Y E 1 2 3

1  Testes para uma seqüência de Pares de Locos

2  Teste do efeito de interação (com 1 g.l.)  pode-se adotar testes com 2 ou 3 g.l 3  Comparação do modelo aditivo conjunto com cada modelo de um único Loco

(46)

Modelos para Pares de Locos

Efeito de Epistasia “Interação” entre Genes

Genótipo Fenótipo Ambiente

AA

bb Bb BB

Efeitos Genéticos Aditivos Y

aa

Y

Aa

bb Bb BB

Efeitos Genéticos Não Aditivos

AA

aa Aa

(47)

Modelos para Pares de Locos

2 1 2 1 2 2 1 1 1 2 2

*

*

1

X

a

d

X

d

a

X

a

d

X

d

i

a a

X

a

X

a

i

d d

X

d

X

d

a

y

Loco1 Loco2 Epistasia

ef. aditivo

Epistasia ef. de dominância

Loco1 e Loco2 em “Equilíbrio de Ligação (LD)”

Modelo com 2 Locos: 8 graus de liberdade (Fatorial 3²)

2 1 2 1

*

d d a d

*

a a a d

X

X

i

X

X

i

Epistasia ef. Aditivo com ef. dominância

(48)

Efeito de Epistasia

Gráficos de Perfis de Médias

Há evidência da existência de efeito de interação entre os locos 1 e 2 na variação da resposta Y?

GenoL1 M e a n 2 1 0 26 24 22 20 18 16 14 12 10 GenoL2 2 0 1

Interaction Plot (data means) for Traco

M e a n o f Tr a co 2 1 0 23 22 21 20 19 18 17 16 15 14 2 1 0 GenoL1 GenoL2

(49)

Ajuste do Modelo de Epistasia

Traco = 18,0 + 3,90 a1 - 0,044 d1 + 4,13 a2 - 0,110 d2 - 0,088 a1a2 + 0,123 a1d2 - 0,076 d1a2 - 0,14 d1d2

Predictor Coef SE Coef T P Constant 17,9662 0,3167 56,73 0,000 a1 3,9006 0,4554 8,56 0,000 d1 -0,0437 0,6334 -0,07 0,945 a2 4,1284 0,4554 9,06 0,000 d2 -0,1099 0,6334 -0,17 0,863 a1a2 -0,0879 0,4963 -0,18 0,860 a1d2 0,1228 0,9109 0,13 0,893 d1a2 -0,0759 0,9109 -0,08 0,934 d1d2 -0,140 1,267 -0,11 0,912 S = 0,978754 R-Sq = 91,1% R-Sq(adj) = 90,3% Analysis of Variance Source DF SS MS F P Regression 8 889,05 111,13 116,01 0,000 Residual Error 91 87,17 0,96 Total 99 976,22

(50)

GenoL1 M e a n 2 1 0 26 24 22 20 18 16 14 12 10 GenoL2 2 0 1

Interaction Plot (data means) for traco2

M e a n o f tr a co 2 2 1 0 18 17 16 15 14 13 12 11 10 9 2 1 0 GenoL1 GenoL2

Main Effects Plot (data means) for traco2

Efeito de Epistasia

Gráficos de Perfis de Médias do Traço2

Há evidência da existência de efeito de interação entre os locos 1 e 2 ?

(51)

Ajuste do Modelo de Epistasia

traco2 = 13,6 + 3,51 a1 + 0,571 d1 + 3,75 a2 - 0,544 d2 + 4,11 a1a2 – 0,876 a1d2 + 0,245 d1a2 + 1,31 d1d2

Predictor Coef SE Coef T P Constant 13,6185 0,2915 46,72 0,000 a1 3,5090 0,4192 8,37 0,000 d1 0,5705 0,5830 0,98 0,330 a2 3,7476 0,4192 8,94 0,000 d2 -0,5442 0,5830 -0,93 0,353 a1a2 4,1055 0,4568 8,99 0,000 a1d2 -0,8756 0,8385 -1,04 0,299 d1a2 0,2446 0,8385 0,29 0,771 d1d2 1,306 1,166 1,12 0,266 S = 0,900965 R-Sq = 96,1% R-Sq(adj) = 95,7% Analysis of Variance Source DF SS MS F P Regression 8 1807,47 225,93 278,33 0,000 Residual Error 91 73,87 0,81 Total 99 1881,33

(52)

Médias amostrais [,1] [,2] [,3]

[1,] 173.1069 161.3177 154.2257 [2,] 159.0260 166.8530 167.0044 [3,] 144.5349 169.6013 183.3551

mi=165, a1= 5, a2= 2, a1a2= 15, d1=0, d2=0, d1d2=0, a1d2=0, d1a2=0, s2=8 Exercício no R:

Gerar n=500 observaçõesde dados genotípicos e fenotípicos Loco1: PA= 0.05 PT= 0.05 PC= 0.45 PG= 0.45

Loco2: PA= 0.15 PT= 0.15 PC= 0.35 PG= 0.35

> fit12 <- glm(fenotipos[,3] ~ ad1 + ad2 + ad1ad2, x=TRUE) Coefficients Estimate Std. Error t value Pr(>|t|)

(Intercept) 164.9300 0.9539 172.897 < 2e-16 *** ad1 5.5053 1.1748 4.686 3.6e-06 *** ad2 2.5261 1.0217 2.473 0.0138 * ad1ad2 15.7076 1.2686 12.382 < 2e-16 *** Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(53)

mi=165, a1= 5, a2= 2, a1a2= 15, d1=0, d2=0, d1d2=0, a1d2=0, d1a2=0, s2=8 Exercício no R:

Gerar n=500 observaçõesde dados genotípicos e fenotípicos Loco1: PA= 0.05 PT= 0.05 PC= 0.45 PG= 0.45 Loco2: PA= 0.15 PT= 0.15 PC= 0.35 PG= 0.35 1 1 1 0.0 0.5 1.0 1.5 2.0 150 160 170 180 Loco F e n ó tip o 2 2 2 3 3 3

(54)

Modelos Genéticos Gerais

 Controle de Qualidade dos Dados

 Modelos Uniloco Univariados: definir os efeitos genéticos e o nível de significância conjunto (correção para múltiplos testes)

 Modelos Multilocos Univariado: Como pesquisar o espaço multilocos (locos em LD)? Como selecionar o conjunto ótimo de locos (busca exaustiva, condicional ou

conjunta)? Como definir os efeitos multilocos (modelos aditivos, epistáticos, haplotípicos)?

 Modelos Multivariados

 Modelos de efeitos genéticos aleatórios ou mistos

Referências

Documentos relacionados

a) Na doença de Crohn dos cólons, ao contrário da reto- colite ulcerativa, o reto tende a se apresentar pouco comprometido ou até mesmo endoscopicamente normal. b)

Não existem dados clínicos disponíveis para pacientes com alteração hepática grave (Child Pugh C) (ver itens “Contra-indicações” e “Características Farmacológicas”). -

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

AMU Análise Musical MTOB Música de Tradição Oral Brasileira. AMUA Análise Musical Avançada MUSITEC Música

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

Propor uma alternativa para as embalagens plásticas existentes nos dias atuais, através da obtenção de filmes a partir de blendas de amido de mandioca como matéria-prima para o

atribuições legais e em conformidade com o que dispõe a Lei Federal 8.666/93 e suas alterações, resolve homologar e adjudicar a decisão da Comissão Permanente de

As unidades serão classificadas por padrões, para a premiação final, o padrão do clube será média dos padrões das unidades recebendo sua pontuação somente após o Campori,