MAE0540-Genética de Populações
MAE5757-Métodos Estatísticos em
Genética e Genômica
Júlia Maria Pavan Soler
O genoma é um sistema estruturado/organizado. Duas importantes leis contribuem para a caracterização e organização do genoma:
Lei do Equilíbrio de Hardy-Weinberg
Lei do Equilíbrio de Ligação
Como o efeito de um “gene” pode ser mensurado?
Caso: diploide e locos dialélicos
Modelos de Efeitos fixos
3
Marcadores Moleculares
Pontos de referência no genoma
variações comuns/raras na sequência
de DNA entre indivíduos
Posição conhecida
Passíveis de Genotipagem
Alu repeat no Chr 8
Padrão de Bandas (eletroforese em gel):
+/+ presença do repeat nos dois alelos (pesado)
-/+ presença do repeat em somente um alelo
-/- ausência do repeat nos dois alelos (leve)
Marcadores Moleculares - SNPs
Single Nucleotide Polymorphisms
SNP: common variants (MAF>1%)
“Genotype calls” para cada SNP: AA Aa aa Chips de informação de marcadores para cada indivíduo
106 SNPs
Imagem (Scanner)
Capacidade: Placas com 12x8 posições (96 chips por vez)
AA if 2 Aa if 1 aa if 0 i X
Genotipagem de SNPs
AA
Aa
aa
Dados da intensidade dos “alelos” A e a para o SNP rs2131259
Amostra da população brasileira Referência (verde): dados HapMap
Os dados (x,y) podem ser transformados para serem melhor representados:
Coordenadas polares: inclinação e distância à origem
Rotacionar 45: (x-y) versus ½(x+y) (conhecido como gráfico MA, gráfico de Blend-Altman, semelhante ao gráfico do desvio padrão pela média)
Genotipagem de SNPs
Organismos Poliplóides: Ploidia k (k+1) genótipos Ex. Cana de açúcar: SNP com ploidia 5
No gráfico com as intensidades de cada “alelo” (nucleotídeo):
O número de raios define a ploidia (os genótipos): AAAAA, AAAAa, ..., aaaaa A posição no raio define o número de réplicas: indivíduo com o genótipo
AAAaa sendo que no loco de SNP pode haver duplicação ou deleção de alelos.
a A
Genotipagem de SNPs
Transformação de Variáveis
Organismos Poliplóides: Ploidia k (k+1) genótipos a A y x x k U Projeção dos dados na
combinação convexa x+y=1:
Distribuição da variável U: multimodal (dados simulados)
Leis de Segregação de Alelos
Equilíbrio de Hardy-Weinberg (EHW)
a ♂ ♀ A ♂ ♀ a A b B
Independência entre alelos dentro do loco. Probabilidade de genótipos é descrita em
termos de probabilidades alélicas. (Falconer e Mackay, 1996)
Equilíbrio de Ligação (LD): independência entre locos
2 2 2 A P AA P a P A P Aa P a P aa P
a b
P a P b P B P a P B a P b P A P b A P B P A P B A P Independência entre alelos de locos diferentes (haplótipos)
9
Equilíbrio de H-W - Sistema MN
(%) MM MN NN Total Greenland 83.5 15.6 0.9 569 Iceland 31.2 51.5 17.3 747 American Whites 29.0 50.0 21.0 6129Falconer & Mackay, 1996
O sistema MN em Iceland está em equilíbrio de H-W ?
# total de alelos = 2x747=1494 # alelos M = (2x233)+385=851
p(M)=0.5696 p(N)=0.4304 (estimativa!!) MM MN NN Total O 233 385 129 747 Probab. Estimada 0.3245 0.4903 0.1852 1 E 242.37 366.26 138.37 747
1.9555
0.3762 Pr 22
p o sistema está em equilíbrio suportando o modo de herança Mendeliano
Refaça o teste para as demais populações. H0: ?
Equilíbrio de Hardy-Weinberg
Genótipo aa Aa AA Total Trinomial P(aa) P(Aa) P(AA) 1,0
Distribuição sob Eq. H-W: Simplex Aa
aa AA aa AA
Aa
Gráfico ternário com a região de aceitação do teste 2 em função de n dado
α=5% (à esquerda) e de α dado n=50 (à direita).
Graffelman and Camarena (2008), Human Heredity 65: 77-84. Outras alternativas de teste: - Singer et al., 1991 - FBST(Pereira e Stern, 1999) - J. Graffelman (2008, 2015)
Equilíbrio de Ligação
bb Bb BB Total aa P(aa,bb) P(aa,Bb) P(aa,BB) P(aa) Aa P(Aa,bb) P(Aa,Bb)* P(Aa,BB) P(Aa) AA P(AA,bb) P(AA,Bb) P(AA,BB) P(AA) Total P(bb) P(Bb) P(BB) 1,0
b B Total a P(ab) P(aB) P(a) A P(Ab) P(AB) P(A) Total P(b) P(B) 1,0
Distribuição dos genótipos – Multinomial (8 g.l) Análise no nível de indivíduos (n)
Distribuição dos haplótipos – Multinomial (3 g.l) Análise no nível cromossômico (2n)
P(AA,BB)=P(AB)2 =[P(A).P(B)+D AB]2 ; DAB=P(AB)-P(A)P(B)
0
:
0D
AB
H
*: incerteza sobre o arranjo dos haplótipos (em cis ou trans?)- Teste 2 clássico
Equilíbrio de Ligação
Distribuição dos genótipos – Multinomial (8 g.l) Distribuição dos haplótipos – Multinomial (3 g.l)
Modelo Restrito Equilíbrio de Ligação
2 1 0~
ln
ln
2
L
L
0
:
0D
AB
H
Modelo Saturado
P
P
D
Dados
L
L
ln
A,
B,
AB0
|
ln
0
P
P
D
Dados
L
L
ln
A,
B,
AB|
ln
Exemplo: Teste de Desequilíbrio de Ligação
Loco 1 BB Bb bb Total AA 10 15 5 30 Aa 10 50 13 73 aa 3 13 10 26 Total 23 78 28 129 Loco 2Distribuição de genótipos nos Locos 1 e 2
# haplótipos AB = 2(10)+10+15=45 # haplótipos aB = 10+2(3)+13 =29 # haplótipos Ab = 15+2(5)+13 =38 # haplótipos ab = 13+13+2(10)=46 B b A a 45 (0.2848) 38 (0.2405) 29 (0.1835) 46 (0.2911)
Estimativas Censuradas dos Parâmetros (eliminando obs AaBb)
03878 . 0 ) 4684 . 0 )( 5253 . 0 ( 2848 . 0 ˆ 4684 . 0 ˆ 5253 . 0 ˆ AB B A D P P estimativas viciadas
)
05
.
0
(
83
.
3
2 1
p
Teste de Independência Clássico Concl.?Teste de Desequilíbrio de Ligação
Loco 1 BB Bb bb Total AA 10 15 5 30 Aa 10 50 13 73 aa 3 13 10 26 Total 23 78 28 129 Loco 2Distribuição de genótipos nos Locos 1 e 2
Estimativas dos Parâmetros com Dados Completos
incorporando a incerteza sobre o arranjo dos haplótipos nos casos duplo heterozigoto Algoritmo EM ou uso das informações do HapMap
B b A a 0.3277 0.1878 0.1529 0.3316 0799 . 0 ˆ 4806 . 0 ˆ 5155 . 0 129 / ) 2 / 73 30 ( ˆ AB B A D P P
)
003
.
0
(
89
.
8
2 1
p
Concl.?89
.
8
)]
,
(
/
)
,
,
(
ln[
2
L
P
AP
BD
ABL
P
AP
B
Coeficiente de Desequilíbrio de Ligação
B A AB B AP
P
P
D
D é uma Medida de Covariância
contrário caso 0 presente está se 1 A X contrário caso 0 presente está se 1 B Y
B A B A Y XE
XY
E
X
E
Y
X P X A E 1 ( 1)
Y P Y B E 1 ( 1)
XY P X Y AB E 1 ( 1; 1) Coeficientes de Desequilíbrio de Ligação
0
,
min
0
,
min
'
D
se
D
D
se
D
D
b a B A B a b A
1
0
;
2 2 2
r
D
r
b a B A
1
'
1
D
D’ = r2 = 0: Equilíbrio de ligação (independência entre locos)
B A AB
D
17
Recombinantes
Sem Ligação (Locos “Distantes”)
Não Recombinantes
Ligação (Locos “Próximos”)
Estrutura do Genoma
Material de 1 indivíduo (meiose) Material de 1 indivíduo (meiose)
Declínio do Desequilíbrio
theta: fração de Recombinação
Fontes de Desequilíbrio (fuga da independência/associação)
Ligação Genética
Variação Amostral (“deriva” em populações finitas)
Mutação, Seleção
Efeito de Fundador: pop. isolada com único ancestral
Estratificação ou Miscigenação (Paradoxo de Simpson): o desequilíbrio pode ocorrer entre locos não ligados (distantes)
Como definir e estimar o efeito de um
“gene” sobre uma variável de interesse?
Padrão de Variação Fenotípica
Fenótipo (Y) = Gene (X) + Ambiente (E)
Gene (X)
Fenótipo (Y)
Ambiente
Monogênicos Pleiotropia (Y1,Y2) Epistasia (G1,G2) 1, 2, 12Padrão de Variação Fenotípica
1 1
X
G1
G1
Y
n
1 1 2 2 1 2 12 1 1X
E EX
GX
GX
GX
GY
n
1 1 1 1X
E EX
G GY
n
X
E EX
G GX
EX
G EGY
n 1 1 1 1 1
Y
1Y
2
n2
1
2
X
G1
11
12
1
2
Modelos considerando o “gene” como um fator de efeito fixo sobre Y
Modelos mais gerais podem ser definidos com o “gene”como aleatório!
Mapeamento de “Genes”
|
|
Y
E Y X
Y
E Y X
Componente Fixo Componente Aleatório
Componente Genético
Mapear variantes (“genes”) comuns na população
Modelado como Efeito Fixo
Modelado como Efeito Aleatório
Mapear variantes raras, que expliquem a covariância entre
150.00 2 190.00 3 135.46 1 148.72 2 178.00 3 ... ... 126.49 1 164.54 2 168.64 2 179.58 2
Dados de pressão arterial (Y) e genótipo de um marcador SNP1 (X) para uma amostra aleatória de 169 funcionários de
uma empresa.
Delineamento com Indivíduos não relacionados e variável de interesse
quantitativa (delineamento pouco utilizado).
Há evidência de algum efeito do SNP1 sobre o fenótipo Y? Y X
Efeito Genético – Fator Fixo
Efeito do Gene na Média de Y
Modelos ANOVA : 1 fator em três níveis (genótipo do SNP1=aa, Aa, AA). Temos 2 graus de liberdade para estudar o efeito do “gene” (SNP1)
-1 para aa 0 para Aa 1 para AA 0 para aa 1 para Aa 0 para AA
2
aa AAa
2
aa AA Aad
2
aa AA
i d i a i ia X
d X
e
y
a iX
X
d i
0
:
0 2
d
a
H
e
V
y
V
a
d
a
y
E
e i i AA Aa aa i
Aditivo Dominante(+) Dominante(-)
aa Aa AA aa Aa AA
a a qq Qq QQ 0 d qq Qq QQ 20 30 40 50 60 Média Y
Modo Codominante de Herança
qq Qq QQ 20 30 40 50 60
Modo Dominante de Herança Média Y qq Qq QQ 20 30 40 50 60 Média Y
Modo Recessivo de Herança
a d a qq Qq QQ a d a qq Qq QQ
Efeito Genético
qq Qq QQ Y qq Qq QQ Y a d a qq QQ Qq a d a qq Qq QQExemplo
Estimação dos Ef Genéticos
d a X e X Y 0 1 1 1 0 1 0 1 1 M1 P S QQ Qq qq 210 200 190 180 170 160 150 140 130 120 Boxplot of PS by M1 PS M1 150.00 2 190.00 3 135.46 1 148.72 2 178.00 3 ... ... 126.49 1 164.54 2 168.64 2 179.58 2 Analysis of Variance Source DF SS MS F p Regression 2 30149 15074 60.49 0.000 Residual Error 166 41366 249 Total 168 71515 62 . 177 ˆ 22 . 154 ˆ 00 . 145 ˆ 309 . 161 ˆ 089 . 7 ˆ 31 . 16 ˆ MM Mm mm d a 2 mm MM PS = 161 + 16.3 Xa - 7.09 Xd
Predictor Coef SE Coef T p Constant 161.309 1.486 108.54 0.000 Adit 16.311 1.486 10.98 0.000 Domi -7.089 2.806 -2.53 0.012
LAB1: Exercício de Simulação de Dados e
Estimação de Efeitos Genéticos
AA se 2 Aa se 1 aa se 0 i X Xi ~ Binomial
n 2; p P(A)
2 2 2 ) 1 ( 2 1 ) 1 ( 0 p X P p p X P p X P i i i Gerar dados de marcadores SNP em Eq. H-W:
Gerar variáveis quantitativas Y tal que: Yij ~ N(j , ² ); j = + a Xa + d Xd
LAB1: Resultados para n=60, m=1 e 50 runs
Yij ~ N(j , ²=42 )
LAB1: Efeitos Genéticos (Fixos)
Ajustar modelos para estimar o efeito do marcador molecular (variável SNP: número de alelos “A” )
yj = + a Xa + d Xd + e ; eij ~ N(j , ² )
Parametrização 1: modelo com efeito aditivo e de dominância do marcador Xa = 0 (aa), 1 (Aa), 2 (AA) Xd = 0 (aa), 1 (Aa), 0 (AA)
E(Y|aa)= aa = E(Y|Aa)= Aa = + a + d E(Y|AA)= AA = + 2a a = (AA - aa )/2 d = Aa – (AA + aa )/2 = aa
LAB1: Efeitos Genéticos (Fixos)
Ajustar modelos para estimar o efeito do marcador molecular (variável SNP: número de alelos “A” )
yj = + a Xa + d Xd + e ; eij ~ N(j , ² )
Parametrização 2: modelo com efeito aditivo e de dominância do marcador Xa = -1 (aa), 0 (Aa), 1 (AA) Xd = 0 (aa), 1 (Aa), 0 (AA)
E(Y|aa)= aa = - a E(Y|Aa)= Aa = + d E(Y|AA)= AA = + a a = (AA - aa )/2 d = Aa – (AA + aa )/2 = (AA + aa )/2
LAB1: Efeitos Genéticos (Fixos)
Ajustar modelos para estimar o efeito do marcador molecular (variável SNP: número de alelos “A” )
yj = + a Xa + d Xd + e ; eij ~ N(j , ² )
Parametrização 3: modelo com efeito linear e quadrático Xa = 0 (aa), 1 (Aa), 2 (AA) Xd = 0 (aa), 1 (Aa), 4 (AA) E(Y|aa)= aa = E(Y|Aa)= Aa = + a + d E(Y|AA)= AA = + 2a + 4d a = ? d = ? Como os parâmetros a e d estão definidos?
LAB1: Efeitos Genéticos (Fixos)
Ajustar modelos para estimar o efeito do marcador molecular (SNP: var. quantitativa discreta – número de alelos de risco) yj = + a Xa + e ; eij ~ N(j , ² )
Parametrização 4: Modelo com somente o efeito linear/aditivo do marcador Xa = 0 (aa), 1 (Aa), 2 (AA)
E(Y|aa)= aa =
E(Y|Aa)= Aa = + a E(Y|AA)= AA = + 2 a
Solução de mínimos quadrados (ou máxima verossimilhança) Mais usada! a = AA - Aa
a a X a i ai a a a aa AA a Y X s n Y X n Y X Y X X X a ˆ ˆ ) 1 ( ' ' ˆ ˆ ˆ 2 1
LAB1: Efeitos Genéticos (Fixos)
Ajustar modelos para estimar o efeito do marcador molecular (SNP: 1 fator em 3 níveis de resposta)
yj = + 1 X1 + 2 X2 + e ; eij ~ N(j , ² )
Parametrização 5: genótipo homozigoto como casela de referência X1 = 0 (aa), 1 (Aa), 0 (AA) X2 = 0 (aa), 0 (Aa), 1 (AA)
E(Y|aa)= aa = E(Y|Aa)= Aa = + 1 E(Y|AA)= AA = + 2 1 = Aa - aa 2 = AA – aa = aa
Fenótipo (Y) Quantitativo
Efeito Genético de um Marcador Molecular (X)
Modelos de Regressão (ANOVA) Outros modelos a serem testados:
0 0 1 0 1 | : | :
G Y E H X G Y E H G Modelo AA Aa aa EfeitoDominante 1 1 0 Efeito Recessivo 1 0 0 Efeito Aditivo 2 1 0 Efeito Aditivo 1 0 -1 Efeito Aditivo 1 0,5 0 Genótipo Valores de XGTestes de H0: 1=0 : Estatística F, Estatística Razão de Verossimilhanças
uso de um grau de liberdade para testar o efeito do “gene”
Ajuste de Modelos de Regressão para dados de um mapa ou plataforma de marcadores moleculares
0 0 1 0 1 | : : Esporádico M odelo | : Genético M odelo M g M G Y E H X G Y E HEfeitos Genéticos
0 0 1 1 10 ˆ ˆ log L L LodTestar o Efeito Linear do Marcador via Estatísticas F:
Estatística LogScore: mudança de escala na estatística razão de
verossimilhanças
Testes via Estatísticas da Razão de Verossimilhança (Estatísticas Lod Score) gl Mod g l s F s QM QMMod F ~ . . ; . .Re Re
2 0 1 1 0 0 0 1 1 ~ ˆ ˆ ln 2 ˆ ˆ ln 2 p L L L L RV p: diferença no número de parâmetros sob o modelos completo (H1) e reduzido
Tabela de ANOVA
F.V. g l SQ QM F p
Modelo k-1
Resíduo N-k
TOTAL N-1
2)
(
y
y
n
j j
ij j ijy
y
)
2(
ij ijy
y
)
2(
SQMod / (k-1) SQRes / (N-k) QMMod / QMRes0
...
1 2 1
k
H:
Suposições clássicas (análise de diagnóstico ?): normalidade, homocedasticidade e independência k N k
F
s
QM
QMMod
F
~
1; Re
Modelos Genéticos
Equivalência entre Estatísticas
2 1 2 1 Re
ˆ
n j j j Total n j j j síduo y y SQ y y SQR 2 / Re n sidual Total SQ SQ Estatística Lod Score: Lod log10
ln 2 RV
Lod Lod e RV e Lod 61 . 4 log 2 217 . 0 log 2 1 10 10
1
1 1 / 2 Re Re n síduo síduo Total k k n SQ SQ SQ k k n F Estatística Razão de Verossimilhanças:
Estatística F:
Sob condições de regularidade válidas
Passo 1: Modelos Uni-Locos no Mapeamento Genético Testar o efeito de cada marcador separadamente
0 0 1 0 1 | : : Esporádico M odelo ,..., 1 ; | : Genético M odelo M g M g G Y E H G g X G Y E HMapas e Plataformas de Marcadores
Problemas:
- Definir como o efeito do loco será testado (com 1 ou 2 g.l. no caso de locos bialélicos)
- Adotar um nível de significância global para o conjunto de locos testados: correção para múltiplos testes (Bonferroni, FDR)
- GWAS (Genome Wide Association Studies): adotar αc=10-8
Problema de alta dimensão
Estatísticas Lod Score (ou F, ou AIC, ou –log(p-valor) ) na ordenada e a posição de marcadores na abscissa
Gráfico Manhattan
Chr4 - Marcador NPY2a Chr11 – Marcadores R561 R1246 Mapeamento da pressão basal: mapa com 300 marcadores Testes com 1 g.l. e dados completos.
Y |G
0 1 Xg Xg 2,1,0 E
Y |G
0 1 Xg Xg 2,1,0 E Chr2 MT1PB R360 Chr4 TGFAAGráfico Manhattan
Mapeamento da pressão arterial sistólica: mapa com 300 marcadores Testes com 1 g.l. e dados completos.Mapeamento Genético
Ajuste de modelos unilocos para estudar o efeito de milhares de SNPs Poucos sinais significantes estudar efeitos mais gerais (multilocos e interação com o ambiente, pleiotropia)
Modelos para Pares de Locos
Epistasia
Genótipos Conjuntos de Múltiplos Locos
Y |GM
0 1
GM1
2
GM2
12
GM1*M2
E
Análise por Loco: considerar os efeitos principais de cada loco (aditivo e de dominância) bem como os efeitos de interação entre
pares de locos (“Epistasia”)
Alternativas de Análise:
Análise por Loco
Análise por Haplótipo (conhecer/estimar a fase haplotípica) Loco1 Q2Q2 Q2q2 q2q2 Q1Q1 Q1q1 q1q1 Loco2 G00 G10 G20 G01 G11 G21 G02 G12 G22
Gene (X) Fenótipo (Y) Ambiente
Modelos para Pares de Locos
q
2q
2Q
2q
2Q
2Q
2q
1q
1Q
1q
1Q
1Q
1
Q1Q1Q2Q2 2 2 1 1q Q Q Q
q1q1Q2Q2
2 2 1 1Q Q q Q
Q1q1Q2q2 2 2 1 1q Q q q
2 2 1 1Q q q Q
Q1q1q2q2 2 2 1 1q q q q
1 1Q Q
Q1q1 1 1q q
2 2q q
Q2q2
Q2Q2
2
2 2 2 2 2 q q Q Qa
2
1 1 1 1 1 q q Q Qa
0
:
2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1
Q Q q q Q Q Q Q q q q q q q Q Q Q Q q q Q Q Q Q q q q q q q Q QH
Efeitos Aditivos Marginais
Modelos para Pares de Locos
Como pesquisar o espaço Biloco?
0 2 2 0 2 1 1 0 1 2 2 1 1 0 2 1 12 2 2 1 1 0 | (Nulo) Esporádico M odelo | Loco M odelo | Loco M odelo | (Conjunto) Aditivo M odelo * | ) (Epistasia Completo M odelo M M M M M G Y E M G Y E M G Y E M M G Y E M M M M G Y E 1 2 31 Testes para uma seqüência de Pares de Locos
2 Teste do efeito de interação (com 1 g.l.) pode-se adotar testes com 2 ou 3 g.l 3 Comparação do modelo aditivo conjunto com cada modelo de um único Loco
Modelos para Pares de Locos
Efeito de Epistasia “Interação” entre Genes
Genótipo Fenótipo Ambiente
AA
bb Bb BB
Efeitos Genéticos Aditivos Y
aa
Y
Aa
bb Bb BB
Efeitos Genéticos Não Aditivos
AA
aa Aa
Modelos para Pares de Locos
2 1 2 1 2 2 1 1 1 2 2*
*
1X
ad
X
da
X
ad
X
di
a aX
aX
ai
d dX
dX
da
y
Loco1 Loco2 Epistasia
ef. aditivo
Epistasia ef. de dominância
Loco1 e Loco2 em “Equilíbrio de Ligação (LD)”
Modelo com 2 Locos: 8 graus de liberdade (Fatorial 3²)
2 1 2 1*
d d a d*
a a a dX
X
i
X
X
i
Epistasia ef. Aditivo com ef. dominância
Efeito de Epistasia
Gráficos de Perfis de Médias
Há evidência da existência de efeito de interação entre os locos 1 e 2 na variação da resposta Y?
GenoL1 M e a n 2 1 0 26 24 22 20 18 16 14 12 10 GenoL2 2 0 1
Interaction Plot (data means) for Traco
M e a n o f Tr a co 2 1 0 23 22 21 20 19 18 17 16 15 14 2 1 0 GenoL1 GenoL2
Ajuste do Modelo de Epistasia
Traco = 18,0 + 3,90 a1 - 0,044 d1 + 4,13 a2 - 0,110 d2 - 0,088 a1a2 + 0,123 a1d2 - 0,076 d1a2 - 0,14 d1d2
Predictor Coef SE Coef T P Constant 17,9662 0,3167 56,73 0,000 a1 3,9006 0,4554 8,56 0,000 d1 -0,0437 0,6334 -0,07 0,945 a2 4,1284 0,4554 9,06 0,000 d2 -0,1099 0,6334 -0,17 0,863 a1a2 -0,0879 0,4963 -0,18 0,860 a1d2 0,1228 0,9109 0,13 0,893 d1a2 -0,0759 0,9109 -0,08 0,934 d1d2 -0,140 1,267 -0,11 0,912 S = 0,978754 R-Sq = 91,1% R-Sq(adj) = 90,3% Analysis of Variance Source DF SS MS F P Regression 8 889,05 111,13 116,01 0,000 Residual Error 91 87,17 0,96 Total 99 976,22
GenoL1 M e a n 2 1 0 26 24 22 20 18 16 14 12 10 GenoL2 2 0 1
Interaction Plot (data means) for traco2
M e a n o f tr a co 2 2 1 0 18 17 16 15 14 13 12 11 10 9 2 1 0 GenoL1 GenoL2
Main Effects Plot (data means) for traco2
Efeito de Epistasia
Gráficos de Perfis de Médias do Traço2
Há evidência da existência de efeito de interação entre os locos 1 e 2 ?
Ajuste do Modelo de Epistasia
traco2 = 13,6 + 3,51 a1 + 0,571 d1 + 3,75 a2 - 0,544 d2 + 4,11 a1a2 – 0,876 a1d2 + 0,245 d1a2 + 1,31 d1d2
Predictor Coef SE Coef T P Constant 13,6185 0,2915 46,72 0,000 a1 3,5090 0,4192 8,37 0,000 d1 0,5705 0,5830 0,98 0,330 a2 3,7476 0,4192 8,94 0,000 d2 -0,5442 0,5830 -0,93 0,353 a1a2 4,1055 0,4568 8,99 0,000 a1d2 -0,8756 0,8385 -1,04 0,299 d1a2 0,2446 0,8385 0,29 0,771 d1d2 1,306 1,166 1,12 0,266 S = 0,900965 R-Sq = 96,1% R-Sq(adj) = 95,7% Analysis of Variance Source DF SS MS F P Regression 8 1807,47 225,93 278,33 0,000 Residual Error 91 73,87 0,81 Total 99 1881,33
Médias amostrais [,1] [,2] [,3]
[1,] 173.1069 161.3177 154.2257 [2,] 159.0260 166.8530 167.0044 [3,] 144.5349 169.6013 183.3551
mi=165, a1= 5, a2= 2, a1a2= 15, d1=0, d2=0, d1d2=0, a1d2=0, d1a2=0, s2=8 Exercício no R:
Gerar n=500 observaçõesde dados genotípicos e fenotípicos Loco1: PA= 0.05 PT= 0.05 PC= 0.45 PG= 0.45
Loco2: PA= 0.15 PT= 0.15 PC= 0.35 PG= 0.35
> fit12 <- glm(fenotipos[,3] ~ ad1 + ad2 + ad1ad2, x=TRUE) Coefficients Estimate Std. Error t value Pr(>|t|)
(Intercept) 164.9300 0.9539 172.897 < 2e-16 *** ad1 5.5053 1.1748 4.686 3.6e-06 *** ad2 2.5261 1.0217 2.473 0.0138 * ad1ad2 15.7076 1.2686 12.382 < 2e-16 *** Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
mi=165, a1= 5, a2= 2, a1a2= 15, d1=0, d2=0, d1d2=0, a1d2=0, d1a2=0, s2=8 Exercício no R:
Gerar n=500 observaçõesde dados genotípicos e fenotípicos Loco1: PA= 0.05 PT= 0.05 PC= 0.45 PG= 0.45 Loco2: PA= 0.15 PT= 0.15 PC= 0.35 PG= 0.35 1 1 1 0.0 0.5 1.0 1.5 2.0 150 160 170 180 Loco F e n ó tip o 2 2 2 3 3 3
Modelos Genéticos Gerais
Controle de Qualidade dos Dados
Modelos Uniloco Univariados: definir os efeitos genéticos e o nível de significância conjunto (correção para múltiplos testes)
Modelos Multilocos Univariado: Como pesquisar o espaço multilocos (locos em LD)? Como selecionar o conjunto ótimo de locos (busca exaustiva, condicional ou
conjunta)? Como definir os efeitos multilocos (modelos aditivos, epistáticos, haplotípicos)?
Modelos Multivariados
Modelos de efeitos genéticos aleatórios ou mistos