arte e novas ferramentas
Flávio S. Schenkel
Professor
Auditório da Farsul – Porto Alegre/RS , 9 de Agosto, 2012
1º Workshop – Seleção genômica para resistência ao carrapato bovino nas raças Hereford e Braford
Pesquisa e Implementação de
seleção genômica no Canadá
Flávio S. Schenkel
- Nenhum projeto de seleção genômica em
andamento no Brazil
- Porém bastante interesse nesta área
1
oprojeto no Canada: 2004
5 anos para implementar seleção genômica
em gado leiteiro (Holandês)
- Vários projeto de seleção genômica em
andamento:
- Zebu leiteiro: Dr. Marcos Vinicius da Silva, EMBRAPA
- Búfalo: Dr. Humberto Tonhati, UNESP-Jaboticabal
- Nelore: Dr. Fernando Garcia, UNESP-Araçatuba
Dra. Lúcia Galvão, UNESP-Jaboticabal
- Hereford/Braford: Dr. Fernando Cardoso, EMBRAPA Conexão DeltaG
Genômica não é magia.
Há pouco valor em:
– Conhecer a sequência genômica;
– Ter painéis de marcadores de alta densidade;
Se estas informações não forem traduzidas em
As ferramentas genômicas incluem:
• Ferramentas
básicas:
SNP
chips,
Microarranjos, etc.
• Ferramentas
de
aplicação
básica:
Mapeamento de genes/QTL, imputação de
genótipos e haplótipos, etc.
• Ferramentas de aplicação prática:
Testes
genéticos, avaliação genômica, verificação
e descoberta de paternidade, etc.
Esta apresentação focará principalmente
na pesquisa e ferramentas desenvolvidas
no CGIL, na Universidade de Guelph,
Canada.
Elas incluirão:
•
Ferramentas de aplicação básica
T C 2 C 1 A G 1 G 2 Conceitos:
Desequilíbrio de ligação (DL) entre um marcador e um gene
A G C 1 1 T C G 2 2 Crossover Alta recombinação Baixa recombinação Baixíssima recombinação
Fase de ligação (FL) entre um marcador e um gene A G C 1 1 T C G 2 2
1 e G estão em fase de acoplamento 1 e C estão em fase de repulsão
Se não há recombinação, as fases seriam as mesmas entre famílias
A C C 1 1 T G G 2 2 Família 1 Família 2
Fase de ligação entre um marcador e um gene A G C 1 1 T C G 2 2
Note que os genótipos são os mesmos nos dois casos:
- GC para o marcador - 12 para o gene A C C 1 1 T G G 2 2 Família 1 Família 2
Obs: Apenas o genótipo do marcador será conhecido através da genotipagem.
Evento Ano
• Sequência completa do genoma bovino 2004
• Painel de 10000 SNP 2006
- Pesquisa genômica básica; Primeiras predições genômicas 2006/07
• Painel de 50000 SNP 2007
- Primeiras avaliações genômicas oficiais (HO, JE) 2009
• Painel de 3000 SNP 2010
- Primeiras avaliações genômicas com genótipos imputados 2010
• Painel de 777k SNP e 6000 SNP 2011
• Primeiros sequenciamentos de ancestrais importantes 2010/11
• Imputação ao nível da sequência 2012
Padrão de DL no genoma- Exemplo no Holandês
(Bohanova et al. 2010. BMC Genomics, 11:421) Distância (Mb)
(Sargolzaei et al. 2008. JDS 91:2106-2117)
Frequência e média do r2 para distâncias pequenas entre
pares de SNPs sintênicas
0 0,2 0,4 0,6 0,8 1 1,2 Ayrshire-Holstein Ayrshire-Guernsey Holstein-Guernsey r= 0.93 - 0.96
Avaliação multi-raças ? (Larmer, S. 2012. MSc. Thesis) Distância (cM) Co rr ela çã o
Software para avaliação do DL
C++ para plataformas Windows ou Linux
Simulator genômico – Um exemplo
(Brito et al. 2011. BMC Genetics, 12:80) Número de animais no grupo de treinamento
Acu
rá
cia
Simulador Genômico
(Sargolzaei and Schenkel. 2009. Bioinformatics, 25: 680-681)
C++ para plataformas Windows ou Linux
Imputação de um painel de SNPs de baixa densidade para um painel de alta densidade
- Grande impacto no número de fêmeas genotipadas
- Grande impacto na quantidade de informação genômica disponível
Imputação
Imputação baseada na informação da família:
Touro - AD Vaca - AD
Progênie- BD
Imputação baseada na informação da população:
Método baseado janelas sobrepostas.
Atribuição da fase de ligação e imputação são feitos
simultaneamente.
Haplótipos longos são procurados e atribuídos
primeiro para capturar parentesco próximo e, então, haplótipos pequenos são procurados para capturar parentescos distantes.
Software para imputação genômica
(Sargolzaei et al. 2012. PAG Meeting)
C++ para plataformas Windows ou Linux
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
99,2
99,2
99,1
98,1
97,9
97,7
97,6
97,1
97,1
92,2
93,8
92,9
90,0
95,0
100,0
HO
JE
BS
50-50
50-3
50-U
U-U
Validação (animais jóvens): Genótipos 50k de animais nascidos>2009 para HO e JE e >2008 para PS foram reduzidos para 3k e 6k.
Referência (animais velhos): Animais com genótipos 50k mais velhos do que os animais de Validação.
PS
Validação Referência
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
99,2
99,2
99,1
98,1
97,9
97,7
97,6
97,1
97,1
92,2
93,8
92,9
90,0
95,0
100,0
HO
JE
BS
50-50
50-3
50-U
U-U
Imputação de 3k para 50k SNP Genótipo do Pai-Mãe Acurá cia PSFimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
Imputação de 6k para 50k SNP
Genótipo do Pai-Mãe
Acurá
cia
Fimpute – Um estudo de validação
(Sargolzaei et al. 2012. PAG Meeting)
Imputação no Pardo Suiço
Software
Imputação em gado de corte
Acurácia da imputação em Angus puros: 4732 ref. (497 AN), 100 imp.
Acurácia da imputação em cruzados: 4732 ref. , 146 imp.
Marcadores em EL Marcadores em DL Marcadores diretos Famílias Marcadores esparsos População Marcadores densos População Esparso/Denso
Mais fáceis usar
M M M
genéticos
Difíceis de usar Fáceis de usar Seleção genômica
Predição do potencial genético dos animais e parentes DEP genômica Seleção Modelo infinitesimal BLUP / Bayes Marcadores genéticos
Medidas nos animais
Produção Tipo Reprodução Auxiliares Pedigree 2 passos 1 passo
O que é?
O uso de
painéis densos de marcadores genéticos
distribuídos
em todo o genoma
para estimar valores
genéticos dos animais baseado no
disequilíbrio de
ligação
(
DL).
Pressuposição: Existem marcadores suficientes para capturar a maior parte da variação genética.
Limitação: Grande número de efeitos para estimar.
Densidade do painel vs. DL Métodos estatísticos
Software para predição de DEPs genômicas
(Sargolzaei et al. 2009. DCBGC Meeting, Oct. 7, 2009) C++ para plataformas Windows ou Linux Métodos: Gblup ou Regressão Cumeeira em 2 PassosFerramentas Descrição Uso adicional Reconstrução de haplótipos e imputação Imputação: • de genótipos perdidos • de 3k/6k para 50k/777k • de 50k para 777k
- Aumento da informação genômica - Redução do custo de genotipagem
- Ajuda no mapeamento fino de genes/QTL - Detecção de haplótipos deletérios
Relações genômicas
Construção da matriz de relacinamento genômico
- Endogamia genômica
- Verificação e descoberta de parentesco
De-regressão De-regressão das DEP, usando todo o pedigree
- Mapeamento fino de genes/QTL
Treinamento dos efeitos dos marcadores
Usando DEPs ou fenótipos
- Mapeamento fino de genes/QTL - Testes genéticos
Edição dos dados
• Conflitos pais-progênie • Conflitos de sexo e raça
- Verificação e descoberta de parentesco - Confirmação da raça
Validação
– Ganho em confiança da MPG
comparado com a MP em HO no Canadá
Treinamento
4121
~1100 domésticas524
Validação
MP
MPG
Aumento
Prod. (n=3)
0.39
0.64
0.25
Escore de CS
0.37
0.54
0.17
Tipo (n=5)
0.37
0.58
0.21
Accurácia Intervalo entre gerações i RT RG LT LG i x RT i x RG Pai de touros 2.06 0.99 0.75 6.5 1.75 2.04 1.54 Pai de vacas 1.40 0.75 0.75 6.0 1.75 1.05 1.05 Mãe de touros 2.42 0.60 0.75 5.0 2.0 1.45 1.82 Mãe de vacas 0.27 0.50 0.50 4.25 4.25 0.14 0.14 Total 21.75 9.75 4.68 4.55 Tradicional: 4.68/21.75 = 0.215 Genômico: 4.55/ 9.75 = 0.467 Ganho genético anual esperado:
O dobro com 8% do custo Simulação – Schaeffer (2006). J. Anim. Breed. Genet. 123: 218–223
Impacto da avaliação genômica
(Van Doormaal 2012. CDN article, July 2012)
Tendência genética- Tourinhos HO ofertados no Canada (índice GLPI)
Ganho: 445 pontos/ano Ganho: 210 pontos/ano Ganho: 109 pontos/ano Semestre G LPI m édio
Voltando ao mapeamento fino
163 vacas HO: 81 alta RIMA e 82 baixa RIMA
Genotipadas com Illumina Bovine SNP50 BeadChip
Exemplo: Resposta imune mediada por anti-corpos (RIMA)
Estudo de associação: Método Generalizado de Quase-Verossimilhança (Feng et al., 2011)
Voltando ao mapeamento fino
Diagrama de Manhattan para resposta imune mediada por anti-corpos em gado HO. Cromossomo
Caminho do processamento e apresentação antígena associada com RIMA. Em vermelho, os genes associados com RIMA.
Painéis de alta densidade x Avaliação multi-raças
Acurácia da predição genômica (r[DEPG,DF]) obtida com GBlup
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
Validação Referência Holandês Combinado Holandês Jersey Holandês Jersey Holandês Jersey Jersey Produção de leite
Modelos alternativos
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
Bayes R: Assume uma mistura de 4 distribuições normais que explicam 0%, 0.01%, 0.1% e 1% da variação.
Bayes M: Assume uma única distribuição normal, mas amostra a fase de ligação (sinal do efeito).
Modelo tradicional
Gblup: Assume uma única distribuição normal e uma única fase de ligação.
- Distribuição simétrica dos efeitos dos marcadores com uma variância comum
- Não modela a fase de ligação
Painel Validação Referência Holandês Combinado Holandês Jersey Holandês Jersey Holandês Jersey Jersey
Acurácia da predição genômica (r[DEPG,DF]) obtida com Bayes R *
* Media para produção de leite, gordura e proteína
(Erbe et al. 2012. J. Dairy Sci. 95 :4114–4129)
Modelos alternativos
Painel Método Gblup Criar e inverter G ASREML Bayes RO que teremos no futuro próximo
Sequenciamento completo: Projeto 1000 Touros (várias raças) – Dr. Ben Hayes (Austrália)
Populações referências para imputação de 50k e 777k para a sequência completa.
O que teremos no futuro próximo
Mais ênfase em fêmeas: Imputação para AD e
para a sequência completa. Projeto “genoma imputado de 10000 vacas”
- Australia - Canada
Possiibilidades:
- Aumentar acurácia das avaliações genômicas - Minimizar viés devido a tratamento preferencial
O que teremos no futuro próximo
Mais ênfase em filtragem/seleção de SNPs: Baseada em Estatística e Biologia
Métodos novos/aprimorados Possiibilidades:
- Aumentar acurácia das avaliações genômicas - Avaliações genômicas multi-raciais
O que teremos no futuro próximo
Testes genéticos:
Para características específicas, tais como resistência a doenças e reprodução.
Exemplo: Haplótipos influenciando fertilidade em gado leiteiro
Haplótipo HH1
A mutação causal foi encontrada
CGA -> Arginina
TGA -> Codon de terminação
Gene APAF1 é importante para o desenvolviemnto embrionário normal
O que teremos no futuro próximo
O que teremos no futuro próximo
Exemplo: Haplótipos influenciando fertilidade em gado leiteiro
Impacto
Freq TC TNR Primeiros ancestrais conhecidos Holstein
HH1 4.5% -3.1% -1.1% Pawnee Farm Arlinda Chief HH2 4.6% -3.0% -1.7% Willowholme Mark Anthony
HH3 4.7% -3.2% -3.1% Gray View Skyliner e Glendell A. Chief Jersey
JH1 23.4% -3.7% -3.7% Observer Chocolate Soldier Brown Swiss
BH1 14.0% -3.4% -2.5% West Lawn Stretch Improver
Não há magia em genômica.
Somente há valor se:
Desenvolvermos informações relevantes através de
ferramentas úteis e práticas.
Colaboração é fundamental para a implementação com sucesso das ferramentas genômicas
- População de referência/treinamento - Pesquisa e desenvolvimento
•
Parceiros da indústria: - L’Alliance Boviteq Inc - CDN/DairyGen- Associações de Raça
•
Agências de financiamento:- Ontario Centre for Agricultural Genomics - NSERC
- Genome Canada/Genome Alberta
•
Colaboradores internacionais: - AIPL-USDAMuito
Imputação baseada na informação da população:
Procura de haplótipos longos a curtos ~ De parentes próximos a distantes