Inicialmente, uma discussão será feita sobre o fenótipo usado nesse estudo de associação. Em seguida, todas as características do genótipo serão descritas, além do controle de qualidade que foi realizado no mesmo.
7.3.1 A PTA do leite
A avaliação genética é um processo pelo qual faz-se a previsão do valor genético 2 dos
animais com base em uma ou mais características (VALENTE et al., 2001). O principal objetivo desse procedimento é ordenar os indivíduos em uma amostra ou população a m de selecionar os melhores indivíduos e descartar os piores. Diversas metodologias podem ser usadas, desde o mais simples e menos preciso, baseando-se somente em dados de produção do animal, até procedimentos mais sosticados, em que informações genômicas e de parentesco são agregadas. Os métodos mais sosticados baseiam-se em modelos estatísticos, requisitando processos computacionais demorados e complexos (VALENTE et al., 2001).
A eciência de um programa de seleção para produção de leite é mais dependente da seleção de touros do que de vacas, pois os touros produzem mais descendentes do que as vacas, principalmente se a inseminação articial for também usada (VALENTE et al., 2001). Consequentemente, pode-se praticar maior intensidade de seleção de machos do que de fêmeas (VALENTE et al., 2001). Outro ponto importante a considerar é que a produção de leite não pode ser medida diretamente nos touros, logo, tal característica deve ser medida em parentes próximos do sexo feminino, sendo denominada de pseudo- fenótipo.
O trabalho de Silva et al. (2014) explica detalhadamente esse tipo de característica. A capacidade prevista ou predita de transmissão (do inglês, Predicted Transmitting Ability- PTA) de um touro é computado a partir da produção de leite de sua prole feminina com base na metodologia desenvolvida em Verneque et al. (2012). A PTA é uma medida do desempenho esperado das lhas do touro em relação à média genética dos rebanhos (VERNEQUE et al., 2012). Assim, por exemplo, uma PTA de 500 kg para produção de
2Representa o que o animal transmite à progênie. Signica o quanto da diferença em produção em
relação à média da população ou em relação às companheiras de rebanho que o animal transmite para os descendentes (VALENTE et al., 2001).
leite signica que, se o touro for usado numa população com nível genético igual ao usado para avaliá-lo, cada lha produzirá em média 500 kg por lactação a mais do que a média do rebanho (VERNEQUE et al., 2012). A PTA é a metade do valor genético e é o termo usado quando a avaliação genética é executada usando-se o modelo animal (VERNEQUE et al., 2012). A metodologia aplicada para a medição da PTA e os resultados obtidos estão descritos detalhadamente em Verneque et al. (2012).
Segundo (VALENTE et al., 2001), o modelo animal tornou-se a base para a avaliação genética de vacas e touros nos Estados Unidos em 1989. O uso desse método tem- se tornado frequente. Nesse modelo, a PTA do leite é obtida com base na avaliação simultaneamente de vacas e touros, baseando-se no histórico de produção das vacas, diferentemente dos modelos que avaliam separadamente machos e fêmeas. Assim, o modelo animal objetiva produzir preditores para o valor genético do animal. VanRaden e Wiggans (1991) demonstram os cálculos da PTA do leite de forma detalhada.
Para o cálculo da PTA do leite, somente o efeito genético do animal é considerado, reduzindo-se a maioria de fatores não-genéticos que inuenciam na produção de leite das vacas tais como os efeitos externos (ambientais) e/ou internos (siológicos). Alguns efeitos externos são devido a região, o rebanho, as diferenças sazonais de ano para ano, etc (VALENTE et al., 2001). Como fatores internos ou de natureza siológica pode-se citar: idade, gestação, lactação, efeitos maternos entre outros (VALENTE et al., 2001). A maioria desses fatores podem ser medidos e os seus efeitos sobre a produção conhecidos, possibilitando o estabelecimento de padrões de variação (VALENTE et al., 2001). Dentre os mais importantes: duração da lactação, número de ordenhas, idade da vaca, época de parição, período de serviço e período seco (VALENTE et al., 2001). Assim, é coerente relacionar a PTA do leite de um touro, que contempla praticamente só informação genética relativa à produção de leite de sua progênie feminina, com informações genômicas de marcadores moleculares, com a nalidade de selecionar os SNPs informativos para esse fenótipo. Por conseguinte, busca-se a explicação do valor genético por meio de informação genômica dada pela variação alélica dos marcadores tipo SNP mais relevantes.
7.3.2 Descrição dos Dados
Para demonstrar a metodologia proposta, foi usada uma amostra de 343 touros genotipados da raça Gir (raça Bos indicus brasileira) fornecida pela Empresa Brasileira
de Pesquisa Agropecuária Gado de Leite (Embrapa Gado de Leite). Dos 343 animais, somente 240 possuem prole feminina, permitindo a mensuração da PTA do leite, que neste caso é o fenótipo considerado. A PTA do leite é uma característica que possui herdabilidade igual a 0,28 (h2
= 0, 28) para essa população de touros Gir (VERNEQUE et al., 2012). Os valores da PTA não foram derregredidos, pois as acurárias das PTAs dos touros foram todas superiores a 0,70. Esse conjunto de dados é parte do projeto de pesquisa descrito em Arbex et al. (2010) e no Apêndice A.1, que descreve sobre os termos de uso do conjunto de dados reais.
O genoma do bovino tem aproximadamente 3 bilhões de pares de bases e possui 30 pares de cromossomos, sendo 29 pares autossômicos e um par sexual. O genótipo dos touros foi gerado a partir do Illumina BovineSNP50kv2 BeadChip contendo um total de 56.947 marcadores.
As variáveis explicativas, descritas pela frequência de ocorrência do alelo B no locus, foram codicadas da seguinte maneira: AA = 0 (ausência do alelo a), Aa = 1 (presença de uma cópia do alelo a) e aa = 2 (presença de duas cópias do alelo a). Os valores faltantes, devido a erros de leitura, foram considerados como heterozigoto Aa = 1. Essa codicação é descrita detalhadamente em Illumina (2014).
7.3.3 Pré-processamento
Para o controle de qualidade (CQ) da base de dados real foram aplicados os ltros call-rate ≥ 0, 95, MAF ≥ 0, 05 e HW E ≥ 0, 05/56.947, sendo 0.05 a signicância do HWE, 56.947 a quantidade de SNPs na base original e 0,05/56.947 o limite de corte do HWE com correção de Bonferroni. Após a aplicação dos ltros descritos acima, restaram 22.845 marcadores para a aplicação do método de seleção SMS, por conseguinte, a redução total promovida pelo controle de qualidade foi de 34.102 SNPs.
A Figura 7.7 demonstra o número de marcadores por cromossomo antes e após o controle de qualidade, sendo o cromossomo 99 um artifício para designar SNPs que estão presentes no chip de genotipagem, mas que não foram mapeados para nenhum dos 30 cromossomos. Note que os cromossomos 6 e X tiveram respectivamente, a menor e a maior redução na quantidade de SNPs após o controle de qualidade.
Figura 7.7 Número de marcadores SNPs antes e após o controle de qualidade (CQ).