• Nenhum resultado encontrado

A ANÁLISE ESTATÍSTICA NA GENÉTICA BÁSICA OU MENDELIANA

N/A
N/A
Protected

Academic year: 2021

Share "A ANÁLISE ESTATÍSTICA NA GENÉTICA BÁSICA OU MENDELIANA"

Copied!
21
0
0

Texto

(1)

A ANÁLISE ESTATÍSTICA NA GENÉTICA BÁSICA OU

MENDELIANA

Índice

1.0 – REVENDO ALGUMAS REGRAS DE PROBABILIDADE...1

2.0 – AS REGRAS DO PRODUTO E DA ADIÇÃO APLICADAS À GENÉTICA MENDELIANA...2

2.1 – ANALISANDO A REGRA DO PRODUTO...2

2.1.1 – A REGRA DO PRODUTO E A PRIMEIRA LEI DE MENDEL...3

2.1.2 – A REGRA DO PRODUTO E A SEGUNDA LEI DE MENDEL...4

2.2 – ANALISANDO A REGRA DA ADIÇÃO...5

2.2.1 – A REGRA DA ADIÇÃO E A PRIMEIRA LEI DE MENDEL...5

2.2.2 – A REGRA DA ADIÇÃO E A SEGUNDA LEI DE MENDEL...6

3.0 – A PROBABILIDADE CONDICIONAL...6

4.0 – O MODELO DE DISTRIBUIÇÃO BINOMIAL...8

5.0 – A ANÁLISE ESTATÍSTICA APLICADA À GENÉTICA MENDELIANA...12

5.1 – ALGUNS DADOS RELEVANTES SOBRE MODELOS PROBABILÍSTICOS...12

5.2 – TESTANDO UM MODELO DE HERANÇA MENDELIANA...14

5.3 – O TESTE DE QUI QUADRADO (X²)...17

5.4 – RELEMBRANDO O CONCEITO DE GRAU DE LIBERDADE E DE NÍVEL DE SIGNIFICÂNCIA ALFA...18

5.5 – ALGUMAS RESTRIÇÕES AO USO DO TESTE DE X²:...20

6.0 – BIBLIOGRAFIA BÁSICA...20

1.0 – REVENDO ALGUMAS REGRAS DE PROBABILIDADE

Em genética é comum fazermos o uso de previsões sobre a chance de nascimento de indivíduos portando características desejáveis ou indesejáveis, ou sobre a forma de herança de um caráter. Para tanto, nos utilizamos de noções básicas de probabilidade aprendidas comumente nas aulas de estatística, tais como as regras de multiplicação, de adição, ou mesmo de probabilidade condicional. Como, nesse caso, teremos dois tipos de resultados – os previstos pelo modelo que empregamos e o que obtemos ao cruzar os indivíduos – também precisamos lançar mão de análises estatísticas para podermos aumentar o grau de certeza em relação a interpretação que fazemos sobre a herança da característica analisada.

(2)

teoria probabilística que nos ajudam a definir como determinadas combinações de eventos terão a chance de acontecer, bem como alguns conceitos estatísticos fundamentais usados para interpretarmos o modelo de herança de um caráter.

2.0 – AS REGRAS DO PRODUTO E DA ADIÇÃO APLICADAS À GENÉTICA MENDELIANA

O touro Juvenal e a vaca Estrela, embora mochos, carregam, cada um, uma cópia do gene alelo que confere a presença de chifres. Isso significa que a presença dessa estrutura é recessiva em relação a sua ausência. Quer dizer, nessa raça, os animais só serão chifrudos se nascerem homozigotos (cc). Por sua vez, os mochos poderão ser homozigotos (CC) ou heterozigotos (Cc), que é justamente o genótipo de cada um desses progenitores.

Embora Juvenal e Estrela tenham em suas células somáticas uma cópia de cada um desses dois alelos, cada um de seus gametas carregará uma cópia ou do alelo C, ou do c, na frequência de 50% cada. Logo, se Juvenal e Estrela forem cruzados, eles poderão gerar os tipos de descendentes apresentados na figura ao lado. Como a união de gametas masculinos e femininos com diferentes alelos de um mesmo loco acontece de maneira independente, podemos calcular a probabilidade de surgimento de cada uma das combinações genotípicas possíveis usando as regras do produto e da adição.

2.1 – ANALISANDO A REGRA DO PRODUTO

Em probabilidade, a regra do produto se refere a chance de que dois eventos independentes (A e B) ocorram simultaneamente, sendo representada pela seguinte equação:

(3)

2.1.1 – A REGRA DO PRODUTO E A PRIMEIRA LEI DE MENDEL

Essa regra é bastante utilizada na primeira lei de Mendel, como, por exemplo, quando queremos calcular a chance de Juvenal e Estrela produzirem um bezerro chifrudo (cc). Neste caso, tal probabilidade depende do encontro casual de um espermatozoide e de um oócito, cada um deles carregando um alelo de efeito recessivo c. Como a frequência de gameta carregando esse alelo nos animais heterozigotos é de 50%, a chance de sortearmos um oócito ou um espermatozoide carregando o alelo c será:

P(gameta c) = 1/2 ou 50%

Então a probabilidade desse casal ter um filhote chifrudo será:

P(chifrudo ou cc) = P(alelo c de Juvenal) x P(alelo c de Estrela)P(chifrudo ou cc) = 0,5 x 0,5

P(chifrudo ou cc) = 0,25 ou 25%

Também podemos usar essa mesma regra para calcularmos a chance desse filhote ser mocho homozigoto (CC):

P(mocho homozigoto ou CC) = P(alelo C de Juvenal) x P(alelo C de Estrela)P(mocho homozigoto ou CC) = 0,5 x 0,5

P(mocho homozigoto ou CC) = 0,25 ou 25%

Na verdade, podemos considerar todas as possibilidades de encontros casuais desses gametas maternos e paternos:

(1/2 C : 1/2 c)(1/2 C : 1/2 c) (1/4 CC : 1/2 Cc : 1/4 cc) ou (1 CC :2 Cc : 1 cc) ou (25% CC : 50% Cc : 25% cc)

(4)

2.1.2 – A REGRA DO PRODUTO E A SEGUNDA LEI DE MENDEL

Além de serem heterozigotos para o loco que controla a presença e ausência de chifres, Juvenal e Estrela também são heterozigotos para o loco que controla a cor da pelagem, que pode ser preta (VV ou Vv) ou vermelha (vv).

Sendo assim, se os locos para os caracteres presença/ausência de chifres (C/c) e coloração da pelagem (V/v) segregarem independentemente. Isso significa que, se eles seguirem a segunda lei de Mendel, a chance de obtermos um descendente mocho e vermelho (ccvv) também será calculada a partir do produto das suas probabilidades individuais:

P(mocho e vermelho ou ccvv) = P(ser mocho ou cc) x P(ser vermelho ou vv)P(mocho e vermelho ou ccvv) = 0,25 x 0,25

P(mocho e vermelho ou ccvv) = 0,0625 ou 6,25%

Portanto, usando a regra do produto, é possível determinar a chance de surgimento de todos os arranjos genotípicos possíveis na prole desse casal a partir das probabilidades esperadas para cada caráter analisado:

(1/4 CC : 1/2 Cc : 1/4 cc)(1/4 VV : 1/2 Vv : 1/4 vv)

(1/16 CCVV : 2/16 CCVv : 1/16 CCvv : 2/16 CcVV : 4/16 CcVv : 2/16 Ccvv : 1/16

ccVV : 2/16 ccVv : 1/16 ccvv)

Assim, as frequências esperadas para cada uma das combinações genotípicas na geração F2 serão:

P(CCVV) = 1/16 ou 0,0625 ou 6,25%P(CCVv) = 2/16 ou 0,125 ou 12,5%P(CCvv) = 1/16 ou 0,0625 ou 6,25%P(CcVv) = 4/16 ou 0,25 ou 25,0%

(5)

P(Ccvv) = 2/16 ou 0,125 ou 12,5%P(CcVV) = 2/16 ou 0,125 ou 12,5%P(ccVV) = 1/16 ou 0,0625 ou 6,25%P(ccVv) = 2/16 ou 0,125 ou 12,5%P(ccvv) = 1/16 ou 0,0625 ou 6,25% Uma outra forma de representar

os resultados previstos para o cruzamento entre Estrela e Juvenal para esses dois caracteres simultaneamente é apresentada a seguir, algo que é conhecido como quadrado de Punnett:

2.2 – ANALISANDO A REGRA DA ADIÇÃO

Em probabilidade, se os eventos A e B são independentes e se estes não se superpõem no universo amostral, a chance que ao menos um dele aconteça é dado pela regra da adição:

P(A ou B) = P(A) + P(B)

2.2.1 – A REGRA DA ADIÇÃO E A PRIMEIRA LEI DE MENDEL

Por exemplo, voltando à primeira lei de Mendel, se quisermos saber a probabilidade de um descendente de Estrela e Juvenal ser heterozigoto, temos que considerar o fato de existirem 2 maneiras possíveis de isso acontecer:

(6)

P(heterozigoto ou cC) = P(alelo c de juvenal) x P(alelo C de Estrela)

Assim, a probabilidade do filhote de Juvenal e Estrela nascer heterozigoto será dado pela união das regras do produto e da soma:

P(filhote heterozigoto ou Cc) = P(Cc) + P(cC)

P(filhote heterozigoto ou Cc) = (0,5 x 0,5) + (0,5 x 0,5)P(filhote heterozigoto ou Cc) = 0,25 + 0,25

P(filhote heterozigoto ou Cc) = 0,5 ou 50%

2.2.2 – A REGRA DA ADIÇÃO E A SEGUNDA LEI DE MENDEL

Passando agora para a segunda lei de Mendel, poderíamos perguntar qual seria a chance de Estrela e Juvenal gerarem um filhote mocho e preto. Neste caso, temos que observar que vários genótipos diferentes produzirão esse fenótipo nos descendentes: • P(mocho e preto ou C_V_) = P(CCVV) + P(CCVv) + P(CcVV) + P(CcVv)P(mocho e preto ou C_V_) = (0,25 x 0,25) + (0,25 x 0,5) + (0,5 x 0,25) + (0,5 x 0,5) • P(mocho e preto ou C_V_) = 0,0625 + 0,125+ 0,125 + 0,25 • P(mocho e preto ou C_V_) = 0,5625 ou 56,25% 3.0 – A PROBABILIDADE CONDICIONAL

As regras do produto e da soma são a base para a compreensão da herança mendeliana. Porém, muitas vezes as nossas perguntas possuem alguns componentes restritivos que alteram de maneira significativa o nosso universo de possibilidades. Em outros casos, são tantos eventos a serem analisados que precisamos de alguns atalhos para não termos que somar ou multiplicar cada situação independentemente até chegarmos à probabilidade final. Então, vamos analisar o seguinte exemplo:

A vaca Deocrécia, que atualmente está prenhe, é mocha igual aos seus progenitores, Juvenal e Estrela. Sabendo disso, podemos nos perguntar:

(7)

Qual seria a chance dela também ser heterozigota como os seus progenitores?

Alguém prontamente poderia responder que essa chance seria de 50%. Porém, essa probabilidade seria incorreta!

Mas, o que teria de diferente nesta pergunta que nos levará a um outro resultado probabilístico?

De acordo com as informações contidas na própria pergunta, já sabemos que Deocrécia é mocha! Sendo assim, ela somente poderá ser homozigota dominante (CC) ou heterozigota (Cc). Portanto, não existe mais no nosso espaço amostral a possibilidade dela nascer chifruda (cc):

Logo, neste caso, temos que utilizar os princípios da probabilidade condicional. Nela, a possibilidade de um evento A acontecer, tendo em vista que um evento B já ocorreu, é dada da seguinte forma:

P(A∩B) = P(A/B)/P(B)

No nosso exemplo, P(B) é a probabilidade de Deocrécia ser mocha (3/4) e P(A/B) é a probabilidade dela, em sendo mocha, ser heterozigota (2/4). Equacionando essas informações:

• P(heterozigota/em sendo mocha) = (2/4)/(3/4)

(8)

Observe bem a diferença:

Se tivéssemos perguntado qual seria a probabilidade de um filhote de Estrela e Juvenal nascer mocho e heterozigoto (Cc), responderíamos 50%! Isso porque, neste caso, como ele ainda não nasceu, ou então, ainda não se tornou adulto, não podemos descartar a possibilidade dele se vir a ser chifrudo (cc). Mas Deocrécia já nasceu, é adulta e é mocha e está lá no pasto ruminando o seu capim!

4.0 – O MODELO DE DISTRIBUIÇÃO BINOMIAL

Podemos utilizar as regras de probabilidade para calcularmos a chance de vários filhotes de Juvenal e Estrela nascerem com uma determinada combinação de características.

Por exemplo, qual seria a probabilidade de Juvenal e Estrela produzirem 2 bezerros chifrudos?

Bem, sabemos que cada nascimento é um evento independente, ou seja, se a probabilidade do primeiro filhote nascer mocho (CC ou Cc) é de 75%, no próximo parto, a probabilidade do filhote ser mocho continuará sendo 75%. Então, como queremos saber a chance de Juvenal e Estrela terem dois filhotes mochos, usamos a regra do produto:

P(dois filhotes mochos ou C_) = P(1º filhote mocho) x P(2º filhote mocho)P(dois filhotes mochos ou C_) = 3/4 x 3/4 ou 0,75 x 0,75

P(dois filhotes mochos ou C_) = 9/16 ou 0,5625 ou 56,25%

A chance desses dois filhotes nascerem chifrudos também é calculada dessa mesma maneira:

P(dois filhotes chifrudos ou cc) = P(1º filhote chifrudo) x P(2º filhote

chifrudo)

P(dois filhotes chifrudos ou cc) = 0,25 x 0,25 = 0,0625 ou 6,25%

Por outro lado, para calcularmos a probabilidade deles virem a ter um filhote chifrudo e um mocho, temos que considerar as seguintes situações:

(9)

I – Se impusermos a ordem de nascimento:

Por exemplo, o primeiro filhote será chifrudo e o segundo será mocho, então teremos:

• P(primeiro filhote chifrudo e o segundo mocho) = P(chifrudo) x P(mocho) • P(primeiro filhote chifrudo e o segundo mocho) = 0,25 x 0,75 = 0,1875 ou

18,75%

II – Se não impusermos a ordem de nascimento:

Nesse caso, teremos que considerar as duas situações possíveis:

• P(primeiro filhote chifrudo e o segundo, mocho ou primeiro filhote mocho e o segundo chifrudo) = (0,25 x 0,75) + (0,75 x 0,25)

• P(primeiro filhote chifrudo e o segundo mocho ou primeiro filhote mocho e o segundo chifrudo) = 0,1875 + 0,1875 = 0,375 ou 37,50%

Até aqui está tranquilo, mas, e se aumentarmos o número de filhotes de Estrela e Juvenal?

Podemos recorrer ao binômio de Newton, onde as letras p e q representarão a probabilidade de dois eventos inter-relacionados acontecerem, como a chance de Juvenal e Estrela terem um filhote mocho ou chifrudo:

P(mocho) = p = 3/4P(chifrudo) = q = 1/4

Tendo isso em mãos, podemos prever os resultados esperados para vários descendentes:

(10)

Para determinarmos o padrão de distribuição esperado para n de descendentes, podemos usar o triângulo de Pascal:

Nesse caso, geraríamos as seguintes expansões binomiais: • n = 1 → (p + q)¹ = 1p¹q0 + 1p0q¹ = p + q

n = 2 →(p + q)² = 1p²q0 + 2p¹q¹ + 1p0q² = p² + 2pq + q²

n = 3 → (p + q)³ = 1p³q0 + 3p²q¹ + 3p¹q² + 1p0q³ = p³ + 3p²q + 3pq² + q³ • Etc…

Por exemplo, se esse casal tiver n = 2 descendentes, as possibilidades serão:

(p + q)² = p² + 2pq + q²

Onde:

p² = (3/4)² = 9/16 ou 0,5625 ou 56,25% → 2 mochos

2pq = 2 x 3/4 x 1/4 = 6/16 ou 0,375 37,5% → 1 mocho e 1 chifrudo1q² = (1/4)² = 1/16 ou 0,0625 ou 6,25% → dois chifrudos

Note que para dois ou três descendentes será fácil realizar esses os cálculos. Mas, se aumentamos o número de previsões, mesmo a expansão binomial se tornará um processo bem mais complicado. Sendo assim, também podemos utilizar a seguinte equação:

(11)

Onde:

• P = Probabilidade do evento de interesse ocorrer; • n = Número total de eventos pretendidos;

• s = Número de vezes esperada para o evento de interesse; • p = Probabilidade de ocorrência do evento de interesse;q = Probabilidade de ocorrência do evento alternativo.

Por exemplo, para calcularmos novamente a chance desse casal ter 2 descendentes, sendo um mocho e outro chifrudo, não importando a ordem de nascimento:

• P(1 mocho e 1 chifrudo) = {2!/[1!(2 – 1)!]}(3/4)¹(1/4)¹ • P(1 mocho e 1 chifrudo) = 2 x 3/4 x 1/4

• P(1 mocho e 1 chifrudo) = 6/16 ou 0,375 37,5%

Porém, usar essa equação para apenas dois descendentes é um desperdício. Então, vamos passar para a seguinte situação:

Se esse casal tiver 10 descendentes, qual será a chance de nascerem 7 mochos e 3 chifrudos, não importando a ordem de nascimento?

• P(7 mochos e 3 chifrudos) = {10!/[7!(10 – 7)!]}(3/4)7(1/4)³

• P(7 mochos e 3 chifrudos) = {3628800/(5040 x 6)} x 0,133483887 x 0,015625 • P(7 mochos e 3 chifrudos) = 120 x 0,133483887 x 0,015625

(12)

5.0 – A ANÁLISE ESTATÍSTICA APLICADA À GENÉTICA MENDELIANA

Mendel descobriu que do cruzamento entre linhagens puras de ervilhas de cores amarelas e verdes são esperados os seguintes resultados nas gerações F1 e F2:

Se nos atermos apenas à geração F2, serão esperadas duas classes fenotípicas de ervilhas – o que chamamos de segregação – nas seguintes frequências:

P(amarelas ou V_) = 3/4 ou 75%P(verde ou vv) = 1/4 ou 25%

Porém, do ponto de vista estatístico, tais proporções são esperadas em que condições específicas, mesmo?

5.1 – ALGUNS DADOS RELEVANTES SOBRE MODELOS PROBABILÍSTICOS

Quando lançamos uma moeda não viciada para o alto, sabemos que existe a possibilidade de 50% dela cair com a coroa voltada para cima. O mesmo é esperado para a outra face. Acontece que essa probabilidade de sorteio de 50% de cara e 50% de coroa é esperada quando fazemos sorteios infinitos. Por exemplo, se lançarmos uma moeda honesta 100 vezes, poderemos ter 48 caras e 52 coroas, ou 55 caras e 45

(13)

coroas, e assim por diante. Neste caso, a variação entre os valores probabilisticamente esperados e aqueles observados em nosso sorteio costumam ser devido a erros de amostragem aleatórios, algo esperado quando realizamos sorteios finitos. Inclusive, existe uma relação inversa entre a quantidade de sorteios e a proporção esperada de desvios ao acaso. Quer dizer, quanto mais sorteios ou amostragens, menores deverão ser os desvios em relação aos valores probabilísticos esperados e vice-versa.Para entendermos um pouco sobre isso, observe os seguintes resultados de um teste estatístico de qui quadrado (X²) para 4 sorteios independentes:

Experimento Nº de sorteios Caras Coroas Desvios

1 2 3 4 100 100 1.000 1.000 48 55 480 550 52 45 520 450 -2/+2 +5/-5 -20/+20 +50/-50 0,16n.s. 1,0n.s. 1,6n.s. 10*

N.S.: desvios estatisticamente não significativos ao nível α (alfa) de 5% e 1 Grau de Liberdade; *: desvios estatisticamente significativos ao nível α (alfa) de 5% e 1

Grau de Liberdade.

De acordo com os resultados dos testes estatísticos, para 3 dos 4 experimentos realizados, os desvios encontrados podem ser considerados como erros de amostragem triviais, algo que terá grande chance de acontecer novamente, caso realizemos novos sorteios finitos de iguais tamanhos. Contudo, embora os experimentos 2 e 4 tratem de desvios igualmente proporcionais (55% de caras e 45% de coroas), o último apresenta um resultado estatisticamente significativo. Isso quer dizer que, do ponto de vista estatístico, podemos afirmar que, com o limite alfa testado (5%), somente 5 em cada 100 sorteios realizados com esse tamanho amostral deverá produzir, por puro acaso, um desvio semelhante a esse.

Como a chance disso acontecer por puro acaso é muito baixa (5%), devemos procurar uma outra explicação plausível para tal resultado. Uma possibilidade é que a moeda 4 não seja honesta, ou então, pode ser que o sorteador tenha se utilizado de algum truque para aumentar a chance dela cair com a cara voltada para cima. Quer dizer: é estatisticamente mais seguro aceitar que os desvios encontrados nos experimentos 1 a 3 sejam por conta do acaso. Assim como é estatisticamente mais seguro rejeitar o acaso como o responsável pelos desvios encontrados no experimento 4!

(14)

Isso também é válido na genética mendeliana:

Ao realizarmos cruzamentos infinitos entre heterozigotos, como, por exemplo, entre ervilhas F1 amarelas (Vv x Vv), esperamos obter um número infinito de descendentes que deverão se enquadrar no modelo probabilístico de 3/4 de descendentes produtores de sementes amarelas (V_) e 1/4 de sementes verdes (vv). Contudo, quando obtermos um número finito de descendentes, poderemos encontrar desvios para mais ou menos ervilhas amarelas (V_) e verdes (vv), por fatores meramente casuais, os quais chamamos de erros amostrais. Assim, oscilações aleatórias nos números esperados de descendentes, em relação à média estatística, são comumente encontrados quando estudamos o mundo real e, por conseguinte, um número finito de amostras.

Acontece que, ao tentarmos desvendar o mecanismo de herança de uma nova característica em uma população ou espécie, precisamos escolher o melhor modelo que o explique. E, como veremos ao longo dessa disciplina, o controle genético baseado em apenas um gene de efeito maior e com dois alelos, um de efeito dominante e o outro recessivo é apenas uma de várias possibilidades de controle hereditário nas espécies.

Dessa forma, como nunca trabalhamos com cruzamentos e proles infinitas, precisamos ter certeza que os desvios que comumente encontramos depois de ajustarmos o nosso modelo aos resultados observados, sejam devidos a erros de amostragens aleatórios e não ao fato de termos testado um modelo impróprio de herança.

5.2 – TESTANDO UM MODELO DE HERANÇA MENDELIANA

A metáfora da moeda honesta permite que compreendamos a relação entre valores probabilísticos esperados, observados e os desvios casuais mais e menos prováveis que deverão ser encontrados entre ambos. Entretanto, é na ciência que essa lógica se mostra fundamental para a interpretação de resultados experimentais de uma maneira que seja o mais imparcial possível.

Para uma melhor compreensão disso, vamos imaginar que você amostrou uma população de uma nova espécie vegetal e encontrou variação para a cor das flores, que podem ser púrpura, lilás e rosa. Você trouxe sementes dessas plantas para o seu laboratório e, depois de algumas gerações de endocruzamento, você conseguiu obter linhagens puras apenas para plantas de flores púrpuras e rosas. Em um experimento, ao cruzar uma linhagem pura de flores púrpura com outra de flores rosa, você obteve

(15)

uma geração F1 com 100% de flores lilás. E, ao cruzar as plantas F1 entre si, foram encontrados os seguintes resultados na geração F2:

Para podermos interpretar os resultados obtidos, em primeiro lugar precisamos sugerir um modelo de herança que explique a forma de transmissão desse caráter. Neste caso, pelos resultados desse cruzamento, o mais provável é que a cor dessa hortaliça seja governado por um loco com dois alelos que exibem dominância incompleta:

Como, na geração F2 obtivemos 957 indivíduos, as proporções esperadas ajustadas para esse tamanho amostral, em cada uma dessas três classes seriam:

P(púrpura ou RR) = 1/4 x 967 = 241,75P(lilás ou Rr) = 2/4 x 967 = 483,5P(rosa ou rr) = 1/4 x 967 = 241,75

(16)

Resumindo as frequências esperadas e observadas na geração F2:

Note que, entre os valores esperados e observados existem pequenos desvios:

Por exemplo para as flores púrpura, obtivemos 227 – 241,75 = -14,75 plantas esperadas nesta classe genotípica. Desvios também foram encontrados para as flores lilás (-1,5) e rosa (16,25). Logo, precisamos nos certificar se tais oscilações podem ser consideradas casuais ou se elas ocorrem pelo fato do modelo de herança escolhido não explicar corretamente a transmissão desse caráter. Por esse motivo é que precisamos aplicar um teste estatístico, que nos auxiliará na escolha da hipótese mais provável. Neste caso, testaremos duas hipóteses possíveis:

Hipótese nula (H0): não há associação entre os grupos – a diferença observada entre a estatística amostral (estimador) e o parâmetro populacional é devido tão somente ao acaso, ou seja, esta não é significativa (do ponto de vista estatístico, as frequências observadas = frequências esperadas);

Hipótese alternativa (H1): os grupos estão associados – a diferença observada entre a estatística amostral (estimador) e o parâmetro populacional é significativa, ou seja, esta não pode ser atribuída ao acaso (do ponto de vista estatístico, as frequências observadas ≠ frequências esperadas).

Portanto:

Se o X² calculado ≥ que o X² tabelado → Rejeita-se H0 • Se o X² calculado < que o X² tabelado → Aceita-se H0

Logo, se aceitamos a hipótese nula, podemos considerar que os desvios encontrados entre os valores observados e esperados serão devidos ao acaso. Portanto, o modelo que utilizamos para explicar a herança desse caráter poderá ser aceito!

(17)

5.3 – O TESTE DE QUI QUADRADO (X²)

O qui quadrado ou chi quadrado (Χ²) de Pearson é um teste estatístico aplicado a dados categóricos para avaliar quão provável qualquer diferença observada aconteça por fatores meramente casuais. Este é um teste não paramétrico – o que significa que ele não depende de parâmetros populacionais como média e variância – e o seu princípio básico é comparar proporções, quer dizer, possíveis divergências entre as frequências observadas e esperadas para um certo evento.

Assim, ele pode ser utilizado para:

• Verificar se a frequência com que um determinado acontecimento observado em uma amostra se desvia significativamente ou não da frequência com que ele é esperado;

• Comparar a distribuição de diversos acontecimentos em diferentes amostras, a fim de avaliar se as proporções observadas destes eventos mostram ou não diferenças significativas, ou se as amostras diferem significativamente quanto às proporções desses acontecimentos.

Em genética mendeliana este teste permite comparar as frequências obtidas em um determinado experimento com as frequências teóricas, calculadas matematicamente para o mesmo número de dados da amostra, conforme o modelo de herança que propormos para explicar os valores encontrados em cada classe. O teste de X² é resumido na seguinte equação:

ou X² = Σ [(o – e)²/e]

Onde, d representa os desvios entre os valores observados (o) e os esperados (e):

d = o – e

Então, voltando às nossas plantas, calculamos os desvios de X² para cada classe fenotípica da geração F2:

Flores púrpura (RR) = (o – e)²/e → (227 – 241,75)²/241,75 = 0,89995Flores lilás (Rr) = (o – e)²/e → (482 – 483,5)²/483,5 = 0,00465

(18)

Somando os 3 desvios de X²:

A significância ou não do X² obtido pode ser verificada em uma tabela de contingência contendo os desvios de X² críticos (representado por x²c) unilaterais. Comumente utilizamos o nível de

significância (alfa) de 0,05 (ou 5%). Além do alfa, também devemos determinar o número correto de graus de liberdade (G.L.) que utilizaremos nesta comparação de X².

Então, procurando na tabela o valor de X², com alfa de 5% e 3 – 1 = 2 graus de liberdade:

• X² crítico tabelado (X²c) = 5,99 • X² experimento = 1,997

Como o X² obtido é menor que o X² crítico tabelado, podemos aceitar H0. Ou seja, o nosso modelo de herança mendeliana simples do tipo dominância incompleta explicaria a forma de transmissão hereditária da coloração das flores nessa hortaliça.

5.4 – RELEMBRANDO O CONCEITO DE GRAU DE LIBERDADE E DE NÍVEL DE SIGNIFICÂNCIA ALFA

Graus de liberdade: quantidade de dados que dispomos para fazermos inferências ou afirmações sobre um conjunto de dados. Este é obtido a partir do número de determinações independentes (dimensão da amostra) menos o número de parâmetros estatísticos a serem avaliados na população;

(19)

Nível de significância alfa: probabilidade de rejeitarmos H0 quando esta é verdadeira – lembre-se que o alfa deve ser sempre estabelecido antes que se realize a análise estatística dos dados.

O total de G.L. disponível para o ajuste do modelo aplicado numa análise estatística de X², será:

G.L. = classes observadas Número total de Número de informações necessáriaspara se estimar cada classe

Lembrando que, quando trabalhamos com genética mendeliana e queremos testar os ajustes dos modelos de primeira ou de segunda leis de Mendel, as estimativas (E) para as frequências esperadas dentro de cada classe serão sempre fixas:

Nº de classes F2 para a 1ª lei (Dominante/recessivo) F2 para a 1ª lei (Codominante) F2 para a 2ª lei (Dominante/recessivo) 1 2 3 4 E1 = 3/4 x N E2 = 1/4 x N -E1 = 1/4 x N E2 = 2/4 x N E3 = 1/4 x N -E1 = 9/16 x N E2 = 3/16 x N E3 = 3/16 x N E4 = 1/16 x N Total N N N

E = Proporção esperada para cada classe de acordo com o modelo utilizado.

Então, a única informação que precisamos ter em mãos é o total (N) de indivíduos F2 amostrados (aqueles obtidos em nosso experimento) para chegarmos às

estimativas (E) esperadas em cada classe!

Por exemplo, no caso do mecanismo de herança das nossas hortaliças, temos 3 classes fenotípicas na geração F2 com proporções fixas em (1/4 : 2/4 : 1/4). Assim, a única informação que necessitamos para obtermos os valores esperados para cada uma delas é o total de descendentes (N = 967):

P(púrpura ou RR) = 1/4 x N → 1/4 x 967 = 241,75P(lilás ou Rr) = 2/4 x N → 2/4 x 967 = 483,5

(20)

P(rosa ou rr) = 1/4 x N → 1/4 x 967 = 241,75

Porém, veremos que em genética de populações, o número de graus de liberdade disponível para o teste estatístico do ajuste do modelo deverá levar em consideração outras estimativas, como os cálculos das frequências dos alelos na

população amostrada (exemplo: p e q), a estimativa do coeficiente de endocruzamento (F), etc…

5.5 – ALGUMAS RESTRIÇÕES AO USO DO TESTE DE X²2:

• Quando tivermos apenas um grau de liberdade disponível para se verificar a significância do ajuste do modelo, ele não deverá ser aplicado para experimentos com um tamanho amostral inferior a 40;

• Quando tivermos mais de 1 grau de liberdade disponível, nenhuma das classes testadas poderá ter valor menor que 1 e, o número de classes com valores esperados menores que 5 não poderá ultrapassar 20% do número total de classes. Se isso acontecer, é preferível reformular a tabela, somando por exemplo, as classes vizinhas;

• Se o tamanho amostral se situar entre 20 e 40, o teste só poderá ser utilizado caso as frequências esperadas em todas as classes contrastadas sejam maiores ou iguais a 5;

• Por fim, se uma ou mais classes apresentar uma frequência esperada menor que 5, ou se o tamanho amostral for menor que 20, sugere-se o uso do teste exato de Fisher.

6.0 – BIBLIOGRAFIA BÁSICA

• GRIFFITHS, AJF; WESSLER, SR; LEWONTIN, RC & CARROLL, SB (2008). Introdução à Genética. Guanabara Koogan SA, 9ª ed, 711p.

• PIERCE, BA (2016). Genética – Um enfoque conceitual. Guanabara Koogan SA, 5ª ed, 759p.

• RAMALHO, M; SANTOS, JB & PINTO, CB (2008). Genética na

(21)

agropecuária. UFLA, 4ª ed, 464p.

• SNUSTAD, DP & SIMMONS, MJ (2013). Fundamentos de Genética. Guanabara Koogan SA, 6ª ed, 739p.

Referências

Documentos relacionados

A utilização de um site como ferramenta no ensino de aprendizagem pode levar à introdução de um novo conceito, o e-portefólio, servindo este espaço de repositório de trabalhos

Entre as atividades, parte dos alunos é também conduzida a concertos entoados pela Orquestra Sinfônica de Santo André e OSESP (Orquestra Sinfônica do Estado de São

Os resultados deste estudo mostram que entre os grupos pesquisados de diferentes faixas etárias não há diferenças nos envoltórios lineares normalizados das três porções do

É perceptível, desta forma, o constante aumento do aprofundamento dos personagens: os “príncipes” têm agora não só nome e falas, mas personalidades bem desenvolvidas,

Ao rever todas as análises e discussões que realizamos neste trabalho, embasadas nos preceitos funcionalistas aplicados à tradução e nos paradigmas bakhtinianos,

É nesse cenário que o direito do trabalho vem a suportar maior prejuízo, ao passo que nenhum outro ramo do direito vive tão próximo das manifestações econômicas como o

Como já foi dito neste trabalho, a Lei de Improbidade Administrativa passa por uma releitura doutrinária e jurisprudencial, visando delimitar de forma precisa os tipos ímprobos,

Discussion The present results show that, like other conditions that change brain excitability, early environmental heat exposure also enhanced CSD propagation in adult rats.. The