Aplicações da álgebra linear na genética

(1)

Rev. Bras. de Iniciação Científica (RBIC), Itapetininga, v. 5, n.6, p. 15-29, 2018. Edição Especial UFSM

15 APLICAÇÕES DA ÁLGEBRA LINEAR NA GENÉTICA

APPLICATIONS OF LINEAR ALGEBRA IN GENETICS

APLICACIONES DEL ÁLGEBRA LINEAL EN LA GENÉTICA

Ravine Taís Wenningkamp1

Taísa Junges Miotto2

Resumo: O presente trabalho tem como objetivo utilizar-se de ferramentas estudadas em Álgebra Linear para estudar a propagação de uma característica herdada em sucessivas gerações através da modelagem matemática de um problema de hereditariedade apropriado e, a partir deste, do cálculo de potência de matrizes.

Palavras-chave: Matrizes. Autovalores. Hereditariedade autossômica.

Abstract: The present work aims to use tools studied in Linear Algebra to study the propagation of a characteristic inherited in successive generations through the mathematical modeling of a problem of appropriate heredity and, from this, the calculation of matrices power.

Keywords: Matrices. Eigenvalues. Autosomal inheritance.

Resumen: El presente trabajo tiene como objetivo utilizar herramientas estudiadas en Álgebra Lineal para estudiar la propagación de una característica heredada en sucesivas generaciones através de la modelación matemática de un problema de hereditariedad apropiadas y, a partir de este modelo, el cálculo de poténcia de matrizes.

Palabras-clave: Matrizes. Valores Propios. Hereditariedad autosómica.

Envio 28/08/2018 Revisão 30/08/2018 Aceite 15/10/2018

1_{Acadêmica de Matemática Bacharelado. Universidade Federal de Santa Maria. E-mail: ravinetaissw@gmail.com} 2_{Doutora em Matemática. Professora adjunta da Universidade Federal de Santa Maria. E-mail:}

(2)

16

Introdução

Denota-se hereditariedade autossômica o modo pelo qual os genes dos pais são passados para seus descendentes. Considerando que cada indivíduo possui um par de genes, denotados por A e a, e que estes vão determinar as características exteriores de cada indivíduo, são estudados os prováveis genótipos dos descendentes, a partir do genótipo dos pais, fazendo uso de modelos matriciais, e por meio desses modelos acompanha-se a distribuição genotípica de uma população através de sucessivas gerações.

Sabendo que A e a são os genes que governam as características de um indivíduo, os possíveis pares a serem formados são AA, Aa e aa. Desse modo, se um dos pais possui o genótipo aa, a única possibilidade para o descendente é que ele herde o gene a desse genitor. Agora, se um dos pais tiver o genótipo Aa o descendente terá a mesma probabilidade de herdar tanto o gene A quanto o gene a desse genitor. Assim, um indivíduo, cujos genitores têm genótipo aa e Aa, poderá ser tanto do genótipo Aa quanto do genótipo aa, com igual probabilidade. No quadro 1 estão listadas todas as possibilidades de combinações entre o genótipo dos pais, bem como as probabilidades dos genótipos dos descendentes.

Quadro 1 - Probabilidades dos possíveis genótipos dos descendentes para todas as combinações de genótipo dos pais.

Genótipos dos Descendentes

Genótipos dos Pais

AA - AA AA - Aa AA - aa Aa - Aa Aa - aa aa - aa

AA 1 1/2 0 1/4 0 0

Aa 0 1/2 1 1/2 1/2 0

(3)

17

Metodologia

Este trabalho teve início a partir de um projeto de pesquisa que teve como base os estudos na área da álgebra linear. Foram realizados encontros semanais nos quais eram feitos seminários relacionados ao estudo aprofundado dos conteúdos desse ramo da matemática.

Depois de abordados os vários conceitos de álgebra linear, estes foram utilizados na aplicação de um problema de hereditariedade, resultando no presente trabalho.

E, a parte da aplicação na área de genética teve como base para estudo uma aplicação do livro "Álgebra linear com aplicações" dos autores Howard Anton e Chris Rorres.

Resultados e discussão

Considerando uma plantação de bocas de leão com todos os três possíveis genótipos, AA (produz flores vermelhas), Aa (produz flores roxas) e aa (produz flores brancas) queremos analisar como será a distribuição dos três genótipos depois de n gerações considerando vários casos.

No primeiro caso vamos supor que cada planta da população é sempre fertilizada por uma planta do genótipo AA.

Para n = 0, 1, 2, ..., tem-se que:

an = fração de plantas do genótipo AA na n-ésima geração;

bn = fração de plantas do genótipo Aa na n-ésima geração;

cn = fração de plantas do genótipo aa na n-ésima geração.

Denota-se por a0, b0 e c0 a distribuição inicial dos genótipos. Ainda, para n = 0, 1, 2, ...,

temos que:

an + bn +cn = 1.

Analisando o quadro 1, é possível expressar através de equações a distribuição de genótipos em cada geração a partir da distribuição na geração precedente:

an = an-1 + 1/2 bn-1

bn = cn-1 + 1/2 bn-1

cn = 0.

De acordo com a primeira equação, compreende-se que todos os descendentes de uma planta cujo genótipo é AA também serão do genótipo AA e metade dos descendentes de uma

(4)

18

planta cujo genótipo é Aa serão do genótipo AA. A segunda equação garante que todos os descendentes de uma planta cujo genótipo é aa serão do genótipo Aa e metade dos descendentes de uma planta cujo genótipo é Aa serão do genótipo Aa. Já a terceira equação afirma que não há descendentes do genótipo aa de uma planta cujo genótipo é aa.

As equações acima podem ser escritas em notação matricial como: x(n)_{= Mx}(n-1) _{, para n = 1,2,... (1)} Onde: x(n)₌ _{, x}(n-1) ₌ _{e M =} 1 1/2 0 0 1/2 1 0 0 0 .

Tem-se que M é a matriz cujos coeficientes representam as três primeiras colunas do quadro 1.

É possível transformar a equação (1), de forma recursiva, de modo a obter a seguinte expressão:

x(n)_{= Mx}(n-1) _{= M}2_x(n-2)_{= M}3_x(n-3) _{=... = M}n_x(0)_,

tal que x(0)_{é a distribuição inicial dos genótipos.}

Agora, pode-se encontrar uma expressão explícita para M(n)_{, usando x}(n)_{= M}n_x(0)_{. Para}

encontrar tal expressão explícitaé preciso diagonalizar a matriz M, ou seja, procurar uma matriz diagonal D e uma matriz invertível P tais que:

M = P.D.P-1_.

Então tem-se que:

M(n) _{= P.D}n_.P-1_, onde Dn= 0 0 λ 0 0 .

Primeiramente, é preciso encontrar os autovalores e os autovetores da matriz M, da seguinte forma: (M λ. ).v = 0. Logo: 1 1/2 0 0 1/2 1 0 0 0 λ 1 0 0 0 1 0 0 0 1 . = 0

(5)

19

1 λ 1/2 0 0 1/2 λ 1 0 0 0 λ . = 0

Assim, o det (M . ).v = 0, isto é:

det 1 λ 1/2 0 0 1/2 λ 1 0 0 0 λ =0. (1 λ).( 1/2 λ).( 0 λ) = 0 3 _(3/2). 2 _{+ (1/2). = 0.}

As raízes do polinômio característico são os autovalores da matriz M: λ1 =1 λ2 = 1/2 λ3 = 0

A substituição de cada λ na equação ( λ. ).v = 0 nos permite determinar os autovetores associados. Sendo v = , tem-se que:

1 λ 1/2 0 0 1/2 λ 1 0 0 λ . = 0 Para λ1 = 1: 1 1 1/2 0 0 1/2 1 1 0 0 1 . = 0 0 1/2 0 0 1/2 1 0 0 1 . = 0 0. + 1/2. + 0. = 0 0. 1/2. + 1. = 0 0. + 0. 1. = 0

Resolvendo esse sistema, obtém-se:

(6)

20

Então, os autovetores associados ao autovalor λ1 = 1 são os vetores da forma (x,0,0), ou

seja, x.(1,0,0). Portanto, v1 = 1 0 0 . Para λ2 = 1/2: 1 1/2 1/2 0 0 1/2 1/2 1 0 0 1/2 . = 0 1/2 1/2 0 0 0 1 0 0 1/2 . = 0 1/2. + 1/2. + 0. = 0 0. + 0. + 1. = 0 0. + 0. 1/2. = 0 Resolvendo esse sistema, obtém-se:

y = -x z = 0

Então, os autovetores associados ao autovalor λ2 = 1/2 são os vetores da forma (x, -x,0),

ou seja, x.(1,-1,0). Portanto, v2 = 1 1 0 . Para λ3= 0: 1 0 1/2 0 0 1/2 0 1 0 0 0 . = 0 1 1/2 0 0 1/2 1 0 0 0 . = 0 1. + 1/2. + 0. = 0 0. + 1/2. + 1. = 0 0. + 0. + 0. = 0

(7)

21

y = -2x z = x

Então, os autovetores associados ao autovalor λ3 = 0 são os vetores da forma (x, -2x, x),

ou seja, x.(1,-2,1). Portanto, v3 =

1 2 1

.

Dessa forma, pode-se expressar a matriz diagonal D da seguinte maneira:

D = λ 0 0 0 λ 0 0 0 λ = 1 0 0 0 1/2 0 0 0 0 .

A matriz P é composta pelos autovetores nas colunas, enquanto que P-1_{é a matriz inversa}

de P, sendo que nesse caso ambas coincidem. Segue a matriz P:

P =

1 1 1

0 1 2

0 0 1

= P-1_.

Determinadas as matrizes P, P-1_{e D, segue que:}

x(n)_{= PD}n_P-1_x(0)₌ 1 1 1 0 1 2 0 0 1 . (1) 0 0 0 (1/2) 0 0 0 (0) . 1 1 1 0 1 2 0 0 1 . x(n) ₌ ₌ 1 1 (1/2) 1 (1/2) 0 (1/2) (1/2) 0 0 0 . = + + (1/2) (1/2) (1/2) + (1/2) 0

(8)

22

Como a0 + b0 + c0 = 1, tem-se:

an = 1 – (1/2)n b0 - (1/2)n-1c0

bn = (1/2)n b0 + (1/2)n-1c0

cn = 0.

Assim, estas são as fórmulas explícitas para a fração dos três genótipos na n-ésima geração de plantas.

Dessa forma, como (1/2)n_{e (1/2)}n-1 _{tendem a zero quando n tende ao infinito, segue que:}

an →1

bn →0

cn =0.

Isso mostra que no limite todas as plantas da população serão do genótipo AA, ou seja, a plantação será composta apenas por bocas de leão vermelhas.

Para o segundo caso vamos supor que cada planta é sempre fertilizada por uma planta do mesmo genótipo, ao invés de ser fertilizada por uma planta com genótipo AA. Novamente pretende-se descobrir como será a distribuição dos três genótipos na população depois de um número qualquer de gerações.

Para n = 0, 1, 2, ..., tem-se que:

an = fração de plantas do genótipo AA na n-ésima geração;

bn = fração de plantas do genótipo Aa na n-ésima geração;

cn = fração de plantas do genótipo aa na n-ésima geração.

Agora, são analisadas a primeira, a quarta e a sexta colunas do quadro 1. Dessa forma, obtemos as equações abaixo referentes a distribuição de genótipos em cada geração em função da distribuição na geração precedente:

an = an-1 + 1/4 bn-1

bn = 1/2 bn-1

cn = 1/4 bn-1 + cn-1.

Analogamente à aplicação anterior, é possível escrever as expressões acima em notação matricial: x(n)_{= Mx}(n-1) x(n)₌ _{, x}(n-1) ₌ _{e M =} 1 1/4 0 0 1/2 0 0 1/4 1

(9)

23

E recursivamente, obtém-se a expressão:

x(n)_{= M}n_x(0)_,

tal que x(0)_{é a distribuição inicial dos genótipos.}

Novamente é preciso encontrar uma expressão explícita para M(n)_{, para isso}

diagonalizamos a matriz M, ou seja, procuramos uma matriz diagonal D e uma matriz invertível P tais que:

M = P.D.P-1_.

Então tem-se que:

M(n) _{= P.D}n_.P-1_,

Como no exemplo anterior, é preciso encontrar os autovalores e os autovetores da matriz M: (M λ. ).v = 0. Logo: 1 1/4 0 0 1/2 0 0 1/4 1 λ 1 0 0 0 1 0 0 0 1 . = 0 1 λ 1/4 0 0 1/2 λ 0 0 1/4 1 λ . = 0

Assim, o det (M . ).v = 0, isto é:

det 1 λ 1/4 0 0 1/2 λ 0 0 1/4 1 λ =0. (1 λ).( 1/2 λ).( 1 λ) = 0 3 _(5/2). 2 _{+ 2 – 1/2 = 0.}

As raízes do polinômio característico são os autovalores da matriz M: λ1 =λ2 = 1 e λ3 = 1/2

Substituindo cada λ na equação ( λ. ).v = 0 determinamos os autovetores associados. Sendo v = , tem-se que:

1 λ 1/4 0

0 1/2 λ 0

0 1/4 1 λ

(10)

24

Para λ1 = λ2 = 1: 1 1 1/4 0 0 1/2 1 0 0 1/4 1 1 . = 0 0 1/4 0 0 1/2 0 0 1/4 0 . = 0 0. + 1/4. + 0. = 0 0. 1/2. + 0. = 0 0. + 1/4. + 0. = 0

y = 0

Então, os autovetores associados ao autovalor λ1 = λ2 = 1 são os vetores da forma (x, 0,

z), tal que o auto espaço associado é bidimensional, ou seja, v = {[x(1,0,0) + z(0,0,1)]} . Portanto, v1 = 1 0 0 e v2 = 0 0 1 . Para λ3 = 1/2: 1 1/2 1/4 0 0 1/2 1/2 0 0 1/4 1 1/2 . = 0 1/2 1/4 0 0 0 0 0 1/4 1/2 . = 0 1/2. + 1/4. + 0. = 0 0. + 0. + 0. = 0 0. + 1/4. + 1/2. = 0 Resolvendo esse sistema, obtém-se:

y = -2x z = x

(11)

25

Então, os autovetores associados ao autovalor λ3 = 1/2 são os vetores da forma (x,-2x,x),

ou seja, x.(1,-2,1). Portanto, v3 =

1 2 1

.

Dessa forma, pode-se expressar a matriz diagonal D da seguinte maneira:

D = λ 0 0 0 λ 0 0 0 λ = 1 0 0 0 1 0 0 0 1/2 .

A matriz P é composta pelos autovetores nas colunas, enquanto que P-1_{é a matriz inversa}

de P. Seguem ambas as matrizes:

P = 1 0 1 0 0 2 0 1 1 e P-1₌ 1 1/2 0 0 1/2 1 0 1/2 0

x(n)_{= PD}n_P-1_x(0) = 1 0 1 0 0 2 0 1 1 . (1) 0 0 0 (1) 0 0 0 (1/2) . 1 1/2 0 0 1/2 1 0 1/2 0 . x(n) ₌ ₌ 1 1/2 (1/2) 0 0 (1/2) 0 0 1/2 (1/2) 1 .

Assim, tem-se que:

an = + [1/2 (1/2) ]b0

bn = (1/2) b0

(12)

26

Dessa forma, quando n tende ao infinito, (1/2)n_→_{0 e (1/2)}n+1_→_{0, portanto, segue que:}

an → + 1/2 b0

bn =0

cn → + 1/2 b0.

Isso mostra que no limite todas as plantas da população serão do genótipo AA e aa, ou seja, a plantação será composta por bocas de leão vermelhas e bocas de leão brancas.

Para o terceiro caso vamos supor que cada planta é sempre fertilizada por uma planta que tenha o genótipo Aa. Dessa forma, temos que a matriz M é dada por:

M =

1/2 1/4 0

1/2 1/2 1/2

0 1/4 1/2

,

cuja decomposição é obtida por M = P.D.P-1_{. Então tem-se que:}

M(n) _{= P.D}n_.P-1

Temos que os autovalores da matriz M são:

λ1 = 0, λ2 = 1/2 e λ3 = 1,

enquanto que os autovetores associados são:

v1 = 1 2 1 , v2 = 1 0 1 e v3 = 1 2 1 .

Dessa forma, temos que a matriz diagonal D é:

D = λ 0 0 0 λ 0 0 0 λ = 0 0 0 0 1/2 0 0 0 1 . E a seguir as matrizes P e P-1_: P = 1 1 1 2 0 2 1 1 1 e P-1₌ 1/4 1/4 1/4 1/2 0 1/2 1/4 1/4 1/4

x(n)_{= PD}n_P-1_x(0) = 1 1 1 2 0 2 1 1 1 . (0) 0 0 0 (1/2) 0 0 0 (1) . 1/4 1/4 1/4 1/2 0 1/2 1/4 1/4 1/4 .

(13)

27

x(n) ₌ ₌ (1/2) + 1/4 1/4 (1/2) + 1/4 1/2 1/2 1/2 (1/2) + 1/4 1/4 (1/2) + 1/4 . = ((1/2) + 1/4) + (1/4) + (1/4 (1/2) ) (1/2) + (1/2) + (1/2) (1/4 (1/2) ) + (1/4) + (1/4 + (1/2) ) Como a0 + b0 + c0 = 1, temos a0/2+ b0/2+ c0/2= 1/2, e a0 = 1- b0 -c0.

Assim, tem-se que:

an = (1/2) + 1/4 (1/2) b0 (1/2) c0

bn = 1/2

cn = 1/4 (1/2) + (1/2) b0 + (1/2) c0

Dessa forma, quando n tende ao infinito, (1/2)n_→_{0 e (1/2)}n+1_→_{0, portanto, segue que:}

an →1/4

bn =1/2

cn →1/4.

Isso mostra que no limite a plantação continuará sendo composta pelos três genótipos. Para o quarto e último caso, vamos supor que cada planta é sempre fertilizada por uma planta que tenha o genótipo aa. Dessa forma, a matriz M é dada por:

M =

0 0 0

1 1/2 0 0 1/2 1

,

e como nas aplicações anteriores M = P.D.P-1_{. Então tem-se que:}

M(n) _{= P.D}n_.P-1

Temos que os autovalores da matriz M são:

λ1 = 0, λ2 = 1/2 e λ3 = 1,

enquanto que os autovetores associados são:

v1 = 1 2 1 , v2 = 0 1 1 e v3 = 0 0 1 .

(14)

28

Temos que a matriz diagonal D é:

D = λ 0 0 0 λ 0 0 0 λ = 0 0 0 0 1/2 0 0 0 1 .

E a seguir as matrizes P e P-1_{, que coincidem:}

P =

1 0 0

2 1 0

1 1 1

= P-1

x(n)_{= PD}n_P-1_x(0) = 1 0 0 2 1 0 1 1 1 . (0) 0 0 0 (1/2) 0 0 0 (1) . 1 0 0 2 1 0 1 1 1 . x(n) ₌ ₌ 0 0 0 (1/2) (1/2) 0 (1/2) + 1 (1/2) + 1 1 . = 0 (1/2) + (1/2) (1/2) (1/2) + 1

Assim, tem-se que:

an = 0

bn = (1/2) + (1/2)

cn = (1/2) (1/2) + 1

Dessa forma, quando n tende ao infinito, (1/2)n_→_{0 e (1/2)}n-1_→_{0, portanto, segue que:}

an →0

bn →0

cn →1.

Isso mostra que no limite todas as plantas da população serão do genótipo aa, ou seja, a plantação será composta apenas por bocas de leão brancas.

(15)

29

Conclusões

A partir deste trabalho percebe-se a importância da álgebra linear num contexto geral; aqui seus conceitos e definições foram aplicados em um problema de hereditariedade, mas estes podem ser amplamente usados em outras áreas. E por isso é fundamental ter um domínio de suas ferramentas para poder interligar com as mais diversas áreas do conhecimento.

Referências

LEON. S.J. Álgebra linear com aplicações. 4ª. ed. Rio de Janeiro: Livros Técnicos e Científicos Editora S/A, 1999.

ANTON. H.; RORRES C. Álgebra linear com aplicações. 10ª. ed. Porto Alegre: Bookman, 2012, p. 473-475.