• Nenhum resultado encontrado

TÍTULO: AUTORES - Unesp

N/A
N/A
Protected

Academic year: 2023

Share "TÍTULO: AUTORES - Unesp"

Copied!
1
0
0

Texto

(1)

TÍTULO:

Criação de redes de co-expressão gênica utilizando expressão diferencial AUTORES:

Giovana Lanza Okada (Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp); Faculdade de Ciências Agronômicas; gigilanzaokada@gmail.com); Rafael Plana Simões (Universidade Estadual Paulista “Júlio de Mesquita Filho”

(Unesp); Faculdade de Ciências Agronômicas; rafael@fca.unesp.br); Leonardo Mantelle Mello Maldonado (Universidade Estadual Paulista “Júlio de Mesquita Filho” (Unesp); Faculdade de Ciências Agronômicas;

leomantellemaldonado@gmail.com); Bruno Afonso Corrêa (Universidade Estadual Paulista “Júlio de Mesquita Filho”

(Unesp); Faculdade de Ciências Agronômicas; brunoafonso12@hotmail.com; SubPrograma de Extensão Universitária Divulgação do Vestibular Unesp e Inclusão dos Melhores Alunos da Escola Pública na Universidade)

INTRODUÇÃO:

A biologia de sistemas abrange métodos matemáticos e computacionais os quais estudam a complexidade de siste-

mas biológicos, que compreendem a dinâmica dos processos biológicos em nível celular.

Dentro da biologia de sistemas, são estudadas as redes de co-expressão gênica. Os métodos mais aplicados para sua análise são baseados em correlação simples, por apresentar baixa complexidade numérica. (CARTER et al., 2004;

LANGFELDER; HORVATH, 2008) Porém, as taxas de sucesso são baixas, em razão da correlação simples considerar apenas correlações de expressão entre pares isolados de genes de uma rede, não acompanhando o alto enredamento entre os nós dos sistemas biológicos.

O presente estudo propõe uma nova metodologia com a utilização de análise de expressão diferencial de genes para geração de redes de co-expressão, sendo mais eficiente ao utilizar uma análise multivariada da expressão dos genes, mo- delando as redes de forma mais fiel. (LOVE; HUBER; ANDERS, 2014)

OBJETIVOS:

O objetivo desse estudo é a formação de um método que resulte em redes de co-expressão de maneira mais fidedigna, obtendo o maior número correto de arestas positivas verdadeiras possível.

MATERIAL E MÉTODOS:

Para o presente estudo, foram utilizados dados genômicos da espécie do organismo modelo Saccharomyces cere- visiae. Os reads filtrados foram mapeados sobre seu respectivo genoma utilizando o programa Bowtie 2 e as expressões em Rlog foram calculadas usando o pacote DESeq2 do software R. Assim, foram obtidos os dados de expressão genica de todos os genes (𝑛𝑔𝑒𝑛𝑒𝑠 = 6703) da espécie Saccharomyces cerevisiae em 36 experimentos diferentes (𝑛𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜𝑠 = 36). A determinação da expressão diferencial dos genes também foi realizada utilizando o pacote DESeq2.

Para determinar a significância estatística (p-value) da expressão diferencial de todos os genes i em dado experi- mento j, todos os demais experimentos k (sendo k={1, 2, ... , 𝑛𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜𝑠}\{j}) foram considerados como condição controle, obtendo assim uma matriz de probabilidades, P(𝑛𝑔𝑒𝑛𝑒𝑠 × 𝑛𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜𝑠), onde cada linha corresponde a um gene i e cada coluna a um experimento j. A partir dessa matriz, foi gerada uma matriz de adjacências da rede, A(𝑛𝑔𝑒𝑛𝑒𝑠 × 𝑛𝑔𝑒𝑛𝑒𝑠), onde cada elemento tem um valor binário. São considerados como genes co-expressos aqueles com expressão diferencial esta- tisticamente significativa (p-value ≤ 0,05) simultaneamente em um ou mais experimentos.

O software MatLab gerou a representação gráfica da rede gerada e o histograma dos graus de conectividade. Em seguida, comparou-se a rede encontrada com aquela validada experimentalmente. A interseção gerou uma matriz de con- fusão. Os resultados de tal matriz foram comparados com a matriz de confusão obtida a partir do método de correlação simples.

RESULTADOS:

O método de geração de redes de co-expressão utilizando dados de expressão diferencial gerou uma rede com 231.452 vértices, com topologia bidimensional e histograma dos graus de conectividade desses nós obteve um coeficiente de deter- minação R² = 0,98, bem ajustado à lei da potência. A comparação das matrizes de confusão entre o método de correlação simples e o proposto obteve maior número de arestas verdadeiras positivas (VP) para a expressão diferencial com 175 arestas e apenas 10 para a correlação simples. A razão 𝑛𝑔𝑒𝑛𝑒𝑠/VP para expressão diferencial foi 1322,6 e para correlação, 2396,2.

DISCUSSÃO:

Os resultados revelam que o método proposto produz uma rede com topologia adequada, ou seja, uma rede livre de escala.

As comparações entre as matrizes de confusão demonstram a maior eficácia da aplicação da expressão gênica, pois apre- sentou aumento no número de arestas verdadeiras positivas e diminuição na razão 𝑛𝑔𝑒𝑛𝑒𝑠/VP, com uma redução de 44,8%.

REFERÊNCIAS:

CARTER, S. L. et al. Gene co-expression network topology provides a framework for molecular characterization of cellular state. Bioinformatics (Oxford, England), v. 20, n. 14, p. 2242–2250, 22 set. 2004.

LANGFELDER, P.; HORVATH, S. WGCNA: an R package for weighted correlation network analysis. BMC bioinformatics, v. 9, p. 559, 29 dez. 2008.

LOVE, M. I.; HUBER, W.; ANDERS, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2.

Genome Biology, v. 15, p. 550, 5 dez. 2014.

Referências

Documentos relacionados

MATERIAL E MÉTODOS: Como fontes de pigmentos indicadores de acidez foram utilizadas cascas de jabuticaba Myrciaria cauliflora DC Berg., flores secas industrializadas de Hibiscus