• Nenhum resultado encontrado

Prova de Admissão do Programa Inter-unidades em Bioinformática. 17 de Novembro de NOME:

N/A
N/A
Protected

Academic year: 2021

Share "Prova de Admissão do Programa Inter-unidades em Bioinformática. 17 de Novembro de NOME:"

Copied!
31
0
0

Texto

(1)

Prova de Admissão do Programa Inter-unidades em Bioinformática 17 de Novembro de 2017.

NOME: _______________________________________________________ A prova contém 30 (trinta) questões divididas em 3 (três) áreas do conhecimento (matemática/estatística, ciência da computação, ciências biológicas). Você deverá responder um total de 10 (dez) questões, sendo obrigatoriamente um mínimo de 7 (sete) de uma única área do conhecimento. Caso deseje, você pode responder as 10 (dez) questões de uma área, se preferir, pode também responder 7 (sete) questões de uma área e 3 (três) de outra(s) área(s). Responda cada questão dentro do quadrado correspondente. Respostas fora do quadrado correspondente não serão consideradas. A prova pode ser feita a lápis. Boa prova!

(2)

Questões da Área de Matemática e Estatística

1. Um pesquisador dispõe de 92 estudantes a serem alocados aleatoriamente aos grupos G1 ou G2. Ele decide lançar uma moeda e, na ocorrência de “cara” o estudante será alocado a G1, caso contrário a G2. Os seguintes resultados foram obtidos:

Número de estudantes

G1 35

G2 57

Total 92

a) Com base nesses dados estime a probabilidade 𝜋 de ocorrência de “cara” da moeda.

b) Obtenha o intervalo de 95% de confiança para 𝜋.

c) Com base nos resultados você diria que a moeda é honesta (𝜋=0,50)? Justifique.

Considere que:

𝑃(𝑍 ≤ 1,645) = 0,95 e 𝑃(𝑍 ≤ 1,960) = 0,975, Z variável normal padrão. 𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 𝑛, 𝜋 ; 𝑝𝑎𝑟𝑎 𝑛 𝑔𝑟𝑎𝑛𝑑𝑒: 𝑝 =𝑋

𝑛~𝑁(𝜋,

𝜋 1 − 𝜋 𝑛 )

(3)

2. O intervalo 1,65 ± 0,20 é o intervalo de 95% de confiança construído a partir de uma amostra de tamanho 100, para a média µM da altura (em metros) de mulheres de uma população.

a) Com base nesse intervalo, qual seria a decisão do teste da hipótese H0: µM =1,87 versus H1: µM ≠1,87? Justifique.

b) Suponha que nessa população, as alturas, tanto de homens como de mulheres, sigam uma distribuição normal com desvio padrão igual a 0,80m. Considerando que em uma amostra de 80 homens dessa população foi observada uma média de altura de 1,87m, encontre o intervalo de 95% de confiança para a média populacional µH da altura (em metros) de homens.

c) Há evidência amostral de diferença significante entre as médias de alturas de homens e mulheres? Justifique.

Considere que:

(4)

3. Um pesquisador está investigando variáveis associadas com a expressão de um gene. Com essa finalidade, o seguinte modelo foi adotado:

y = β0 + β1x1 + β2x2 + β3x1x2 + e

em que y corresponde à intensidade de expressão do gene, x1 (=0, 1, 2) representa o número de alelos G em um marcador molecular, x2 é uma variável indicadora de hipertensão (0=normotenso e 1=hipertenso) e e é um erro aleatório com média zero e variância constante.

Indique FALSO ou VERDADEIRO, e justifique, as seguintes afirmações:

a) β0 é a intensidade de expressão esperada do gene, independentemente das demais variáveis.

b) β1 indica a variação esperada na intensidade de expressão correspondente à mudança de uma unidade no número de alelos G, independentemente da outra variável.

c) β3=0 indica que retas paralelas explicam o efeito de x1 sobre y para normotensos e hipertensos.

(5)

4. Em um experimento o pesquisador acompanhou por 30 dias a causa das internações hospitalares (devido à doença A ou à doença B). Ao final desse período o seguinte resultado foi obtido, classificado segundo o gênero do paciente:

Gênero Doença A Doença B Total

Masculino 150 92 242

Feminino 90 206 296

Total 240 298 538

a) Com base nos dados, qual é a probabilidade de internação devido à doença A de acordo com o gênero do paciente?

b) Considere π a probabilidade de um evento ocorrer. A chance do evento é definida como π/(1-π). Com base na amostra obtida, calcule a razão de chances de internação devido à Doença A entre masculinos e femininos.

(6)

5. Sejam X, Y e Z variáveis aleatórias quaisquer, e a, b, c e d constantes. Responda:

a) Quando cor(aX + b, cY + d) = cor(X, Y)? (cor é o operador correlação)

b) Quando var(X + Y) = var(X) + var(Y) ? (var é o operador variância)

(7)

6. Encontre os intervalos de convergência para a representação em série de Taylor de:

a) 𝑔 𝑡 = 𝑒!

(8)

7. Interprete a solução e dê um exemplo de aplicação da equação diferencial:

f ''(t) = -af(t).

(9)

8. Calcule:

a) 2 lg 0.1 + 3ln (𝑒!); lg: logaritmo na base 10, ln: logaritmo na base e

b)

2 ln 3𝑒 − ln (9) 3 ln 5𝑒 −32 ln (25)

(10)

9. Formule o problema tratado em PCA – Principal Component Analysis e sua relação com a teoria espectral de matrizes simétricas.

(11)

10. Uma matriz simétrica A é positiva definida se, e somente se, xʹAx>0, sendo x um vetor não nulo . Neste caso, a forma quadrática associada à

matriz A também é positiva definida.

a) Determine a matriz A associada à forma quadrática

(

)

1 2 2 2 2 1 2 1,x 3x 3x 2xx x f = + + .

(12)

Questões da Área de Ciência da Computação

1. Mostre um autômato finito determinístico que opera sobre o alfabeto Σ = {a,b} e que aceita cadeias do seguinte tipo: um ou mais a’s seguido de zero ou mais b’s. Por exemplo, as cadeias aaa e aab são aceitas pelo autômato, mas as cadeias bb, bbaa,aabba não são.

(13)

2. Qual é o algoritmo mais eficiente para ordenar n números inteiros, supondo que cada número representa a idade de uma pessoa? Esboce o algoritmo e faça sua análise de complexidade.

(14)

3. Suponha um grafo orientado e ponderado, com pesos não negativos. Sobre um tal grafo podemos imaginar os dois seguintes problemas: (a) achar o caminho mais curto (ou mais leve) de um vértice u a um vértice v; (b) achar o caminho mais longo (ou mais pesado) (sem repetição de vértices) de um vértice u a um vértice v. O peso de um caminho é a soma dos pesos de suas arestas. Pergunta: os dois problemas podem ser resolvidos de forma eficiente? Justifique sua resposta.

(15)

4. Qual é a técnica que se usa para a análise da complexidade de algoritmos recursivos? Dê um exemplo (de algoritmo recursivo e de aplicação da técnica a ele).

(16)

5. Dada uma turma T com n alunos e as relações de amizade entre pares de alunos, queremos determinar quantas panelinhas existem na turma. Um aluno X não pertence a uma panelinha P se X não tem relação de amizade com nenhum aluno que pertence a P; do contrário, X pertence a P. Apresente um algoritmo eficiente para determinar as panelinhas de T. As relações de amizade são simétricas: se X é amigo de Y então Y é amigo de X. Você deve considerar que cada aluno é amigo de si mesmo, portanto panelinhas de um único aluno são possíveis. Note que um membro de uma panelinha P não necessariamente é amigo de todos os demais membros de P; basta um.

(17)

6. Apresente um pseudo-código da função pop(P,x) para uma pilha P. Se a pilha estiver vazia, pop devolve ‘falso’. Caso contrário ela devolve ‘verdadeiro’, coloca em x o valor do topo da pilha, e atualiza a pilha. Suponha que P é um vetor.

(18)

7. Apresente uma expressão regular que gera cadeias de 0’s e 1’s em que o número de 0’s consecutivos e o número de 1’s consecutivos é sempre par. Exemplos de cadeias que devem ser geradas: 0011, 11110011, 0000. Exemplos de cadeias que não devem ser geradas: 00011, 11011. Você pode usar apenas os operadores * (repetição de zero ou mais vezes), | (alternação entre caracteres), concatenação de caracteres e os parênteses para agrupar caracteres.

(19)

8. Existem oito sacos sendo que sete delas contêm bolas pesando cinco gramas cada bola e apenas um saco contendo bolas de quatro gramas cada. Você tem a disposição uma balança digital. Descreva uma estratégia para que, com apenas uma pesagem, descubra qual o saco que contém bolas de quatro gramas. Cada saco contém tantas bolas quanto se queira.

(20)

9. Dada uma árvore binária de busca de inteiros, mostre a estrutura da árvore após cada um dos valores 5, 2, 4, 7, 8, 1, 3 serem inseridos e depois mostre a mudança no resultado da árvore quando 2 é removido.

(21)

10. Para cada uma das afirmações a seguir, responda verdadeiro ou falso.

a) O algoritmo de Prim usa Union-find como estrutura de dado.

b) No Union-find com compressão de caminho, após realizarmos uma operação de Find-Set(x), a altura da árvore que x está sempre diminui.

c) Na melhor implementação possível da estrutura de dado Union-find, o custo no pior caso para cada operação é O(log n).

d) Na melhor implementação possível do Union-find, o custo no pior caso para a operação de Make-set é O(1).

(22)

Questões da Área de Ciências Biológicas

1) O fluxo da informação genética envolve os processos denominados replicação, transcrição e tradução.

a) Justifique essa afirmação, indicando o papel de cada um desses processos na transmissão de informação em sistemas biológicos.

b) Indique quais as principais moléculas (substratos, produtos e catalizadores) envolvidas em cada um dos processos.

(23)

2) Como os grupos polares e apolares se distribuem na estrutura terciária de proteínas globulares?

A maioria das proteínas globulares são desnaturadas por uma breve exposição a 65oC, mas algumas delas que possuem resíduos de cisteína em sua cadeia devem ser aquecidas por mais tempo e a temperaturas mais altas para desnaturarem. Qual a base molecular dessa propriedade? Como a desnaturação dessas proteínas com resíduos de cisteína poderia ser facilitada?

(24)

3) Esquematize a estrutura típica de um gene eucariótico contendo 3 exons. Indique no esquema e explique por escrito a função dos elementos regulatórios mais importantes para:

a) o controle da transcrição do DNA

b) o processamento do RNA para dar origem ao RNA mensageiro maduro c) o início da tradução da proteína a partir do mRNA maduro

(25)

4) Explique porque a replicação do DNA é semiconservativa, bidirecional e semidescontínua.

(26)

5) Os 20 aminoácidos que compõem as proteínas são codificados por 61 códons diferentes. No entanto, apenas 32 RNAs transportadores distintos são suficientes para reconhecer todos os 61 códons e garantir a síntese de proteínas. Explique esse aparente paradoxo utilizando seus conhecimentos sobre o mecanismo de leitura do código genético.

(27)

6) Qual a diferença entre mutações genéticas e modificações epigenéticas do genoma? Dê um exemplo de um tipo de modificação epigenética frequente e explique o seu papel no controle da expressão gênica.

(28)

7) A sequência de DNA abaixo contem o gene que codifica para a cadeia A da insulina humana. Os códons de início e fim da região codificadora estão

sublinhados e em negrito. 5’ AGCCCTCCAGGACAGGCTGCATCAGAAGAGGCCATCAAGCAGATCACTGTCCTTCTGCCATGGCCCTGT GGATGCGCCTCCTGCCCCTGCTGGCGCTGCTGGCCCTCTGGGGACCTGACCCAGCCGCAGCCTTTGTGAA CCAACACCTGTGCGGCTCACACCTGGTGGAAGCTCTCTACCTAGTGTGCGGGGAACGAGGCTTCTTCTA CACACCCAAGACCCGCCGGGAGGCAGAGGACCTGCAGGTGGGGCAGGTGGAGCTGGGCGGGGGCCCTGG TGCAGGCAGCCTGCAGCCCTTGGCCCTGGAGGGGTCCCTGCAGAAGCGTGGCATTGTGGAACAATGCTG TACCAGCATCTGCTCCCTCTACCAGCTGGAGAACTACTGCAACTAGACGCAGCCCGCAGGCAGCCCCAC ACCCGCCGCCTCCTGCACCGAGAGAGATGGAATAAAGCCCTTGAACCAGCAAAA 3’

a) Forneça a sequência de um par de oligonucleotídeos iniciadores apropriados para a amplificação do gene da insulina. Marque na sequência acima o local de anelamento de cada iniciador.

b) Faça um esquema ilustrando a amplificação da região pretendida ao longo do 1º ciclo da PCR. Indique a orientação das fitas de DNA no esquema.

c) quantas vezes a quantidade inicial de DNA seria amplificada após 10 ciclos de PCR?

d) Que procedimento prévio seria necessário para amplificar o gene da insulina por PCR a partir de RNA isolado de uma linhagem celular?

(29)

8) Nas duas colunas listadas abaixo há uma série de termos relacionados. Faça a ligação entre os nomes constantes da coluna da esquerda com um único termo na coluna da direita.

RNA polimerase vetor

primase tradução

HindIII RNA mensageiro de eucarioto

intron holoenzima

5’ cap metilação de RNA mensageiro

plasmídeo promotor

AUG endonuclease de restrição

TATA box splicing

Poli A replicação

(30)

9) Compare a expressão gênica em procariotos e eucariotos quanto ao: a) grau de acoplamento da transcrição e da tradução.

b) número de produtos gênicos em um transcrito primário.

c) número de proteínas resultantes da tradução de um transcrito primário. d) controle por fatores de transcrição protéicos

(31)

10) Quais são os principais elementos necessários para a transcrição de genes presentes na sequência de DNA de eucariotos? Descreva a função desses elementos e o seu papel no controle da expressão gênica durante a diferenciação e desenvolvimento em organismos multicelulares.

Referências

Documentos relacionados

Curvas de rarefação (Coleman) estimadas para amostragens de espécies de morcegos em três ambientes separadamente (A) e agrupados (B), no Parque Estadual da Ilha do Cardoso,

Quando a luz acende, o console está sob a condição de monitoramento, com os medidores de nível principal mostrando o nível do sinal do canal do monitor e o sinal do canal é

Nos termos do artigo 24 da Instrução CVM 400, a quantidade de Ações inicialmente ofertada (sem considerar as Ações Adicionais) poderia ter sido, mas não foi, acrescida em até

Não podem ser deduzidas dos nossos dados quaisquer informações sobre uma dada característica específica, nem sobre a aptidão para um determinado fim. Os dados fornecidos não eximem

F REQUÊNCIAS PRÓPRIAS E MODOS DE VIBRAÇÃO ( MÉTODO ANALÍTICO ) ... O RIENTAÇÃO PELAS EQUAÇÕES DE PROPAGAÇÃO DE VIBRAÇÕES ... P REVISÃO DOS VALORES MÁXIMOS DE PPV ...

Our contributions are: a set of guidelines that provide meaning to the different modelling elements of SysML used during the design of systems; the individual formal semantics for

São considerados custos e despesas ambientais, o valor dos insumos, mão- de-obra, amortização de equipamentos e instalações necessários ao processo de preservação, proteção

No entanto, as perdas ocasionadas na cultura do milho em função da interferência imposta pelas plantas daninhas têm sido descritas como sendo da ordem de 13,1%, sendo que em casos