--- INSTITUTO SUPERIOR TÉCNICO
Sistemas de Apoio à Decisão Exame 2 15 julho 2006
---
• A duração deste exame é de duas horas.
• É um exame com consulta.
• O número total de pontos é 20.
• Marque as suas respostas NA FOLHA DE EXAME.
• Escreva o seu número e nome no topo de cada página.
• Escreva todas as formulas.
• You have 2 hours. Panic not.
• The exam is open-book, open-notes.
• 20 points total.
• Mark your answers ON THE EXAM ITSELF.
• Write your number and name at the top of each page.
• Write all formulas!
Para o uso oficial somente - For official use only
1 2 3 4 5 6 SUM
4 4 2 3 3 4 20
1. (4 pts) Algumas perguntas fáceis para começar
Assinale as seguintes frases como verdadeiras (V) ou falsas (F). Cada resposta correcta corresponde a uma cotação de +1 valor. Resposta errada -0,5. Se não responder a cotação é 0.
I. Se x e y são independentes então P(y|x)=P(y) e P(x|y)=P(x)
If x and y are independent, then P(y|x)=P(y) and P(x|y)=P(x)
II. ID3 algoritmo de aprendizagem em arvore tem o problema potencial de overfitting do treino
ID3 tree learning algorithm has the potential problem of overfitting the training data.
III. Redes neuronais tem o problema de overfitting dos dados de treino.
Training neural networks has the potential problem of overfitting the training data.
IV. A regra de aprendizagem do perceptrão é um método eficaz e completo para um perceptrão aprender a classificar correctamente qualquer problema com duas classes.
The Perceptron Learning Rule is a sound and complete method for a Perceptron to learn to correctly classify any two-class problem.
Considere o seguinte conjunto de transacções:
TID Items bought 100 {a, b, c,d, e, f}
200 {a, b, c, d}
300 {a, c, g, h}
400 {b, e, i}
500 {a, b, c, d, e}
(a) (2 pts) Construa uma arvore fp da database de transição com um suporte minimo de Min_sup=60% (3/5)
Construct fp-tree from the transaction database, with minimum support threshold Min_sup=60% (3/5)
(b) (1 pts) Calcule bases condicionais de padrão
Determine conditonal pattern bases
(c) (1 pts) Calcule os padrões frequentes (itemset) relacionados com e.
Determine the frequent patterns (itemset) related to e.
Num espaço bidimensional (veja a figura) dados o ponto x, (query point) dois pontos w e quatro pontos v, para que valores de k o k-vizinhos mais proximos da o resultado da classe v para x (de acordo com a função de distancia Euclidiana).
In a two dimensional space (see the figure) given a query point x, two points w and four points v, for which k’s the k nearest neighbor gives as the result the class v (according to the Euclidian distance function)?
4. (3 pts) Bayes
1% das mulheres com mais de 40 anos que são examinadas sofrem de cancro da mama. 80%
das mulheres que realmente sofrem de cancro da mama irão ter um resultado positivo na mamografia (quer isto dizer que o teste indica que a mulher sofre de cancro). 9.6% das mulheres que na realidade não sofrem de cancro da mama irão ter um resultado positivo na mamografia (querendo dizer que elas foram erradamente diagnosicadas com o cancro).
Defina duas variaveis aleatorias Booleanas, M para um teste positivo de mamografia e
¬M para um teste negativo, C para a mulher que sofre de cancro da mama e
¬C para a que não sofre.
1% of women over age forty who are screened, have breast cancer. 80% of women who really do have breast cancer will have a positive mammography (meaning the test indicates she has cancer). 9.6% of women who do not actually have breast cancer will have a positive mammography (meaning that they are incorrectly diagnosed with cancer). Define two Boolean random variables, M meaning a positive mammography test and ¬M meaning a negative test, and C meaning the woman has breast cancer and ¬C means she does not.
(a) (2 pts) Se uma mulher neste grupo etário tem um teste positivo na mamografia, qual a probabilidade que ela sofre realmente de cancro?
If a woman in this age group gets a positive mammography, what is the probability that she actually has breast cancer?
(b) (1 pts) No caso de uma mulher que tem um teste positivo na mamografia, M1, repetir o teste numa segunda mamografia, M2, que também dá um resultado positivo. Use o
pressuposto Naïve de Bayes para calcular a probabilidade que a mulher sofre de cancro da mama dados os resultados dos 2 testes.
Say a woman who gets a positive mammography test, M1, goes back and gets a second mammography, M2, which also is positive. Use the Naive Bayes assumption to compute the probability that she has breast cancer given the results from these two tests.
5. (3 pts) Tree (ID3)
Suponha que quer reconhecer artigos em boas condições e artigos defeituosos produzidos pela sua empresa. Pode medir as 3 propriedades de cada parte (P1, P2 e P3) e caracteriza-las com valores Booleanos. Retira aleatoriamente alguns artigos da linha de produção e testa
intensivamente se os artigos estão ou não em boas condições obtendo os seguintes resultados:
Suppose you wish to recognize good and bad items produced by your company. You are able to measure three properties of each widget (P1, P2 and P3) and express them with Boolean values. You randomly grab several items from your shipping dock and extensively test whether or not they are good, obtaining the following results:
P1 P2 P3 resultado
sim Sim sim bem
sim Sim não corrupto
não Não sim bem
não Sim não corrupto
sim Não sim bem
não Não não bem
não Não não bem
a) (3 pts) Calcule a raiz da arvore de decisão para este conjunto de exemplos usando o algoritmo ID3. Indique os seus calculos.
Determine the root of the decision tree for this set of examples using the ID3 algorithm showing your calculations.
Dados os pesos w
1={w
11=0.1,w
12=0.2,w
13=0.2,w
14=0.1},
w
2={w
21=0.1,w
22=0.1,w
23=0.1,w
24=0.2}, W
1={W
11=0.1,W
12=0.1}, W
2={W
21=0.1,W
22=0.1} e a função de activação
Given are the weights w1={w11=0.1,w12=0.2,w13=0.2,w14=0.1}, w2={w21=0.1,w22=0.1,w23=0.1,w24=0.2}, W1={W11=0.1,W12=0.1}, W2={W21=0.1,W22=0.1} and the activation function σ(x)
(a) (2 pts) Calcule O
1e O
2para o vector de input x={0,1,0,0}={x
1=0,x
2=1,x
3=0,x
4=0}
Compute O1 and O2 for the input vector x={0,1,0,0}={x1=0,x2=1,x3=0,x4=0}
!
f (x) = " (x) = 1
1 + e
(#x )(b) (2 pts) Depois de calcular O
1e O
2faça um gradiente descendente estocástico com η =1 para o alvo (target) t={0,0}, determine
!
"W
ije
!
"w
jkpara o primeiro passo de adaptação.
After computing O1 and O2 perform a stochastic gradient descent with η=1 for the target t={0,0}, determine