• Nenhum resultado encontrado

Mestrado em Engenharia Informática Descrição, Armazenamento e Pesquisa de Informação 2005/ de Junho de 2006

N/A
N/A
Protected

Academic year: 2021

Share "Mestrado em Engenharia Informática Descrição, Armazenamento e Pesquisa de Informação 2005/ de Junho de 2006"

Copied!
12
0
0

Texto

(1)

Descri¸c˜ao, Armazenamento e Pesquisa de Informa¸c˜ao 2005/2006

Exame de Avalia¸c˜ao Dura¸c˜ao: 2,5 horas 16 de Junho de 2006

NOME:

Observe por favor as seguintes instru¸c˜oes:

• Leia cuidadosamente o exame at´e ao fim por forma a escolher a sua estrat´egia. • O exame tem a dura¸c˜ao m´axima de 150 minutos.

• O exame ´e com consulta de todo o material pr´oprio trazido para o efeito.

• Deve responder nos espa¸cos fornecidos neste exame, podendo usar, se for mesmo ne-cess´ario, o espa¸co das costas da folha.

• O exame tem 10 perguntas, com as pontua¸c˜oes indicadas, totalizando 150 pontos.

Problema 1.a 1.b 1.c 2.a 2.b 2.c 3.a 3.b 3.c 3.d Total NOTA

M´ax. Pontos 15 15 20 15 15 15 15 20 10 10 150 —

Pontos

Cristina Ribeiro Jo˜ao Correia Lopes

(2)

O dom´ınio da informa¸c˜ao usada nos exemplos deste exame ´e o futebol, em particular os eventos associados a um campeonato do mundo. A informa¸c˜ao neste dom´ınio ´e gerida pelos diversos intervenientes: federa¸c˜oes, jogadores, org˜aos de comunica¸c˜ao, agˆencias de not´ıcias.

Os exemplos dados s˜ao necessariamente curtos. Em cada grupo de perguntas concretiza-se um dos contextos de utiliza¸c˜ao da informa¸c˜ao do dom´ınio, sendo pedidas solu¸c˜oes para problemas existentes ou avalia¸c˜ao das que s˜ao apresentadas.

1. Armazenamento de XML

Considere o seguinte documento que cont´em uma not´ıcia sobre um jogo do Mundial de Futebol, guardado no ficheiro noticia.xml.

<?xml version="1.0" encoding="UTF-8"?> <not´ıcia ref="n234mft06t76">

<t´ıtulo>

Vit´oria magra </t´ıtulo>

<sub-t´ıtulo>

Portugal vence Angola com golo de Pauleta </sub-t´ıtulo>

<destaque> A Selec¸c~ao Nacional entrou no Mundial a ganhar, vencendo Angola por 1-0. Um golo de Pauleta, logo aos quatro minutos, garantiu os tr^es pontos.

Portugal teve oportunidades para dilatar a vantagem, mas Angola tamb´em desperdi¸cou ocasi~oes - que talvez fossem aproveitadas por uma equipa como o Ir~ao ou M´exico.

</destaque>

<publica¸c~ao>11-06-2006 21:53</publica¸c~ao> <actualiza¸c~ao>12-06-2006 15:56</actualiza¸c~ao>

<corpo>Com um meio-campo diferente do habitual, devido `a aus^encia de Deco, Portugal entrou bastante ofensivo e Pauleta quase que conseguia o golo mais r´apido do Mundial, aos 14 segundos.

O a¸coreano marcou tr^es minutos depois, aproveitando um cruzamento de Figo, vindo da esquerda. Os cerca de 25 mil portugueses - mais de metade da

assist^encia - no est´adio de Col´onia fizeram a festa, muitos ter~ao acreditado que mais golos a´ı viriam. Mas tal n~ao aconteceu, n~ao por falta de oportunidades. E de ambos os lados.

Durante a primeira parte, a equipa das "quinas" manteve o dom´ınio da bola. No entanto, Angola foi progredindo no terreno, chegando v´arias vezes `a baliza de Ricardo, sobretudo com remates de longe.

Pauleta, Figo - eleito "Homem do Jogo" -, Cristiano Ronaldo e Sim~ao tiveram o segundo golo nos p´es, mas a pontaria teimou em falhar. O guardi~ao angolano Jo~ao Ricardo tamb´em cumpriu - por exemplo aos 44 minutos numa boa defesa a um remate de Ronaldo.

Na segunda parte, a situa¸c~ao n~ao melhorou. Portugal esteve longos minutos sem criar perigo, enquanto a bola aparecia mais no seu meio-campo.

O seleccionador angolano Oliveira Gon¸calves refrescou o ataque com Mantorras no lugar de Akw´a. O avan¸cado do Benfica apareceu apenas uma vez com perigo `a entrada da ´area de Ricardo, j´a perto do final.

Entre os 60 e os 82 minutos, Luiz Filipe Scolari usou todas as substitui¸c~oes para mexer no meio-campo. Sa´ıram Ronaldo, Petit e Tiago; entraram Costinha, Maniche e Hugo Viana. A alegria dos primeiros minutos de jogo n~ao regressou. J´a em tempo de compensa¸c~ao, foi a vez de Maniche ter a oportunidade de dobrar a vantagem. Um grande remate de longe do m´edio portugu^es, uma enorme defesa do guarda-redes angolano.

Angola esteve longe da presta¸c~ao dos outros jogos com Portugal e superou as expectativas. J´a a forma¸c~ao das "quinas" cumpriu, mas n~ao brilhou.

</corpo>

(3)

<ficha>

<marcadores>

<marcador>0-1, Pauleta, 04 minutos.</marcador> </marcadores>

<equipas> <equipa>

<nome>Angola</nome>

<jogadores>Jo~ao Ricardo, Loco, Jamba, Kali, Delgado, Andr´e, Figueiredo (Miloy, 80), Mateus, Z´e Kalanga (Edson, 70), Mendon¸ca e Akw´a (Mantorras, 60)

</jogadores>

<suplentes> Lama, M´ario, Marco Airosa, Lebo Lebo, Rui Marques, Marco Abreu, Miloy, Edson, Fl´avio, Love, Titi Buengo e Mantorras </suplentes>

</equipa> <equipa>

<nome>Portugal</nome>

<jogadores>Ricardo, Miguel, Fernando Meira, Ricardo Carvalho, Nuno Valente, Petit (Maniche, 72), Tiago (Hugo Viana, 83), Cristiano Ronaldo (Costinha, 60), Figo, Sim~ao e Pauleta

</jogadores>

<suplentes> Quim, Paulo Santos, Paulo Ferreira, Ricardo Costa, Caneira, Costinha, Maniche, Hugo Viana, Boa Morte, Nuno Gomes e H´elder Postiga

</suplentes> </equipa>

</equipas>

<´arbitro>Jorge Larrionda (Uruguai)</´arbitro>

<ac¸c~ao_disciplinar>Cart~ao amarelo para Cristiano Ronaldo (26), Jamba (28), Loco (48+), Andr´e (52) e Nuno Valente (79)

</ac¸c~ao_disciplinar>

<assist^encia>45.000 espectadores (lota¸c~ao esgotada)</assist^encia> </ficha>

</not´ıcia>

a) Para ser usado na descri¸c˜ao da informa¸c˜ao dos documentos do tipo da not´ıcia do ficheiro noticia.xml, obtenha o trecho do XML Schema (XSD) s´o para a parte relativa `as equipas (elemento <equipas> e seus filhos).

(4)

b) Considerando a existˆencia de uma colec¸c˜ao de not´ıcias, em documentos similares ao ficheiro noticia.xml, guardados numa base de dados XML nativa, por exemplo na colec¸c˜ao db/noticias em eXist, formule uma interroga¸c˜ao XQuery para obter a resposta `a pergunta:

Quais os t´ıtulos das not´ıcias que mencionam “Figo”, “Angola” ou “Porto” em jogos da Equipa “Portugal”, publicadas em “11-6-2006”?

(5)

c) A empresa Mirabola, para tratar a informa¸c˜ao relacionada com os jornais que edita, possui uma base de dados Objecto-Relacional (por exemplo Oracle) contendo, nomeadamente, o texto de not´ıcias, as fotos relacionadas, etc.

Por forma a tratar de forma eficiente a grande quantidade de not´ıcias que lhe chegam em formato XML, como por exemplo as relacionadas com o Mundial de Futebol do ficheiro noticia.xml, o Departamento de Inform´atica da Mirabola pretende implementar uma solu¸c˜ao em Base de Dados.

Considerando apenas que ´e desej´avel fazer pesquisa nas not´ıcias, pesquisa atrav´es de XPATH, e integra¸c˜ao com perguntas SQL `a base de dados existente, apresente brevemente as vantagens e desvantagens de cada uma das aproxima¸c˜oes:

1. Base de Dados Oracle com a informa¸c˜ao da not´ıcia num CLOB e OracleText; 2. Base de Dados Oracle com a informa¸c˜ao em XMLDataType;

3. Base de Dados Oracle com a informa¸c˜ao em v´arias tabelas com XSU (XML SQL Utility); 4. Base de Dados XML nativa, por exemplo eXist, contendo colec¸c˜oes de not´ıcias.

(6)

2. Pesquisa de Informa¸c˜ao

O Jornal di´ario Mirabola, nos seus 10 anos de existˆencia, acumulou not´ıcias de eventos como jogos e outras competi¸c˜oes desportivas. Cada not´ıcia ´e um ficheiro XML, com um modelo que ´e seguido no exemplo visto (noticia.xml).

Os jornalistas tˆem frequentemente necessidade de pesquisar nos conte´udos de not´ıcias antigas. Uma situa¸c˜ao vulgar ´e precisarem de consultar not´ıcias de eventos que referem personagens, locais ou mesmo aspectos laterais ao pr´oprio evento (chuva, desacatos). Para esse efeito foi decidido instalar um sistema de pesquisa sobre o reposit´orio das not´ıcias.

a) A eficiˆencia dos sistemas de pesquisa textual ´e conseguida construindo ´ındices sobre os textos dos documentos. Diga que diferen¸ca existe, do ponto de vista de um sistema de pesquisa, entre usar documentos em texto simples e documentos XML.

(7)

b) Suponha que se pretende escolher entre 2 ferramentas de pesquisa chave-na-m˜ao, nas quais a indexa¸c˜ao ´e realizada automaticamente sobre o reposit´orio e a interroga¸c˜ao se faz por palavras-chave. As empresas est˜ao dispon´ıveis para fazer uma instala¸c˜ao experimental dos seus siste-mas, para serem experimentados. Descreva sucintamente o m´etodo que usaria para realizar uma avalia¸c˜ao das aplica¸c˜oes. Suponha que disp˜oe de pessoas e tempo limitados para a tarefa: 2 pessoas durante 2 dias.

(8)

c) O jornal tem, para al´em das not´ıcias, um arquivo volumoso de fotos, para as quais existem liga¸c˜oes nos documentos das not´ıcias. ´E costume os jornalistas precisarem de reutilizar fotos de arquivo, e portanto a pesquisa de imagens ´e tamb´em uma situa¸c˜ao frequente. Diga qual ser´a a melhor forma de pesquisar as imagens: de forma independente dos textos, juntando imagens e texto num mesmo reposit´orio, ou partindo dos textos para as imagens.

(9)

3. Ontologias e Semantic Web

O Departamento de Inform´atica do Mirabola vai desenvolver a ontologia OntoFoot para o dom´ınio dos campeonatos de futebol. A ontologia deve incluir os conceitos de campeonato, jogo, jogador, equipa. Deve tamb´em incluir propriedades que captem as rela¸c˜oes mais importantes entre estes conceitos.

a) Escreva um trecho de RDF que descreva a noticia.xml. Use o vocabul´ario Dublin Core para registar que a not´ıcia foi escrita em Portuguˆes por http://www.fe.up.pt/~jlopes/, que a sua data ´e 12-6-2006 e que tem como palavras-chave “futebol”, “campeonato”, “Portugal” e “Angola”.

(10)

b) Esboce um esqueleto de ontologia de acordo com o proposto, especificando classes, hierarquia das classes, propriedades com dom´ınios e contradom´ınios.

(11)

c) Na altura de uma competi¸c˜ao importante, muitas agˆencias, jornais e outros meios de co-munica¸c˜ao tˆem de usar informa¸c˜ao originada em outras fontes, e que portanto n˜ao segue os modelos de documentos adoptados internamente por cada um. Explique de que forma se pode resolver este problema usando uma ontologia.

(12)

d) Suponho que ´e respons´avel pela gest˜ao da informa¸c˜ao sobre eventos desportivos na empresa Mirabola.

Exponha a sua vis˜ao sobre o conjunto da informa¸c˜ao que tem de gerir e manter dispon´ıvel para a elabora¸c˜ao das diversas publica¸c˜oes da empresa. Em particular explique como se relacionam entre si os seguintes subconjuntos da sua informa¸c˜ao:

1. Ontologia do dom´ınio (exemplo: OntoFoot );

2. Documentos com informa¸c˜ao de base sobre eventos (exemplo: noticia.xml);

3. Meta-informa¸c˜ao dos documentos sobre eventos (exemplo: registo RDF com descri¸c˜ao de not´ıcia);

4. Base de dados com equipas, jogadores, instala¸c˜oes desportivas, campeonatos.

FIM.

Referências

Documentos relacionados

De seguida, vamos adaptar a nossa demonstrac¸ ˜ao da f ´ormula de M ¨untz, partindo de outras transformadas aritm ´eticas diferentes da transformada de M ¨obius, para dedu-

• Não há inflação de alimentos, há inflação, causada por choques cambiais, auxílio emergencial, problemas fiscais e má gestão de estoques públicos;. • O Brasil precisa

A assistência da equipe de enfermagem para a pessoa portadora de Diabetes Mellitus deve ser desenvolvida para um processo de educação em saúde que contribua para que a

servidores, software, equipamento de rede, etc, clientes da IaaS essencialmente alugam estes recursos como um serviço terceirizado completo...

Para disciplinar o processo de desenvolvimento, a Engenharia de Usabilidade, também conceituada e descrita neste capítulo, descreve os métodos estruturados, a

1- Indica com P, se a frase estiver na voz passiva e com A se estiver na ativa. Depois, passa-as para a outra forma. a) Vimos um cisne moribundo.. Assinala com um X o

1- Indica com P, se a frase estiver na voz passiva e com A se estiver na ativa. Depois, passa-as para a outra forma.. Assinala com um X o retângulo correspondente.. Derivada

Por último, temos o vídeo que está sendo exibido dentro do celular, que é segurado e comentado por alguém, e compartilhado e comentado no perfil de BolsoWoman no Twitter. No