• Nenhum resultado encontrado

6.2 Adequação da Implementação aos Requisitos

6.2.7 Interface Web Consumidor

Os consumidores poderão acessar os conjuntos de dados por meio da URI <http://sgdw2. cloudapp.net/>. O desenvolvimento da Interface Web para o consumidor seguiu a mesma diretriz do desenvolvimento da Interface Web para o produtor, ou seja, com o uso das mesmas tecnologias e frameworks. Em síntese, para os consumidores é possível realizar filtros nos conjuntos de dados, efetuar download dos dados, acessar os dados e metadados por meio da API e acessar todas as versões dos conjuntos de dados. A Figura 6.26 exibe a tela principal da Interface Web para os consumidores.

Figura 6.26: Tela principal da Interface Web para os consumidores. Fonte: o autor

6.3

Conclusão

Este Capítulo teve por objetivo mostrar que é possível desenvolver uma solução que gerencie adequadamente os conjuntos de dados na Web, ou seja, por meio da prova de conceito implementada mostramos que é possível implementar a arquitetura proposta no Capítulo anterior. Dessa forma, como resultado da prova de conceito, desenvolvemos o SGDW-v01 que permite atender, por meio de um conjunto de serviços, os requisitos listados no modelo de arquitetura proposto. A seguir, no Quadro 6.1, são elencados os serviços do SGDW-v01 e quais os requisitos ao qual cada um deles está relacionado.

Dos requisitos elencados, três não foram atendidos em nossa prova de conceito, sendo o requisito de prover mecanismos para a criação de canais de comunicação entre os produtores e consumidores, garantir a preservação dos conjuntos de dados ao longo do tempo e o gerenci- amento de metadados. Consideramos que o requisito de gerenciamento de metadados não foi atendido na prova de conceito uma vez que ele não foi encapsulado como um serviço e ainda não é apoiado por um processo de curadoria. Dessa forma, quando um serviço precisa criar, usar ou atualizar metadados, ele realiza todos os procedimentos diretamente no repositório de dados. Alguns serviços atendem parcialmente os requisitos, uma vez que nem todas as caracte- rísticas necessárias para o requisito foram atendidas. Assim, o Serviço de Criação de Conjuntos de Dados não atende completamente ao requisito correspondente pois não permite a especifi- cação de subconjuntos de dados. O Serviço de Collector só foi implementado para fontes de dados relacionais, não considerando as fontes de dados não relacionais e os dados presentes em arquivos, por exemplo. Somado a isso, o Serviço de Gerenciamento de Versões só considera as atualizações nos dados e não é gerado uma versão para atualizações nos metadados, ainda que em nossa prova de conceito os metadados só são atualizados quando os dados são atualizados.

6.3. CONCLUSÃO 107

Quadro 6.1: Serviços da Prova de Conceito x Requisitos de um SGDW

Serviço Requisito Adequação do Serviço ao Re- quisito

Criação de Conjuntos de Da- dos

R1. Prover mecanismos para a criação de conjuntos de dados auto-descritivos;

Parcial

Gerenciamento de Distribui- ções

R2. Possibilitar a criação de múltiplas distri- buições para um mesmo conjunto de dados, ou seja, a disponibilização dos dados em diferentes formatos;

Atende

Gerenciamento de Acesso R3. Prover múltiplos meios de acesso aos conjuntos de dados, que podem ser desde o download de arquivos até o acesso por meio de APIs;

Atende

Não implementado R4. Prover mecanismos para a criação de canais de comunicação entre os atores do ecossistema de dados na Web;

Não atende

Gerenciamento de Atualiza- ção

R5. Garantir o acesso a dados atualizados de acordo com a fonte de origem;

Parcial

Collector R6. Prover mecanismos para a extração e transformação dos dados de origem em dados na Web;

Parcial

Gerenciamento de Versões R7. Prover mecanismos para o gerencia- mento de versões de conjuntos de dados;

Parcial

Não implementado R8. Prover mecanismos para o gerencia- mento de metadados (curadoria de metada- dos);

Não atende

Preservação R9. Garantir a preservação dos conjuntos de dados ao longo do tempo;

Parcial

Gerenciamento de URIs R10. Garantir o uso de identificação única, por meio de URIs, para os conjuntos de dados, distribuições, versões e, preferenci- almente, para os itens de cada conjunto de dados;

Atende

Fonte: o autor

buições de forma automática. Além disso, a estrutura do sistema que foi adotada permite que novos formatos possam ser adicionados e automaticamente disponibilizados para que sejam consumidos. Também foram desenvolvidos métodos de acesso que permitem a recuperação dos dados por meio de download em massa e por meio de API. Assim como, foi garantido a identificação única para os conjuntos de dados, versões e distribuições.

Portanto, com a prova de conceito foi possível explorar o modelo de arquitetura proposto e verificar que é possível implementar um SGDW. Além disso, ela também foi usada para definir a infraestrutura necessária para o desenvolvimento evolutivo do SGDW. Por fim, foi possível observar que o modelo de arquitetura adotado é flexível ao ponto de viabilizar a implementação de novos serviços que não foram atendidos.

7.1

Considerações Finais

Neste trabalho foi apresentado e especificado um modelo de arquitetura para um Sis- tema Gerenciador de Dados na Web (SGDW). O modelo proposto leva em consideração os principais requisitos e funcionalidades que um sistema deste tipo deve atender para prover um gerenciamento adequado dos conjuntos de dados publicados na Web.

Foi apresentada uma visão geral da fundamentação teórica desta dissertação, discutindo os principais assuntos relacionados ao contexto de Dados na Web. Assim, discorremos sobre os ecossistemas de dados na Web e analisamos o ciclo de vida dos dados na Web. A partir da análise realizada, verificamos a necessidade de alteração do ciclo referenciado na literatura e propomos uma nova instância do ciclo de vida dos dados na Web.

Somado a isso, apresentamos as principais soluções para catalogação de dados atualmente e suas respectivas características. Em seguida, discorremos sobre as Boas Práticas para Dados na Web recomendada pelo W3C e fizemos uma análise para verificar a adequação das soluções as boas práticas. O resultado da análise apontou que desafios voltados a qualidade dos dados, versionamento, preservação, enriquecimento e republicação dos dados são poucos explorados pelas principais soluções de catálogos de dados.

Buscamos entender os principais desafios para publicação e consumo dos dados na Web e, a partir do estudo desses desafios, as premissas para o compartilhamento de dados na Web foram apresentadas. Dessa forma, guiados pelas premissas, definimos os requisitos que uma solução de compartilhamento de dados na Web deve ter para prover um gerenciamento adequado dos conjuntos de dados. Assim, foram estabelecidas 4 premissas e 10 requisitos. Para complementar a análise anteriormente realizada, fizemos uma nova análise das soluções de catalogação de dados verificando o atendimento delas aos requisitos listados. Os resultados discutidos no Capítulo 4 mostraram que as soluções atuais apresentam lacunas quanto aos requisitos de gerenciamento de versões, gerenciamento de metadados, comunicação entre consumidores e produtores e a preservação dos conjuntos de dados.

Documentos relacionados