• Nenhum resultado encontrado

Sistemas de Informação com base na Web: vantagens das páginas dinâmicas e breve referência às tecnologias para

III.1.2 Arquitectura da Web

A Web é um sistema hipermédia distribuído, baseado no modelo cliente-servidor [Varela e Hayes, 1994]. O servidor é uma aplicação informática disponível para receber solicitações de outros programas ou computadores (os clientes) e processá-los através de uma rede de computadores, ligados por um sistema de telecomunicações [CNS, 1999]. O servidor Web, também conhecido por servidor http, tem como objectivo fornecer documentos para os clientes quando estes são requeridos. No âmbito da Internet, o browser é o cliente que solicita a informação ao servidor para posteriormente a apresentar no ecrã do sistema informático do seu utilizador [CNS, 1999]. Estes, em geral, têm interface gráfica, são multi-plataforma (ex.: X-Windows, MS-Windows, Macintosh), multi- protocolo (ex.: HTTP, FTP, News, file, …), e apresentam convenientemente informação hipermédia [Silva, 1999]. Opcionalmente, o browser, nomeadamente no caso dos mais recentes, pode estar acompanhado por aplicações externas usadas na apresentação do documento, caso não seja capaz de interpretar algum tipo de dado (como por exemplo, som

ou imagens em movimento), Fig.III.1. O processo de funcionamento da Web segue basicamente os seguintes passos:

1. através de um cliente Web o utilizador selecciona o documento, ou simplesmente uma parte do hipertexto ligada a um documento;

2. o cliente Web envia uma mensagem com a requisição feita pelo utilizador representada por um endereço. Esta mensagem é enviada através da rede para o servidor, que busca a informação no disco local ou dispara a execução de uma aplicação externa. Após o processamento do pedido, o servidor envia uma resposta ao cliente que o solicitou e fecha a conexão;

3. quando o cliente recebe a informação solicitada, verifica se os dados são válidos, através de informações contidas em campos do cabeçalho da mensagem. Após esta verificação o cliente mostra a informação ao utilizador.

Fig.III.1 - Arquitectura simplificada da Web.

Uma das características mais importantes da Web e que contribui em parte para o seu sucesso é a facilidade de utilização das suas componentes tecnológicas: (i) protocolo de comunicação entre o cliente e servidor (HTTP - HyperText Transfer Protocol) [HTTP, 1999; HTTP, 2000]; (ii) mecanismos de endereçamento (URL - Uniform Resource

Locator); e, finalmente, (iii) a linguagem de representação da informação hipermédia

(HTML - Hypertext Markup Language) [HTML, 2000].

III.1.2.1 HTTP – Protocolo de Comunicação entre o Cliente e o Servidor

Para o transporte de informação entre o cliente e o servidor Web foi proposto um protocolo de comunicação denominado HTTP (HyperText Transfer Protocol) [HTTP, 2000; W3C, 2000]. Este protocolo é caracterizado por ser um protocolo stateless e não

Cliente Servidor

Browser

Aplicações Externas

Servidor

Web Sistema de arquivo

Programas CGI, ASP, … Protocolo

stateful [Silva e Delgado, 1997]. Isto significa que o cliente Web envia o pedido de uma

operação ao servidor Web, este atende o pedido e logo em seguida encerra a conexão. Com esta característica do protocolo pretende-se proporcionar uma maior eficiência e velocidade aos sistemas de informação hipermédia distribuídos como é o caso da Web.

Embora o padrão de funcionamento do protocolo HTTP fosse adequado originalmente ao modelo hipermédia distribuído, em algumas situações apresenta algumas limitações de desempenho. Por exemplo, no caso de um utilizador querer navegar por um conjunto de documentos que se encontram num mesmo servidor, este sistema exige que, por cada documento acedido, seja necessário estabelecer a conexão e o fecho da conexão, o que torna essas duas operações redundantes e consequentemente ineficientes. É por este motivo que se encontra em desenvolvimento uma nova versão do protocolo HTTP - NG (HyperText Transfer Protocol Next-Generation), que se espera vir a solucionar algumas das limitações apresentadas pela actual versão [Silva e Delgado, 1997; Nielsen et al., 1998].

III.1.2.2 URL – Mecanismos de Endereçamento

A necessidade de referenciar diferentes tipos de recursos distribuídos por diferentes servidores exigiu a criação de um sistema de endereçamento consistente e uniforme, que permitisse o acesso aos objectos de informação que “flutuam” na rede [Silva, 1999]. O sistema de endereçamento URL (Uniform Resource Locator) é particular e único, referenciando apenas uma página da Web. Consiste, basicamente, na concatenação do seguinte conjunto de informação: protocolo, endereço da máquina onde se encontra o servidor, endereço particular do objecto pretendido (objecto e respectivo path) e, eventualmente, parâmetros adicionais e dependentes do protocolo utilizado. Portanto, a sintaxe de uma URL poderá tomar a seguinte forma: [protocolo://host/path/objecto#localização], onde:

- protocolo - indica o tipo de recurso da Internet que deve ser usado para a conexão com o servidor (ex.: HTTP, FTP, NEWS, WAIS, FILE);

- host - é o nome da máquina da Internet segundo o DNS - Domain Name Service - (ex.: www.ua.pt ), também conhecido por domínio;

- objecto – o nome do documento ou do programa a ser executado pelo servidor

Web;

- localização – é opcional e quando aparece vem sempre seguido do símbolo cardinal representando uma marca textual de posição dentro do objecto (documento). O URL é o caminho para especificar um objecto de informação na rede e é formado por uma palavra apenas, ou seja, não existem espaços em branco. Pode ser usado para requisitar diferentes tipos de objectos com diferentes protocolos, sendo que cada protocolo é específico para um determinado tipo de serviço.

III.1.2.3 HTML – Linguagem de Representação dos Documentos Hipermédia

A representação, por excelência, de informação na Web utiliza o formato da linguagem HTML (Hypertext Markup Language) [HTML, 2000]. Esta corresponde a um conjunto de regras que permitem descrever a estrutura do conteúdo de um documento, de modo a que o mesmo possa ser descodificado e mostrado adequadamente pelo browser onde se encontra o utilizador. A linguagem HTML é composta por um conjunto de elementos, os tag’s, que, por sua vez, permitem especificar a estrutura de um documento

Web, como, por exemplo, títulos, parágrafos, listas, tabelas e até ligações para outros

documentos, entre outras várias funções. O HTML é uma aplicação de uma linguagem de mais alto nível designada por SGML (Standard Generalized Markup Language) [SGML, 2000; Bingham, 1996; Bryan, 1992] e, como tal, independente da plataforma em que é exibida, cabendo ao cliente Web interpretá-la de acordo com a sua configuração. Uma outra característica, também muito importante do HTML, é a possibilidade da geração de formulários, que contêm campos e ícones para o preenchimento de dados pelo utilizador, permitindo assim um maior dinamismo e fazendo com que as páginas da Web funcionem para entrada de dados pelos utilizadores.

Pelo facto do HTML constituir a linguagem franca da Web, não significa que todos os documentos que por aí circulam tenham de estar nesse formato. Ou seja, o cliente Web pode exibir documentos em diversos formatos incluindo arquivos de texto convencionais sem nenhuma formatação, arquivos com imagens no formato JPEG e GIF, ou mesmo páginas HTML geradas automaticamente a partir de aplicações desenvolvidas com outro tipo de tecnologias (ex.: ASP). Aliás, sendo o HTML uma linguagem de marcação, tem

pouco poder de processamento [Yerkey, 2001]; com a sua utilização na concepção de documentos (páginas), apenas é possível mostrar dados estáticos e, como tal, mudanças nos dados implicam a necessidade de rescrever todo o documento HTML. No caso de existirem centenas de ocorrências da mesma classe de informação, cada ocorrência corresponde a uma página, e cada página necessita de ser individualmente escrita em HTML. Para além disto, estas páginas apresentam grandes limitações em relação a determinadas funcionalidades, tais como, pesquisa em bases de dados, cálculos matemáticos, personalização de resultados para diferentes utilizadores, entre outras. Em conclusão, apesar do código HTML constituir a linguagem franca da Web, quando utilizada de maneira singular na elaboração das páginas de determinados Web sites, dificulta o manuseamento desses documentos para possíveis actualizações ou outro tipo de manutenção (por exemplo, para a actualização dos documentos da Web escritos em código HTML, é necessário remover todo o documento antigo, implicando, muitas vezes, o aparecimento de ligações partidas quando o mesmo se encontra referenciado por outros documentos). Esta limitação da linguagem HTML, conjuntamente com a tendência crescente do número de documentos na Web, contribuem fortemente para o caos no qual se encontra actualmente grande parte da informação disponível nessa gigantesca rede.