(54) Epígrafe: SISTEMA DE COMUNICAÇÃO ASSÍNCRONO DE MENSAGENS DE VOZ E ÁUDIO (57) Resumo:
O SISTEMA DE COMUNICAÇÃO ASSÍNCRONO DE MENSAGENS DE VOZ E ÁUDIO É UM SISTEMA DE COMUNICAÇÃO BASEADO NO E-MAIL, QUE PERMITE A TROCA ASSÍNCRONA DE MENSAGENS DE VOZ ATRAVÉS DA INTERNET (7), A PARTIR DE UM COMPUTADOR SEM NECESSIDADE DE UTILIZAR O TECLADO E O RATO, RECORRENDO A COMANDOS DE VOZ (2)(12) E A INTERFACES SIMPLIFICADOS (11)(3). O SISTEMA É IMPLEMENTADO, NO MÍNIMO, POR DOIS CLIENTES, (1) E (13), E PERMITE O ENVIO DE MENSAGENS DE VOZ PARA UM DESTINATÁRIO, A RECEPÇÃO DE MENSAGENS DE VOZ, A IDENTIFICAÇÃO SONORA DO REMETENTE NO MOMENTO DA CHEGADA DE UMA MENSAGEM OU QUANDO O UTILIZADOR PERCORRE A LISTA MENSAGENS RECEBIDAS. O PROCESSO DE COMPOSIÇÃO DAS MENSAGENS É REALIZADO POR VOZ, SENDO APENAS NECESSÁRIO RECORRER A UM ECRÃ SENSÍVEL AO TOQUE PARA ESCOLHER UM CONJUNTO LIMITADO DE OPÇÕES. A INTERFACE GRÁFICA DISPONÍVEL NO ECRÃ SENSÍVEL AO TOQUE É DESENHADA DE FORMA SIMPLIFICADA E DIRECCIONADA PARA UTILIZADORES TECNOLOGICAMENTE EXCLUÍDOS. (12) FASCÍCULO DE PATENTE DE INVENÇÃO
G10L 15/26 (2006.01)
(22) Data de pedido: 2009.07.28
(30) Prioridade(s):
(43) Data de publicação do pedido: 2011.02.08 (45) Data e BPI da concessão: /
(73) Titular(es):
INSTITUTO POLITÉCNICO DE LEIRIA RUA GENERAL NORTON DE MATOS,
APARTADO 4133 2411-901 LEIRIA PT INOV INESC INOVAÇÃO - INSTITUTO DE NOVAS
TECNOLOGIAS PT
(72) Inventor(es):
ANTÓNIO MANUEL DE JESUS PEREIRA PT ANTÓNIO GOMES LEAL PT ISABEL PEREIRA MARCELINO PT ALEXANDRE GONÇALVES GASPAR PT JOÃO ALBERTO PERES PATRÍCIO PT
O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação baseado no e-mail, que permite a troca assíncrona de mensagens de voz através da Internet (7), a partir de um computador sem necessidade de utilizar o teclado e o rato, recorrendo a comandos de voz (2)(12) e a interfaces simplificados (11)(3). O sistema é implementado, no mínimo, por dois clientes, (1) e (13), e permite o envio de mensagens de voz para um destinatário, a recepção de mensagens de voz, a identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas. O processo de composição das mensagens é realizado por voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher
um conjunto limitado de opções. A interface gráfica
disponível no ecrã sensível ao toque é desenhada de forma
simplificada e direccionada para utilizadores
DESCRIÇÃO
Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio
Domínio técnico da invenção
O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação assíncrono baseado no e-mail (norma MIME - Extensões Multi função para Mensagens de Internet), vocacionado para o envio e recepção de mensagens de voz utilizando uma interface simplificada.
Antecedentes da Invenção
As soluções cliente de e-mail mais utilizadas, tanto aquelas que são pessoais como o Microsoft Outlook ou o Mozilla Thunderbird, como as interfaces de correio electrónico acessíveis através da Internet, são vocacionadas para o tratamento de mensagens de texto sendo todas as suas funcionalidades direccionadas para esse fim.
Existem, no entanto, algumas soluções que permitem o envio de e-mail de voz, embora nenhuma delas implemente o conceito do sistema de comunicação assíncrono de mensagens de voz e
áudio. Foram analisadas e comparadas quatro soluções
comerciais: My Voice Email; WaxMail; Vemail; e MailAmp. Os critérios gerais de avaliação foram:
a)A solução é Stand Alone ou funciona como aplicativo adicional de um cliente de e-mail standard?
b)A solução funciona com comandos de voz? c)Permite o envio de e-mail de texto?
d)Permite o envio de e-mail com anexos em voz (remetente, assunto e corpo da mensagem)?
e)Na recepção de e-mail, permite a reprodução por voz de: remetente, assunto e mensagem?
f)Tem uma interface adequada a pessoas pouco familiarizadas com dispositivos informáticos?
No que respeita ao critério a), as soluções My Voice Email e Vemail possuem funcionamento autónomo, enquanto a outras duas funcionam como aplicativo adicional do Outlook da Microsoft. Na interacção por voz com o utilizador, o critério b), nenhuma das soluções disponibiliza tal interface, sendo necessário interagir através do teclado ou rato.
As quatro soluções avaliadas permitem o envio de e-mail em formato de texto. Já no que se refere ao envio de mensagens completas de voz, incluindo os campos “remetente”, “assunto” e “corpo”, todas elas permitem apenas o envio do corpo da mensagem como anexo.
Na recepção de e-mail, critério e), nenhuma das soluções avaliadas permite a reprodução integrada dos conteúdos de voz, isto é, a mensagem de voz é tratada como um anexo, não existindo o conceito de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio no assunto e no destinatário.
Relativamente ao critério f), nenhuma das soluções apresenta uma interface adequada a pessoas pouco familiarizadas com dispositivos informáticos ou com necessidades especiais.
Os mesmos critérios foram ainda analisados na avaliação de algumas patentes existentes na área do e-mail e das interfaces de voz. Os documentos analisados foram US 2007/0127640 e CA 2 527 813 A1, US 2009/024707 A1, US 2005/01 08338 A1, US 2003/083881 A1, US 6 404 859 B1 e US 2004/0019488 A1.
No que respeita ao critério a), nenhuma das patentes acima referidas surge com soluções Stand Alone nem funcionam como add-on de um cliente de e-mail standard.
Em relação ao critério b) em análise, “A solução funciona com comandos de voz?”, verificou-se que apenas a patente US 2007/0127640 não contempla esta característica.
Na sua generalidade, as patentes supracitadas permitem envios de e-mails de texto (critério c), mas não e-mails com anexo de destinatário, assunto e mensagem em formato de áudio (critérios d e e). Aqui surgem algumas soluções que vão no sentido de converter voz em texto e vice-versa.
Por fim, em relação à lista de critérios em análise, verifica-se que em nenhuma das patentes supracitadas está presente a preocupação de disponibilizar interfaces adequadas a pessoas pouco familiarizadas com dispositivos informáticos (critério f).
Descrição geral da invenção
O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação baseado no e-mail, que permite a troca assíncrona de mensagens de voz através da Internet (7), a partir de um computador sem necessidade de utilizar o teclado e o rato, recorrendo a comandos de voz (2)(12) e a interfaces simplificados (11)(3). O sistema é implementado, no mínimo, por dois clientes, (1) e (13), e permite o envio de mensagens de voz para um destinatário, a recepção de mensagens de voz, a identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas. O processo de composição das mensagens é realizado por voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher
um conjunto limitado de opções. A interface gráfica
disponível no ecrã sensível ao toque é desenhada de forma
simplificada e direccionada para utilizadores
tecnologicamente excluídos.
Descrição das Figuras
A Figura 1 representa o funcionamento base do Sistema de
demonstrado pela interacção entre dois utilizadores, cada um deles com um cliente de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio. O utilizador A (1) emite comandos de voz (2) que são analisados e processados pela aplicação cliente instalada no computador do utilizador A (3). Estando a mensagem completa, com destinatário, assunto e corpo, a aplicação encapsula os dados (4), e utiliza um cliente de e-mail (5) para encaminhar a mensagem, recorrendo ao protocolo SMTP - Protocolo de transferência de correio simples (Simple Mail Transfer Protocol) (6), enviando a mensagem (7).
Ao detectar uma nova mensagem recebida através do protocolo IMAP - Internet Message Access Protocol, POP3 - Post Office Protocol ou outro (8), o cliente de e-mail (9) instalado no computador do utilizador B, obtém a mensagem contendo o destinatário, assunto e corpo (10) e emite uma notificação sonora e visual ao utilizador B (11). Este, através de comandos de voz, indica que pretende ouvir a mensagem (12). A Figura 2 representa o diagrama de integração do Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio. O sistema de comunicação surge como uma camada intermédia entre
clientes de e-mail (5) e o utilizador (1). O seu
funcionamento baseia-se num modelo em 3 sub-camadas:
Interface (2), abstracção (3) e Interface com clientes de e-mail (4).
A camada de Interface (2) permitirá a comunicação com o utilizador final (1), possibilitando que este envie e receba e-mails apenas com recurso a voz. Como alternativa, o utilizador poderá ainda interagir com a Interface através de toque no dispositivo.
A camada de abstracção do sistema (3) surge como uma camada de abstracção onde são definidas as funcionalidades do Sistema de Comunicação Assíncrono de Mensagens de Voz e
Áudio, construindo a mensagem de e-mail a enviar, surgindo assim como o core do sistema.
A camada Interface com clientes de e-mail (4) permitirá a comunicação com determinados clientes de e-mail específicos (5), servindo de aplicativo adicional, de modo a estender as funcionalidades dos clientes de e-mail e a suportar as especificações definidas pela camada de abstracção do sistema (3).
Descrição detalhada da invenção
O Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio é um sistema de comunicação assíncrono, de mensagens de
voz/áudio, caracterizado pela simplicidade do seu
funcionamento, pela utilização do protocolo SMTP - Protocolo de transferência de correio simples (Simple Mail Transfer Protocol) que permite a comunicação através de qualquer servidor de e-mail actual de modo transparente, e que ao nível da utilização possui as características seguintes:
1.Envio de mensagens de voz para um destinatário de forma assíncrona, utilizando uma interface do tipo e-mail.
2.Recepção de mensagens de voz de um determinado destinatário de forma assíncrona, utilizando uma interface do tipo e-mail.
3.Composição das mensagens utilizando voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher um conjunto limitado de opções.
4.Identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas.
O sistema de comunicação surge como um método simples de comunicação assíncrona, que pode ser utilizado por pessoas
com conhecimentos mínimos, ou até mesmo nulos, sobre tecnologias de informação – iliteracia informática.
O facto de poder ser implementado para qualquer cliente de e-mail torna-o de implementação e utilização quase universal. Por não realizar conversões entre áudio/voz e texto (síntese e reconhecimento de fala) torna-se rápido e simplificado. Esta vantagem poderá ser apontada também como uma desvantagem caso se contemple o tamanho de uma mensagem de texto e uma mensagem de áudio/vídeo na sua transmissão. Contudo, a aplicação de algoritmos de compressão e o aumento progressivo da largura de banda que se tem verificado leva a que não seja um ponto de inviabilização.
A principal vantagem a destacar será, portanto, a sua
simplicidade, contrastando com os sistemas complexos
existentes actualmente.
De modo mais detalhado, podemos referir que, a nível de funcionamento, o utilizador A indica que pretende comunicar com o utilizador B; sendo esta indicação realizada através de um comando de voz (“Enviar e-mail”) ou mediante interacção
simples com o dispositivo, pressionando o ícone
representativo do envio de e-mail.
A partir do momento em que o comando é reconhecido pela aplicação, surge um “diálogo” entre a aplicação e o utilizador A. Ou seja, toda a interacção entre utilizador e aplicação será efectuada por som ou vídeo:
a)A aplicação que implementa o conceito de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio responderá ao utilizador A solicitando o destinatário da mensagem. Esta pergunta será colocada de forma sonora (“Para quem deseja enviar a mensagem?”); O utilizador responderá, com o nome do destinatário;
b)A aplicação irá procurar o nome do destinatário na lista de contactos do utilizador A;
c)A aplicação perguntará ao utilizador A o assunto da mensagem (“Qual o assunto da mensagem?”);
d)O utilizador indicará o assunto da mensagem e a aplicação anexará um ficheiro de som com o assunto da mensagem;
e)A aplicação perguntará ao utilizador A o corpo da mensagem (“Qual a mensagem?”);
f)O utilizador indicará o corpo da mensagem e a aplicação anexará um ou mais ficheiro de som ou vídeo com o corpo da mensagem;
g)A aplicação anexará a fotografia do remetente,
encapsulará a mensagem e aplicará algoritmos de
compressão sobre a mesma, enviando-a de seguida;
h)A aplicação emitirá a mensagem de som: “Mensagem enviada com sucesso” e exibirá uma imagem correspondente ao envio com sucesso.
Ao receber uma mensagem, a aplicação descompacta o seu conteúdo e notifica o utilizador B (visual e sonoramente) da chegada da mensagem. Ou seja:
a)A aplicação que implementa o conceito de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio indicará “Chegou uma mensagem de <nome do remetente>, deseja abrir a mensagem?”;
b)O utilizador B responderá afirmativamente;
c)A aplicação valida a resposta indicada pelo utilizador; d)A aplicação abrirá a mensagem, colocando a fotografia do
remetente visível, indicará sonoramente “Assunto da mensagem: <assunto enviado>” e, posteriormente, mostrará o corpo da mensagem (ou de modo sonoro ou vídeo).
Exemplos de aplicação
Foi realizada uma demonstração a idosos de um protótipo do sistema de comunicação. A amostra consistiu em 8 idosos, com
a média de idades de 81 anos. Importa ainda referir que apenas 1 dos 8 idosos tinha tido alguma interacção com um computador e que 3 dos 8 idosos não sabiam ler.
Foram disponibilizados 4 postos de trabalho em salas diferentes, cada um com computador, colunas de som, webcam e microfone. Foi solicitado aos idosos que enviassem e recebessem mensagens através do Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio, recorrendo a comandos de voz.
Do decorrer dos testes, concluiu-se que, na generalidade, o sistema agradou aos intervenientes e não foram detectadas dificuldades de interacção significativas.
Aplicação industrial
A exploração desta invenção poderá fazer-se em duas vertentes distintas:
a)Desenvolvimento e comercialização de aplicações cliente de Sistema de Comunicação Assíncrono de Mensagens de Voz e Áudio – Estas aplicações cliente poderão ser diferenciadas
pelas tecnologias utilizadas e funcionalidades
disponibilizadas, onde existe uma grande margem de
evolução, entre outros, no que se refere à edição simplificada de conteúdos áudio ou à realização de tarefas de pesquisa e ordenação neste tipo de mensagens;
b)Utilização do conceito de forma integrada em soluções vocacionadas para pessoas com necessidades especiais e/ou soluções com interfaces inovadoras, designadamente com recurso a técnicas de realidade aumentada, indo ao encontro do conceito de Design Universal.
REIVINDICAÇÕES
1.Sistema de comunicação assíncrono, de mensagens de voz/áudio, que pela utilização do protocolo SMTP - Protocolo de transferência de correio simples (Simple Mail Transfer Protocol) - permite simplicidade do seu funcionamento e a comunicação através de qualquer servidor de e-mail actual de modo transparente, e que ao nível da utilização é caracterizado por:
a)Envio de mensagens de voz para um destinatário de forma assíncrona, utilizando uma interface do tipo e-mail;
b)Recepção de mensagens de voz de um determinado
destinatário de forma assíncrona, utilizando uma interface do tipo e-mail;
c)Composição das mensagens utilizando voz, sendo apenas necessário recorrer a um ecrã sensível ao toque para escolher um conjunto limitado de opções;
d)Identificação sonora do remetente no momento da chegada de uma mensagem ou quando o utilizador percorre a lista mensagens recebidas.
Desenhos