• Nenhum resultado encontrado

7 A Infraestrutura PersonalTVware

7.6 Abordagem de Recomendação Personalizada Sensível ao Contexto

Nesta seção serão descritos os principais mecanismos da proposta de abordagem de recomendação personalizada sensível ao contexto para TV Digital

personalizada, que é utilizada pelo PersonalTVware. A abordagem proposta se enquadra no grupo estimação e elicitação de preferências contextuais (descrito na subseção 5.1.1). A abordagem proposta para o PersonalTVware, tem como base a filtragem de informação, e o emprego de aprendizagem supervisionada dependente do contexto para criação de modelos de conhecimento, posteriormente utilizados na etapa de predição de preferências contextuais. Para isso, são utilizadas as técnicas de filtragem de informação da área de recuperação de informação e classificação da área de mineração de dados descritas nas seções 5.3, 5.4, e o conceito de perfil

contextual do usuário, que será apresentado a seguir na subseção 7.6.1.

7.6.1 Conceito de Perfil Contextual do Usuário

Um perfil contextual do usuário é definido, neste trabalho, como sendo o registro a ser utilizado nas tarefas de classificação e predição, sendo formado por uma agregação de atributos que representam as informações que constituem o contexto corrente, perfil do usuário (especificamente dados pessoais) e o atributo- classe, ou seja, o atributo alvo com classes pré-definidas. Cada classe corresponde ao gênero de um determinado programa de TV (preferência contextual). Este gênero pode ser obtido a partir da interação do usuário, como assistir ou avaliar um programa de TV, ou ainda pode ser inferido para este usuário, dependendo do caso de uso em que esteja sendo utilizado o perfil contextual do usuário.

Tabela 5 - Atributos que compõem o perfil contextual do usuário

Atributos Origem

 Sexo;  Idade;  Idioma;  Ocupação.

Modelo do usuário – Dados pessoais

 Localização Física;  Localização simbólica;  Dia simbólico;

 Hora simbólica;  Tipo de dispositivo.

Modelo do Contexto – Informações contextuais

 Gênero (atributo-classe) Obtido a partir de um programa de TV selecionado OU a ser inferido para o usuário.

A Tabela 5 apresenta os atributos selecionados que compõem o perfil

contextual do usuário, destacando a origem dos mesmos. Adicionalmente, em

trabalhos futuros tais atributos podem ser complementados ou até mesmo substituídos por outros de maior expressividade. Vale ressaltar que, por questões de privacidade, não aparece a identificação do usuário (ID do usuário) no perfil

contextual do usuário, pois esta informação não é explorada no processo de

predição.

7.6.2 Aprendizagem Supervisionada Dependente do Contexto

Esta é a etapa de aprendizagem (ou treinamento), onde o algoritmo de classificação constrói o modelo de conhecimento por meio da análise ou aprendizagem do conjunto de treinamento composto por perfis contextuais dos

usuários (registros) com seus rótulos de classes associados, ou seja, atributo-classe

Gênero instanciado. No contexto da classificação os perfis contextuais dos usuários podem ser referenciados como tuplas, instâncias, exemplos, ou casos de testes. Uma tupla, X, pode ser representada por meio de vetor de atributos n-dimensional, X=(x1, x2,..., xn). A Figura 22 ilustra o processo de aprendizagem supervisionada

dependente do contexto.

Figura 22 - Etapa de aprendizagem ou treinamento. Adaptado de (HAN; KAMBER, 2006).

Conjunto de Treinamento (Perfis Contextuais dos Usuários)

Sexo Idade Idioma Ocupação Localização Física Localização Simbólica Dia Simbólico Hora Simbólica Tipo de Dispositivo Gênero M Adulto PT Professor BR-AM Casa Domingo Manhã Fixo Esportes M Adulto PT Advogado BR-AM Casa Domingo Noite Fixo Entretenimento F Adolescente PT Estudante BR-AM Casa Domingo Manhã Fixo Música F Adolescente PT Estudante BR-AM Casa Domingo Noite Fixo Entretenimento M Adulto PT Médico BR-AM Trabalho Segunda Manhã Portátil Notícias ... ... ... ... ... ... ... ... ... Algoritmo de Classificação Modelo de Conhecimento y=f(X)

1

2

3

O conjunto de treinamento (1) é obtido por meio da técnica de realimentação de relevância (descrita na seção 5.5), e posteriormente analisado pelo algoritmo de classificação (2) para criação do modelo de conhecimento. Vale ressaltar que o

modelo de conhecimento é representado de acordo com a técnica de classificação

empregada pelo classificador tais como árvore de decisão, uma rede bayesiana, uma rede neural, modelo vetorial, dentre outros. O modelo de conhecimento (3) obtido pode ser compreendido como uma função, y=f(X), que permite predizer o rótulo y do atributo-classe de um dado perfil contextual do usuário X.

7.6.3 Predição de Preferências Contextuais

Esta é a segunda etapa (Figura 23), onde dado um perfil contextual do

usuário X com o atributo-classe Gênero não instanciado (1), deseja-se descobrir o

rótulo y do atributo-classe associado para um determinado usuário, ou seja, a preferência contextual (gênero de programas de TV). Para que isso ocorra, é necessário que o algoritmo de predição (2) utilize o modelo de conhecimento y=f(X)

(3) obtido na etapa anterior, que permite predizer o rótulo y do atributo-classe de um

dado perfil contextual do usuário X construído a partir da solicitação de uma recomendação.

Figura 23 - Etapa de predição. Adaptado de (HAN; KAMBER, 2006).

Perfil Contextual do Usuário X

Sexo Idade Idioma Ocupação Localização Física Localização Simbólica Dia Simbólico Hora Simbólica Tipo de Dispositivo Gênero M Adulto PT Professor BR-AM Casa Domingo Manhã Fixo Rótulo y?

Modelo de Conhecimento y=f(X) Algoritmo de Predição y = Esportes

1

2

3

A partir do perfil contextual do usuário X com o rótulo y inferido, ou seja, o gênero (preferência contextual) descoberto torna-se possível a geração de recomendação sensível ao contexto por meio da etapa de filtragem de informação sensível ao contexto descrita a seguir na subseção 7.6.4. Neste trabalho, os valores dos gêneros obtidos pela predição estão de acordo com especificação de metadados do TV Anytime (TV-ANYTIME, 2007b).

7.6.4 Filtragem de Informação Sensível ao Contexto

O objetivo desta etapa é filtrar os programas de TV que provavelmente serão relevantes e adequados ao perfil e contexto do usuário. Desta forma, o processo de filtragem explora além das preferências explícitas, as preferências contextuais inferidas na etapa anterior (vista na subseção 7.6.3), bem como as informações contextuais (dia e horário, lugar de origem do programa de TV e do usuário), e os metadados dos programas de TV.

A técnica de filtragem empregada é a filtragem baseada em conteúdo (FBC) (vista na subseção 5.3.1) que consiste em comparar os termos que descrevem o perfil do usuário com as descrições dos conteúdos, visando obter uma lista de conteúdos que provavelmente serão de interesses do usuário. A comparação entre o perfil do usuário com as descrições dos conteúdos pode ser realizada por meio de uma linguagem de consulta de metadados (vista na seção 3.4) ou métrica de similaridade comumente utilizada, que é o cálculo do cosseno do ângulo entre dois vetores (ADOMAVICIUS; TUZHILIN, 2005).

A similaridade entre os vetores que representam o perfil do usuário e programa de TV indica o grau de relevância. No entanto, este método apesar de ser muito utilizado em sistemas de recomendação baseados em dados semi- estruturados, não oferece a flexibilidade necessária para que seja possível customizar recomendações ou definir consultas sobre documentos XML que representam o conteúdo e perfil do usuário (ADOMAVICIUS; TUZHILIN, 2005). Deste modo, foi empregada a linguagem de consulta de metadados, que oferece a possibilidade de elaboração de expressões de consulta complexas sobre os

documentos XML (com estruturas de descrição inter-relacionadas) sendo o seu uso recomendado para TV-Anytime (TV-ANYTIME, 2007b).