• Nenhum resultado encontrado

7.3 SWEETS

7.3.3 Resultados do Experimento – parte 1

São quatro as categorias de habilidades (Capítulo 5) utilizadas na abordagem proposta neste trabalho para a inferência do grau de especialidade do usuário em um assunto a, são elas: Ha-

bilidade informada; Demonstrada, Sugerida e Refutada.

As habilidades na categoria Informada são aquelas que são informadas pelos usuários na Plataforma LinkedIn e Lattes. Como são as habilidades que os próprios especialistas assu- mem que tem, então não há necessidade de realizar nenhum cálculo adicional. É necessário apenas considerá-las no processo de inferência do grau final de especialidade do candidato a especialista em um assunto a.

Para a categoria Habilidade Demonstrada, foram utilizadas os dados das publicações científicas das pessoas disponíveis na Plataforma Lattes – conforme mencionado no Capítulo 6. As especialidades dos indivíduos são determinadas a partir das palavras chave associadas às publicações científicas dos usuários disponíveis na Plataforma Lattes, em que cada uma possui seu grau de importância de acordo com a categoria que pertence (e.g. publicações em periódicos ou conferência). Este grau de importância atribuído a cada categoria é configurável de acordo com o ambiente em que estiver implantado. Mais informações sobre o assunto são apresentadas no Capítulo 5. Uma vez que o nível de experiências das pessoas é mensurado na categoria de Habilidades Demonstradas, foi aplicado um questionário para estes indivíduos, a

Não foi possível analisar nos experimentos a eficiência dos cálculos das Habilidades

Sugeridas e Refutadas, apesar de que ambas são apresentadas na abordagem proposta no pre-

sente trabalho. Estas categorias de habilidades dependem fortemente de frequentes interações dos usuários no ambiente para que possam ser mensuradas. Um cenário ideal para que estas categorias de habilidades possam ser avaliadas adequadamente é um ambiente organizacional em que as pessoas o utilizam para o desenvolvimento de suas atividades diárias. Estas ativi- dades devem envolver interações constantes com outras pessoas, por exemplo, através de fó- runs de discussão. Assim, passa-se a ter parâmetros ideais para a refutação ou a sugestão de que uma determinada pessoa possua ou não uma habilidade específica.

Para determinar o grau final de especialidade de uma pessoa em um assunto a, é aplica- da a Equação (5.9) apresentada no Capítulo 5. Nesta equação, são considerados os 4 tipos de habilidades apresentados na abordagem proposta no presente trabalho. Porém, para este expe- rimento, a equação foi ajustada de forma a desconsiderar as categorias de habilidades Sugeri-

da e Refutada, já que não foi possível aplicá-las no presente experimento. A Equação (5.9)

representa uma média ponderada, por isso o ajuste realizado não foi complexo – foi necessá- rio apenas desconsiderar os valores destas categorias e seus respectivos pesos no cálculo. O grau final de especialidade de uma pessoa em um assunto a está em uma escala de 0 a 1. Nes- te experimento, foram considerados que as pessoas que possuem grau final de especialidade maior ou igual a 0,8 em um assunto a são classificadas como especialistas.

Para mensurar a eficiência da abordagem adotada para o cálculo da habilidade na cate- goria Calculada, devem ser utilizadas as produções dos usuários e a ontologia Oci. A ontolo- gia Oci é composta por relacionamentos entre conceitos (tags) associados a um determinado peso. Ambos são determinados pela co-ocorrência dos conceitos (tags) nos elementos utiliza- dos para a criação da folksonomia. Quanto maior o peso entre os conceitos, maior a frequência que eles co-ocorrem, e maior a relação semântica entre eles (Capítulo 5).

Na plataforma Konnen o número de objetos tagged era bastante limitado, aproximada- mente 9, com um total de 16 tags diferentes. Esta limitação seria um problema para mensurar a eficiência da abordgem proposta para a inferência da habilidade na categoria Calculada. Por isso, foi utilizada uma fonte externa de objetos tagged, BibSonomy, um sistema social de bo-

okmark e compartilhamento de publicações. Para selecionar tags relevantes ao contexto dos

usuários e as relações semântica entre elas, foi identificado o termo que mais ocorre em rela- ções aos usuários no experimento – foram consideradas também as palavras-chave associada

às publicações dos usuários nesta análise. Este termo serviu de entrada para a importação das informações do BibSonomy. O termo mais frequente entre os usuários foi “Social Networks”.

A ontologia Oci possui um total de 955 tags. Para criá-la ou atualizá-la, exige-se um alto custo computacional. Por isso, este processo é realizado periodicamente e pode ser configura- do. Inicialmente, foi definido um intervalo de 15 dias. A Figura 7.9 mostra uma representação

Oci.

Figura 7.9: Lightweight Ontology Oci.

A ontologia Oci possui 9291 relacionamentos, por isso, o emaranhado de informações apresentadas na Figura 7.9 não está claro. Para que fosse possível visualizar a evidência se- mântica entre os termos, foi utilizada uma escala logarítmica com base 1,01 para normalizar os pesos dos primeiros 15 termos que mais co-ocorrem, e uma escala de 1,02 nos termos res- tantes. Assim, os termos que possuem maior semântica entre eles são evidenciados, conforme parte destacada na Figura 7.9. Dentre este conjunto de termos que mais co-ocorrem (desta- cam-se) estão “folksonomy”, “tagging”, “collaborative” e “social”.

Surgiram na ontologia tags que têm significados idênticos representados em relaciona- mentos distintos como, por exemplo, “social networks” e “social network”. Este problema era esperado, já que os usuários têm a liberdade de associar livremente os conceitos (tags) aos itens (publicações), e na abordagem adotada não é realizado um tratamento para evitar esta situação. Além disso, podem existir erros de digitação. A livre descrição é uma característica de folksonomia. Esses problemas comprometem o enriquecimento da ontologia, logo, podem tornar o cálculo da Habilidade Calculada menos eficiente.

O passo seguinte para o cálculo da habilidade na categoria Calculada é indexar a base de conhecimento dos usuários. Para isso, são utilizadas as produções textuais (textos planos de qualquer natureza, e.g. post em uma comunidade ou o conteúdo de um documento rtf) dos usuários que compõem os perfis pré-processados destes usuários. Estes perfis possuem os termos mais relevantes e a frequência (peso) com que eles ocorrem em relação ao usuário.

Para realizar a indexação, são considerados os conceitos/termos da ontologia Oci e seus

respectivos relacionamentos. Não são considerados todos os conceitos, pois a decisão de utili- zá-los está limitada à quantidade de relacionamentos que possuem. A quantidade mínima de relacionamentos deve ser maior que 1. Neste experimento, foram considerados os termos que possuem no mínimo 4 relacionamentos.

O mínimo de 4 relacionamentos foi adotado em razão de: quando o experimento foi exe- cutado com no mínimo 3 relacionamentos foi identificado um conjunto grande de especiali- dades para os usuários; quando adotou-se um valor mínimo de 5 relacionamentos as especia- lidades foram reduzidas drasticamente. Por isso, chegou-se a um valor intermediário, 4. É provável que cada experimento diferente necessite de uma análise similar para determinar este valor mínimo ideal de relacionamentos. Existem no experimento 408 relacionamentos com esta configuração.

Além disso, estes relacionamentos devem possuir um peso maior que 1. Os relacionamen- tos que possuem peso mínimo 1 possuem evidência de pouca densidade semântica entre eles, logo, não são considerados relevantes para o experimento. Para definir o peso ideal a ser con- siderado, é importante que sejam conduzidos experimentos para realizar esta análise.

O grau inferido para a habilidade na categoria Calculada também está em uma escala de 0 a 1. Para que uma pessoa possa ser classificada como possível especialista em um assunto a, é necessário que este grau esteja acima de um limiar. O limiar adotado neste trabalho foi 0,8.

Não foram realizados testes exaustivos para determinar qual o limiar ideal, pois isso implica- ria em sucessivas modificações e análises no experimento.