PersonaWeb ferramenta de criação de personas para auxiliar na concepção de jogos digitais

Texto

(1)Pós-Graduação em Ciência da Computação. “PERSONAWEB: ferramenta de criação de personas para auxiliar na concepção de jogos digitais” Por. Ana Luiza do Nascimento Leite Dissertação de Mestrado. Universidade Federal de Pernambuco posgraduacao@cin.ufpe.br www.cin.ufpe.br/~posgraduacao. RECIFE, JULHO/2011.

(2) . UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA PÓS‐GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO . ANA LUIZA DO NASCIMENTO LEITE . “PersonaWeb – ferramenta de criação de personas para auxiliar na concepção de jogos digitais” . ESTE TRABALHO FOI APRESENTADO À PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO DO CENTRO DE INFORMÁTICA DA UNIVERSIDADE FEDERAL DE PERNAMBUCO COMO REQUISITO PARCIAL PARA OBTENÇÃO DO GRAU DE MESTRE EM CIÊNCIA DA COMPUTAÇÃO.. ORIENTADOR: SILVIO ROMERO LEMOS MEIRA, D.Sc. CO-ORIENTADOR: ANDRÉ M. MARQUES DAS NEVES, D.Sc.. RECIFE, JULHO/2011.

(3)

(4)

(5) Dedico este trabalho a meu filho, Augusto César..

(6) AGRADECIMENTOS. Ao meu marido, Jaildes, pelo apoio e incentivo. Ao meu filho, Augusto César, pelas horas que tive de deixá-lo para dedicar-me a conclusão deste trabalho. A minha mãe, Sônia, minhas irmãs, Isabel e Poliana e meu sobrinho, José Luiz, por sempre estarem ao meu lado e servirem de incentivo nos momentos mais difíceis durante este processo. Ao meu pai, Luis, que faleceu sem chegar a ver esta minha conquista, mas que sempre deixou claro seu orgulho. A Ricardo, por confiar e incentivar a ir sempre além nos meus estudos. A Silvio Meira e André Neves, pela orientação, que foi essencial ao desenvolvimento deste trabalho. Aos amigos, Francisco Oliveira, Anderson Rocha, Simone Araujo, Francisco Melo, Milton, Márcio, Camila e João. A André Marllus pela força enorme que deu, ajuda importante na hora certa. A Noca e Jane, que muitas vezes cuidaram do meu filho para eu poder escrever e implementar. A todos, meu sincero obrigada..

(7) RESUMO A Indústria de Jogos Digitais é um mercado em constante ascensão. Essa perspectiva destaca o interesse teórico e empírico de muitos pesquisadores com jogos digitais, apresentando algumas questões, debates sobre metodologias e aspectos teóricos. Um dos maiores desafios no desenvolvimento de jogos é a concepção, etapa essencial no ciclo de produção de um jogo, que é muitas vezes deixada de lado. Outro problema é que há pouca preocupação com pesquisa do usuário e experiência de uso do jogador, o que se configura num problema mais humano do que técnico. XDM, denominada eXtensible Design Methods é uma metodologia desenvolvida nos últimos anos no Departamento de Design da UFPE, que visa ajudar na concepção de jogos e artefatos digitais e possui abordagem centrada no usuário através da técnica personas. A importância de focar na experiência do usuário é que o segredo de um bom projeto é conhecer bem as pessoas que irão usufruir do mesmo. O presente trabalho dá enfoque a implementação de um sistema, o PersonaWeb, que cria personas de forma automática, levando em consideração algumas particularidades que compõem seu cenário, resultando em cartas, que são úteis na metodologia XDM.. Palavras-chave: Jogos digitais – Metodologia de design – XDM – Personas.

(8) ABSTRACT The Digital Game Industry is a constantly ascending market. This perspective highlights the theoretical and empirical interest of many researchers with digital games, featuring some questions, discussions on methodologies and theoretical aspects. One of the biggest challenges in game development is the design, essential step in the production cycle of a game, which is often overlooked. Another problem is that there is little concern with user research and user experience of the player, which configures a problem more human than technical. XDM, called eXtensible Design Methods is a methodology developed in recent years in the Departamento de Design of UFPE, which aims to help in the design of games and digital artifacts and features user-centered design through the personas technique. The importance of focusing on the user experience is that the secret of a good design is to know the people who will enjoy it. This paper focuses the implementation of a system, the PersonaWeb, which automatically creates personas, taking into account some peculiarities that make its scenario, resulting in cards, which are useful in the methodology XDM.. Keywords: Digital Game – Design Methodology – XDM – Personas.

(9) SUMÁRIO . 1 . INTRODUÇÃO............................................................................................ 13 1.1 1.2 1.3 . 2 . Motivação ................................................................................................................. 13 Objetivo .................................................................................................................... 14 Estrutura do Trabalho ............................................................................................... 14. MÉTODOS GERAIS DE DESIGN ............................................................. 16 2.1 Métodos de design .................................................................................................... 16 2.1.1 Asimov ................................................................................................................. 16 2.1.2 Lobach .................................................................................................................. 16 2.1.3 Jones ..................................................................................................................... 17 2.2 Metodologias de Design para Jogos ......................................................................... 17 2.2.1 Tim Hutsman ........................................................................................................ 18 2.2.2 Pascal Luban ......................................................................................................... 19 2.2.3 Eric Zimmerman ................................................................................................... 20 2.2.4 Ernest Adams e Andrew Rollings ........................................................................ 20 2.2.5 Brathwaite e Ian Schreiber ................................................................................... 21 2.3 XDM WEB – GDRLab UFPE ................................................................................. 22 2.4 Considerações finais ................................................................................................. 24. 3 . PERSONAS.................................................................................................. 25 3.1 Sobre a técnica .......................................................................................................... 25 3.2 Cards Persona ........................................................................................................... 28 3.2.1 Inspiração ............................................................................................................. 28 3.2.2 Descrição do modelo ............................................................................................ 29 3.2.3 Cartas .................................................................................................................... 30 3.2.4 Limitações ............................................................................................................ 30 3.3 Considerações finais ................................................................................................. 32. 4 . KDD E MINERAÇÃO DE DADOS ........................................................... 33 4.1 Descoberta de Conhecimento em Bases de Dados ................................................... 33 4.2 Mineração de dados .................................................................................................. 34 4.2.1 Classificação ......................................................................................................... 35 4.2.2 Regressão .............................................................................................................. 36 4.2.3 Agrupamento (Clustering).................................................................................... 37 4.3 Considerações finais ................................................................................................. 39. 5 . PERSONAWEB ........................................................................................... 40 5.1 Recursos utilizados pela PersonaWeb ...................................................................... 40 5.1.1 Weka ..................................................................................................................... 40 5.1.2 SimpleKmeans ...................................................................................................... 42 5.1.3 IMDB .................................................................................................................... 43 5.1.4 LastFM ................................................................................................................. 44 5.2 Descrição da ferramenta ........................................................................................... 45 5.2.1 Primeira fase – Pré-processamento....................................................................... 47 5.2.2 Segunda fase – Mineração dos dados ................................................................... 48 .

(10) 5.2.3 Terceira fase – Interpretação e construção das cartas........................................... 49 5.3 Arquitetura ................................................................................................................ 51 5.4 Fluxo Navegacional .................................................................................................. 52. 6 . ESTUDO DE CASO .................................................................................... 58 6.1 6.2 6.3 . 7 . CONSIDERAÇÕES FINAIS ....................................................................... 68 7.1 7.2 . 8 . Olimpíadas de Jogos Digitais e Educação ................................................................ 58 Características da base de dados............................................................................... 58 Utilizando o PersonaWeb ......................................................................................... 58. Contribuição ............................................................................................................. 69 Trabalhos Futuros ..................................................................................................... 69. REFERÊNCIAS ........................................................................................... 70 .

(11) LISTA DE FIGURAS. Figura 1: Etapas do desenvolvimento de jogos ................................................................... 17. Figura 2: Processo iterativo de design ................................................................................. 19. Figura 3: Processo de design de jogos digitais .................................................................... 20. Figura 4: Tela da ferramenta XDM WEB (Persona e seu cenário) ...................................... 22. Figura 5: Tela do XDM Web completa ............................................................................... 22. Figura 6: Fragmento de persona apresentada na forma tradicional .................................... 24. Figura 7: Exemplo da carta de um planeswalker Jace Belen ............................................... 27. Figura 8: Exemplo da carta principal ................................................................................. 29. Figura 9: Exemplo de cartas auxiliares ............................................................................... 29. Figura 10: Etapas do processo de KDD ............................................................................. 32. Figura 11: Exemplo de uma árvore de decisão ................................................................... 36. Figura 12: Exemplo de um arquivo arff .............................................................................. 37. Figura 13: Fluxograma do Algoritmo K-means .................................................................. 40. Figura 14: Fragmento dos métodos da API da LastFM ...................................................... 41. Figura 15: Arquitetura PersonaWeb ................................................................................... 42. Figura 16: Fases do PersonaWeb ........................................................................................... 44 Figura 17: Fase de pré-processamento – PersonaWeb ........................................................ 46. Figura 18: Fase de mineração de dados – PersonaWeb ....................................................... 47. Figura 19: Arquivo de saída do SimpleKmeans ................................................................. 47. Figura 20: Fase de interpretação e visualização – PersonaWeb .......................................... 48. Figura 21: Tela inicial PersonaWeb ..................................................................................... 49. Figura 22: Tela pré-processamento do PersonaWeb ........................................................... 49. Figura 23: Tela para preenchimento das imagens das cartas .............................................. 52. Figura 24: Tela para escolha da imagem da carta principal ................................................ 52. Figura 25: Tela Final do PersonaWeb ................................................................................. 53. Figura 26: Arquivo Arff da base da OJE ............................................................................ 58.

(12) LISTA DE TABELAS Tabela 1: Exemplo de uma base de dados .......................................................................... 33.

(13) LISTA DE QUADROS. Quadro 1: Atributos relevantes e atributos excluídos ............................................................ 55.

(14) LISTA DE GRÁFICOS. Gráfico 1: Quantidade e porcentagem dos clusters obtidos ................................................ 58.

(15) LISTA DE ABREVIAÇÕES. UFPE. Universidade Federal de Pernambuco. GDRLab. Game Design Research Lab. UPA. Usability Professionals' Association. OJE. Olimpíada de Jogos Digitais e Educação. KDD. Knowledge discovery in databases. WEKA. Waikato Environment for Knowledge Analysis. ARFF. Attribute-Relation File Format. XML. eXtensible Markup Language. API. Application Programming Interface. ISO. International Organization for Standardization. IMDB. Internet Movie Database. JSF. JavaServer Faces. JDBC. Java Database Connectivity.

(16) 13. 1. INTRODUÇÃO. Este capítulo relata as principais motivações para realização deste trabalho, mostra o objetivo e, mostra como está estruturada o restante desta dissertação.. Motivação O jogo é uma forma de prazer e divertimento mais primitivo do que a cultura [HUIZINGA 2007]. É um processo essencial na socialização e formação da personalidade do indivíduo [BRIGHETTI 2003]. Na década de 70, surgiram os jogos digitais. A sua propagação se deu devido ao surgimento de consoles em espaços domésticos, que serviam de plataforma para sua execução. Aarseth destaca um amplo interesse pelos jogos digitais [AARSETH 2003]. Essa perspectiva destaca o interesse teórico e empírico de muito pesquisadores com jogos digitais, cada um apresentando debates sobre metodologias, perspectivas teóricas e questões que buscam responder sobre o mesmo [BRYCE e RUTTER 2006]. Entre os três maiores desafios no desenvolvimento de jogos, está o processo de concepção de jogos, etapa muito importante no ciclo de produção de um jogo, que é muitas vezes deixada de lado e que é essencial para maturidade da empresa [LUBAN 2006]. Neste trabalho são mostradas algumas metodologias de desenvolvimento de jogos, que mostram estudos relacionados ao desenvolvimento, onde é possível ver algumas dificuldades no projeto do jogo, como pouca preocupação com a experiência de uso do jogador. Também será mostrada uma metodologia, resultado de pesquisas desenvolvidas nos últimos anos no Departamento de Design da UFPE, denominada eXtensible Design Methods - XDM. XDM é um processo de design adequado à contemporaneidade cibernética [NEVES 2008]. Visa ajudar na concepção de jogos e artefatos digitais (foco inicial da ferramenta). Possui abordagem de concepção centrada no usuário, onde a primeira fase da metodologia abrange pesquisa com o usuário. Inserida na mesma, está a técnica de personas, objeto de estudo do presente trabalho, que são arquétipos, cuja metas e padrões de comportamento, servem como guia para orientação das decisões sobre recursos do produto, navegação, interação e até mesmo design visual [GOODWIN 2001]. O Estado de Pernambuco possui por volta de 10 empresas de jogos, dentre elas se destacam a Manifesto, a i2, a Playlore, a Preloud, a Meantime, a Jynx. A OJE - Olimpíadas.

(17) 14. de jogos de Pernambuco [NEVES 2009] é um consórcio formado pela Jynx, Manifesto, Meantime e CESAR, através da parceira do Porto Digital com a UFPE. É um empreendimento do Estado de Pernambuco com o Porto Digital, voltado para alunos e professores da rede de ensino, desenvolvido em forma de uma gincana de jogos digitais, onde o principal interesse é estimular o aprendizado e participação dos alunos e já conta com mais de 100.000 usuários online [OJE]. O Departamento de Design da UFPE, através do GDRLab, motiva-se a fazer pesquisas de métodos e ferramentas que venham a melhorar a competitividade das empresas de jogos pernambucanas [NEVES 2009]. A metodologia XDM, citada anteriormente, é o resultado de uma dessas pesquisas. Essa metodologia utiliza a técnica de personas através do modelo Cards Persona. Sendo que o mesmo possui limitações quanto à criação das personas, pelo fato de todo o processo ser manual, o que acarreta dificuldades tanto na geração das personas, quanto na análise e visualização dos dados, caso se tenha uma amostra grande. O presente trabalho irá desenvolver uma melhoria para essa metodologia, o qual automatizará a criação dessas personas, fazendo uso da base de dados do Consórcio da Olimpíada de Jogos Digitais e Educação. A solução proposta possui um processo próprio de pré-processamento, interpretação e criação das personas, essa última com base na metodologia XDM, e a fase de mineração de dados implementada a partir da API da Weka.. Objetivo Esta pesquisa tem como objetivo automatizar a construção de personas, no intuito de auxiliar na concepção de jogos digitais, através do uso da solução proposta na metodologia XDM WEB.. Estrutura do Trabalho Este trabalho será apresentado da seguinte forma: o capítulo 2 discorre sobre o estado da arte: metodologias de design, metodologias de design para jogos e personas. O capítulo 3 fala sobre Personas e o modelo Cards Persona. O capítulo 4 faz uma explanação sobre o Processo de Descoberta de Conhecimento em Base de Dados e descreve a ferramenta proposta neste trabalho, PersonaWeb, enquanto que o capítulo 5 mostra os resultados obtidos.

(18) 15. na aplicação da base de dados da OJE na ferramenta PersonaWeb. E o capítulo 6 faz algumas considerações finais..

(19) 16. 2. MÉTODOS GERAIS DE DESIGN Este capítulo irá abordar de forma geral métodos de design e metodologias de design. para jogos. Métodos de design Os primeiros estudos sobre métodos de design começaram na década de 60, devido a complexidade de desenvolvimento de um novo produto, que dava maior responsabilidade ao designer sobre a sua concepção [VAN AKEN 2005]. Todo esse período teve suas gerações, a que o processo de design era estruturado de forma linear, em seguida veio a geração em que as fases eram cíclicas. Com as pesquisas em metodologia e o amadurecimento da atividade do design, vêem-se agora métodos centrados no usuário, argumentativos, orientados pela satisfação, onde contam com o usuário como parceiro. Algumas metodologias de design existentes na literatura e seus respectivos autores serão apresentados a seguir.. Asimov Modelo prescritivo, composto por três fases, sendo que dentro de cada fase há os procedimentos de análise, sintetização, avaliação, decisão, aperfeiçoamento e revisão [ASIMOV 1962]. I.. Levantamento das necessidades do projeto e definição de parâmetros de design. Geração de alternativas analisadas pela viabilidade econômica;. II. III.. Preliminar de design. Escolha da solução que tem o melhor conceito; Linha e produção. Elaboração de detalhes menores do design e criação e avaliação de um protótipo.. Lobach Divide o processo de design em quatro fases referente à fase de concepção. I.. Análise do problema. Levantamento das variáveis do projeto e suas influências para a configuração do novo produto;.

(20) 17. II.. Geração de alternativas. Busca das melhores idéias para solução do problema, devem fluir livremente, fazendo uso de todo um processo criativo;. III.. Avaliação das alternativas. As idéias geradas são analisadas até que ocorra a escolha da melhor solução;. IV.. Realização da solução. Construção do primeiro protótipo com documentação contendo suas especificações técnicas.. Esse processo é iterativo, as fases interagem entre si com avanços e retrocessos [LOBACH 2001].. Jones Divide o processo de concepção em três fases: análise (dividir o problema em pedaços), síntese (reagrupar os problemas de várias maneiras) e avaliação (testes da aplicação prática de cada novo reagrupamento). Jones [JONES 1992] denomina essas fases em: I.. Divergência. Testar a estabilidade e instabilidade de tudo que está ligado ao produto, a fim de identificar possíveis caminhos a serem seguidos junto aos usuários, mercado, produtores e patrocinadores do projeto;. II.. Transformação. O projeto deve ser guiado de acordo com uma idéia central. Objetivos e limites do projeto são definidos. Nessa fase ocorre a divisão do problema em sub-problemas a fim de quebrar a complexidade;. III.. Convergência. Agrupamento das informações colhidas, redução de incertezas secundárias, a fim de escolher dentre as várias alternativas a que será realizada.. Compreender as falhas que um novo produto poderá apresentar e tentar corrigi-las, a fim de evitar um aprendizado tardio é um dos principais benefícios de fazer uso de metodologias de concepção [JONES 1992].. Metodologias de Design para Jogos Esforços vêm sendo feito quanto a métodos que melhor contribuam para a concepção, desenvolvimento e avaliação ao longo do processo de um jogo. Braimstorming, Game Design, Document Design, Cronograma, Level Design, Beta, Teste, Versão final e Demo são as.

(21) 18. etapas de desenvolvimento de um jogo [PERUCIA 2005]. Essas etapas podem ser visualizadas na Figura 1.. Figura 1: Etapas do desenvolvimento de jogos [AMAZONAS 2007] Serão mostradas a seguir opiniões de autores que apresentam trabalhos relacionados a alguma das etapas do processo de desenvolvimento de jogos.. Tim Hutsman Divide o processo de design em três seções: o que fazer para preparar um jogo, o que pensar enquanto está fazendo o jogo, e o que necessita para definir o mesmo, ou seja, o que fazer, em que pensar e como avaliar necessidades. Para saber o que precisa para o jogo, é necessário ter um conhecimento do que está acontecendo ao redor. Conhecer o mercado, saber o que a empresa quer ou o que não quer. É uma fase para perguntas, tipo: quais as tendências atuais, o que os jogadores estão procurando (ter uma idéia sobre o que as pessoas querem) e quais ferramentas atuais se tem acesso. Pensar é estar envolvido com o processo de concepção. É estar atento a detalhes como: boa quantidade de conteúdo, equilíbrio entre níveis de dificuldades. O autor destaca ainda que para se ter uma visão geral dos riscos e minimizá-los é necessário vincular o game design com orçamento de projeto e tempo. Avaliar.

(22) 19. as necessidades nada mais é do que ver o que é preciso para se chegar à definição do jogo [HUTSMAN 2000]. Hustman dá ainda algumas dicas, como: • não se deve complicar um jogo, quando dá para ajudar através de enredo, regras e controles, tentar reutilizar o que de melhor já foi implementado em outros jogos; • deixar o controle com o jogador, evitando explicações que em nada contribuem; • ter conhecimento de todos os tipos de controles que o usuário terá para jogar, e avisar antes ao usuário, caso ocorra alguma quebra ou se estabeleça novas regras. “Não se é um bom design apenas quando se tem um bom conjunto de idéias, e sim quando se consegue implementá-las”. Pascal Luban Diante das divergências de opiniões entre os envolvidos no projeto do jogo, Luban propõe um método para promover o processo de criatividade, construindo um consenso na equipe, tentando identificar as melhores escolhas. Procura-se deixar a etapa de concepção mais transparente, permitir a todos os envolvidos ver o que e como se estão produzindo idéias. O método está dividido em quatro etapas. 1ª etapa – definir objetivos e organizá-los: aqui ocorre a preparação da equipe. 2ª etapa – identificar os parâmetros e pesquisar seus valores: ou seja, identificar as características do jogo e valores associados. Essa é uma etapa importante, e deve haver clareza entre os parâmetros. 3ª etapa – filtragem de idéias e definição de preferências: na etapa anterior é feita uma pesquisa de valores para os parâmetros. Na etapa atual é feita uma análise de combinação entre os valores de cada parâmetro, onde ocorre a exclusão de pares de valores incompatíveis e a definição de preferências por pares de valores que parecem promissores. 4ª etapa: análise de hipóteses de acordo com prioridades: estabelece um conjunto de critérios a fim de definir o melhor conceito possível. Em seguida, atribui-se pesos a cada critério. Posteriormente, ocorre a conciliação das hipóteses, já que podem ocorrer divergências, daí cada hipótese deve ser avaliada por ângulos diferentes: tanto os gestores quanto os jogadores. E após a melhor escolha, a hipótese conceitual do jogo poderá ser detalhada com segurança, já que conta com o respaldo de todos da equipe [LUBAN 2001]..

(23) 20. Eric Zimmerman Zimmerman busca desenvolver um jogo através de um ciclo iterativo, baseado na prototipação, análise e refinamento ao longo do processo até se encontrar o estágio ideal. O processo iterativo está representado na Figura 2. O design iterativo em jogos significa playtesting, ou seja, jogar o jogo. Durante o processo de concepção e desenvolvimento do jogo, ele precisa ser jogado, seja pela equipe, pelo design, por outras pessoas do escritório, visitantes, o objetivo nesse caso é observar e questionar e em seguida ajustar e testar novamente. Esse processo iterativo irá resultar em um produto robusto e bem sucedido. É importante ter a experiência dos jogadores jogando. Isso possibilita a investigação e experimentação, permitindo a descoberta de respostas para perguntas que nem se tinha idéia, tornando uma poderosa forma de pesquisa em design [ZIMMERMAN 2003].. Prototipar. Refinar. Analisar. Figura 2: Processo iterativo de design [ZIMMERMAN 2003]. Ernest Adams e Andrew Rollings Game design é o processo de: imaginar um jogo, definir a forma como ele funciona, descrever os elementos que compõem o jogo e transmitir as informações para a equipe que construirá o jogo. A concepção do jogo requer tanto criatividade quanto planejamento cuidadoso. O game design reúne as melhores idéias de uma equipe. A metodologia proposta.

(24) 21. por esses autores é a de criação de jogos centrado no jogador. A concepção de um jogador imaginário permite que o designer tenha a tarefa de entreter e criar empatia junto ao mesmo [ADAMS e ROLLINGS 2006]. Ao se produzir um jogo com uma abordagem centrada no usuário, deve-se evitar dois erros: o primeiro é pensar que quem está produzindo o jogo é o próprio jogador. O que deve ser feito são pesquisas que mostrem o público a ser atingido. O segundo erro é ter o jogador como oponente. Hoje os jogos são vistos como ferramentas de passatempo, forma de entretenimento, ou seja, além dos desafios, procura-se socialização e interação entre os jogadores. Concepção (definição do estilo, gênero, público-alvo, papel do jogador e criação do mundo ficcional), elaboração (define a maior parte de detalhes do jogo, adiciona características se necessário– e gera testes para todos esses conceitos) e ajuste (pequenos ajustes - exclui ou melhora alguns conceitos). São os três estágios do processo de design centrado no jogador proposto por Adam e Rollings, como mostra a Figura 3.. Concepção. Elaboração. Ajuste. Figura 3: Processo de design de jogos digitais [ADAMS e ROLLINGS 2006]. Brathwaite e Ian Schreiber Focalizam mais no mercado e sugerem uma pesquisa de público-alvo para o jogo, tanto na fase inicial como na fase de desenvolvimento. Indicam questões chaves a serem respondidas, como: foco de audiência e classificação pretendida pelo jogo, existência da pré-.

(25) 22. concepção de gênero ou categoria e se existe alguma particularidade que se deseja ver no jogo [BRATHWAITE e SCHREIBER 2009].. XDM WEB – GDRLab UFPE. O Departamento de Design da UFPE, através do GDRLab, motiva-se a fazer pesquisas de métodos e ferramentas de design aplicados à concepção de mídia digital, com ênfase em jogos digitais [NEVES 2009]. A metodologia XDM, é o resultado de uma dessas pesquisas. eXtensible Design Methods –XDM é uma metodologia que auxilia o processo de concepção de jogos e artefatos digitais. Possui uma abordagem centrada no usuário e é inspirada nos jogos de cartas colecionáveis. O conceito de extensible dessa metodologia está relacionado ao fato de que o design pode utilizar sub-conjuntos dos métodos que a mesma possui, como também adicionar novos [NEVES 2008]. Esta metodologia ganhou uma versão digital, com o objetivo de criar jogos digitais de forma mais simples e rápida, a XDM WEB. Essa ferramenta inicia-se com a escolha da persona apropriada. Cada persona é bem detalhada, composta de outras cartas que constituem seu cenário, como: filmes, lugares, hobbies e músicas, a Figura 4 mostra essa tela. Essas cartas foram criadas de acordo com o modelo Cards Persona (será detalhado no próximo capítulo). Depois da seleção da Persona, os designers escolhem referências para o produto a ser criado, e a mesma é classificada com os mesmos conceitos antagônicos da etapa anterior, fazendo assim uma associação às preferências da persona. A etapa seguinte às referências é a escolha aleatória das cartas de biônica e cinética – apresentam elementos externos para servirem de inspiração na composição do produto. Todas as cartas servirão para montar a Caixa Morfológica, apresentada na Figura 5, também chamada de Creative Board, que tem a persona como centro, a fim de oferecer subsídios para a criação livre de várias alternativas [NETO 2010]..

(26) 23. Figura 4: Tela da ferramenta XDM WEB (Persona e seu cenário). Figura 5: Tela do XDM Web completa [NETO 2010].

(27) 24. Considerações finais Neste capítulo foram apresentadas de forma geral as metodologias de design e metodologia de design para jogos. Com o amadurecimento das atividades de design, é possível notar a inserção de novos métodos com foco no usuário. Como também em relação a jogos, métodos que melhor contribuam para o processo de desenvolvimento, desde a concepção até a avaliação. Dentre as metodologias de jogos, foi apresentada a XDMWEB, metodologia que possui abordagem centrada no usuário, utilizando a técnica personas, através do modelo Cards Persona. No capítulo seguinte será apresentada esta técnica. Como também será mostrado o modelo Cards Persona – descrição, inspiração e limitações..

(28) 25. 3. PERSONAS. Sobre a técnica A técnica Personas foi introduzida por Alan Cooper, no livro The Inmates are Running the Asylum, em 1998, como um instrumento prático de design de interação. Ganhou rapidamente popularidade por seu poder e eficácia [COOPER 2003]. Persona é um arquétipo do usuário que ajuda a orientar as decisões quanto a recursos, navegação, interação e design visual. Ao se projetar para esse arquétipo, as metas e padrões estando bem compreendidos, poderá ocorrer a satisfação do grupo [GOODWIN 2001]. Os arquétipos que Personas representam são compostos com base em dados recolhidos a partir do comportamento de usuários reais em entrevistas etnográficas. Apesar de possuir um conceito simples, deve ser aplicado com uma sofisticação, já que personas identificam padrões significativos no comportamento do usuário [COOPER, REIMANN e CRONIN 2007]. Um exemplo de persona pode ser visualizado na Figura 6. Personas possibilitam construir suposições e conhecimento sobre usuários, tornando significativa a comunicação da equipe sobre o usuário, o que vem a evitar que a equipe de desenvolvimento use o seu próprio perfil de especialista no projeto. É possível projetar para um pequeno número de usuários específicos, porém atendendo uma grande quantidade de usuários [PRUITT e ADLIN 2006]. Quesenbery [QUESENBERY 2004] afirma que personas poderiam ser compostas de informações da própria equipe, como também incrementá-las com histórias verdadeiras ou fictícias. O que vem a ser discordado por Pruitt e Adlin [PRUITT e ADLIN 2006] que defendem informações reais dos usuários para definição das personas. Como ferramenta de design, Personas ajudam a determinar [COOPER, REIMANN e CRONIN 2007]: • o que um produto deve fazer e como se comportar; • a comunicação entre partes interessadas, programadores, designers e outros; • a manter o design centrado no usuário nas etapas do processo; • a eficácia do projeto e contribuem para outras ações relacionadas com o produto, como marketing e vendas..

(29) 26. Figura 6: Fragmento de persona apresentada na forma tradicional [PRUITT; ADLIN, 2006] Dois processos de criação de personas serão descritos a seguir. O primeiro é baseado na identificação de padrões entre usuários, definindo tipos que possibilitam a organização e prioridade de cada persona [COOPER, REIMANN e CRONIN 2007]. O segundo considera esse primeiro processo, porém aplicado em um ciclo de vida [PRUITT e ADLIN 2006]. O primeiro processo é resultado da aplicação da técnica na Empresa Cooper, que define os seguintes passos [COOPER, REIMANN e CRONIN 2007]: • Identificação de variáveis comportamentais (atividades: o que o usuário faz e com que frequência; atitudes: pensamento do usuário sobre o domínio do produto e da tecnologia; aptidões: nível educacional, treinamento e capacidade de aprendizado do usuário; motivação: porque o usuário está comprometido com o domínio do produto e habilidades: capacidade do usuário em relação ao domínio do produto);.

(30) 27. • Mapeamento dos entrevistados com as variáveis comportamentais (mapear cada usuário com cada variável, a fim de agrupar comportamentos semelhantes); • Identificação de padrões comportamentais significativos; • Sintetizar características e objetivos relevantes (detalhar dados de cada padrão significante, neste momento define nome, sobrenome e ilustração); • Verificar. redundância. e. completude. (identificar. falhas. e. remover. redundâncias); • Expandir descrição de atributos e comportamentos (narrar em terceira pessoa para equipe atitudes, necessidades e problemas das personas); • Definir tipos de personas (primária: representa o alvo primário para o design de interface; secundária: necessidades adicionais de usuários que podem ser adicionados ao produto sem interferir na primária; suplementar: nem são primários nem secundários e sim suplementares; cliente: necessidade de clientes e não de usuários finais; servida: usuários afetados pelo uso do produto; negativa: tipos específicos de usuário o qual o produto não serve). O segundo divide o ciclo de vida da Persona em cinco fases. É um processo cíclico com etapas sequenciais [PRUITT e ADLIN 2006]. • Planejamento familiar: - criar uma equipe que irá trabalhar na construção de personas, - pesquisar a própria empresa para avaliar problemas e necessidade, pesquisa do usuário e identificação de dados que servirá para construção das personas; • Concepção e gestação: - quantas personas serão necessárias criar, comunicar as informações chaves, - que qualidades e elementos descritivos serão inclusos no documento de personas, - priorizar e validar as personas, - decidir quais personas estão prontas para ser introduzida na equipe de produção; • Aniversário e maturação: - organizar as atividades de aniversário, maturação e maioridade, - introduzir as personas na equipe, - assegurar a compreensão, respeito e uso das personas, - gerenciar pequenas mudanças sem que seja mudado o foco da persona;.

(31) 28. • Maioridade: - trabalhar a persona junto com o grupo, - usar as personas para ajudar no planejamento, produção e avaliação do produto; • Realização de tempo de vida e aposentadoria: - avaliar a efetividade do método e avaliar reuso ou aposentadoria para um próximo projeto. Personas permitem identificar grupos distintos de usuários e construir usuários fictícios para representar cada grupo [CALABRIA 2004]. Por isso é melhor manter um número pequeno de personas, já que um grande conjunto poderá se tornar problemático. Vantagens no uso de personas: metas e necessidades do usuário tornam-se ponto comum para equipe; são rápidos para desenvolver e trocar necessidades de usuários; ajudam a criar o que o usuário irá verdadeiramente fazer uso; priorizam esforços de design; diminuem as diferenças de opiniões; diminuem a frequência dos testes de usabilidade, já que podem avaliar com o uso das mesmas [CALABRIA 2004]. Problemas como os descritos a seguir podem ser observados quando as personas não são bem construídas ou não aplicadas ao projeto: não aceitação do líder da equipe, quando as personas não possuem credibilidade ou quando a equipe não sabe utilizá-la de forma eficiente [PRUITT e ADLIN 2006]. Persona funciona muito bem, por ser poderosa quanto à criação de modelos do público alvo. Tendo a capacidade de prever comportamentos, poderão fazer inferências sobre como os usuários irão reagir à escolha de design feita [KREITZBERG e LITTLE 2009].. Cards Persona. Nesta seção será apresentado o modelo Cards Persona, utilizado para inserção das personas na metodologia XDM.. Inspiração Personas foi o método escolhido como base para esta técnica. No entanto, a mesma apresentava carência quanto a ter pouca quantidade de imagens e ilustrações, como também não ter reaproveitamento dos dados. Para suprir a questão de imagens e ilustrações levou-se em consideração abordagens propostas por Baxter (1998) e Chipchase (2009), ambos.

(32) 29. descreviam hábitos e escolhas de pessoas com imagens ao invés de palavras. Com a inserção de imagens tornou-se maior a ficha de personas, tornando mais difícil a reutilização dos dados. A solução para isso veio através da inspiração das cartas do jogo “Magic the Gathering”. A carta desse jogo é composta por características básicas do personagem como nome, imagem, atributos, poderes, etc. Junto com esta carta, são inseridas na mesa de jogo cartas de tipos variados como: itens, magias, terrenos, etc [MAGIC THE GATHERING 2007]. Exemplo na Figura 7.. Figura 7: Exemplo da carta de um planeswalker Jace Belen [OLIVEIRA 2010] Característica deste jogo utilizada no método Cards Persona: a carta principal. O método teria como carta principal a persona em si, contendo nome, foto e características básicas, como mostra a Figura 8, e também códigos correspondentes a cartas auxiliares (variáveis definidas inicialmente no processo: lugar, roupa, filme, etc), como mostra a Figura 9.. Descrição do modelo A confecção de um conjunto de cartas de Personas segue os seguintes passos [OLIVEIRA 2010]:.

(33) 30. 1. Definição das categorias (cartas) auxiliares à persona – define características do conjunto a ser criado, a partir disso saberá a quantidade dos conjuntos de cartas auxiliares serão necessárias. Essa fase serve como base para criação de perguntas para fase seguinte; 2. Pesquisa com usuários – nessa fase entra-se em contato com o usuário através de técnicas como: questionário, entrevistas, observação, etnografia visual, entre outras; Uma vez que já se tenha características bem definidas e as técnicas de pesquisa bem preparadas pode começar a terceira fase. 3. Compilação e resumo dos dados sobre os usuários – aqui os dados são compilados, numa planilha ou banco de dados, para através da análise dos mesmos possa gerar gráficos e relatórios. Com essa compilação se obtém o esboço de futuras personas e cabe ao analista fazer uma divisão coerente para que não sejam geradas personas em excesso ou em quantidade escassa; 4. Elaboração das cartas – aqui o responsável faz a coleta de dados gerados nas fases anteriores e faz uma interpretação a fim de que se possam escolher imagens que melhor representem as características do grupo de usuários.. Cartas Uma equipe de design gráfico do GDRLab, desenvolveu um modelo para as cartas que serve tanto para a persona quanto para as cartas auxiliares. A carta principal, que tem a imagem da pessoa, se diferencia das auxiliares apenas por conter uma seção destinada a códigos (formados por uma letra e dois dígitos numéricos, que relaciona a carta principal com as auxiliares).. Limitações A forma atual de se construir o Cards Persona é manual, tem-se que entrevistar pessoalmente potenciais usuários, selecionar as entrevistas com o nível de respostas mais completas, o agrupamento dos dados é realizado sem critério formal, tem que construir tabelas digitando cada dado a fim de obter informações e ainda construir as cartas colocando códigos,.

(34) 31. nome e descrição manualmente e copiando resultados para fazer buscas por imagens. Claro, sem deixar de comentar, que por ser um trabalho manual, é trabalhoso agrupar grandes amostras.. Nome. Código. Foto / Ilustração. Descrição. Figura 8: Exemplo da carta principal. Figura 9: Exemplo de cartas auxiliares.

(35) 32. Considerações finais Neste capítulo foi apresentada a técnica personas, base para o modelo Cards Persona. Esse modelo é utilizado para agrupar usuários de forma a obter um usuário-modelo que represente um grupo. Sendo que possui limitações quanto a poder analisar pequenas amostras, já que é inviável ao homem analisar, relacionar e interpretar muitos dados sem o auxílio de ferramentas computacionais adequadas. No próximo capítulo será explicado o Processo de Descoberta de Conhecimento em Base de Dados, que é um processo para identificar padrões a partir de grandes bases de dados..

(36) 33. 4. KDD E MINERAÇÃO DE DADOS. Atualmente, os progressos na área da tecnologia da informação proporcionam o desenvolvimento de sistemas de diversas naturezas e possibilitam o armazenamento de grandes volumes de dados. Presume-se que haja informações úteis a serem extraídas dessas grandes bases de dados de forma a oferecer as organizações conhecimento para futuras tomadas de decisões. Para analisar, interpretar e relacionar os dados, o homem precisa da ajuda de ferramentas computacionais adequadas, devido à dificuldade do mesmo em encontrar informações úteis sem automatização. Serão apresentados nesta seção os processos de KDD e Mineração de dados, que auxiliam o homem nessas tarefas. Apesar de alguns autores considerarem os dois como sinônimos, este trabalho adota a definição de Fayyad [FAYYAD 1996], de que KDD é o processo global de descoberta de conhecimento útil a partir de dados, enquanto mineração de dados é a aplicação de algoritmos específicos para a extração de padrões de dados. O objetivo desta seção é apresentar uma introdução às etapas do processo de KDD, processo capaz de descobrir conhecimento útil em grandes bancos de dados, e uma introdução à mineração de dados, etapa em que ocorre a extração de padrões dos dados. Serão apresentadas algumas das principais tarefas de mineração de dados: classificação, regressão e agrupamento; e algumas técnicas para a aplicação dessas tarefas como redes neurais, algoritmos genéticos e árvores de decisão.. Descoberta de Conhecimento em Bases de Dados. O armazenamento em bases de dados de grandes quantidades de dados tornou-se uma prática considerada comum e essencial nos dias de hoje em diversas organizações. Isso ocasiona uma grande possibilidade de existência de informações preciosas entre esses dados. A exploração dessas bases de dados à procura de conhecimento implícito caracteriza o termo KDD. Fayyad [FAYYAD 1996] diz que KDD é um processo, de etapas seqüenciais, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes bases de dados..

(37) 34. Para o bom entendimento de tal definição torna-se necessário dar uma explicação individual de alguns dos termos usados. O processo é interativo, pois necessita do homem como responsável, é iterativo por possuir etapas seqüenciais e possibilitar retorno as etapas anteriores. Por padrões válidos entenda-se conhecimento válido e verdadeiro, e por padrões novos a agregação de novos conhecimentos aos já existentes, o conhecimento útil é o que pode ser usado para beneficiar o contexto aplicado ao processo de KDD. As etapas do KDD consistem na etapa de pré-processamento, mineração de dados e pós-processamento, conforme mostrado na Figura 10. Na etapa de pré-processamento ocorre a seleção, limpeza e tratamento dos dados. A seleção dos dados ocasiona a escolha das instâncias e atributos relevantes para o processo. A limpeza permite a qualidade dos dados, possibilitando o preenchimento dos dados incompletos (ausência de valores), a correção de dados ruidosos, ou seja, dados que contenham valores disparatados (outliers) e a verificação de dados inconsistentes, que possuam alguma discordância entre si. Em seguida, ocorre o tratamento dos dados, que normaliza e reduz a dimensionalidade dos dados – caso variáveis excedam capacidade dos algoritmos de aprendizagem – para serem adequadamente utilizados pelos algoritmos. Após o pré-processamento dos dados, segue a etapa de mineração de dados, onde ocorre a escolha do algoritmo para o cumprimento da tarefa do problema em questão. Na etapa de pós-processamento ocorre à visualização, análise e interpretação do conhecimento obtido, onde os dados são organizados de forma a serem avaliados pelo especialista. O especialista tem papel fundamental nessa etapa, pois é o mesmo que definirá se os padrões adquiridos são interessantes, se o conhecimento é válido, novo e útil, ou se será necessário à volta a alguma das etapas anteriores.. Mineração de dados. Mineração de dados é a etapa mais importante do processo de KDD. O objetivo dessa etapa consiste na análise de dados e aplicação de algoritmos de descoberta que produzem uma enumeração particular de padrões (ou modelos) a partir dos dados. Ou seja, algoritmos que buscam explorar os dados para determinar modelos de conhecimento [FAYYAD 1996]. As técnicas de mineração de dados são aplicadas de acordo com as tarefas a serem realizadas no processo de KDD. Serão descritas a seguir algumas dessas tarefas, sendo que.

(38) 35. será dada uma abordagem geral nas tarefas de classificação e regressão e uma abordagem mais detalhada na tarefa de agrupamento de dados, já que a mesma é a tarefa que será utilizada na solução proposta por este trabalho.. Figura 10: Etapas do processo de KDD. Classificação Essa tarefa tem o objetivo de descobrir uma função para mapear um conjunto de dados de entrada em um conjunto de classes predefinidas, de forma que o processo de classificação possa encontrar algum relacionamento entre um novo dado e essas classes, estabelecendo a qual classe esse novo dado pertence. Um exemplo dessa tarefa seria uma base de dados de clientes potenciais para empréstimos. Os clientes são divididos em clientes confiáveis e clientes inadimplentes. O processo de classificação descobrirá uma função de modo a inserir os clientes que existem no banco de dados em uma das duas classes predefinidas. Um novo cliente pode também ser.

(39) 36. associado a uma das classes a partir de sua semelhança com outros clientes previamente classificados.. Regressão A tarefa de regressão consiste em utilizar o relacionamento existente entre duas ou mais variáveis contínuas de forma que uma delas tenha o seu valor estimado a partir das demais. Para exemplificar essa tarefa será considerada uma base de dados que possua informações sobre o tempo de experiência e o salário atual dos funcionários de uma empresa, exibida na Tabela 1 [GOLDSCHMIDT; PASSOS 2005]. Nessa base de dados existe uma influência direta da variável que denota a experiência em anos na variável salário. Pode-se então construir, através do processo de regressão, uma função para estimar o salário anual de um funcionário a partir de sua experiência. Em um processo real de regressão, procura-se estimar o valor de uma variável em função de várias outras variáveis.. Tabela 1: Exemplo de uma base de dados. [GOLDSCHMIDT; PASSOS 2005]. X (experiência em anos). Y (salário anual em R$ 1.000). 03. 30. 08. 57. 09. 64. 13. 72. 03. 36. 06. 43. 11. 59. 21. 90. 01. 20. 16. 83. Utilizando o modelo de regressão linear nos dados da Tabela 1, temos: X’ = 9,1 Y’ = 55,4.

(40) 37. β = (3 - 91) (30 – 55,4) + (8 – 9,1) (57 – 55,4) + ... + (16 – 9,1) (83 – 55,4) = 3,7 (3 - 91)² + (8 – 9,1)² + ... + (16 – 9,1)² a = 55,4 – (3,7) (9,1) = 21,7 Portanto: Y = 21,7 + 3,7*X. Assim, pode-se estimar que uma pessoa com 20 anos de experiência teria seu salário anual de aproximadamente R$ 95.700,00.. Agrupamento (Clustering) A tarefa de agrupamento a partir de uma base de dados separa os dados formando grupos, utilizando critérios de similaridade. A identificação desses grupos é feita utilizando o princípio de obter padrões que minimizam a distância interna e maximizam a distância entre os grupos [HAN & KAMBER 2001], obtendo dessa forma grupos compostos por dados com alta similaridade, entretanto, distintos de dados presentes em outros grupos. Diferente da tarefa de classificação, que tem rótulos predefinidos, o agrupamento precisa automaticamente identificar os grupos de dados aos quais o usuário deverá atribuir rótulos [FAYYAD 1996]. Exemplificando a tarefa de agrupamento pode-se utilizar uma rede de supermercado que queira agrupar a partir de seu banco de dados, clientes que possuam um mesmo perfil de compras. Uma das formas é agrupar cliente que tenham o mesmo perfil a partir de atributos como faixa etária, nível de renda, etc., para oferecer linhas de produtos semelhantes.. 4.1.1.1 Componentes de uma tarefa de clusterização. A atividade de agrupamento normalmente envolve [JAIN AND DUBES 1988]: •. Representação dos padrões: envolve definição do número, tipo e modo de apresentação dos atributos que descrevem cada padrão;. •. Definição de uma medida de similaridade apropriada ao domínio da aplicação: fornecida por uma função de distância definida entre pares de dados ou padrões;.

(41) 38. •. Clusterização ou agrupamento: os grupos podem ser definidos como conjuntos crisp (um padrão pertence ou não-pertence a um dado grupo) ou fuzzy (um padrão pode apresentar graus de pertinência aos grupos). O processo de agrupamento pode ser hierárquico, com um processo recursivo de junções ou separações de grupos, ou não-hierárquico, com o emprego direto de técnicas de discriminação de clusters;. •. Apresentação do resultado: deve permitir que um computador possa utilizar o resultado de forma direta ou então deve ser orientada ao usuário, permitindo a visualização gráfica dos clusters e a compreensão de suas inter-relações, através da proposição de protótipos ou outras descrições compactas para os clusters.. 4.1.1.2 Técnicas de clusterização de dados A classificação dos algoritmos utilizados na clusterização pode ser dada de acordo com a abordagem utilizada na definição dos clusters: clusterização hierárquica ou por particionamento. 4.1.1.2.1. Clusterização hierárquica. Nesse tipo de clusterização, os clusters são reunidos em forma de árvore, onde cada nó consiste na união de dois elementos [WANG e HODGES 2006]. Essa formação se dá através de aglomerações ou divisões que gera uma árvore hierárquica dos elementos. Na Clusterização Hierárquica Aglomerativa, cada objeto é atribuído a um cluster distinto, e novos clusters vão se formando com a união dos já existentes, baseado nas informações de quão próximos estão os elementos de clusters distintos. Em contrapartida, na Clusterização Hierárquica por Divisão, tem-se inicialmente um único cluster que contém todos os elementos do cluster, e a cada iteração, vão se formando clusters menores, a partir dos já existentes [OCHI et al. 2004].. 4.1.1.2.2. Clusterização por particionamento. Na clusterização por particionamento, o conjunto de elementos é dividido em k clusters. Se a cada iteração não forem satisfeitas as condições do problema, novas.

(42) 39. configurações vão sendo criadas através da migração dos elementos entre os clusters, até que algum critério de parada seja atingido [OCHI et al. 2004]. Além de apresentar como vantagem um melhor refinamento com relação às técnicas de clusterização hierárquica, que não revisitam os clusters já formados. Um dos algoritmos mais utilizados na clusterização por particionamento, é o K-means, algoritmo no qual o SimpleKMeans, utilizado neste trabalho, se baseia.. Considerações finais. Neste capítulo foi apresentado o Processo de Descoberta de Conhecimento em Base de Dados. Foi dado um enfoque maior a tarefa de clusterização dos dados, devido a mesma ser a tarefa escolhida para ser utilizada na fase de mineração de dados da ferramenta PersonaWeb, solução proposta neste trabalho, que será detalhada no próximo capítulo..

(43) 40. 5. PERSONAWEB. Este capítulo descreve a ferramenta PersonasWeb, as tecnologias utilizadas no seu desenvolvimento, sua descrição e arquitetura. Apesar de conceitos sobre personas neste trabalho, o projeto desenvolvido não os segue a risca, tendo sido feitas adaptações para ir de acordo com a necessidade do problema a ser resolvido, sem deixar de manter o foco principal que é obter um usuário-modelo criado a partir de dados reais, que contenha seu nome, seus gostos, seus hábitos, suas habilidades e etc.. Recursos utilizados pela PersonaWeb Nesta seção será detalhada a ferramenta Weka, da qual o PersonaWeb faz uso da sua API, através da utilização do algoritmo SimpleKMeans. Apesar de existir várias outras ferramentas, a escolha da Weka se deu pelo fato de a mesma possuir a implementação do algoritmo SimpleKMeans, que trabalha com bases de atributos mistos, e que tem como base o algoritmo KMeans, método popular para tarefa de clusterização. Essa tarefa é a que é utilizada na fase de mineração de dados do PersonaWeb, já que o objetivo deste trabalho é agrupar pessoas com características semelhantes a partir de bases de dados. Será também dada uma explicação sobre a LastFM e IMDB, bases externas de músicas e filmes, respectivamente, utilizadas através de web services para troca de dados com o PersonaWeb.. Weka Waikato Environment for Knowledge Analysis – Weka foi desenvolvido pela Universidade de Waikato, para resolver tarefas de mineração de dados através de uma coleção de algoritmos de aprendizado de máquina. É um software livre, escrito em Java, licenciado dentro das especificações da GPU (General Public License). Possui interface gráfica para interagir com arquivos de dados como também para visualização dos mesmos, pode ser aplicado em vários níveis diferentes. Você pode acessar a API Weka e fazer uso em seu próprio programa em Java. Para importação dos dados o weka aceita vários formatos como.

(44) 41. csv, binary, c45, sendo que tem somente um formato padrão que consegue manipular, o arff (Attribute-Relation File Format). O ARFF – apresentado na Figura 12 - é um arquivo de texto. Não aceita dados faltosos, nem espaços entre palavras. É formado por três partes: • @relation – deve ser a primeira linha do arquivo, seguida de uma palavrachave que identifique a relação dos dados a ser minerados. • @attribute – representa um conjunto de linhas onde são descritos os atributos. Deve está no início de cada linha seguido do nome do atributo e do tipo, que pode ser nominal ou numérico. • @data – as informações inseridas abaixo dessa linha indicam os registros da base de dados. Cada linha representa uma instância, e deve conter os valores separados por vírgula.. Figura 12: Exemplo de um arquivo arff O weka implementa vários métodos de associação, classificação como árvores de decisão e redes neurais e clusterização, que utiliza algoritmos como o Simple-KMeans, Cobweb, entre outros. Possui facilidade para inclusão de novos métodos, por isso é.

(45) 42. considerada uma ferramenta personalizável e expansível. A visualização gráfica dos dados é dada em forma de histogramas, os resultados mostrados em árvores de decisão e diagramas de dispersão, além da possibilidade de gerar modelos gráficos para montagem de redes neurais [GOLDSCHMIDT; PASSOS 2005].. SimpleKmeans. Algoritmo utilizado pelo PersonaWeb para fazer a tarefa de clusterização na fase de mineração de dados. É uma implementação do pacote WEKA, baseado no algoritmo KMeans [WITTEN e FRANK 2005]. O objetivo desse método é, a partir de uma massa de dados, agrupar n objetos em k grupos com a maior diferença possível entre eles, onde k representa a quantidade de grupos e deve ser definida antecipadamente [BUSSAB, 1990]. Algumas implementações do K-means permite apenas valores numéricos para os atributos. Nesse caso, pode ser necessário converter os atributos categóricos em binários. Também pode ser necessário normalizar os valores de atributos que são medidos em diferentes escalas (por exemplo, "idade"). Sendo que o algoritmo SimpleKMeans trata automaticamente a mistura de atributos categóricos e numéricos. Além disso, o algoritmo automaticamente normaliza atributos numéricos ao fazer os cálculos de distância [PENTAHO DATA MINING]. Este parágrafo descreve a motivação do uso deste algoritmo no PersonaWeb, já que a maioria das bases possuem atributos mistos. O critério de agrupamento dos clusters é baseado em algumas medidas de similaridade, a mais comum e usada pelo SimpleKmeans no PersonaWEB é a distância euclidiana definida por:. K-means O algoritmo K-means tem como parâmetros de entrada: um conjunto de dados com n elementos, e número de clusters, k. Como saída, o k-means tenta identificar entre os dados clusters bem separados..

(46) 43. A execução do algoritmo consiste na escolha aleatória dos k centros iniciais para os clusters, sendo isso de extrema importância já que as posições iniciais muito influenciam no resultado, pois dependendo da escolha desses centróides o algoritmo pode convergir para um ótimo local. O passo seguinte será calcular a distância euclidiana de cada objeto em relação ao centróide de cada grupo, atribuindo o objeto a um cluster onde a distância entre o mesmo e o centróide é mínima, ou seja, associá-lo ao centro mais próximo. Em seguida, recalcular os novos centros dos clusters de modo a minimizar a função objetivo erro quadrático, definida por:. Onde:. é a distância escolhida entre um ponto de dados;. = i-ésimo. padrão pertencente ao j-ésimo cluster; e cj = centróide do j-ésimo cluster. Uma vez recalculados os centróides, o algoritmo atualiza os clusters atribuindo todos os objetos aos novos centros. Esse processo se repete em diversas iterações até que sejam encontrados os centros finais de cada cluster, ou seja, não apresentem deslocamentos significativos, ou até que a função objetivo comece a diminuir expressivamente após certa quantidade de iterações. A Figura 13 mostra um fluxograma da execução do algoritmo k-means, ressaltando a inicialização aleatória dos centros, a atribuição de cada objeto conforme a distância que se encontram dos centros e a busca de forma iterativa pelos centros finais. O algoritmo tem como vantagens: a simplicidade, facilidade de implementação, eficiência para trabalhar com grandes bases de dados, e a realocação iterativa, que com freqüência descobre um ótimo local. Como desvantagens, apresenta a dependência dos valores iniciais de k, a sensibilidade aos ruídos, já que dados ruidosos ou com valores extremamente altos podem influenciar na distribuição dos dados.. IMDB Internet Movie Database (Base de dados de filmes na internet – IMDB) possui uma grande base com dados sobre filmes, curtas e documentários da internet em vários idiomas. Contém informações online sobre trailers, atores, título original, fotos, gênero, diretor, entre outros, e também possui avaliação e resenha feita pelo usuário sobre determinado filme..

(47) 44. Figura 13: Fluxograma do Algoritmo K-means. LastFM É um site de rádio gratuita via internet, que contém um grande catálogo de músicas e que tem agregada uma comunidade virtual onde são trocadas informações, como também o.

(48) 45. usuário pode construir seu perfil musical, recomendar artistas, músicas ou álbuns a outros usuários, se esta estiver disponível no banco de dados da LastFM. Podem também ser formados grupos de usuários com algo em comum, e ainda o recurso de recomendações, no qual com base no gosto do usuário, a LastFM recomenda novas músicas, shows e indica vizinhos musicais (pessoas que gostam das mesmas músicas). A LastFM oferece um web service. A sua API é livre para qualquer pessoa usar e criar seus próprios programas utilizando os seus dados. Sendo que para dados restritos ao usuário, é necessária autorização para uso. Na Figura 14, serão mostrados alguns métodos disponíveis na API.. Figura 14: Fragmento dos métodos da API da LastFM. Descrição da ferramenta. PersonaWeb é a solução implementada que supre uma necessidade da metodologia XDM, que é a criação de personas de forma automática. De forma geral, seu funcionamento se dá a partir de um script de banco de dados MYSQL, que além dos dados gerais deve conter informações do usuário sobre música, filme, hobbie e lugar..

(49) 46. O usuário final do PersonaWeb com o script da base já executado no MYSQL, terá três fases a seguir para a obtenção das personas, como mostra a Figura 16. Primeiro, uma fase de pré-processamento, que irá organizar e tratar os dados para a geração de um arquivo arff, formato lido pelo weka. Em seguida, ocorre a mineração de dados, onde serão obtidos padrões, formados por clusters com características similares. E por fim, a interpretação desses clusters e a formação das personas, com cartas de acordo com padrões identificados que representarão o grupo. Caso seja necessário, o usuário final poderá iniciar novamente o processo, e escolher novos atributos para melhor obtenção de resultado dos padrões.. Figura 16: Fases do PersonaWeb.