Top PDF Aprendizado ativo para ordenação de resultados

Aprendizado ativo para ordenação de resultados

Aprendizado ativo para ordenação de resultados

A ordena¸c˜ao de resultados ´e uma funcionalidade essencial de muitos sistemas: desde m´aquinas de busca na Web, passando por sistemas de recomenda¸c˜ao de produtos e pro- paganda virtual, resultados devem ser ordenados de acordo com sua relevˆancia para a busca efetuada ou baseado em preferˆencias do usu´ario ou em seu perfil. Essa or- dena¸c˜ao ´e especialmente importante para sistemas de busca na Web, uma vez que uma simples pesquisa pode retornar centenas de milhares ou milh˜oes de documentos, mas o usu´ario provavelmente ir´a visualizar apenas alguns poucos no topo da lista. Algorit- mos que aprendem a ordenar (Learning to Rank - L2R) usam t´ecnicas de aprendizado de m´aquina para produzir ordena¸c˜oes melhores do que aquelas obtidas por mode- los cl´assicos de Recupera¸c˜ao de Informa¸c˜ao, como o BM25, por exemplo. M´etodos L2R necessitam de um conjunto de treino rotulado para poderem gerar um modelo de ordena¸c˜ao que pode depois ser utilizado para ordenar os resultados de novas bus- cas. Esses conjuntos de treino s˜ao dif´ıceis e caros de produzir, pois ´e necess´ario que especialistas humanos avaliem os documentos retornados, indicando se s˜ao ou n˜ao rele- vantes ou ent˜ao provendo uma ordem parcial ou total desses documentos de acordo com sua relevˆancia para a busca. Algoritmos de aprendizado ativo podem reduzir o custo desse processo de an´alise de relevˆancia, selecionando de um conjunto n˜ao-rotulado de instˆancias que tˆem o potencial de acelerar o aprendizado do algoritmo de L2R, maxi- mizando a efic´acia do modelo aprendido. Nessa disserta¸c˜ao, propomos um novo m´etodo de aprendizado ativo baseado em regras de associa¸c˜ao que pode ser usado para sele- cionar documentos de um conjunto n˜ao-rotulado sem a necessidade de um conjunto inicial de treino. Esse m´etodo seleciona conjuntos de treino pequenos e efetivos. En- tretanto, n˜ao ´e simples estender esse m´etodo para selecionar mais documentos caso isso seja necess´ario. Portanto, outra contribui¸c˜ao desse trabalho ´e um m´etodo iterativo de sele¸c˜ao de documentos que pode ser usado para selecionar mais instˆancias para serem rotuladas. Nesse segundo est´agio, inicialmente usamos os documentos selecionados pelo primeiro m´etodo para treinar um comitˆe de algoritmos L2R distintos. Depois, o m´etodo progride iterativamente selecionando, para cada busca, aqueles documentos
Mostrar mais

126 Ler mais

Avaliação da medida h-index na ordenação de resultados na blogosfera

Avaliação da medida h-index na ordenação de resultados na blogosfera

Uma crítica que é feita aos motores de pesquisa é que, na resposta a uma interrogação, a maior parte das vezes estes retornam sempre os mesmo resultados para qualquer tipo de utilizador [11]. De facto, a maior parte das interrogações são pequenas e ambíguas. No entanto, nem todos os utilizadores têm a mesma necessidade e objectivos com a mesma interrogação. Existe uma solução para resolver este problema, como o mencionado por Dou et al. [11], que defende a pesquisa personalizada. Para a experiência actual, não existe qualquer interesse em personalizar a pesquisa visto que pretendemos avaliar a eficácia da ordenação de blogues da medida h-index e não avaliar métodos para a melhorar. No entanto, esta questão é pertinente, visto que os resultados retornados por esta medida podem ser do agrado de muitos ou poucos utilizadores. A solução passará por definir um número de utilizadores que permita fazer uma avaliação global desta medida, sem ser influenciada por preferências particulares destes.
Mostrar mais

62 Ler mais

Seleção de características e aprendizado ativo para classificação de imagens de sensoriamento...

Seleção de características e aprendizado ativo para classificação de imagens de sensoriamento...

Em aplica¸c˜oes de sensoriamento remoto, h´a diversos problemas nos quais h´a conhecimento predominante sobre uma categoria ou classe alvo, e pouco conhecimento sobre as demais categorias. Nesses ca- sos, o treinamento de um classificador ´e prejudicado pelo desba- lanceamento de classes. Assim, o estudo de caracter´ısticas visuais para se definir o melhor subespa¸co de caracter´ısticas pode ser uma alternativa vi´avel para melhorar o desempenho dos classificadores. O uso de abordagens baseadas em detec¸c˜ao de anomalias tamb´em pode auxiliar por meio da modelagem da classe normal (comumente majorit´aria) enquanto todas as outras classes s˜ao consideradas como anomalias. Este estudo apresentou uma base de imagens de sensoria- mento remoto, cuja aplica¸c˜ao ´e identificar entre regi˜oes de cobertura vegetal e regi˜oes de n˜ao cobertura vegetal. Para solucionar o pro- blema de desbalanceamento entre as classes, foram realizados estudos das caracter´ısticas visuais a fim de definir qual o conjunto de atributos que melhor representa os dados. Tamb´em foi proposta a cria¸c˜ao de um pipeline para se tratar bases desbalanceadas de cobertura vegetal. Este pipeline fez uso de t´ecnicas de sele¸c˜ao de caracter´ısticas e aprendizado ativo. A an´alise de caracter´ısticas apresentou que o subespa¸co usando o extrator BIC com o ´ındice de vegeta¸c˜ao ExG foi o que melhor distinguiu os dados. Al´em disso, a t´ecnica de ordena- ¸c˜ao proposta mostrou bom desempenho com poucas dimens˜oes. O aprendizado ativo tamb´em ajudou na cria¸c˜ao de um modelo melhor, com resultados caompar´aveis com as melhores caracter´ısticas visuais.
Mostrar mais

88 Ler mais

Habilidades de ordenação temporal em usuários de implante coclear multicanal.

Habilidades de ordenação temporal em usuários de implante coclear multicanal.

O processamento das pistas acústicas dos sons da fala depende da adequada percepção da freqüência e da duração dos estímulos enquanto seqüência de eventos. Objetivo: Avaliar as habilidades de ordenação temporal em usuários de IC multicanal. Método: 14 indivíduos com audição nor- mal, formadores do grupo controle equiparados em idade e gênero com 14 usuários de IC, que formaram o grupo experimental, foram avaliados e comparados quanto ao Teste de Padrões de Freqüência (TPF) e Teste de Padrões de Duração (TPD). Resultados: Os usuários de IC apresentaram bom desempenho nas tarefas de ordenação temporal, com resultados médios de 48,7% no TPF e 59,6% no TPD. Para o grupo controle, o desempenho médio no TPF foi de 63,4% e no TPD de 64,6%. Não foi obtida diferença significativa estatisticamente entre os resultados dos grupos controle e experimental. Conclusão: O IC proporcionou desempenho favorável nas tarefas que exigem habilidades de ordenação temporal para os indivíduos avaliados neste estudo.
Mostrar mais

6 Ler mais

Variação da estrutura da floresta estacional decidual no estado de Santa Catarina e sua relação com a altitude e clima.

Variação da estrutura da floresta estacional decidual no estado de Santa Catarina e sua relação com a altitude e clima.

Por outro lado, as correlações do segundo eixo da ACC, positiva com as precipitações médias e negativa com a média da umidade relativa do ar (Tabela 2), indicam haver alguma influência destes dois fatores na ordenação dos dados. Nos quadrantes superiores do plano de cartesiano representado na Figura 3, vê-se que o conjunto de UA relacionadas com elevadas precipitações anuais é, na sua maioria, representado por aquelas contidas na bacia do rio das Antas. Ressalta-se, contudo, que apesar de a região possuir elevados índices pluviométricos, as precipitações não possuem regularidade, sendo mal distribuídas ao longo do ano (EPAGRI, 2008). Assim, apesar de a grande maioria das bacias de oeste inserir-se no conjunto daquelas que apontam para elevados índices pluviométricos (Tabela 2), parece ser esta também a região de mais forte estacionalidade de sua distribuição. Com respeito à umidade, a Figura 3 demonstra haver uma forte influência deste parâmetro na determinação da dissociação de algumas UA, mas principalmente daquelas situadas na bacia do Peperi-Guaçu. De fato, a Tabela 2 parece indicar que a média da umidade relativa do ar é superior àquela de todas as demais, exceto pela bacia do rio Pelotas, que se equivale a esta. Contudo, a pequena amplitude de variação deste dado (Tabela 3) torna difícil avaliar estes resultados.
Mostrar mais

13 Ler mais

A ordenação das variáveis no processo de otimização de classificadores bayesianos: uma abordagem evolutiva

A ordenação das variáveis no processo de otimização de classificadores bayesianos: uma abordagem evolutiva

Os resultados apresentados nas Tabelas 5.9, 5.10, 5.11 e 5.12 revelam que os valores dos parâmetros genéticos modificados pouco influenciaram os algoritmos na busca de classificadores melhores. Percebe-se, pela Tabela 5.9, que aumentando os valores dos parâmetros genéticos, VOGA-K2 melhorou os scores Bayesianos apenas em dois domínios (Asia e Voting). Nos domínios Synthetic 1 e Synthetic 2, os valores dos scores Bayesianos pioraram. A Tabela 5.10 mostra que VOGA-K2-MBC não obteve melhorias nos scores Bayesianos dos classificadores gerados, mantendo (com exceção de Synthetic 1) os mesmos valores encontrados anteriormente. Analisando a Tabela 5.11, nota-se que os algoritmos de VOGAC também não apresentaram melhorias significativas na MTCC, havendo poucas tendências de resultados melhores, tanto com os valores dos parâmetros mais altos, quanto mais baixos. A Tabela 5.12 mostra que VOEA-K2 melhorou apenas para o domínio Asia, ao utilizar os valores mais altos para os parâmetros.Assim, de maneira geral, a alteração dos parâmetros genéticos não trouxe mudanças significativas nas TCCs médias.
Mostrar mais

114 Ler mais

Ferramenta de apoio para o aprendizado ativo usando dispositivos com caneta eletrônica

Ferramenta de apoio para o aprendizado ativo usando dispositivos com caneta eletrônica

Resumo Este trabalho apresenta uma proposta de desenvolvimento de uma ferramenta educacional baseada no uso de dispositivos móveis com caneta eletrônica, com o intuito de permitir a construção de um ambiente educacional colaborativo, fundamentado no modelo do aprendizado ativo. Experimentos foram realizados com o intuito de medir a interação dos alunos e professor e a integração e organi- zação de exercícios feitos pelos alunos. Os resultados permitiram identificar os benefícios e vanta- gens que a aplicação desse tipo de ferramenta pode ter em sala de aula, como o aumento da motiva- ção e participação dos alunos e a possibilidade de feedback em tempo real do professor.
Mostrar mais

17 Ler mais

Margarida Paiva Correia

Margarida Paiva Correia

50 Os valores apurados neste estudo permitem observar, em termos comparativos, os resultados das diferentes subescalas possibilitando a sua ordenação de acordo com [r]

86 Ler mais

Ranking de municípios para políticas públicas de educação: comparação entre avaliações multicritério a partir do IDH

Ranking de municípios para políticas públicas de educação: comparação entre avaliações multicritério a partir do IDH

A ordenação dos municípios e a seleção daquelas cuja população será alvo de determinada ação deve, tanto quanto possível, fornecer também informação sobre aspectos que possam ser levados em conta na avaliação dos possíveis resultados dessa ação. Os índices de composição probabilística contribuem com informação diferenciada que pode ser útil no processo de seleção de municípios para serem objeto de ações específicas. Por exemplo, a ordenação segundo a probabilidade de ser o pior em algum indicador, e não necessariamente em todos, permite selecionar municípios em que projetos de equalização de oportunidades em determinadas direções do sistema educacional possam ser mais eficientes.
Mostrar mais

14 Ler mais

Aplicação de máquinas de aprendizado extremo ao problema de aprendizado ativo

Aplicação de máquinas de aprendizado extremo ao problema de aprendizado ativo

A estratégia de Aprendizado Ativo proposta neste trabalho é capaz de en- contrar uma solução que maximize a capacidade de generalização do modelo e que controla o termo de crosstalk, tanto para a versão Stream-based quanto para a Pool-based. Para ilustrar essas características, quatro estratégias de seleção de padrões foram aplicadas ao conjunto de dados da Figura 3.3. Em todos os casos foi utilizada a mesma camada escondida ELM com 100 neurô- nios escondidos. A primeira estratégia utiliza o aprendizado Hebbiano com pesos normalizados para aprender, iterativamente, o padrão mais próximo do hiperplano separador, como proposto na heurística de Schohn et al. [58] (apre- sentada na Figura 5.6 como ELMPCP - ELM with Hebbian Perceptron and Clo- sest Patterns). A segunda estratégia usa o aprendizado Hebbiano com pesos normalizados para aprender padrões selecionados aleatoriamente (apresenta- dos na Figura 5.6 como ELMPRP - ELM with Hebbian Perceptron and Random Patterns). As duas últimas estratégias utilizam os métodos de Aprendizado Ativo baseados no teste de convergência, apesentadas como Extreme Active Le- arning Machine (EALM) nas versão Stream-based Selective Sampling (EALMSS) e Pool-based Sampling (EALMPB). Para fins de comparação, também foi in- cluído um classificador ELM com o uso da pseudoinversa e padrões seleciona- dos aleatoriamente. O experimento foi realizado utilizando validação cruzada do tipo 10-fold dez vezes. Os resultados são apresentados na Figura 5.6 em termos da AUC média.
Mostrar mais

100 Ler mais

Aprendizado ativo em modo batch ordenado

Aprendizado ativo em modo batch ordenado

Com a enorme quantidade de informação gerada todos os dias na Internet, fica cada vez mais difícil, se não impossível, processar e administrar manualmente esses dados. Como uma maneira de contornar este problema, algoritmos de Aprendizado de Máquina vêm sendo cada vez mais utilizados nos mais distintos domínios. Um tipo de algoritmo de aprendizado, o Aprendizado Ativo, surgiu como uma maneira de otimizar a fase de treinamento de alguns desses métodos, com a premissa de que os algoritmos são capazes de obter melhores resultados utilizando menos treinamento caso possam escolher quais instâncias devem ser rotuladas. Essa é um premissa especialmente interessante em cenários em que o dado não rotulado é abundante e existe um custo, não desprezível, associado ao processo de rotular uma determinada instância. Em sua forma original, uma instância é rotulada e utilizada pelo algoritmo a cada iteração, o que impossi- bilita o uso de vários oráculos em paralelo. Para resolver este problema, surgiram os métodos de Aprendizado Ativo em Modo Batch, que são capazes de selecionar mais de uma instância a cada iteração. Apesar de estes métodos resolverem o problema dos múltiplos oráculos, ainda existe uma dependência de se executar o algoritmo a cada batch analisado. Com o crescimento do uso desses métodos em ambientes corporativos, surgiu a necessidade de se evitar iterações constantes e, consequentemente, o tempo ocioso de analistas contratados, que esperam por um novo batch. Nesta dissertação, o problema de Aprendizado Ativo em Modo Batch Ordenado é descrito propiciando um relaxamento do método tradicional em Batch. Ao selecionar uma lista ordenada de instâncias é possível gerar uma lista com um número arbitrário de documentos a serem rotulados. Dessa maneira, as iterações do algoritmo podem ser espaçadas conforme a necessidade do usuário. Tal fato possibilita que uma lista de instâncias suficientemente grande (para um dia completo de trabalho do analista) possa ser gerada fora do horário comercial. Além da definição formal deste problema, uma solução é apresentada, uti- lizando um framework que constrói a lista iterativamente ponderando a utilidade da instância para o classificador (incerteza) e a diversidade trazida ao modelo em relação as instâncias já selecionadas. A avaliação experimental demonstra que o uso do Batch
Mostrar mais

99 Ler mais

Maxtermos Mapas de Karnaugh

Maxtermos Mapas de Karnaugh

"Se João mora naquela casa é um homem afortunado; ora João não é um homem afortunado, logo não mora naquela casa.". Juízo Hipotético Juízo Categórico Inferência.[r]

34 Ler mais

Construção automática de micro-ontologias para a personalização na Web

Construção automática de micro-ontologias para a personalização na Web

A segunda é a extracção das palavras mais relevantes nos documentos dentro do contexto do utilizador. Aqui utilizamos um método já existente no sistema [29] e que foi utilizado anteriormente para definir extrair as categorias dos snippets dos resultados. A diferença aqui é que este método vai ser aplicado ao conteúdo total de um documento. Este método é independente da língua o que é uma vantagem enorme. De modo a conseguirmos aplicar este algoritmo primeiro passamos por uma fase onde vamos extrair o texto útil de um documento utilizando um parser de HTML. Em seguida aplicamos o algoritmo em questão e recebemos como resultado um conjunto de palavras simples ou compostas que iremos utilizar no segundo passo. Estes resultados já eram consideravelmente bons na criação das categorias pois conseguíamos através da análise de um snippet (quantidade de texto relativamente pequena) obter palavras bastante fortes tendo em conta o seu conteúdo. Agora aplicado a um número maior de palavras conseguimos ainda resultados mais parecidos com o que deve ser a extracção automática de palavras num sistema de recolha de informação comercial.
Mostrar mais

62 Ler mais

DIFERENÇAS ENTRE OS DIRETÓRIOS

DIFERENÇAS ENTRE OS DIRETÓRIOS

Existem dois tipos básicos de ferramentas de busca na Web: os motores de busca e os diretórios. Entretanto, a partir dessas duas categorias básicas, outros tipos de ferramentas têm surgido, fazendo o mundo dos serviços de busca complexo e volátil. Devido às características específicas de cada ferramenta, o tipo, número e a qualidade dos recursos recuperados através de seu uso, podem variar enormemente. Para obter melhores resultados na busca de informações, o primeiro passo é entender as peculiaridades dos diferentes tipos de ferramentas de busca na Web. E ste artigo oferece uma visão das principais categorias de ferramentas de busca da Internet, suas semelhanças, diferenças e características e analisa, também, as vantagens e desvantagens associadas a cada uma, de forma a proporcionar ao profissional da informação instrumental para aumentar sua eficiência na procura de recursos informacionais.
Mostrar mais

11 Ler mais

A APROPRIAÇÃO DOS RESULTADOS DO PROEB: ESTUDO DE CASO DE UMA ESCOLA ESTADUAL DE JUIZ DE FORAMG

A APROPRIAÇÃO DOS RESULTADOS DO PROEB: ESTUDO DE CASO DE UMA ESCOLA ESTADUAL DE JUIZ DE FORAMG

Conforme Klein e Fontanive (2015, p. 1) evidenciam na passagem, foi um momento de desafio enfrentado pela SRE, que buscava, naquele instante, maneiras de apresentar os resultados. A forma escolhida, talvez, possa não ter sido a mais adequada, mas seria uma possibilidade de os professores, a partir das discussões feitas no nível geral, sem especificação de resultados por escolas, terem melhores condições de entender os resultados quando fossem analisá-los individualmente. Prova de que estratégias estão sendo traçadas e já em execução é o grande empenho empreendido pelo governo estadual de Minas Gerais em instituir o Dia D 22 , momento para que todas as escolas da rede possam trabalhar os dados e realizar oficinas de esclarecimentos gerais.
Mostrar mais

127 Ler mais

A PREOCUPAÇÃO COM A ORDENAÇÃO

A PREOCUPAÇÃO COM A ORDENAÇÃO

No que tange às nossas preocupação em relação às LDs, é importante destacar que, antes do século XIX, as ordens classificatórias de livros eram as mais simples, geralmente expressas em ordenação alfabética, por título. Essa classificação “primária” não deve ser entendida devido ao tamanho reduzido dos acervos. Existiram grandes bibliotecas, como a biblioteca de Al-Hakim, no século X, da qual só o catálogo era composto por 44 volumes e o acervo possuía por volta de 500 mil livros – alguns relatos, um século mais tarde, diziam que essa biblioteca chegou a possuir mais de um milhão de volumes (BATTLES, 2003, p. 70). Mesmo em uma colônia como o Brasil, na qual não se tinha nenhum interesse em constituir uma civilização, houve grandes bibliotecas, como a de Salvador, com nada menos de 15 mil volumes (MORAES, 1979).
Mostrar mais

8 Ler mais

: Brapci ::

: Brapci ::

Nesse caso, o currículo que contempla o desenvolvimento do letramento informacional não deve se ater apenas às disciplinas específicas, mas considerar o todo, o conjunto delas, o aprendizado na totalidade. Nesse contexto, torna- se necessário “medir e descrever o aprendizado do estudante. ” (BUNDY, 2004, p. 25), com os objetivos de facilitar o aprendizado, diagnosticar lacunas de conhecimento, fornecer estrutura para o aprendizado, propiciar oportunidades para estudantes e professores conversarem sobre o aprendizado, bem como prover informação para avaliação do processo de ensino-aprendizagem (BUNDY, 2004, p. 26). No Brasil, vários estudiosos têm desenvolvido pesquisas sobre o tema, por exemplo, Dudziak (2003), Gasque (2008a, 2008b, 2010 a , 2010, b, 2011a, 2001b, 2012, 2016 a , 2016b, 2017), Campello (2003, 2009), Fialho (2004, 2009, 2013), dentre outros. Apesar da grande contribuição dos pesquisadores brasileiros, há ainda a necessidade de investir em mais estudos relacionados à questão da aprendizagem e, especialmente, do currículo. Isso porque o currículo é o processo que torna possível a concretização do ensino-aprendizagem dos conteúdos de LI.
Mostrar mais

20 Ler mais

Estrutura de Dados para Tecnologia

Estrutura de Dados para Tecnologia

 Caminho simples que contém todas as arestas do grafo (e,. consequentemente, todos os seus vértices)[r]

38 Ler mais

MARCIA CRISTINA DA MOTA SALES GESTÃO DE RESULTADOS ESCOLARES: UM ESTUDO DAS ESCOLAS ESTADUAIS NO MUNICÍPIO DE BARCELOS (AM)

MARCIA CRISTINA DA MOTA SALES GESTÃO DE RESULTADOS ESCOLARES: UM ESTUDO DAS ESCOLAS ESTADUAIS NO MUNICÍPIO DE BARCELOS (AM)

No capítulo 1, vimos que, desde a década de 1990, os governos federal e estadual têm investido em avaliações externas para diferentes fins no meio educacional. Segundo Vianna (2003), destaca-se, como uma das prioridades das avaliações em larga escala, a identificação de problemas de aprendizagem com o intuito de superação imediata do quadro apresentado. Entretanto Vianna (2003) reflete que a realidade educacional é bem diversa do imaginado e pretendido porque o impacto dos resultados é considerado mínimo por diversas razões. Segundo o autor, dentre as razões, é possível destacar que os relatórios com os dados elaborados para administradores, técnicos e, em geral, para os responsáveis pela definição e implementação de políticas educacionais não costumam chegar às mãos dos professores para fins de análise, discussão e estabelecimento de linhas de ação. Além disso, são demasiadamente técnicos, empregando um linguajar pleno de tecnicidades, muitas vezes, desconhecidas dos docentes e que poderiam ser evitadas. Por outro lado, esses mesmos resultados são apresentados em termos globais, sem identificação, como seria desejável, das unidades escolares, referindo- se, quando muito, a unidades macro – os estados –, e, nestes, eventualmente, às regiões geoeducacionais (superintendências ou delegacias de ensino). Ainda que os resultados dos desempenhos sejam apresentados em escalas elaboradas por intermédio de rigorosos procedimentos estatísticos e com a especificação dos vários níveis correspondentes de competência, dificilmente os professores têm condições técnicas para interpretar dados que resultam da expertise técnica dos responsáveis pelos relatórios (VIANNA, 2003).
Mostrar mais

176 Ler mais

Show all 10000 documents...