Linguagem Natural

Top PDF Linguagem Natural:

PROCESSAMENTO DE LINGUAGEM NATURAL PARA INDEXAÇÃO AUTOMÁTICA SEMÂNTICO-ONTOLÓGICA

PROCESSAMENTO DE LINGUAGEM NATURAL PARA INDEXAÇÃO AUTOMÁTICA SEMÂNTICO-ONTOLÓGICA

Moens (2000) delineia que o processo natural de seleção automática de descritores a partir de textos em linguagem natural é composto de passos, alguns deles fortemente atrelados a resultados de PLN. O primeiro é a identificação das unidades lexicais do texto. O segundo, a remoção de palavras funcionais, artigos e preposições, por exemplo, além das unidades lexicais que possuam grande frequência no domínio dos documentos, as quais não são específicas o suficiente para representar o conteúdo do documento para recuperação. Já o terceiro passo trata da lematização dos descritores selecionados, para otimização do armazenamento computacional. O quarto passo trata da formação de sintagmas, expressões ou composições para serem utilizados como descritores. Enquanto os primeiros passos ficavam no módulo morfológico de PLN, esse passo já exige o módulo sintático, como detalham Constant, Sigogne e Watrin (2012). O quinto focaliza a substituição dos descritores selecionados por suas respectivas classes em um esquema de representação do conhecimento. A autora menciona um tesauro. Esta pesquisa utiliza uma ontologia e o módulo semântico de PLN. O sexto passo, por fim, estabelece os pesos de cada descritor para classificação e definição de sua efetiva utilização no índice ou descarte. Moens (2000) conclui informando que, conquanto esse processo seja padrão e utilizado por muitos sistemas, a ordem dos passos pode ser trocada. Um exemplo é a inversão do segundo passo com o quarto, ou seja, deixar para excluir as palavras não significativas apenas após a formação das expressões.
Mostrar mais

181 Ler mais

implicações em um fragmento da teoria da linguagem natural :: Brapci ::

implicações em um fragmento da teoria da linguagem natural :: Brapci ::

Sob a justificativa de que existe uma forte intuição de que toda linguagem natural tem uma cate- goria sintática, rotulada por NP, a qual inclui nomes próprios e determinadores tais como “todos”, “maio- ria”, “um”; mas que não existe um modo simples de dar uma definição sintática universal para NP, afir- mam os autores que, nessa situação, a semântica pode contribuir para a teoria sintática e que a semântica sugerida permite propor o seguinte universal.

13 Ler mais

Text Mining e processamento de linguagem natural para interpretação de notas clínicas

Text Mining e processamento de linguagem natural para interpretação de notas clínicas

Esta dissertação enquadra-se no âmbito da conclusão do Mestrado Integrado em Engenharia e Gestão de Sistemas de Informação na Universidade do Minho, sendo o seu tema “Text Mining e Linguagem Natural Para Processamento de Notas Clínicas”. O tema resultou de uma relação contínua entre um Grupo de Investigação da Universidade do Minho e o Centro Hospitalar do Porto (CHP) – Hospital de Santo António. O CHP tem vários doentes internados nos seus serviços, que estão a receber tratamento para a doença que lhes foi diagnosticada. Para fazer o registo das doenças, dos seus tratamentos e respetivos resultados, os médicos utilizam as Notas Clínicas. Estas armazenam toda a informação relativa ao doente e, frequentemente, a sua análise torna-se complexa porque não existe um padrão de escrita seguido por todos os médicos. O maior desafio deste projeto centrou-se na análise do texto que constitui as Notas Clínicas para, posteriormente, criar um sistema de suporte à decisão e ajudar os médicos a deliberar o melhor para o doente. Para fazer esta análise, foram utilizadas duas técnicas na área da análise e da compressão de texto, o Text Mining e o Processamento de Linguagem Natural (PLN). Desenvolveram-se modelos focados na descoberta de conhecimento no texto presente nas Notas Clínicas, com o objetivo de criar padrões de informação. Além destes, também foram levados a cabo outros modelos de previsão de acontecimentos com base na análise de texto, que se revelaram extremamente positivos. Por fim, foi elaborado um dicionário com termos médicos com base na análise das Notas Clínicas fornecidas pelo CHP. Os resultados obtidos foram bastante positivos, onde por exemplo com a criação de modelos de interpretação de texto, foi possível identificar diferentes tipos de diagnóstico efetuados a doentes que sofreram morte cerebral, bem como, a que tipo de doentes isto ocorreu. Estes modelos foram criados com as palavras que constituíam os relatórios médicos, assim como, pelas palavras do dicionário criado. Os modelos de previsão criados também obtiveram resultados bastante satisfatórios, atingindo os 88% de acuidade, o que torna viável a aplicação dos mesmos num ambiente real, como por exemplo o CHP. Todo o trabalho desenvolvido no projeto seguiu na sua vertente prática a metodologia Cross Industry Standard Process for Data Mining (CRISP-DM) e a metodologia de investigação Design Science Research (DSR).
Mostrar mais

198 Ler mais

sição de conhecimento de mundo para sistemas de processamento de linguagem natural

sição de conhecimento de mundo para sistemas de processamento de linguagem natural

Um dos desafios das pesquisas na área de Processamento de Linguagem Natural (PLN) é prover recursos semântico-linguísticos que expressem conhecimento de mundo para suportar tarefas como: extração de informação, recuperação de informação, sistemas de per- guntas e respostas, sumarização de textos, anotação semântica de textos, dentre outras. Para esse desafio este trabalho propõe estratégias para aquisição de conhecimento de mundo. Pro- pomos dois métodos. O primeiro é um método semiautomático que tem como ideia principal utilizar um processo de raciocínio semântico sobre o conhecimento pré-existente em uma base semântica. O segundo é um método de aquisição automática que utiliza a Wikipédia para a geração de conteúdo semântico. A Wikipédia foi utilizada como fonte de conhecimento devido à confiabilidade, dinamicidade e abrangência de seu conteúdo. Neste trabalho propomos um método para aquisição de relações semânticas entre conceitos a partir de textos de artigos da Wikipédia que faz uso de um conhecimento implícito existente na Wikipédia e em sistemas hipermídia: os links entre artigos. Ao longo do texto descritivo de um artigo da Wikipédia apa- recem links para outros artigos que são evidências de que há uma relação entre o artigo corrente e o outro artigo referenciado pelo link. O método proposto objetiva capturar a relação semântica expressa no texto entre eles (artigo corrente e link para outro artigo), sem expressões regulares identificando relações similares através de uma medida de similaridade semântica.
Mostrar mais

89 Ler mais

Processamento de linguagem natural: caracterizacao da produção científica dos pesquisadores brasileiros

Processamento de linguagem natural: caracterizacao da produção científica dos pesquisadores brasileiros

Gonzalez e Strube de Lima (2001), com o intuito de viabilizar a expansão automática de consulta, utilizaram um thesaurus (denominado T-Lex), que possui uma estruturação semântica para implementar relacionamentos lexicais, considerando fundamentos da Teoria do Léxico Gerativo (TLG) de Pustejovsky (1995 29 ). A TLG introduz um conjunto de recursos para análise semântica de expressões em linguagem natural, incluindo operações gerativas que possibilitam derivações composicionais das palavras dependentes de contexto. Um léxico semântico, de acordo com a TLG, é caracterizado como um sistema computacional onde a estrutura Qualia é um dos níveis de representação, com quatro campos (ou papéis) de descrição. Assim, na representação de um item lexical, o papel Formal distingue-o num amplo domínio, o papel Constitutivo descreve o que faz parte dele, o papel Agentivo especifica como ele passou a existir e o papel Télico explica qual a sua função ou propósito. No T-Lex, cada categoria gramatical possui estruturas Qualia específicas. Assim, os novos termos expandidos nas consultas são obtidos pela utilização de critérios semânticos para compor relacionamentos lexicais, conforme estabelecidos no T-Lex. Segundo os autores, os termos obtidos na expansão de uma consulta são selecionados entre os descritores contidos no T-Lex, a partir de operações gerativas. Essas operações tem como objetivo compor um campo lexical (ou campo semântico) de um item lexical. As operações utilizadas são (GONZALEZ, 2000 30 ): especialização, co-herança, associação, equivalência, decomposição e agregação.
Mostrar mais

262 Ler mais

Assistente conversacional para resolução de Problemas Trigonométricos em Linguagem Natural

Assistente conversacional para resolução de Problemas Trigonométricos em Linguagem Natural

Esta abordagem gera um enorme espaço de possíveis sistemas de equações e para encontrar o melhor alinhamento, um modelo de distribuição log-linear sobre estes sistemas completos de equações e o texto é utilizado. Desambiguações do sistema de tradução são tratadas adicionando- se características (features) adicionais ao modelo log-linear, como unigramas e bigramas, se o slot é objeto de uma questão ou pertence a uma questão, se um lema está próximo de uma constante, se pares de slots contém o mesmo lema, comparações numéricas, equivalência de classes gramaticais, entre outros. Embora a proposta dos autores tenha melhorado a acurácia em relação ao sistema ARIS (usado como avaliação), alguns problemas ainda restam insolúveis pois dependem da correta interpretação semântica inerente à linguagem natural.
Mostrar mais

21 Ler mais

Traços de personalidade e expressividade a partir de comunicação em linguagem natural...

Traços de personalidade e expressividade a partir de comunicação em linguagem natural...

O desacoplamento inicial entre a observação de eventos, o registro de ações de agentes e a presença/ausência/proximidade/afastamento de objetos é bastante conveniente do ponto de vista computacional em ambientes de simulação, pois permite que cada uma das causas seja analisada inicialmente dentro de seu contexto computacional, sem grandes rupturas com a estrutura usual das máquinas de jogos utilizadas na operação dos mundos virtuais. No contexto deste trabalho, conforme (SHAIKH; PRENDINGER; ISHIZUKA, 2009, página 52), o modelo OCC fornece uma estrutura de reconhecimento/avaliação de emoções oriantada a objetivos, padrões e atitudes, adequada às implementações que fazem reconhecimento de situações de indução emocional a partir de processamento de linguagem natural (NLP).
Mostrar mais

111 Ler mais

Fundamentos em processamento de linguagem natural: uma proposta para extração de bigramas

Fundamentos em processamento de linguagem natural: uma proposta para extração de bigramas

É senso comum que o texto escrito é uma importante forma de registrar as informações e que atualmente grande parte desse conteúdo informacional está disponível em meio digital. Entretanto, de maneira geral, os computadores lidam com o texto como sendo uma cadeia de caracteres que não têm nenhum significado. A área de Processamento de Linguagem Natural (PLN) vem se empenhando em extrair significados do texto. Nesse sentido este trabalho apresenta uma revisão desse tema e propõe um método automatizado que utiliza uma heurística determinística denominada Heudet que visa extrair bigramas do texto. A meta é extrair o significado do texto através de um conjunto de expressões multipalavras identificadas. Os resultados obtidos foram melhores se comparados com aqueles que utilizam-se das técnicas de medidas de associação estatística obtidas pelo software Ngram Statistics Package (NSP).
Mostrar mais

32 Ler mais

Sistemas de informação em linguagem natural: em busca de uma indexação automática

Sistemas de informação em linguagem natural: em busca de uma indexação automática

O processo de pesquisa de informações nos leva à constatação de uma relação complexa entre escrever, comunicar e descrever a língua para exprimir um pen- samento. Na verdade, o que se deseja é poder representar os conhecimentos mate- rializados por atos de linguagem em um texto. Essa representação, no contexto de nossos-trabalhos, passa pela aplicação de métodos informáticos capazes de veicular propriedades intrínsecas à linguagem natu- ral e à gramática que lhe é própria. O obje- to do trabalho que apresentamos consiste substancialmente em transpor automati- camente um texto, em linguagem natural, para uma metalinguagem de análise gra- matical. Esta análise nos permitirá obser- var a ordem estrutural dos constituintes da frase, que pode diferir da ordem linear. A frase pode então ser descrita por meio de relações de regência entre as unidades últimas. Descrever as funções sintáticas realizadas em um enunciado significa indi- car as dependências existentes entre os elementos deste enunciado.
Mostrar mais

10 Ler mais

Processamento de linguagem natural para indexação automática semânticoontológica :: Brapci ::

Processamento de linguagem natural para indexação automática semânticoontológica :: Brapci ::

Resumo: A pesquisa propõe uma arquitetura de indexação automática de documentos utilizando mecanismos de processamento de linguagem natural em nível semântico. Por meio do arranjo de ferramentas e recursos existentes, agregado ao desenvolvimento de software para integração, é construído um sistema de indexação automática que utiliza conhecimento modelado em uma ontologia para análise semântica. A aplicação da arquitetura é exemplificada e posta à prova em um conjunto de laudos periciais de crimes cibernéticos produzidos pela Perícia Criminal da Polícia Federal. Os resultados de pesquisa apontam para a melhoria que o aprofundamento à análise semântica do processamento de linguagem natural oferece para a seleção automática de descritores e, por extensão, para a recuperação da informação. Dentre as contribuições inéditas desta tese incluem-se a arquitetura de sistema de informação para indexação automática proposta, a ontologia construída para a análise semântica e as implementações em linguagem de programação Python. Por fim, o trabalho insere-se em uma área de pesquisa que tem sido cada vez mais investigada, no entanto ainda carece de resultados amadurecidos, qual seja o processamento de linguagem natural em língua portuguesa.
Mostrar mais

1 Ler mais

2P ROCESSAMENTO DE LINGUAGEM NATURAL

2P ROCESSAMENTO DE LINGUAGEM NATURAL

e sintática, pois ela utiliza o casamento de padrões. No entanto, o que se propõem é a utilização destas fases numa tentativa de minimizar respostas evasivas do chatterbot, pois quando ocorrerem erros de grafi a ele poderá identifi car e indicar correções. Assim, a interpretação de uma sentença em linguagem natural necessita manter as informações morfológicas, sintáticas e semânticas (com as ontologias previamente organizadas), armazenadas em um dicionário, juntamente com as palavras que o sistema compreende (RICH, 1988). Estas informações servem para o processamento da sentença efetuado pelas análises lingüísticas descritas a seguir:
Mostrar mais

13 Ler mais

Enriquecimento de Base de Dorks Com Processamento de Linguagem Natural / Dorks Base Enrichment With Natural Language Processing

Enriquecimento de Base de Dorks Com Processamento de Linguagem Natural / Dorks Base Enrichment With Natural Language Processing

Braz. J. of Develop., Curitiba, v. 6, n. 3,p 10763-10780 mar. 2020. ISSN 2525-8761 interpretar conteúdo em linguagem humana. Diante deste cenário, o objetivo deste trabalho enriquecer base de dorks com processamento de linguagem natural no apoio em testes de segurança da informação. Como metodologia, utilizou-se pesquisa experimental com abordagem quantitativa. Os resultados mostram que o processamento de linguagem natural pode ser utilizado para enriquecer uma base de dorks.

18 Ler mais

Indexar para quem? Ou o conflito entre a linguagem natural sus linguagem controlada

Indexar para quem? Ou o conflito entre a linguagem natural sus linguagem controlada

Na metodologia proposta por Tálamo (1987,citado por Fujita, 2003: 77), o processo de indexação consiste em “identificar o tema de um documento por meio de um mecanismo de perguntas e respostas agrupadas por generalidades e que respondem a cada uma das seguintes questões fundamentais: Quem? (ser), O que? (tema), Como? (modo), Onde? (lugar) e Quando? (tempo)”. Na análise o profissional deverá fazer essas perguntas no intuito de conseguir identificar os termos. Em seguida, deve-se fazer uma comparação entre os conceitos pré-selecionados em linguagem natural com os descritores das linguagens documentárias, se coincidirem podem representar os elementos que fazem parte do conteúdo do documento. A esse respeito faz-se uma distinção entre indexação por extração (palavras ou expressões identificadas e retiradas do documento para representar o assunto do próprio texto) e indexação por atribuição (atribuição de termos a um documento a partir de uma fonte que não é o próprio documento, podendo ser atribuídas pelo próprio indexador ou ainda, traduzidas por descritores retirados das linguagens de indexação, das quais cita-se: tesauros, cabeçalhos de assuntos, sistemas de classificação). É importante destacar que deverá ser verificado se os conceitos escolhidos estão atendendo as necessidades dos usuários, e se os mesmos estão recuperando aquilo que é de seu interesse. Quanto à maneira de indexar pode-se realizar por meio:
Mostrar mais

17 Ler mais

UM MÉTODO DE SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ATRAVÉS DE DADOS ESTATÍSTICOS E PROCESSAMENTO DE LINGUAGEM NATURAL

UM MÉTODO DE SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ATRAVÉS DE DADOS ESTATÍSTICOS E PROCESSAMENTO DE LINGUAGEM NATURAL

RESUMO Este artigo discute a mediação da informação em relação à sumarização automática de textos, examina técnicas de processamento de linguagem natural (PLN), e analisa o uso de técnicas de processamento de texto baseadas em métodos estatísticos de ocorrência de palavras do português brasileiro. Contextualiza o termo sumarização à Ciência da Informação. Propõe e apresenta um método de produção automática de sumários de textos baseado em técnicas de PLN e métodos estatísticos de uso de palavras. Para cada uma dessas técnicas, analisa e exemplifica, e oportunamente, apresenta as equações que governam o uso de tais técnicas. Como resultados obtidos na pesquisa, destaca-se um inédito corpus anotado, composto por aproximadamente meio milhão de palavras do português brasileiro, além dos resultados médios obtidos com os testes empíricos da ferramenta de sumarização, que indicam uma redução da dimensionalidade, para textos com até 500 palavras, da ordem de 53%. A análise geral dos achados da pesquisa indica que os resultados são promissores quanto à capacidade de redução e a preservação do valor semântico dos textos. Palavras-chave: Sumarização automática de textos. Acessibilidade Informacional.
Mostrar mais

14 Ler mais

Tardis & Tame: um ensaio sobre o significado e a metafísica da linguagem natural

Tardis & Tame: um ensaio sobre o significado e a metafísica da linguagem natural

Assuming it is relevant for TAME to be taken as a semantic device, these three properties assign a main role between grammar and logic/cognitive spheres, as they regard a proper ontology for Semantics to be compatible with its own foundations. First, the universalism factor refers to the natural language itself, with no regards to any specific features of any particular language; this is a very interesting insight, for it refers to whatever underlies human languages as a whole, the principles they hold and share and the possibilities they assign (some languages are tenseless, compensating temporality by means of aspect, etc.). Intensional referentialism stands as a crucial predisposition of natural language to encode the notions of reference and truth by means of intensional ontology, running over abstract situations, entities, worlds and so on. Compositionality is perhaps the major role semantics plays as a context-free component, calculating the meaning of complex expressions by the meaning of all its components plus the manner such components are put together.
Mostrar mais

32 Ler mais

Processamento automático de requisitos de software crítico, expressos em linguagem natural

Processamento automático de requisitos de software crítico, expressos em linguagem natural

Um Part-Of-Speech Tagger (POS Tagger) é um software que recebe como entrada um texto numa linguagem humana e atribui etiquetas correspondentes a partes do discurso para cada palavra (e outros sinais de pontuação), como substantivos, verbos, adjetivos, etc. A maioria dos sistemas de etiquetagem são baseados numa estrutura gramatical livre de contexto. Dentro desta base, é importante distinguir entre a Skeleton Parsing e Full Parsing. Full parsing visa proporcionar o mais detalhado possível uma análise da estrutura sintática da frase, enquanto que Skeleton Parsing, tem uma abordagem menos detalhada que tende a utilizar um conjunto de etiquetas sintáticas menos distintas e ignora, por exemplo, a estrutura interna de certos tipos de constituintes [Nor14]. Note-se o exemplo:
Mostrar mais

68 Ler mais

Lapsos, interrupções, balbuciar ... A filosofia de linguagem e os algoritmos de processamento de linguagem natural de deleuze

Lapsos, interrupções, balbuciar ... A filosofia de linguagem e os algoritmos de processamento de linguagem natural de deleuze

La filosofía de Gilles Deleuze desarrolla la crítica nietzscheana al lenguaje y su gramática en la que el predi- cado depende del sujeto. En vez de ello, Deleuze propone un pensamiento basado en el “infinitivo” donde la acción queda suspendida en un eterno presente “sin espesor”. Si bien, esto ya había sido esbozado por Spinoza, el estudio deleuziano va más allá estudiando la agramaticalidad como fenómeno de desborda- miento creativo. En obras escritas junto al psicoanalista Félix Guattari, Deleuze nos presenta rasgos de esta agramaticalidad que aproximándose al fenómeno de la esquizofrenia, crea un claro más allá del lenguaje constreñido por la sintaxis. En otras obras menores Deleuze estudia casos de la literatura y el arte en los que la expresión subvierte la propia lengua y fenómenos como lapsus, interrupciones o balbuceos, no son taras psicoanalíticas, sino potencialidades creativas y deseantes. La pregunta que nos surge, ante las nuevas metodologías de procesamiento de lenguaje natural es hasta qué punto perseveran esta visión constreñida del lenguaje. Los algoritmos NLP pueden darnos una sensación técnica, computacional y constreñida del lenguaje, pero sus reglas desbordan la gramática y nos permiten analizar e incluso generar lenguaje y sen- tido en arreglo a su pragmática social y colectiva.
Mostrar mais

10 Ler mais

Linguagem natural e música em Rousseau: a busca da expressividade.

Linguagem natural e música em Rousseau: a busca da expressividade.

O filósofo busca determinar – tanto no segundo Discurso como no En- saio – se as operações cognitivas – razão, o entendimento – estão condicio- nadas à formação e desenvolvimento da linguagem ou, se essa última su- põe desenvolvidas as faculdades intelectuais. No segundo Discurso, Rousseau estabelece a anterioridade do pensamento: não é a linguagem que cria o pensamento, mas o pensamento que serve de princípio à lingua- gem. A palavra, isto é, a linguagem articulada, elaborada mediante o con- curso de signos de convenção, não constitui o primeiro estágio da lingua- gem; ela é uma aquisição tardia, resultado de um longo processo de evolução de nossas faculdades intelectuais. A língua primitiva, puramente instintiva e anterior às necessidades de comunicação se limitava a expri- mir o grito da natureza: “A primeira língua do homem, a língua mais univer- sal, a mais enérgica e a única de que necessitou antes de precisar persua- dir homens reunidos, é o grito da natureza” (Rousseau, 1978, p.248). O abandono daquele estado de isolamento primitivo e a exigência daí decor- rente de comunicação com os demais levam os homens a recorrerem à lín- gua dos gestos e dos gritos inarticulados. A linguagem dos primeiros tem- pos é ao mesmo tempo visual e auditiva. A primeira consistia em designar os objetos pelos gestos, enquanto a linguagem auditiva se exprimia por meio das “inflexões da voz” e a emissão de “sons imitativos”. 7 Posterior- mente, os homens inventam “sons articulados e convencionais” e esta substituição da linguagem primitiva pelos signos convencionais, isto é, a criação de uma linguagem mais adequada à representação do conteúdo das idéias está intimamente ligada à instituição da família e ao ingresso na vida social. No entanto, tais instituições apenas contribuem para desenvol- vê-la e aperfeiçoá-la, porquanto a palavra tem uma origem natural, já que resulta de disposições presentes no homem desde a origem. Por esse moti- vo sua evolução é indiscernível das etapas de socialização do homem. E se, tal como a sociedade, a linguagem tende a corromper-se, a tornar-se mais e
Mostrar mais

20 Ler mais

O Thesaurus Brasileiro da Educação

O Thesaurus Brasileiro da Educação

[...] segundo sua função, como um instru- mento de controle terminológico utilizado para traduzir a linguagem natural dos do- cumentos, dos indexadores e dos usuários para uma linguagem sistêmica mais conti- da (linguagem documentária, linguagem de informação) [...] do ponto de vista de sua estrutura, o thesaurus é um vocabulário controlado e dinâmico de termos que pos- suem entre si relações semânticas e gené- ricas, baseadas num sistema de conceitos, e que abrange de maneira exaustiva um campo específico de conhecimento.

6 Ler mais

Show all 10000 documents...