• Nenhum resultado encontrado

Corretor Gramatical Para o Emacs

N/A
N/A
Protected

Academic year: 2022

Share "Corretor Gramatical Para o Emacs"

Copied!
1
0
0

Texto

(1)

Corretor Gramatical Para o Emacs

Thiago Maciel Batista

Professor Orientador: Marcelo Finger

Instituto de Matem ´atica e Estat´ıstica da Universidade de S ˜ao Paulo thiguns@gmail.com

Resumo

O editor de texto emacs nunca teve um corretor gramatical para a l´ıngua portuguesa do Brasil. Para suprir essa necessidade, este trabalho teve como principal objetivo acoplar um corretor gramatical ao emacs. O corretor usado no acoplamento foi o co- groo. Na figura 1, podemos ver um trecho de texto no emacs, corrigido e com o erro destacado.

Figura 1: Texto com um erro, que est ´a sendo destacado pelo emacs.

Tamb ´em fez parte do trabalho o estudo de processamento de linguagem natural e o estudo do cogroo.

1. PLN Estat´ıstico

P

ROCESSAMENTO estat´ıstico de linguagem natural(PLN es- tat´ıstico), emprega conceitos de estat´ıstica para processar uma linguagem. Para isso, usa-se um corpus para treinamento, modelos probabil´ısticos e t ´ecnicas de aprendizado de m ´aquina.

2. CoGrOO

E ´

Um corretor gramatical da l´ıngua portuguesa do Brasil feito, a principio, para o OpenOffice.org, que utiliza PLN estat´ıstico.

Figura 2: Principais m ´odulos do cogroo e o fluxo de processa- mento de texto(Ilustrac¸ ˜ao gentilmente cedida por Edwin Miguel)

• SentenceDetect: Separa o texto em sentenc¸as.

• Tokenizer: ´E o m ´odulo que separa uma sentenc¸a em tokens.

• ProperNameFinder: Identifica nomes pr ´oprios.

• ContractionSeparator: Respons ´avel por identificar contrac¸ ˜oes.

• Pretagger: Prepara os tokens para receber informac¸ ˜oes mor- fol ´ogica.

• Postagger: Coloca a classificac¸ ˜ao morfol ´ogica dos tokens.

• Rulesapplier: Aplica as regras gramaticais e gera uma lista com os erros.

3. Como Foi Feito o Acoplamento

O

Acoplamento foi feito por meio de interfaces no cogroo e no emacs. Essas interfaces se comunicam para executar a correc¸ ˜ao.

Figura 3: Modelo do acoplamento. Os n ´umeros indicam a sequ ˆencia de passos para corrigir um texto

4. Conclus ˜oes e Resultados

Conseguiu-se um resultado satisfat ´orio, e o emacs j ´a ´e capaz de usar o cogroo.

Figura 4: Emacs destacando erro no texto. Neste caso h ´a duas sugest ˜oes de correc¸ ˜ao para o erro

Com isso, mostra-se a mobilidade do emacs e do cogroo e a im- port ˆancia do processamento de linguagem natural atualmente.

5. Trabalhos Futuros

• Disponibilizar para os usu ´arios.

• Usar sugest ˜oes para melhorias.

• Aperfeic¸oar correc¸ ˜ao.

• Reportagem autom ´atica de erros.

• Aprendizado de m ´aquina com os erros reportados.

6. Refer ˆencias

[1] Christopher D. Manning and Hinrich Schutze. Foundations of Statistical Natural Language Processing. MIT press, second edition, 1999.

[2] GNU. Gnu emacs. Dispon´ıvel em: http://www.gnu.org/software/emacs/. Acesso em:

2010.

[3] William Colen. Cogroo - corretor gramatical acopl ´avel ao openoffice.org. Dispon´ıvel em:

http://cogroo.sourceforge.net/., Acesso em: 2010.

Trabalho de Formatura Supervisionado - MAC0499 - 2010

Referências

Documentos relacionados

É perceptível, desta forma, o constante aumento do aprofundamento dos personagens: os “príncipes” têm agora não só nome e falas, mas personalidades bem desenvolvidas,

No Rotaract Club de Póvoa de Varzim falou sobre “Resiliência: Vencer a Adversidade” o Dr.. o Rotary Club de Sandim , cujo clube-padrinho foi o Rotary Club de Vila Nova de Gaia.

Infração de Trânsito por não ter localizado os proprietários dos veículos, ou porque não comprovou a entrega das Notificações de Autuação por Infração de Trânsito

A partir das atividades desenvolvidas com a lousa digital na universidade, na escola estadual e das observações realizadas em sala de aula formulou-se um

O protagonismo dos usuários no ensino da psicopatologia: uma experiência na graduação psicologia. A a�vidade prá�ca desenvolvida no Centro de Atenção Diária do Ins�tuto de

Em Nova York, os trabalhadores de abrigos foram aconselhados pelo Departamento de Saúde da cidade para realocação de abrigados e outras pessoas em situação de rua com

controversos, já que alguns estudos não demonstraram redu- ção significativa nos níveis plasmáticos de homocisteína, após os indivíduos serem submetidos a um programa regular de

O sentido original e a correção gramatical do texto seriam preservados caso o trecho “O princípio da equidade, uma ampliação do princípio da dignidade feita