• Nenhum resultado encontrado

Detecção das Relações Retóricas

4. DiZer: Um Analisador Discursivo Automático para o Português do Brasil

4.2. Arquitetura do DiZer

4.2.2. Processos do DiZer

4.2.2.2. Detecção das Relações Retóricas

Neste processo, a partir dos segmentos delimitados no processo de segmentação textual, procuram-se por todas as possíveis relações retóricas entre as proposições expressas por estes segmentos. Para tanto, realiza-se um processo de casamento de padrões, como definido por Russel e Norvig (2003), entre os padrões de análise armazenados no repositório de padrões e os possíveis pares de segmentos identificados pelo DiZer, consultando-se, quando necessário, o repositório de classes.

Um processo de casamento de padrões consiste em verificar se um par de segmentos contém as informações especificadas em um padrão de análise. Se isso ocorrer, estabelece-se a relação indicada no padrão entre as proposições expressas pelos segmentos, obedecendo-se a ordenação entre o núcleo e o satélite (ou outro núcleo, no caso de uma relação multinuclear) especificado no padrão.

O processo de casamento de padrões para dois segmentos quaisquer é aplicado exaustivamente para todos os padrões de análise, produzindo todas as relações retóricas possíveis entre as proposições expressas pelos segmentos. Por exemplo, para o par de segmentos 3 e 4 da Figura 4.10, as relações retóricas CAUSE, EXPLANATION e JUSTIFY são listadas como possíveis, sendo que a proposição expressa pelo segmento 3 é o núcleo destas relações. Os padrões aplicados para a determinação destas três relações são mostrados nas Figuras 4.11-4.13.

Relação CAUSE

Ordem NS

Marcador na 1a. proposição ---

Posição do primeiro marcador ---

Marcador na 2a. proposição pois

Posição do segundo marcador início

Figura 4.11 – Padrão de análise aplicado pelo DiZer para a relação CAUSE

Relação EXPLANATION

Ordem NS

Marcador na 1a. proposição ---

Posição do primeiro marcador ---

Marcador na 2a. proposição pois

Posição do segundo marcador início

Figura 4.12 – Padrão de análise aplicado pelo DiZer para a relação EXPLANATION

Relação JUSTIFY

Ordem NS

Marcador na 1a. proposição ---

Posição do primeiro marcador ---

Marcador na 2a. proposição pois

Posição do segundo marcador início

Figura 4.13 – Padrão de análise aplicado pelo DiZer para a relação JUSTIFY

Note que os três padrões especificam o mesmo marcador discursivo no início de um segmento para que as relações sejam estabelecidas.

Nos casos em que os padrões de análise fazem uso de informações sobre classes de palavras, o repositório de classes é consultado. Quando os marcadores textuais se referem às formas canônicas das palavras, o léxico acoplado ao DiZer é consultado durante o processo de casamento de padrões para se verificar se as palavras presentes no segmento textual possuem as formas canônicas correspondentes requeridas.

É importante dizer que, na análise automática realizada pelo DiZer, não se diferenciam as relações volitivas das não volitivas para as relações CAUSE e RESULT, como se pode notar no padrão de análise da Figura 4.11. Isso se deve ao fato de estas relações possuírem os mesmos marcadores textuais, não sendo possível, portanto, distingui-las.

Quando nenhum padrão se aplica para dois segmentos quaisquer, a relação ELABORATION é utilizada para relacionar suas proposições, pois esta é a relação mais freqüente no CorpusTCC (veja Seção 4.1 neste capítulo) e a mais genérica

definida pela RST. O fato de nenhum padrão se aplicar pode se dever à ausência de marcadores textuais nos segmentos ou à presença de marcadores que não constam no CorpusTCC e, portanto, não possuem padrões de análise correspondentes. Quando nenhum padrão se aplica, a inclusão da relação ELABORATION pode causar a construção de estruturas retóricas inadequadas, entretanto, tal escolha parece ser a mais natural nestes casos.

De forma similar à anotação retórica do CorpusTCC, o DiZer utiliza a estratégia modular e incremental, da esquerda para a direita, para detecção das relações retóricas entre as proposições expressas pelos segmentos: inicialmente, relacionam-se as proposições expressas pelas orações dentro de cada sentença; a seguir, relacionam-se as proposições expressas pelas sentenças dentro de cada parágrafo; por fim, relacionam-se as proposições expressas pelos parágrafos do texto. Como já discutido, tal estratégia se beneficia do fato de o escritor do texto expressar as proposições relacionadas em um mesmo nível de organização hierárquica no texto. Em termos práticos, esta estratégia diminui significativamente as possibilidades de análise pelo DiZer, tornando o processamento automático mais eficiente.

Na Figura 4.14, mostram-se todas as relações encontradas pelo DiZer para os segmentos mostrados na Figura 4.10. Na representação empregada, o predicado rhet_rel(R,Y,X) representa uma estrutura retórica na qual a proposição (ou subestrutura) Y é o satélite e a proposição (ou subestrutura) X o núcleo na relação retórica R.

Figura 4.14 – Relações retóricas detectadas pelo DiZer

A partir do conjunto de relações retóricas produzido pelo DiZer, constroem-se as estruturas retóricas possíveis para o texto, como se explica na subseção seguinte.

rhet_rel(CIRCUMSTANCE, 2, 1) rhet_rel(ENABLEMENT, 1, 2) rhet_rel(CAUSE, 4, 3) rhet_rel(EXPLANATION, 4, 3) rhet_rel(JUSTIFY, 4, 3) rhet_rel(ELABORATION, 6, 5) rhet_rel(ELABORATION, [1, 2], [3, 4]) rhet_rel(BACKGROUND, [3, 4], [5, 6]) rhet_rel(PURPOSE, [5, 6], [3, 4])

As limitações do processo de detecção de relações retóricas como realizado pelo DiZer são que, (a) em teoria, as relações do discurso não se estabelecem, necessariamente, entre proposições expressas por segmentos adjacentes no texto e (b) é comum que segmentos textuais não possuam marcadores textuais. Em relação a (a), Marcu (1997) mostra que é possível construir estruturas igualmente adequadas nas quais as relações se estabelecem somente entre proposições expressas por segmentos adjacentes, utilizando-se, para isso, o critério da composicionalidade; quanto a (b), na análise de um texto pelo DiZer, pode-se causar a produção de uma grande quantidade de relações ELABORATION.