• Nenhum resultado encontrado

Abordagens de pontuação das sentenças do debate e seleção para o sumário

5.2 SUMARIZAÇÃO DO DEBATE

5.2.2 Abordagens de pontuação das sentenças do debate e seleção para o sumário

A fórmula TF/IDF calcula um índice numericamente valorado para um determinado termo. Entretanto, esse termo não corresponde necessariamente à pontuação da sentença da qual ele foi extraído. Assim, para obter um valor associado à sentença, esse trabalho desen- volveu as três técnicas apresentadas a seguir:

• Highest Term Sentence Score (HTSS): nessa abordagem (ilustrada no Quadro 11), à pontuação da sentença é atribuído o maior valor do TF/IDF dentre seus termos calcu- lados. Assim, caso uma sentença apresente termos cujo TF/IDF esteja no conjunto A, a pontuação final da sentença será Max(A)

• Summing Term Sentence Score (STSS): nessa abordagem (ilustrada no Quadro 12), a pontuação da sentença corresponde ao somatório dos índices TF/IDF de todos os seus termos. Portanto, em um conjunto de termos pontuados conforme o conjunto A, a pon- tuação da sentença será de ∑(� ∈ �);

• Standard Deviation Sentence Score (SDSS): nessa abordagem (ilustrada no Quadro 13), a pontuação da sentença corresponde ao somatório do índice TF/IDF dos termos que apresentarem um desvio padrão de 1 do índice de termos apresentados. Assim, pa- ra um conjunto de termos valorados pelo TF/IDF, a pontuação da sentença será a soma dos valores que estiverem no intervalo de um desvio padrão. Ou seja, dado um conjun- to A de termos de uma sentença (valorados conforme o TF/IDF), a média dos termos e o desvio padrão �, a pontuação da sentenças será ∑(� ∈ �|� − � ≤ � ≤ � + �).

Os Quadros 11, 12 e 13 apresentam os sumários gerados pelas abordagens HTSS,

Sentenças selecionadas pelo TF/IDF(t) RO Sentenças selecionadas pelo TF/IDF(tC) RO Sentenças selecionadas pelo TF/IDF(tF)

90 STSS e SDSS, respectivamente. Cada abordagem apresenta um conjunto de sentenças sele- cionadas para o sumário final, sendo que há sentenças distintas bem como sentenças comuns selecionadas entre as três abordagens utilizadas.

Quadro 11 – Abordagem HTSS Highest Term Sentence Score (HTSS)

Sentença Posição

Na França, as consultas dizem respeito menos a setores do que para umpaís como o Brasil, que

tem consultas para os problemas relativos a educação e saúde A favor O debate é uma fonte de informação sobre a maneira de pensar das pessoas bem mais ricas do

que as sondagens. A favor

Há uma grande lista disso, penso em CPCOOP, mas há também associações profissionais como

DEBATLAB ou Forum des débats pour le bien commun. A favor A ética dos debates diz respeito a uma transparência, uma colegialidade dos debates e uma subsi-

diaridade que garantem que a decisão se tome no bom nível. A favor Além disso, para ser eficiente, o âmbito dos debates deve oferecer a cada um o desejo e o prazer

de dar sua contribuição. A favor

Inteiramente essencial, mais fácil dizer do que fazer. A favor Não é o que é dito que importa, mas a capacidade de notificação que consiste em fazer saber a

quem de direito o que é dito, pois isso pode agir sobre sua ação ou seu pensamento. A favor É realmente muito importante ter um método para fazer a análise online de conteúdo escrito na

forma oral, pois ninguém tem tempo de reler e escutar tudo. A favor O debate é o elemento essencial quando o resultado é contribuir para uma tomada de decisão

sancionada por um voto sobre uma questão que diz respeito à gestão de um bem comum. Contrario Sim, mas como ser informado das ideias férteis e qual a contrapartida para seus autores? A favor Se se multiplica por milhares os debates com a lei impõe, é preciso que sua autenticação seja tão

banal quanto um envelope selado. Contrario

Dois casos ilustrativos, primeiramente, a axpressão sob a cobertura do anonimato, sabendo-se que o anonimato integral não é algo que o poder aprecia muito, sobre um suporte mediático o garantisse: 100% pelo design (a expressão é desconectada do autor), e baseado em uma confian- ça, com aquilo que se sabe apenas sobre a confiança em matéria de política e de escuta.

Contrario

Se isso diz respeito ao resultado final está no contexto, segundo o grau de pertinência das inter-

venções. Contrario

Se não se pode estabelecer a relação entre o debate o relatório final, se está na situação em que

um conselho administrativo redige e sensura em última instância. Contrario O usuário com a máquina, o par usuário e máquina com os agentes do serviço. A favor Fonte: o Autor

Quadro 12 – Abordagem STSS

Summing Term Sentence Score (STSS)

Sentença Posição

Eu sou Charlie e eu caricaturo os dois perigos advindos de uma ausência de ética pelo cale a boca

ou não estou nem aí A favor

Isso é um problema concreto, que requer que se saiba o que o debate produziu como recomenda-

ção e de ver como elas foram implementadas pelos poderes públicos. A favor Inteiramente essencial, mais fácil dizer do que fazer. A favor

91 É realmente muito importante ter um método para fazer a análise online de conteúdo escrito na

forma oral, pois ninguém tem tempo de reler e escutar tudo. A favor E, portanto, não se deve dixar que ninguém o faça por nós. A favor O debate é o elemento essencial quando o resultado é contribuir para uma tomada de decisão

sancionada por um voto sobre uma questão que diz respeito à gestão de um bem comum.

Contrario

A regulação deve vir de baixo para estar em conformidade com o modelo de uma democracia

participativa. A favor

Sim, mas como ser informado das ideias férteis e qual a contrapartida para seus autores? A favor Por experiência sabe-se que o anonimato é útil para iniciar o debate. A favor

Enfim, ela é util para os votos. A favor

Se se multiplica por milhares os debates com a lei impõe, é preciso que sua autenticação seja tão

banal quanto um envelope selado. Contrario

Se isso diz respeito ao resultado final está no contexto, segundo o grau de pertinência das inter-

venções. Contrario

Se não se pode estabelecer a relação entre o debate o relatório final, se está na situação em que

um conselho administrativo redige e sensura em última instância. Contrario

É melhor integrar que dividir. Contrario

O usuário com a máquina, o par usuário e máquina com os agentes do serviço. A favor Fonte: o Autor

Quadro 13 – Abordagem SDSS

Standard Deviation Sentence Score (SDSS)

Sentença Posição

Na França, as consultas dizem respeito menos a setores do que para um país como o Brasil, que

tem consultas para os problemas relativos a educação e saúde A favor Eu sou Charlie e eu caricaturo os dois perigos advindos de uma ausência de ética pelo cale a boca

ou não estou nem aí A favor

O debate é uma fonte de informação sobre a maneira de pensar das pessoas bem mais ricas do

que as sondagens. A favor

Os debates só seriam uma maneira de fabricar consentimentos a uma política pública. A favor Se assegurar que as partes envolvidas foram consideradass, que as tomadas de decisão se fazem

em bom nível, que o protocolo foi cumprido e respeitado, que se respeitou a vida privada e a liberdade de pensamento de todos os contribuintes.

A favor

Há uma grande lista disso, penso em CPCOOP, mas há também associações profissionais como

DEBATLAB ou Forum des débats pour le bien commun. A favor Isso é um problema concreto, que requer que se saiba o que o debate produziu como recomenda-

ção e de ver como elas foram implementadas pelos poderes públicos. A favor A ética dos debates diz respeito a uma transparência, uma colegialidade dos debates e uma subsi-

diaridade que garantem que a decisão se tome no bom nível. A favor Além disso, para ser eficiente, o âmbito dos debates deve oferecer a cada um o desejo e o prazer

de dar sua contribuição. A favor

Ele deve, enfim, garantir a cada contribuidor um respeito à sua vida privada e a suas liberdades. A favor Notarização (eletrônica) parece o termo apropriado se considerarmos o artigo da Wikipedia que

lhe é consagrado: http://fr.wikipedia.org/wiki/Notarisation_%C3%A9lectronique. Contrário De fato, ele cobre ao mesmo tempo a autenticação e o armazenamento securizado. Contrário Essa definição só cobre o caso de uma mensagem eletrônica. Contrário A proposição consiste em expandi-la à totalidade de um debate, o que supõe, como eu já disse

antes, a autenticação dos participantes, portanto, a rejeição de participatnes anônimos ou cuja identidade não pode ser verificada.

Contrário

Se isso diz respeito ao resultado final está no contexto, segundo o grau de pertinência das inter-

92 Fonte: o Autor

5.2.3 Análise dos resultados

A primeira análise realizada consistiu na identificação de sentenças que fossem co- muns entre as diferentes técnicas de seleção. O Quadro 14 ilustra as porcentagens de senten- ças comuns entre as diferentes técnicas.

Quadro 14 – Algoritmo de sumarização de debates baseado na técnica TF/IDF adaptada

SDSS STSS

HTSS 40% 53%

STSS 6%

Fonte: o Autor

Pelo Quadro 14, é possível perceber que as abordagens HTSS e STSS obtiveram 53% das sentenças selecionadas em comum, ao passo que a abordagem SDSS foi a que me- nos apresentou sentenças selecionadas em comum com as demais abordagens. Observa-se também que a abordagem STSS selecionou algumas sentenças demasiadamente curtas, o que seria possível, pois seu método de pontuação é dado pela soma dos termos das senten- ças. Percebe-se, portanto, que tal abordagem pode selecionar senetenças que, devido ao seu curto tamanho, apresentaram alta relevância, mesmo que suas palavras individualmente ob- tivessem pontuações mais baixas dadas pelo TF/IDF. É também possível que, devido à soma das pontuações dos termos da sentença, as sentenças maiores seriam necessariamente seleci- onadas como mais relevantes. Entretanto, esse comportamento não foi verificado.

Outra análise diz respeito à dispesão de argumentos por participantes. No Gráfico 3 são ilustradas as proporções de contribuições de cada participante no debate durante o período analisado. Nos Gráficos 4, 5 e 6 são ilustradas as dispersões de sentenças selecionadas para cada uma das abordagens de sumarização utilizadas. É possível perceber que a abordagem STSS foi o único método capaz de extrair sentenças de todos os participantes envolvidos. Esse comportamento pode estar relacionado com o tamanho das sentenças criadas por cada participante. Sendo assim, mesmo que certas sentenças não se apresentem muito relevantes para o sumário, elas podem ainda sim ser selecionadas, pois a pontuação das sentenças será dada pelo somatório de seus termos. Outra observação relevante é que tanto o método HTSS quanto o STSS permitiu selecionar mais sentenças dos participantes 2, 3 e 4 em detrimento

93 do participante 1 (que apresentou quase 70% das contribuições no debate). Esse comporta- mento permite atribuir uma maior dispersão de sentenças para todos os participantes, permi- tindo uma melhor democratização durante extração do sumário. Não obstante, o autor desse trabalho acredita que sumários de outros debates seriam necessários para comprovar essa análise e validar essa observação.

Gráfico 3 – Contribuições de argumentos durante a execução do debate

Fonte: o Autor

Gráfico 4 – Sentenças selecionadas de cada participante pelo método HTSS

Fonte: o Autor 0% 10% 20% 30% 40% 50% 60% 70% 80%

Participante 1 Participante 2 Participante 3 Participante 4

0% 10% 20% 30% 40% 50% 60% 70%

94 Gráfico 5 – Sentenças selecionadas de cada participante pelo método STSS

Fonte: o Autor

Gráfico 6 – Sentenças selecionadas de cada participante pelo método SDSS

Fonte: o Autor