5.2 SUMARIZAÇÃO DO DEBATE
5.2.2 Abordagens de pontuação das sentenças do debate e seleção para o sumário
A fórmula TF/IDF calcula um índice numericamente valorado para um determinado termo. Entretanto, esse termo não corresponde necessariamente à pontuação da sentença da qual ele foi extraído. Assim, para obter um valor associado à sentença, esse trabalho desen- volveu as três técnicas apresentadas a seguir:
• Highest Term Sentence Score (HTSS): nessa abordagem (ilustrada no Quadro 11), à pontuação da sentença é atribuído o maior valor do TF/IDF dentre seus termos calcu- lados. Assim, caso uma sentença apresente termos cujo TF/IDF esteja no conjunto A, a pontuação final da sentença será Max(A)
• Summing Term Sentence Score (STSS): nessa abordagem (ilustrada no Quadro 12), a pontuação da sentença corresponde ao somatório dos índices TF/IDF de todos os seus termos. Portanto, em um conjunto de termos pontuados conforme o conjunto A, a pon- tuação da sentença será de ∑(�� ∈ �);
• Standard Deviation Sentence Score (SDSS): nessa abordagem (ilustrada no Quadro 13), a pontuação da sentença corresponde ao somatório do índice TF/IDF dos termos que apresentarem um desvio padrão de 1 do índice de termos apresentados. Assim, pa- ra um conjunto de termos valorados pelo TF/IDF, a pontuação da sentença será a soma dos valores que estiverem no intervalo de um desvio padrão. Ou seja, dado um conjun- to A de termos de uma sentença (valorados conforme o TF/IDF), a média dos termos � e o desvio padrão �, a pontuação da sentenças será ∑(�� ∈ �|� − � ≤ �� ≤ � + �).
Os Quadros 11, 12 e 13 apresentam os sumários gerados pelas abordagens HTSS,
Sentenças selecionadas pelo TF/IDF(t) RO Sentenças selecionadas pelo TF/IDF(tC) RO Sentenças selecionadas pelo TF/IDF(tF)
90 STSS e SDSS, respectivamente. Cada abordagem apresenta um conjunto de sentenças sele- cionadas para o sumário final, sendo que há sentenças distintas bem como sentenças comuns selecionadas entre as três abordagens utilizadas.
Quadro 11 – Abordagem HTSS Highest Term Sentence Score (HTSS)
Sentença Posição
Na França, as consultas dizem respeito menos a setores do que para umpaís como o Brasil, que
tem consultas para os problemas relativos a educação e saúde A favor O debate é uma fonte de informação sobre a maneira de pensar das pessoas bem mais ricas do
que as sondagens. A favor
Há uma grande lista disso, penso em CPCOOP, mas há também associações profissionais como
DEBATLAB ou Forum des débats pour le bien commun. A favor A ética dos debates diz respeito a uma transparência, uma colegialidade dos debates e uma subsi-
diaridade que garantem que a decisão se tome no bom nível. A favor Além disso, para ser eficiente, o âmbito dos debates deve oferecer a cada um o desejo e o prazer
de dar sua contribuição. A favor
Inteiramente essencial, mais fácil dizer do que fazer. A favor Não é o que é dito que importa, mas a capacidade de notificação que consiste em fazer saber a
quem de direito o que é dito, pois isso pode agir sobre sua ação ou seu pensamento. A favor É realmente muito importante ter um método para fazer a análise online de conteúdo escrito na
forma oral, pois ninguém tem tempo de reler e escutar tudo. A favor O debate é o elemento essencial quando o resultado é contribuir para uma tomada de decisão
sancionada por um voto sobre uma questão que diz respeito à gestão de um bem comum. Contrario Sim, mas como ser informado das ideias férteis e qual a contrapartida para seus autores? A favor Se se multiplica por milhares os debates com a lei impõe, é preciso que sua autenticação seja tão
banal quanto um envelope selado. Contrario
Dois casos ilustrativos, primeiramente, a axpressão sob a cobertura do anonimato, sabendo-se que o anonimato integral não é algo que o poder aprecia muito, sobre um suporte mediático o garantisse: 100% pelo design (a expressão é desconectada do autor), e baseado em uma confian- ça, com aquilo que se sabe apenas sobre a confiança em matéria de política e de escuta.
Contrario
Se isso diz respeito ao resultado final está no contexto, segundo o grau de pertinência das inter-
venções. Contrario
Se não se pode estabelecer a relação entre o debate o relatório final, se está na situação em que
um conselho administrativo redige e sensura em última instância. Contrario O usuário com a máquina, o par usuário e máquina com os agentes do serviço. A favor Fonte: o Autor
Quadro 12 – Abordagem STSS
Summing Term Sentence Score (STSS)
Sentença Posição
Eu sou Charlie e eu caricaturo os dois perigos advindos de uma ausência de ética pelo cale a boca
ou não estou nem aí A favor
Isso é um problema concreto, que requer que se saiba o que o debate produziu como recomenda-
ção e de ver como elas foram implementadas pelos poderes públicos. A favor Inteiramente essencial, mais fácil dizer do que fazer. A favor
91 É realmente muito importante ter um método para fazer a análise online de conteúdo escrito na
forma oral, pois ninguém tem tempo de reler e escutar tudo. A favor E, portanto, não se deve dixar que ninguém o faça por nós. A favor O debate é o elemento essencial quando o resultado é contribuir para uma tomada de decisão
sancionada por um voto sobre uma questão que diz respeito à gestão de um bem comum.
Contrario
A regulação deve vir de baixo para estar em conformidade com o modelo de uma democracia
participativa. A favor
Sim, mas como ser informado das ideias férteis e qual a contrapartida para seus autores? A favor Por experiência sabe-se que o anonimato é útil para iniciar o debate. A favor
Enfim, ela é util para os votos. A favor
Se se multiplica por milhares os debates com a lei impõe, é preciso que sua autenticação seja tão
banal quanto um envelope selado. Contrario
Se isso diz respeito ao resultado final está no contexto, segundo o grau de pertinência das inter-
venções. Contrario
Se não se pode estabelecer a relação entre o debate o relatório final, se está na situação em que
um conselho administrativo redige e sensura em última instância. Contrario
É melhor integrar que dividir. Contrario
O usuário com a máquina, o par usuário e máquina com os agentes do serviço. A favor Fonte: o Autor
Quadro 13 – Abordagem SDSS
Standard Deviation Sentence Score (SDSS)
Sentença Posição
Na França, as consultas dizem respeito menos a setores do que para um país como o Brasil, que
tem consultas para os problemas relativos a educação e saúde A favor Eu sou Charlie e eu caricaturo os dois perigos advindos de uma ausência de ética pelo cale a boca
ou não estou nem aí A favor
O debate é uma fonte de informação sobre a maneira de pensar das pessoas bem mais ricas do
que as sondagens. A favor
Os debates só seriam uma maneira de fabricar consentimentos a uma política pública. A favor Se assegurar que as partes envolvidas foram consideradass, que as tomadas de decisão se fazem
em bom nível, que o protocolo foi cumprido e respeitado, que se respeitou a vida privada e a liberdade de pensamento de todos os contribuintes.
A favor
Há uma grande lista disso, penso em CPCOOP, mas há também associações profissionais como
DEBATLAB ou Forum des débats pour le bien commun. A favor Isso é um problema concreto, que requer que se saiba o que o debate produziu como recomenda-
ção e de ver como elas foram implementadas pelos poderes públicos. A favor A ética dos debates diz respeito a uma transparência, uma colegialidade dos debates e uma subsi-
diaridade que garantem que a decisão se tome no bom nível. A favor Além disso, para ser eficiente, o âmbito dos debates deve oferecer a cada um o desejo e o prazer
de dar sua contribuição. A favor
Ele deve, enfim, garantir a cada contribuidor um respeito à sua vida privada e a suas liberdades. A favor Notarização (eletrônica) parece o termo apropriado se considerarmos o artigo da Wikipedia que
lhe é consagrado: http://fr.wikipedia.org/wiki/Notarisation_%C3%A9lectronique. Contrário De fato, ele cobre ao mesmo tempo a autenticação e o armazenamento securizado. Contrário Essa definição só cobre o caso de uma mensagem eletrônica. Contrário A proposição consiste em expandi-la à totalidade de um debate, o que supõe, como eu já disse
antes, a autenticação dos participantes, portanto, a rejeição de participatnes anônimos ou cuja identidade não pode ser verificada.
Contrário
Se isso diz respeito ao resultado final está no contexto, segundo o grau de pertinência das inter-
92 Fonte: o Autor
5.2.3 Análise dos resultados
A primeira análise realizada consistiu na identificação de sentenças que fossem co- muns entre as diferentes técnicas de seleção. O Quadro 14 ilustra as porcentagens de senten- ças comuns entre as diferentes técnicas.
Quadro 14 – Algoritmo de sumarização de debates baseado na técnica TF/IDF adaptada
SDSS STSS
HTSS 40% 53%
STSS 6%
Fonte: o Autor
Pelo Quadro 14, é possível perceber que as abordagens HTSS e STSS obtiveram 53% das sentenças selecionadas em comum, ao passo que a abordagem SDSS foi a que me- nos apresentou sentenças selecionadas em comum com as demais abordagens. Observa-se também que a abordagem STSS selecionou algumas sentenças demasiadamente curtas, o que seria possível, pois seu método de pontuação é dado pela soma dos termos das senten- ças. Percebe-se, portanto, que tal abordagem pode selecionar senetenças que, devido ao seu curto tamanho, apresentaram alta relevância, mesmo que suas palavras individualmente ob- tivessem pontuações mais baixas dadas pelo TF/IDF. É também possível que, devido à soma das pontuações dos termos da sentença, as sentenças maiores seriam necessariamente seleci- onadas como mais relevantes. Entretanto, esse comportamento não foi verificado.
Outra análise diz respeito à dispesão de argumentos por participantes. No Gráfico 3 são ilustradas as proporções de contribuições de cada participante no debate durante o período analisado. Nos Gráficos 4, 5 e 6 são ilustradas as dispersões de sentenças selecionadas para cada uma das abordagens de sumarização utilizadas. É possível perceber que a abordagem STSS foi o único método capaz de extrair sentenças de todos os participantes envolvidos. Esse comportamento pode estar relacionado com o tamanho das sentenças criadas por cada participante. Sendo assim, mesmo que certas sentenças não se apresentem muito relevantes para o sumário, elas podem ainda sim ser selecionadas, pois a pontuação das sentenças será dada pelo somatório de seus termos. Outra observação relevante é que tanto o método HTSS quanto o STSS permitiu selecionar mais sentenças dos participantes 2, 3 e 4 em detrimento
93 do participante 1 (que apresentou quase 70% das contribuições no debate). Esse comporta- mento permite atribuir uma maior dispersão de sentenças para todos os participantes, permi- tindo uma melhor democratização durante extração do sumário. Não obstante, o autor desse trabalho acredita que sumários de outros debates seriam necessários para comprovar essa análise e validar essa observação.
Gráfico 3 – Contribuições de argumentos durante a execução do debate
Fonte: o Autor
Gráfico 4 – Sentenças selecionadas de cada participante pelo método HTSS
Fonte: o Autor 0% 10% 20% 30% 40% 50% 60% 70% 80%
Participante 1 Participante 2 Participante 3 Participante 4
0% 10% 20% 30% 40% 50% 60% 70%
94 Gráfico 5 – Sentenças selecionadas de cada participante pelo método STSS
Fonte: o Autor
Gráfico 6 – Sentenças selecionadas de cada participante pelo método SDSS
Fonte: o Autor