• Nenhum resultado encontrado

Download/Open

N/A
N/A
Protected

Academic year: 2021

Share "Download/Open"

Copied!
163
0
0

Texto

(1)UNIVERSIDADE METODISTA DE SÃO PAULO ESCOLA DE COMUNICAÇÃO, EDUCAÇÃO E HUMANIDADES Programa de Pós-Graduação em Comunicação Social. ANDRÉ ROSA DE OLIVEIRA. METADADOS COMO ATRIBUTOS DA INFORMAÇÃO ESTRUTURADA EM BASES DE DADOS JORNALÍSTICAS NA WEB. São Bernardo do Campo-SP, 2016.

(2)

(3) UNIVERSIDADE METODISTA DE SÃO PAULO ESCOLA DE COMUNICAÇÃO, EDUCAÇÃO E HUMANIDADES Programa de Pós-Graduação em Comunicação Social. ANDRÉ ROSA DE OLIVEIRA. METADADOS COMO ATRIBUTOS DA INFORMAÇÃO ESTRUTURADA EM BASES DE DADOS JORNALÍSTICAS NA WEB. Tese apresentada em cumprimento parcial às exigências do Programa de Pós-Graduação em Comunicação Social da Universidade Metodista de São Paulo (UMESP) para obtenção do grau de Doutor. Orientadora: Profa. Marli dos Santos Co-orientador: Prof. Walter Teixeira Lima Júnior. São Bernardo do Campo-SP, 2016.

(4) FICHA CATALOGRÁFICA Ol4m. Oliveira, André Rosa de Metadados como atributos da informação estruturada em bases de dados jornalísticas na web / André Rosa de Oliveira. 2016. 163 p. Tese (doutorado em Comunicação Social) --Escola de Comunicação, Educação e Humanidades da Universidade Metodista de São Paulo, São Bernardo do Campo, 2016. Orientação: Marli dos Santos. Co-orientação: Walter Teixeira Lima Júnior. 1. Jornalismo 2. Internet 3. Metadados 4. Interdisciplinaridade I. Título. CDD 302.2.

(5) FOLHA DE APROVAÇÃO. A tese Metadados como atributos da informação estruturada em bases de dados jornalísticas na Web, elaborada por André Rosa de Oliveira, foi defendida e aprovada em 19 de setembro de 2016, perante a banca examinadora composta pelos professores Marli dos Santos, Walter Teixeira Lima Júnior, Ronaldo Cristiano Prati, Leandro Key Higuchi Yanaze e Roberto Joaquim de Oliveira.. Declaro que o autor incorporou as modificações sugeridas pela banca examinadora, sob a minha anuência enquanto orientadora, nos termos do Art.34 do Regulamento dos Cursos de Pós-Graduação.. São Bernardo do Campo, 19 de novembro de 2016.. ____________________________________________________________________ Assinatura do orientador (Profa. Dra. Marli dos Santos). ____________________________________________________________________ Visto do Coordenador do Programa de Pós-Graduação. Programa: Pós-Graduação em Comunicação Social Área de concentração: Processos Comunicacionais Linha de pesquisa: Inovações Tecnológicas na Comunicação Contemporânea.

(6)

(7) “Papai, é sério que vocês perdiam tempo escrevendo sobre a necessidade de cruzar campos do conhecimento para avançar cientificamente? Caramba, vocês eram muito antiquados!” Para Joana, a menina que vai perceber o óbvio: vivemos num tempo em que é preciso parar de chamar ruído de informação..

(8)

(9) “Olho o mapa da cidade Como quem examinasse A anatomia de um corpo... (E nem que fosse o meu corpo!) Sinto uma dor infinita Das ruas de Porto Alegre Onde jamais passarei... Há tanta esquina esquisita, Tanta nuança de paredes, Há tanta moça bonita Nas ruas que não andei (E há uma rua encantada Que nem em sonhos sonhei...) Quando eu for, um dia desses, Poeira ou folha levada No vento da madrugada, Serei um pouco do nada Invisível, delicioso Que faz com que o teu ar Pareça mais um olhar, Suave mistério amoroso, Cidade de meu andar (Deste já tão longo andar!) E talvez de meu repouso...” Mário Quintana. “A map is not the territory”. Alfred Korzybski.

(10)

(11) AGRADECIMENTOS Entre os nomes imprescindíveis, esta lista precisa começar com o nome da Kátia Bizan. Não fosse por sua disponibilidade e agilidade, ouso dizer, nenhum mestrando ou doutorando do PósCom da Metodista conseguiria seu título. Ao Walter “Waiãpi” Lima, pesquisador que quero ser quando crescer e fonte de inspiração e admiração há dez anos. Por sua seriedade, estímulo e paciência. À Marli dos Santos, por compartilhar sua paixão pelo Jornalismo e, especialmente, pela confiança ao acolher este trabalho. Ao Fábio Josgrilberg e à Pró-Reitoria de Pós-Graduação e Pesquisa da UMESP, pelo apoio e concessão de benefício por meio do Programa de Suporte à Pós-Graduação de Instituições de. Ensino Particulares (PROSUP),. financiado pela. Coordenação. de. Aperfeiçoamento de Pessoas de Nível Superior (CAPES). Ao Ronaldo Prati, por suas observações na etapa de qualificação (e por ter apresentado o GATE!). E, antecipadamente, aos membros da banca examinadora. Aos meus colegas de disciplinas, professores e membros multidisciplinares dos grupos de pesquisa Tecccog e Human Data, personificados na figura realizadora e guerreira da Amanda Luiza. À Iara Mola e à Aline Veingartner, pelo dedicado e meticuloso trabalho de lanternagem e polimento destas páginas. À Patrícia Rangel, incentivadora desta e de muitas outras jornadas, e aos colegas das Faculdades Rio Branco, pela troca de pensamentos. Aos meus alunos. Na prática, meus companheiros de viagem. No futuro, minhas referências bibliográficas. A cada interlocutor que perguntava “sobre o que é sua tese?” ou “o que você tem na cabeça?”, em especial a amigos como o Cassio Politi, pela oportunidade de organizar ideias ao tentar explicá-las – não sem antes questionar: “quanto tempo você tem?”. Ao Seu Rui, à Dona Helena, ao Dani e à Claudinha, professores da minha vida. E à Dona Eugênia (que foi professora de verdade), pelas orações. Por último, mas não menos importante, à Rina, minha garotinha ruiva, mãe da Jojô, companheira de aventuras, redatora e editora dos nossos melhores momentos, por tudo o que somos e seremos..

(12)

(13) LISTA DE QUADROS Quadro 2.1 – Exemplos de marcação semântica de localidade .................................................. 68 Quadro 4.1 – Etapas para a construção de um instrumento de observação ............................. 111 Quadro 4.2 – Diretrizes iniciais para coleta de dados ............................................................... 114 Quadro 5.1 – Metadados em bases de dados jornalísticas do El País ..................................... 122 Quadro 5.2 – Metadados em bases de dados jornalísticas da Globo.com ............................... 125 Quadro 5.3 – Metadados em bases de dados jornalísticas do The Washington Post .............. 127 Quadro 5.4 – Metadados em bases de dados jornalísticas do The New York Times ............... 130 Quadro 5.5 – Metadados em bases de dados jornalísticas do The Guardian .......................... 134 Quadro 5.6 – Metadados em bases de dados jornalísticas da BBC .......................................... 138 Quadro 5.7 – Adoção de metadados em bases de dados jornalísticas: proposta para análise 140.

(14)

(15) LISTA DE FIGURAS Figura 0.1 – Estrutura da tese ....................................................................................................... 29 Figura 1.1 – Componentes da informação jornalística na web ................................................. 43 Figura 2.1 – Ciclo de um objeto de informação ......................................................................... 53 Figura 2.2 – Conexões interdisciplinares em torno de metadados ............................................ 54 Figura 2.3 – Classificação proposta para níveis de detalhamento e relacionamento de metadados................................................................................................................... 61 Figura 2.4 – Representação simples de um esquema de triplas ................................................. 71 Figura 2.5 – Modelo possível de ontologia para notícias ........................................................... 72 Figura 2.6 – Diagrama do projeto Linking Open Data .............................................................. 73 Figura 2.7 – Pilha da web semântica............................................................................................ 75 Figura 3.1 – Relação entre as tecnologias computacionais e os objetivos jornalísticos ........... 92 Figura 3.2 – Cadeia de valor por meio de linked data .............................................................. 100 Figura 4.1 – Processo para condução de um estudo de caso .................................................... 116 Figura 5.1 – Código-fonte de uma notícia do site El País ........................................................ 121 Figura 5.2 – Esquema simplificado do Sistema de Dados Esportivos da Globo.com ............ 124 Figura 5.3 – Arquitetura do sistema de gerenciamento de notícias do The Guardian............ 134 Figura 5.4 – Exemplo de ontologia da BBC para um evento dos Jogos Olímpicos de 2012 . 136.

(16)

(17) SUMÁRIO INTRODUÇÃO ........................................................................................................................... 25 Capítulo I – COMUNICAÇÃO E TECNOLOGIA ............................................................... 33 1.1 Inquietação histórica por interdisciplinaridade ..................................................................... 34 1.2 Relação entre Jornalismo e bases de dados na Web ............................................................. 40 1.3 Jornalismo e bases de dados: uma linha do tempo ............................................................... 46 Capítulo II – METADADOS ..................................................................................................... 51 2.1 Apresentação de um conceito: além dos “dados sobre dados” ............................................ 52 2.2 Conexões interdisciplinares dos metadados .......................................................................... 55 2.3 Objetos de informação rotulados na Web: uma classificação .............................................. 60 Capítulo III – INOVAÇÃO JORNALÍSTICA ....................................................................... 79 3.1 Inovação e mídia: para fugir das “buzzwords” ...................................................................... 80 3.2 Jornalismo Computacional para “hackear” processos ......................................................... 88 3.3 Relação entre Jornalismo Computacional e metadados ....................................................... 98 Capítulo IV – MÉTODO PARA ANÁLISE.......................................................................... 103 4.1 Discussões preliminares sobre o uso de casos .................................................................... 104 4.2 Exemplos de casos em estudos de Jornalismo na Web ...................................................... 107 4.3 Elaboração de um instrumento de observação .................................................................... 111 Capítulo V – OBSERVAÇÃO E DISCUSSÃO .................................................................... 119 5.1 Apresentação e observação de veículos jornalísticos ......................................................... 120 5.2 Apontamentos sobre o uso de metadados no Jornalismo ................................................... 139 CONCLUSÃO ........................................................................................................................... 145 REFERÊNCIAS ........................................................................................................................ 151.

(18)

(19) RESUMO OLIVEIRA, A. R. Metadados como atributos da informação estruturada em bases de dados jornalísticas na web. 2016. 163 p. Tese (Doutorado em Comunicação Social) – Universidade Metodista de São Paulo, São Bernardo do Campo.. Bases de dados abastecidas com notícias produzidas para a Web representam um repositório de informação com potencial tecnológico de ser reutilizado de inúmeras formas e por outras plataformas digitais conectadas via redes. No processo de produção jornalística, esta é uma das transformações provocadas pela evolução tecnológica que exigem novas habilidades ‒ entre elas, a necessidade de organizar, recuperar e reutilizar esse material. Diante disso, este trabalho pretende mostrar de que forma a adoção de estruturas baseadas em metadados contribui para o desenvolvimento da informação jornalística produzida e armazenada nessas bases. Para tanto, ele se apoia no conceito de pensamento computacional para encorajar o cruzamento de conhecimentos entre a Comunicação e as Ciências da Computação e da Informação, além de investigar o impacto dessas relações nas rotinas de produção e elaboração de produtos de mídia. Impulsionado pela importância da memória para a produção jornalística e pelas discussões em torno da Web de Dados e de padrões semânticos abertos, discute ainda a possibilidade de veículos noticiosos se tornarem plataformas, estimulando a obtenção de relações invisíveis entre temas e contextos, bem como a intersecção entre jornalistas e desenvolvedores. Com base em um estudo exploratório envolvendo cinco organizações de mídia, na identificação de atributos que caracterizem diferentes níveis de estruturação e na proposição de um instrumento de análise baseado em funcionalidades adotadas por esses veículos, defende-se que a adoção de marcações, esquemas com vocabulários controlados, ontologias formais ou outras estruturas são indispensáveis para a adaptação do Jornalismo diante de um cenário em constante mudança.. Palavras-chave: Jornalismo. Internet. Metadados. Interdisciplinaridade..

(20)

(21) RESUMEN Bases de datos alimentadas con noticias producidas por la Web representan un repositorio de información con potencial tecnológico para ser reutilizado en varias formas y por otras plataformas digitales conectados por medio de redes. Este es uno de los cambios producidos por los avances tecnológicos en el proceso de producción de periódicos, que requieren nuevas habilidades incluyendo la necesidad de organizar, recuperar y reutilizar este material. Por este motivo, este trabajo tiene como objetivo mostrar cómo la adopción de estructuras basadas en los metadatos contribuye con el desarrollo de la información periodística producida y almacenada en estas bases de datos. Por consiguiente, se basa en el concepto de pensa miento computacional para estimular la interacción de conocimientos entre la Comunicación y Ciencias de la Computación e Información, además de investigar el impacto de estas relaciones en las rutinas de producción y desarrollo de productos informativos. Impulsado por la importancia de la memoria para la producción periodística y los debates en torno a la Web de datos y estándares semánticos abiertos, también se discute la posibilidad de que los medios de convertirse en plataforma, animando para encontrar relaciones invisibles entre temas y contextos, así como la intersección entre periodistas y programadores. Con base en un estudio exploratorio que incluía cinco medios de comunicación, en la identificación de atributos que caracterizan a los diferentes niveles de estructuración y en una propuesta de instrumento de análisis basado en las características adoptadas por estos vehículos, se argumenta que la adopción de marcas, esquemas de vocabulario controlado, ontologías formales u otras estructuras son indispensables en la adaptación del periodismo ante escenarios en cambio constante.. Palabras clave: Periodismo. Internet. Metadatos. Interdisciplinariedad..

(22)

(23) ABSTRACT Databases fed with news produced for the Web represent an information repository with technological potential to be reused in a number of ways and by other digital platforms connected via networks. This is one of the transformations in the journalistic production process, induced by the technological evolution which demand new abililites. Among them, the need to organise, recover and reuse this material. For this reason, this work intends to show how the adoption of structures based in metadata contributes to the development of news information produced and stored in these databases. Therefore, it relies on the concept of computational thinking to encourage the intersection of knowledges between Communications, Information and Computer Science, in addition to investigate the impact of this relationships in the routines of production and creation of media products. Propelled by the importance of the memory for the journalistic production and the discussions around the Web of Data and open semantic standards, the discussions also goes on the possibility of news channels to become platforms, encouraging to have invisible relationships between themes and contexts, the intersection between journalists and Web developers. Based on an exploratory study involving five media organisations, in the identification of attributes that characterize different levels of structuration and an analytical tool proposition based on features adopted by these vehicles, it is argued that the adoption of markups, controlled vocabulary schemas, formal onthologies or other schemas are crucial for journalism adaptation facing a new and constantly changing scenery.. Keywords: Journalism. Internet. Metadata. Interdisciplinarity..

(24)

(25) 25. INTRODUÇÃO O Jornalismo está em crise. As evidências são claras: em linhas gerais, o que circula a partir de portais de notícias está baseado em informações superficiais, binárias (são boas ou ruins, sem contexto) e banais. Elas são emotivas, espetaculares, coloridas, perseguem sentimentos do leitor com objetivos comerciais. Têm medo de ousar ou transgredir. Favorecem o narcisismo e a busca pela notoriedade, extrapolando arquétipos culturais e comerciais. Trata-se de captar a atenção a qualquer preço. A visão é do pesquisador espanhol Ramón Reig (2015, p. 46), que propõe uma “teoria estrutural do Jornalismo” para compreendermos as relações políticas e econômicas nas quais a profissão do jornalista está alicerçada, culminando com questões relevantes desde a formação de novos profissionais até a constituição e práticas de organizações noticiosas. Em sua visão, o avanço da tecnologia é apenas uma das variáveis que afetam as redações, ao lado de outras de caráter mercadológico: mesmo a informação baseada em dados obtidos por mecanismos computacionais, mas fora de contexto, sem interpretação ou atendendo a algum direcionamento da empresa informativa, não serve para nada (REIG, 2015, p. 84). O debate a respeito das transformações do jornalismo sob prismas distintos ‒ como a função social do jornalismo (sintetizada na expressão watchdog), discussões éticas, organização das redações e pressões mercadológicas, entre outras práticas profissionais ‒, foi potencializado graças a fenômenos relacionados, entre outras variáveis, à evolução tecnológica e à consequente “era da convergência” (JENKINS, 2009), a partir do impacto provocado pela comunicação mediada por computador e conectado em rede a partir dos anos 1970 (HILTZ; TUROFF, 1993). Esse direcionamento pode trazer reflexões futuristas, relacionando modelos de jornal adaptados ao gosto e preferências do leitor (NEGROPONTE, 1995) a uma geração influenciada por dispositivos conectados à internet, carregados de aplicações úteis “para aliviar as tensões de nossa existência diária” (TURKLE, 2011, p. 160). Nesse contexto, surgem novas plataformas midiáticas, capazes de acelerar o consumo, a.

(26) 26 produção e a distribuição de conteúdos informativos. Para tanto, já estão em curso modificações em estruturas tradicionais ‒ o que inclui, entre outras possibilidades, uma reconfiguração dos meios e da prática jornalística como objeto de estudo (LIMA JUNIOR, 2012) segundo formatos e linguagens das narrativas digitais, incluindo-se aí signos textuais e audiovisuais (RAMOS, 2011). Além disso, sua evolução também se verifica por meio do uso de softwares ou algoritmos (CORRÊA; BERTOCCHI, 2012b), tendo-se também como base a convergência física das redações e o papel polivalente dos profissionais que as ocupam (SALAVERRÍA; GARCÍA AVILÉS, 2008). Sejam quais forem as motivações das redações em publicar notícias num ambiente digital, David Caswell, pesquisador do Reynolds Journalism Institute, observa que, historicamente, a produção e exibição de informação no ambiente amigável da internet acessado por navegadores – a Web – se baseia nos mesmos princípios editoriais de qualquer produto: não levam em conta potenciais continuidades da história ou variações possíveis; só fazem sentido em suas próprias edições, sem levar em conta os recursos inerentes ao ambiente digital (CASWELL, 2015). Em um cenário amplo e cético pautado pela sombra da crise, ele oferece outra interpretação para a expressão “jornalismo estruturado”. Seu experimento, denominado Structured Stories 1 ‒ um protótipo que coleta fragmentos de notícias relacionados a eventos específicos e que, a partir de uma codificação prévia desses elementos, oferece ao usuário narrativas maiores ‒, valida um fenômeno que já acontece: o consumo de textos únicos ou isolados vem dando lugar a streamings digitais reunidos e apresentados a partir de modelos matemáticos traduzidos em algoritmos (CASWELL, 2015). A ideia de David Caswell se fundamenta em um conceito descrito e desenvolvido desde os anos 1970, denominado “bases de dados relacionais” ‒ uma estrutura ubíqua para reunir dados em tabelas separadas e relacionadas entre si, de forma que novos dados e estruturas possam ser adicionados, removidos ou cruzados. Com a digitalização de conteúdos, a popularização de dispositivos computacionais e a interconexão destes em redes telemáticas, há grande quantidade de dados sendo armazenada nessas bases, o que representa um desafio para qualquer área do conhecimento ‒ inclusive para as Ciências Humanas ‒ no que diz respeito a transformálos em algo potencialmente útil e, ao mesmo tempo, reutilizável (GITELMAN, 2013, p. 3).. 1. Disponível em: <http://www.structuredstories.com/>. Acesso em: 29 dez. 2015..

(27) 27 O termo “jornalismo estruturado”, focado em sua relação com bases de dados, surgiu pela primeira vez numa proposta do editor de inovação e dados da Thomson Reuters, Reginald Chua 2 . Em essência, ele propõe a fragmentação de narrativas jornalísticas em partes reunidas e relacionadas entre si. Chava Gourarie, do Columbia Journalism Review, aponta o artigo Why the Islamic State leaves tech companies torn between free speech and security, do The Washington Post 3 , como um protótipo de jornalismo estruturado 4 . E tanto essas iniciativas quanto o projeto Structured Stories permitem uma definição preliminar:. Jornalismo estruturado é uma nova forma de jornalismo baseada em reportagens como componentes estruturados em uma base de dados, e posterior recuperação destes componentes estruturados para gerar produtos informativos. A abordagem ainda é incipiente, mas lida diretamente com diversos problemas sistêmicos enfrentados por produtores e consumidores de notícias em um ecossistema de mídia digital, e pode potencialmente facilitar o rearranjo do Jornalismo em redes, bem como a criação de produtos informativos controlados pelo consumidor num contexto que se estende além do artigo (CASWELL; RUSSELL; ADAIR, 2015, tradução nossa)5.. Longe de defender a premissa de que termos emergentes e baseados em protótipos (como “jornalismo estruturado” ou equivalentes) representam o “santo graal” do Jornalismo, este trabalho pretende amarrar uma palavra-chave ao processo de coletar dados, organizá-los, dar-lhes sentido, apresentá-los e permitir seu compartilhamento (sequência elementar de elaboração da informação jornalística), bem como reforçar, a partir de uma visão interdisciplinar, a expectativa por trás da proposta sugerida por Caswell, entendendo-se que, quanto à interdisciplinaridade:. Dada uma disciplina científica, existe uma interdisciplina que a vincula a outra. Esta máxima metodológica convida a ultrapassar as fronteiras das disciplinas – algo fértil, mas irrefutável. Além disso, ajuda a distinguir a 2. Disponível em: <https://structureofnews.wordpress.com/structured-journalism/>. Acesso em: 6 nov. 2015. 3 Disponível em: <http://www.washingtonpost.com/world/national-security/islamic-states-embrace-ofsocial-media-puts-tech-companies-in-a-bind/2015/07/15/0e5624c4-169c-11e5-89f361410da94eb1_story.html>. Acesso em: 6 nov. 2015. 4 “‘Structured journalism’ offers readers a different kind of story experience”. Disponível em: <http://www.cjr.org/innovations/structured_journalism.php>. Acesso em: 6 nov. 2015. 5 Versão original: “Structured Journalism is a new form of journalism based on reporting news as structured components into a database, and subsequent retrieval of those structured components to generate news products. The approach is still nascent but it directly addresses several systemic problems facing news producers and news consumers in the digital media ecosystem, and it may potentially facilitate the rebundling of journalism as networks and the creation of consumer-controlled news products with context that extends beyond the article”..

(28) 28 ciência da pseudociência, que normalmente está isolada (BUNGE, 2007, p. 114, tradução nossa)6.. A palavra-chave deste trabalho é metadados. Pretende-se aqui verificar a sua importância num processo imaginado por David Weinberger, conhecido autor do Manifesto Cluetrain. Ele publicou sua “teoria unificada da Web”, que, na prática, resume-se no título de seu livro: Small pieces loosely joined (em uma tradução livre, “Fragmentos unidos livremente”). Em linhas gerais, as nossas conexões na Web e os diálogos resultantes delas funcionam como documentos ligados, que seriam equivalentes a “livros construídos individualmente” (WEINBERGER, 2002). Podemos aplicar esse mesmo princípio a bases de dados com conteúdo jornalístico armazenado, nas quais os metadados funcionam como um tipo de “cola” entre fragmentos. Ou, usando outra metáfora, é isso o que diferencia uma “sala cheia de livros” de uma “biblioteca”. Assim como outros trabalhos que procuram relacionar Jornalismo, bases de dados, computação e suas consequências (ANDREW, 2008; STAVELIN, 2013), este também se propõe a observar a informação jornalística sob a perspectiva de áreas como as Ciências da Computação e da Informação ‒ mais especificamente, por meio dos metadados. Estruturada a partir da ilustração da Figura 0.1, esta tese parte da premissa segundo a qual, a partir de um conceito indispensável para qualquer nível de recuperação da informação, caminhos interdisciplinares oferecem relações entre aspectos teóricos, tecnológicos e sociais capazes de responder à seguinte questão: de que forma o uso de metadados contribui na estruturação e no desenvolvimento da informação jornalística produzida e armazenada em bases de dados? Presume-se que esta relação possa influenciar não apenas produtos informativos, mas os processos para sua elaboração – entre eles sistemas capazes de personalizar recomendações, individualizando decisões como critérios editoriais ou de noticiabilidade.. Os conhecidos critérios de noticiabilidade não preveem como o jornalista deva guardar um certo dado em um banco de dados e como ele poderá recuperá-lo mais tarde, extraindo pautas ou gerando visualizações de dados... Será preciso um novo estudo para observar as novas práticas sistêmicas e delas assumir quais novos critérios de noticiabilidade dialogam com dados e metadados (BERTOCCHI, 2014, p. 12). 6. Versão original: “Dada una disciplina científica existe una interdisciplina que la vincula a otra disciplina científica. Esta máxima metodológica invita a traspasar las fronteras de las disciplinas, lo cual resulta fecundo aunque irrefutable. Además, ayuda a distinguir la ciencia de la seudociencia, que típicamente está aislada”..

(29) 29. Figura 0.1 – Estrutura da tese. Fonte: Produzida pelo autor.. Ainda no que tange à estruturação deste trabalho, o Capítulo I destaca a trajetória interdisciplinar marcada pela influência tecnológica no Jornalismo – interdisciplinaridade esta que ocorre desde o Império Romano (PAVLIK, 2000), mas que ganhou corpo somente no final dos anos 1960 com o desenvolvimento do Jornalismo de Precisão e obteve um novo sentido diante de uma virada computacional na postura dos pesquisadores das Ciências Humanas (BERRY, 2011). Apesar de necessárias, as conexões entre as disciplinas não são simples: fatores culturais, sociais e relações de poder estão ligados à dificuldade de serem realizadas pesquisas envolvendo outras áreas do conhecimento. Conexões entre a Comunicação e a Filosofia da Mente ou a Neurociência, por exemplo, são muito distantes do imaginário da maioria dos pesquisadores na área (LIMA JUNIOR, 2014). Além disso, o Capítulo I contextualiza a apropriação do termo “memória” pelo Jornalismo e introduz uma proposta elaborada pelo W3C, consórcio criado por Tim Berners-Lee (inventor da Web) e responsável pela elaboração de padrões para mantê-la em crescimento organizado. Na visão dele, a Web pode saltar do patamar de repositório de documentos ‒ ainda que estes sejam gerados dinamicamente, possibilitando aos computadores interpretarem e estabelecerem inferências e relações entre esses dados,.

(30) 30 automação, integração e o reuso em sistemas diferentes (BERNERS-LEE; HENDLER; LASSILA, 2001). Essa proposta catapultou expectativas envolvendo agentes inteligentes e relações invisíveis entre temas e contextos obtidas por eles em uma “Web Semântica” – uma ideia intrincada, já que vamos “começar a falar sobre semântica, que quer dizer ‘o que as coisas significam?’. E, claro, todo mundo tem uma opinião diferente sobre isso, de modo que as conversas podem ser infinitas” (HEY; TANSLEY; TOLLE, 2009, p. xxix, tradução nossa) 7. Aproveitar a informação jornalística a partir da lógica da Web de Dados significa elaborar modelos de estrutura e formalizar relações para que elas possam ser aplicadas em outros datasets – conjuntos externos de bases de dados. É o que se discute no Capítulo II, no qual a palavra-chave do trabalho é examinada. Para que a notícia possa ser rotulada e categorizada por metadados, de maneira a descrevê-la ou indicar a sua natureza ou propriedades (inclusive com dados que auxiliaram o jornalista a construí-la), torna-se pertinente compreender técnicas envolvendo iniciativas já propostas para relacionar elementos e gerar conexões significativas para usuários. Essas práticas foram organizadas a partir de uma escala: marcações (níveis de utilização mais elementares), esquemas e ontologias (níveis mais sofisticados) e interconexão (disponibilidade e compreensão por máquinas). Assim, reforça-se novamente a relevância (e a complexidade) de uma abordagem interdisciplinar: Desde o fim dos anos 1990 centenas – se não milhares – de físicos, cientistas da computação, matemáticos e outros pesquisadores do núcleo duro da ciência interessaram-se por questões que tradicionalmente eram pertencentes às ciências sociais... Bancos de dados de proporções imensas foram analisados, inúmeros novos modelos teóricos foram propostos e milhares de artigos foram publicados... Quão próximo estão de responder às grandes questões das ciências sociais, como o desenvolvimento econômico das nações, a globalização da economia ou a relação entre imigração, desigualdade e intolerância? Peguem um jornal e julguem vocês mesmos, mas eu diria que não muito (WATTS, 2011, p. 10).. Talvez Watts não tenha se dado conta, mas o fato de não ter encontrado o que procura em jornais pode ter outra razão, e não estamos falando na potencial frustração com os resultados diante dos limites da recuperação de informação via Web. Em um ambiente de mídia social conectada, a informação jornalística passa a ser um bem 7. Versão original: “[...] you’re going to start talking about semantics, which is to say, ‘What do things mean?’ And of course everybody has a different opinion of what things mean, so the conversations can be endless”..

(31) 31 comum, não mais uma exclusividade do veículo. Mais do que um potencial para aproximar as empresas de mídia do seu público, ou mesmo para conquistar uma vantagem competitiva em um cenário de constante evolução, o Jornalismo tenta encontrar meios e formatos para se reinventar e sobreviver nesse ambiente. A apropriação de tecnologias ‒ que inclui a estruturação de bases de dados em um sistema complexo como a internet e remete ao histórico movimento refratário dos profissionais envolvidos (DAGIRAL; PARASIE, 2011) ‒ se coaduna ao foco do Capítulo III: a palavra em latim da qual surgiram os verbos “mudar” e “renovar” ‒ innovare. Inovação é uma proposição ampla e heterogênea o suficiente para que, num contexto acadêmico, aceite incontáveis apropriações. É inegável, no entanto, que a associação entre inovação e Jornalismo represente “percepções heterogêneas e interdisciplinares, experiências e conhecimentos sintetizados em novas formas de ver, compreender e apresentar questões sociais” (GYNNILD, 2014, tradução nossa) 8. Desta associação, emerge uma linha de pensamento: a de que é possível otimizar processos de produção da notícia como um programador faria ao depurar um software. Essa é a essência do Jornalismo Computacional (COHEN; HAMILTON; TURNER, 2011). Daniela Bertocchi (2014) sugere novas experimentações e oportunidades tendo como pano de fundo o aspecto computacional na produção de notícias. Mais do que isso, defende que a informação jornalística comporta-se como um sistema aberto e complexo, cuja sobrevivência depende da adaptabilidade em relação aos sistemas com os quais interage. A inclusão de metadados em bases de dados noticiosas pode representar novos modelos de uso e reaproveitamento desse material. Com base nisso, como estruturar o conteúdo jornalístico armazenado em bases de dados por meio de metadados? Quais as possibilidades de diálogo entre essas estruturas e os objetivos jornalísticos? Quais os desafios para a adoção dessas práticas e suas implicações nas rotinas produtivas das redações? Em torno dessas perguntas, uma investigação exploratória qualitativa, detalhada nos Capítulos IV e V, conduz uma observação a cinco veículos cujas práticas são reconhecidamente inovadoras: Globo.com, The Washington Post, The New York Times, The Guardian e BBC. Os processos que envolvem o uso de metadados nessas. 8. Versão original: “In processes of journalism innovation, heterogeneous and cross-disciplinary insights, experiences and knowledge are synthesized into new ways of seeing, understanding and presenting societal issues”..

(32) 32 organizações, listados e categorizados de acordo com os níveis de utilização propostos, demonstram o esforço desses grupos de mídia voltado ao enriquecimento do material jornalístico produzido ‒ otimizando o trabalho de armazenamento, recuperação, relacionamento, distribuição de notícias. O estudo dessas práticas auxiliam na compreensão de processos produtivos e de distribuição ou difusão e no levantamento de hipóteses, ajudando igualmente no desenvolvimento de um instrumento de análise (EISENHARDT, 1989; YIN, 2009) para futuras investigações sobre práticas de jornalismo estruturado em dados. Além da justificativa em relação aos procedimentos de investigação, ainda são discutidos os limites e cuidados para a elaboração de estudos baseados em casos. A combinação de variáveis humanas (na produção de conteúdo e na construção de esquemas de metadados) e computacionais (algoritmos e sistemas que culminam em produtos automatizados) contribui para que o Jornalismo possa fortalecer a notícia, identificando objetivos jornalísticos (qualidade, clareza, profundidade, precisão, formas de organização). Enquadrar essas etapas a partir de uma lógica computacional representa uma série de barreiras que exige uma visão crítica, desejada neste trabalho..

(33) 33. Capítulo I – COMUNICAÇÃO E TECNOLOGIA “Em poucos anos, homens poderão se comunicar mais efetivamente, face a face, com uma máquina”. Assim começa o texto The Computer as a Communication Device, de Joseph Carl Robnett Licklider, um dos nomes mais importantes da história na Ciência da Computação. Ele defendia que a comunicação poderia compreender um processo ativo envolvendo a relação entre máquinas e a informação. Mais do que isso: poderia existir algo não trivial nessa relação, indo além do que estamos acostumados, por exemplo, entre livros e bibliotecas. Isto porque sistemas envolvendo computadores representam áreas a serem exploradas: mais informação pode ser utilizada para responder a questões de relevância. Sistemas capazes de se relacionar com dados são, portanto, cruciais (LICKLIDER; TAYLOR, 1968). A proposição do autor pode parecer uma obviedade nos dias de hoje, em que usuários comuns se relacionam com a informação por meio de múltiplas telas e sistemas. Conforme a referência acima, o texto de Licklider é do final dos anos 1960 ‒ o que revela a proximidade das Ciências da Computação e a Comunicação. Esta aproximação, defendida aqui como necessária mas ao mesmo tempo difícil de fazer, é o assunto deste capítulo..

(34) 34. 1.1 Inquietação histórica por interdisciplinaridade O pensamento de Licklider disfarça uma questão inicial: com qual conceito de comunicação, entre as 249 teorias distintas relacionadas ao tema (CRAIG, 1999) ele trabalha? A associação entre máquinas e informações sugere, como explica Robert T. Craig, uma atitude prática e que valoriza a complexidade de seus problemas seguindo a lógica de seu processamento humano e não humano, derivada do trabalho de pensadores como Shannon, Wiener, von Neumann, e Turing – a cibernética. Durante as conferências de Macy, entre os anos 1940 e 1950, os cibernéticos procuravam criar ligações entre pesquisadores da engenharia, biologia, psicologia e outras ciências sociais, entre eles o sociólogo Paul Lazarsfeld (LIMA JÚNIOR, 2014). A origem das modernas teorias da comunicação é tão distante quanto os obstáculos para estas ligações. Em maio de 1959, Charles Percy Snow compartilhou com a sua audiência, em Cambridge, uma preocupação oriunda da sua convivência com intelectuais da ciência e das humanidades: trata-se de dois grupos que observam os mesmos fenômenos, mas que não se compreendem entre si. Mais do que isso: suas atitudes e visões constroem uma polarização capaz de criar duas culturas. Segundo Snow (1959, tradução nossa), as razões dessa separação são profundas e complexas, enraizadas na história do homem. E ele mesmo já apontava a dificuldade em se criarem pontes entre essas duas culturas:. Todas as setas apontam para o mesmo caminho. Fechar a lacuna entre nossas culturas é uma necessidade, tanto no sentido intelectual mais abstrato quanto no mais prático. Enquanto estes dois sensos crescerem separados, então a sociedade não será capaz de pensar com sabedoria9.. A necessidade premente em criar pontes entre a visão científica pautada pela evolução tecnológica e as humanidades ‒ o que inclui a comunicação ‒ é o pano de fundo deste trabalho. Mais de cinquenta anos se passaram da observação feita por Snow e o debate permanece. Um dado contrastante foi obtido em uma pesquisa 10 realizada entre 2008 e 2010 pelo Observatório Ibero-americano de Ciência, Tecnologia e. 9. Versão original: “All the arrows point the same way. Closing the gap between our cultures is a necessity in the most abstract intellectual sense, as well as in the most practical. When those two senses have grown apart, then no society is going to be able to think with wisdom”. 10 Reportagem da Revista Pesquisa FAPESP, fevereiro de 2012. Disponível em: <http://revistapesquisa.fapesp.br/2012/02/27/o-que-voc%C3%AA-n%C3%A3o-quer-ser-quandocrescer/>. Acesso em: 16 set. 2012..

(35) 35 Sociedade (Ryct/Cyted) com jovens entre 15 e 19 anos em sete capitais: Assunção, São Paulo, Buenos Aires, Lima, Montevidéu, Bogotá e Madri. Essa geração, imersa em tecnologia, espera se profissionalizar na área das Ciências Sociais (resposta de 56% dos entrevistados). Menos de 3%, no entanto, vislumbram atuar nas áreas das Ciências Exatas ou Naturais. O levantamento questionou a escolha dos estudantes: a maioria acredita que essa área é “chata” ou “muito difícil”. A visão dos jovens que chegarão ao mercado de trabalho nos próximos anos é aparentemente paradoxal, mas se revela como um reforço ao pensamento de Snow. Por um lado, o imediatismo gerado pelas novas tecnologias estrutura a sua presença em praticamente todos os aspectos de suas vidas; por outro, a ideia (simplista) de que é possível se desenvolver com pouco esforço, a partir de uns poucos comandos ou cliques, provoca um sinal de alerta sobre como a sociedade do futuro irá compreender seu universo. Nota-se que os obstáculos a serem percorridos estão além da complexidade das tecnologias, abrangendo também uma cultura fortemente arraigada e visível aos olhos de quem enxerga o campo da comunicação ao longe: a de que os necessários caminhos que passam pelo cruzamento de campos do conhecimento não são tão fáceis quanto simplesmente dizer “interdisciplinaridade”. Tal como ocorre com outras definições, essa relação gera intermináveis discordâncias acadêmicas. Afinal, se as definições podem representar amarras fortes na análise de um fenômeno, também podem representar armadilhas. Diante da experiência com estudantes de Filosofia e Ciências Naturais, o filósofo da tecnologia Val Dusek (2006, p. 26) observa “duelos de definições pautados por impaciência e arbitrariedade”. Essas definições são frequentemente chamadas de “meramente semânticas” ou talvez pareçam exageradamente detalhistas. De início, o termo “interdisciplinaridade” ganha força diante da necessidade de compreender fenômenos a partir de uma visão plural. No caso da Comunicação,. Entende-se que há necessidade de o pesquisador da área de comunicação digital e em redes compreender que a evolução da ciência, e, por consequência, da tecnologia, é um processo humano natural. O pesquisador deve dominar os conceitos e se ambientar no campo de produção de tecnologias voltadas para a comunicação social (LIMA JUNIOR, 2007, p. 124)..

(36) 36 Na vida diária, preocupamo-nos pouco com as definições precisas, com as descrições exatas ou com as medições afinadas, como exige o conhecimento dito científico (BUNGE, 1987). Por outro lado, a própria fragilidade inerente ao homem – que, por sua vez, é transferida para a ciência – faz com que a construção desse conhecimento, sustentado a partir de definições que procurem aguçar as fronteiras da sua aplicabilidade, transforme-se em algo desafiador, independentemente da área do conhecimento que se pretende observar. Para Martino e Boaventura (2013), essa construção exige um esforço muito maior que o trabalho especializado (já bastante difícil), e corre o risco de sofrer apropriações e usos indevidos de conceitos de diferentes ciências, assimilando a produção de conhecimento ao trabalho de lidar com informação. Conexões entre disciplinas, portanto, seria um mito. Será mesmo? Tradicionalmente, as humanidades enxergam a realidade a partir do pensamento e da reflexão mais abstratos, tendo como prisma uma ou mais disciplinas – de acordo com o que se estabeleceu nos Estados Unidos pelo ato National Foundation on the Arts and the Humanities, em 1965: O termo ‘humanidades’ inclui, mas não se limita, ao estudo e interpretação de: linguagem, tanto moderna e clássica; linguística; literatura; história; jurisprudência; filosofia; arqueologia; religião comparada; ética; história, crítica e teoria das artes; aspectos das ciências sociais que empregam conteúdo humanístico e empregam métodos humanistas; e o estudo e aplicação das humanidades para o ambiente humano, com particular atenção ao reflexo de nosso patrimônio diversificado, tradições e história; e para a relevância das humanidades com as exigências atuais da vida nacional (tradução nossa)11.. E onde entra a tecnologia nesse cenário? Para Bunge (1987), “a tecnologia moderna se alimenta da ciência, e a ciência moderna depende de equipamentos e estímulos provenientes de uma indústria altamente tecnificada”. Assim, da mesma forma que a tecnologia permeia a sociedade diante de um irreversível processo de digitalização da informação, da constituição de infraestrutura tecnológica, ferramentas. 11. Versão original: “The term ‘humanities’ includes, but is not limited to, the study and interpretation of the following: language, both modern and classical; linguistics; literature; history; jurisprudence; philosophy; archaeology; comparative religion; ethics; the history, criticism and theory of the arts; those aspects of social sciences which have humanistic content and employ humanistic methods; and the study and application of the humanities to the human environment with particular attention to reflecting our diverse heritage, traditions, and history and to the relevance of the humanities to the current conditions of national life”. Disponível em: <http://www.neh.gov/about>. Acesso em: 22 out. 2014..

(37) 37 digitais e condições para seu uso, o pensamento que norteia as Ciências da Computação passou a ser entendido como uma lógica necessária a outras áreas do conhecimento. Diante da necessidade de resolver problemas, Wing (2006) propõe o conceito de “pensamento computacional”. A ideia é recorrer a conceitos da Ciência da Computação, abstrair questões que podem ser solucionadas por sistemas – não se trata de entender códigos e programar – e encontrar modelos eficientes para buscar respostas. Ao propor o conceito e observar a sua influência em outros campos do conhecimento (como a Estatística), a autora reforça o caráter interdisciplinar dos conceitos da Ciência da Computação, ao afirmar que “o pensamento computacional é uma habilidade fundamental para qualquer um, não apenas para cientistas da computação” (WING, 2006, p. 33). Novas metodologias baseadas em sistemas computacionais, bem como ambientes colaborativos entre diferentes perfis interdisciplinares, fizeram emergir um campo de estudo (ou, sob um ponto de vista crítico, um “guarda-chuva acadêmico”) pautado no objetivo de fortalecer o pensamento, sem perder de vista a compreensão humanística sobre esses fenômenos: o campo das digital humanities12, ou “humanidades digitais” (SCHREIBMAN; SIEMENS; UNSWORTH, 2004). Os autores enxergam dois momentos no desenvolvimento das Digital Humanities: o primeiro, quantitativo, ressaltando tanto a infraestrutura quanto a capacidade em recuperar dados em largas bases e em digitalizar projetos; o segundo, qualitativo, fortalece os métodos das humanidades, incluindo metodologias híbridas. Pesquisador e professor sênior da Swansea University, David M. Berry (2011) sugere um terceiro momento, denominado “virada computacional”, no qual é preciso “encontrar o código-fonte” correspondente a cada projeto, o significado de conceitos após eles terem sido “softwerizados”:. Se o código e o software tornaram-se objetos de pesquisa para as Ciências Humanas e Sociais, incluindo a Filosofia, precisamos compreender as dimensões ôntica e ontológica dos códigos de computador. De modo geral, sugerimos uma abordagem filosófica para o código e o software, prestando atenção aos seus aspectos mais amplos e conectando-os à materialidade deste crescente mundo digital. Com isso em mente, a questão do código torna-se fundamental para a compreensão das digital humanities, e serve como condição para uma possibilidade das muitas formas computacionais. 12. Como não há uma expressão consensual equivalente em português (a tradução remete a um grupo de pesquisa da USP que trata do tema), optou-se por manter o termo original..

(38) 38 que mediam a experiência da cultura e sociedade contemporâneas (BERRY, 2011, p. 17, tradução nossa)13.. Ao lembrar que a tecnologia ignora filtros ao permitir acesso a distintas bases de dados de conhecimento a partir de qualquer lugar, o autor afirma que essa virada computacional nas disciplinas humanas, na qual o código-fonte faz parte do contexto, poderia representar o começo de um movimento de “ciência revolucionária”, bem como o aparecimento da constelação de uma nova “ciência normal”, sob o prisma das revoluções científicas de Thomas Kuhn. Tal ponto de vista remete a uma percepção de Snow (1959): as humanidades (ou os “não cientistas”) costumam definir cientistas como otimistas, desconhecendo a condição humana; por outro lado, os cientistas acreditam que os “intelectuais da literatura” são totalmente imprecisos. Natural, portanto, considerar a percepção de Berry com cautela. A tensão entre o homem, a tecnologia e os seus valores reforçam o binômio entre as humanidades e a tecnologia, pautado por encantamento e conflito. Ao buscar compreensão sobre a tecnologia, Andrew Feenberg (2001), filósofo e um dos pioneiros no estudo da comunicação mediada por computador, recupera a origem grega da palavra techné: os gregos associam a produção de artefatos à natureza, de acordo com propósitos bem definidos. Num contexto moderno, no entanto, ela aparece em uma abordagem instrumental, na qual a tecnologia é isenta de valores, sem qualquer essência. Desta forma, no decorrer dos séculos, a tecnologia pode ser definida ao longo de dois eixos. O primeiro diz respeito ao que a tecnologia é ou não: neutra ou carregada de valores, como os gregos acreditavam. O segundo permite enxergar a tecnologia como autônoma, isto é, que possui as suas próprias leis ou se são humanamente controláveis, se temos liberdade em decidir como ela será desenvolvida – e isso se aplica à internet, criada para fins militares, desenvolvida pelas universidades e explorada pelos mais diversos segmentos.. A internet suporta uma visão de convivência harmoniosa entre os seres humanos e suas máquinas. Mas suas aplicações políticas a posicionam para outra dimensão da sociedade tecnológica moderna. A tecnologia é um 13. Versão original: “If code and software are to become objects of research for the humanities and social sciences, including philosophy, we will need to grasp both the ontic and ontological dimensions of computer code. Broadly speaking, then, this paper suggests that we take a philosophical approach to the subject of computer code, paying attention to the wider aspects of code and software, and connecting them to the materiality of this growing digital world. With this in mind, the question of code becomes central to understanding in the digital humanities, and serves as a condition of possibility for the many computational forms that mediate out experience of contemporary culture and society”..

(39) 39 fenômeno de dois lados: em uma das mãos há o operador; em outra, o objeto. Num lugar onde tanto o operador quanto o objeto são humanos, a ação técnica é um exercício de poder. Além disso, onde a sociedade é organizada em torno da tecnologia, o poder tecnológico é a principal forma de poder na sociedade. Este é seu potencial distópico (FEENBERG, 2001, tradução nossa)14.. A Web, entendida como a janela amigável da internet, começou a se popularizar nos anos 1990, quando experimentou um crescimento exponencial graças às suas características de auto-organização: pessoas e empresas das mais variadas áreas (inclusive jornalísticas) passaram a criar páginas HTML e a relacioná-las com outras. Cientistas que estudam sistemas complexos verificaram que a rede tem propriedades inesperadas em função da sua estrutura global, da forma como informações se propagam em suas conexões e do comportamento de motores de busca. Tais propriedades conduzem a algo que pode ser chamado de um “comportamento adaptativo”, definindo a Web como um sistema complexo:. Um sistema em que grandes redes de componentes sem controle central e com regras simples de operação dá origem a um comportamento coletivo complexo, a um sofisticado processamento de informação e a adaptação por meio de aprendizagem ou evolução (MITCHELL, 2009, p. 13, tradução nossa)15.. A partir de um debate profundo entre a existência de valores intrínsecos em artefatos tecnológicos e o envolvimento humano com esses instrumentos, Feenberg (2001) nos lembra de que não se trata de uma simples relação de meios e fins. Escolhemos usar máquinas e, diante das múltiplas alternativas oferecidas por um sistema complexo (como é o caso da Web e dos seus dispositivos conectados), fazemos usos e apropriações rotineiras ainda norteadas por variáveis políticas e econômicas.. 14. Versão original: “The Internet supports a vision of harmonious coexistence between humans and their machines. But these political applications of the Internet point to another dimension of modern technological society. Technology is a two-sided phenomenon: on the one hand there is the operator, on the other the object. Where both operator and object are human beings, technical action is an exercise of power. Where, further, society is organized around technology, technological power is the principle form of power in the society. This is its dystopian potential”. 15 Versão original: “a system in which large networks of components with no central control and simple rules of operation give rise to complex collective behavior, sophisticated information processing, and adaptation via learning or evolution”..

(40) 40. 1.2 Relação entre Jornalismo e bases de dados na Web Desde janeiro de 1994, quando o semanário Palo Alto Weekly 16 reproduziu na Web parte do material de sua edição impressa, o Jornalismo busca as melhores alternativas para compartilhar e armazenar informação nesse ambiente, que é composto por documentos codificados em marcação hipertextual e relacionados entre si, acessados por meio de softwares específicos (navegadores). E aqui cabe pontuar, ainda que de forma primária, uma definição de informação no contexto da Web: Informação, como estritamente definido por Shannon, diz respeito à previsibilidade de uma fonte de mensagem. No mundo real, no entanto, informação é algo analisado por seu significado, que é lembrado e combinado com outras informações, produzindo resultados ou ações. Em suma, a informação é processada através de computação (MITCHELL, 2009, p. 57, tradução nossa)17.. Matéria-prima para o Jornalismo, a informação é um labirinto conceitual. Em linhas gerais, podemos definir informação em termos de dados e significado. A informação é feita com dados organizados a partir de uma sintaxe predefinida – um código ou linguagem (FLORIDI, 2010, p. 21). Informação, como nos lembra Melanie Mitchell (2009), é um conceito que a Comunicação tomou emprestado do matemático Claude Shannon, entre outros autores. Ele adaptou ideias da termodinâmica, associadas à concentração de energia e entropia, desenvolvidas em nível molecular por Ludwig Boltzmann no século XIX, para abstrair a comunicação entre telefones. Em essência, o volume de informação tem relação com a entropia da mensagem de origem ‒ não tem relação alguma com o significado da mensagem, mas sim com a qualidade do sinal. Intrigado com esse problema, Shannon publicou, em 1948, um artigo de 79 páginas no The Bell System Technical Journal, dividido nas edições de julho e outubro, denominado A Mathematical Theory of Communication. Conhecido entre os pesquisadores da área graças ao seu esquema “emissor-receptor”, ele apresentou ainda um neologismo: bit, derivado de binary digits, uma unidade para medir informação (SHANNON, 1948). Aos olhos da ciência, o termo “informação” só passou a fazer 16. “Palo Alto Weekly becomes the first newspaper to publish its entire editorial content to the internet”. Disponível em: <http://www.paloaltoonline.com/about/palo_alto_online_timeline.php>. Acesso em: 28 mar. 2015. 17 Versão original: “Information, as narrowly defined by Shannon, concerns the predictability of a message source. In the real world, however, information is something that is analyzed for meaning, that is remembered and combined with other information, and that produces results or actions. In short, information is processed via computation”..

(41) 41 sentido quando deixou de ser vago, abstrato, impreciso ‒ como a ideia de movimento antes das Leis de Newton. Portanto, um “rito de purificação” se tornou necessário. Só assim podemos entender “informação” como algo que corre por todo o mundo: o sangue e o combustível, o princípio vital (GLEICK, 2011, p. 3). Já na Computação, o termo possui significados diversos a partir do seu uso (recuperação ou armazenamento de informação), sendo que, neste sentido, os dados são binários, capazes de ser processados por computadores. Entretanto, o desejo humano de extrair conhecimento por meio do relacionamento de dados e informações provenientes de diversas fontes é anterior ao advento das tecnologias digitais conectadas. Ele existe desde as formulações do filósofo e cientista Gottfried Wilhelm von Leibniz (Biblioteca Universal) e do dispositivo modulado por Vannevar Bush ‒ capaz de armazenar e recuperar informação (Memex) ‒, passando pela cooperação entre homem e máquina imaginada por Licklider (Libraries of future). Depois, ele chega ao processamento da informação por máquinas computacionais, bem como à construção e à formalização de uma rede de informações que culminou com hiperlinks criados por Tim Berners-Lee (Web), até alcançar a formatação de estrutura para colaboração e para obtenção de conhecimento implantada por Jimmy Wales (Wikipedia). E o Jornalismo convive e se apropria de recursos oriundos dos Sistemas da Informação nessa nada breve linha do tempo, mais especialmente a partir dos anos 1970, quando as bases de dados passam a integrar as suas rotinas produtivas (RIBAS, 2007). Um exemplo de plataforma de mídia nesse contexto é o Google News 18, no qual usuários que visitam a sua primeira página identificam as suas manchetes (as top stories) e editorias como em um jornal tradicional. A diferença, porém, está na composição da página: a edição é feita automaticamente, por meio de um algoritmo que classifica notícias provenientes de múltiplas fontes.. Se um usuário estiver conectado ao Google e permitir explicitamente a função ‘Histórico da Web’, o sistema irá registrar seu histórico de navegação e gerar uma seção personalizada, denominada ‘Recomendado para [conta]’, contendo sugestões de links baseados em seus cliques. A gravação desse registro é totalmente anônima e é mantida em segurança, de acordo com as políticas de privacidade do Google (LIU; DOLAN; PEDERSEN, 2010, tradução nossa)19. 18 19. Disponível em: <http://news.google.com>. Acesso em: 22 out. 2014. Versão original: “If a user signs in to her Google Account and explicitly enables Web History, the system will record her click history and generate a personalized section for her, named ‘Recommended.

(42) 42. Antes de ser um exemplo de ferramenta baseado em algoritmos, o Google News está na Web, um sistema de documentos codificados em marcação hipertextual e relacionados entre si, acessados por meio de softwares específicos (navegadores). Criada pelo físico britânico Tim Berners-Lee em 1989, a Web se transformou em um ambiente amigável de navegação, permitindo o desenvolvimento de ferramentas para a produção e o compartilhamento de conteúdos com facilidade. Entendendo a Web como um espaço de mudanças significativas tanto na comunicação quanto em atividades como pesquisa científica, Berners-Lee observa um considerável volume de disciplinas interessado em desenvolvê-la em seu potencial. No entanto, essas disciplinas não a identificam claramente como seu principal foco de atenção. Apesar do interesse espalhado em Ciências Humanas e em estudos ligados à Computação, é comum encontrar essas discussões restritas em silos disciplinares. Susan Halford, Cathy Pope e Leslie Carr, da Universidade de Southampton, valorizam a interdisciplinaridade e a abertura de informações como forma de estudar e compreender a Web como um fenômeno humano, além de projetar seu crescimento e capacidades futuras. É delas o “manifesto por uma ciência da Web” (HALFORD; POPE; CARR, 2010). Apesar do claro interesse da Matemática e da Ciência da Computação, o lado social da Web precisa ser melhor entendido a partir de disciplinas como Geografia, Psicologia, etc. No Jornalismo, a Web é reconhecida como um poderoso repositório de informação, fortalecendo o uso de bases de dados (BARBOSA; TORRES, 2013). A Figura 1.1 apresenta uma relação entre os atributos da informação nesse ambiente.. for [account]’, containing stories recommended based on her click history in Google News. The recorded click histories were fully anonymized and kept secure according to the Google Privacy Policy”..

(43) 43 Figura 1.1 – Componentes da informação jornalística na web. Fonte: Produzida pelo autor.. No Jornalismo, por exemplo, bases informacionais seriam compostas tanto por bancos de dados com matérias de veículos diversos (históricos) quanto por dados oriundos de fontes externas – os datasets. Em ambos, o desafio proposto há dezenas de anos permanece: de que forma recuperá-los diante de potenciais inconsistências, redundâncias e ruídos? Um dos pesquisadores mais interessados na questão da memória jornalística no Brasil, o professor Marcos Palacios, sintetiza esse modelo: a construção da realidade pelo Jornalismo se baseia em um universo de significados disputados conflitivamente, ocupando um lugar de memória ao lado de outros documentos – uma espécie de “rascunho histórico” à espera de que um historiador consolide o texto final (PALACIOS, 2010, p. 41). O autor aponta, no entanto, que o acervo de um veículo informativo não se limita a esse olhar externo: para a produção jornalística de qualidade, a consulta e a apropriação de informações em bases de dados internas e externas ao veículo é evidente (PALACIOS, 2008). O seu acionamento é comum para produção de conteúdos relacionados a efemérides e retrospectivas. Ele também aparece de maneira recorrente em comparações e analogias para contribuir com a construção de um retrato do presente. Por fim, há a relação entre os veículos e seu público – público este que passa a dispor de recursos para investigar aspectos históricos em torno do material que lhe é oferecido. O usuário se torna cada vez mais presente a partir da popularização de.

(44) 44 ferramentas sociais conectadas em rede. Parte do discurso formulado nessa relação acaba incorporado aos produtos jornalísticos contemporâneos. Se é fato que nem toda informação é jornalismo e que a atividade jornalística não se confunde com o simples testemunho, é igualmente fato que a comunicação rizomática e a liberação do polo emissor multiplicaram – a perder de vista – os lugares de memória em rede (PALACIOS, 2010, p. 45). Palacios usa, portanto, o termo “lugar de memória” para definir um local onde as lembranças são externalizadas – arquivos, repositórios de documentos nos quais o jornalismo se insere. A esse propósito, a palavra “memória” (do latim memor oris, “que se lembra”) também aparece na Biologia: refere-se a um grupo de habilidades de aprendizado e à retenção de experiências que humanos e outros animais possuem. A mesma analogia serviu de inspiração para o matemático John Von Neumann elaborar a arquitetura de computadores: eles se tornariam mais rápidos se as instruções elementares fossem armazenadas em sua memória. O modelo proposto por Neumann ainda é seguido pela maioria dos computadores atuais (LIMA JUNIOR, 2013a, p. 110). A visão de que a memória tem sua importância, como se não houvesse necessidade de comprovação, pode fazer sentido dentro dos limites da comunicação social, como se não houvesse necessidade de comprovação. Mas ela exige contextualização num cenário de apropriação, pelo Jornalismo, das técnicas oriundas de outras áreas, associadas à tecnologia, como as Ciências da Computação – incluindo processos de armazenamento e recuperação da informação, englobando “aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação” (MOOERS, 1951, apud SARACEVIC, 1996, p. 44).. As tecnologias online não são uma panaceia que magicamente transformará as notícias, carregando-as com alto teor de relevância social. Como ferramenta de auxílio à profissão, a pesquisa em fontes digitais facilita o trabalho do jornalista na tarefa de localização da informação. Um profissional não bem preparado para usar esse tipo de processo encontrará problemas na verificação dos dados (LIMA JUNIOR, 2006, p. 122).. Marcos Palacios (2010) observa que os textos jornalísticos precisam caminhar para uma efetiva incorporação de elementos relacionados à memória em sua estruturação. Um dos modelos teóricos preocupados com essa relação é o Paradigma do Jornalismo Digital em Bases de Dados (JDBD), considerado lugar de inovação.

Referências

Documentos relacionados

As principais indicações para a realização foram a suspeita de tuberculose (458 pacientes) e uso de imunobiológicos (380 pacientes).. A maior prevalência de resultado positivo

No caso de uma apresentação de Artigo em formato Áudio, o arquivo deverá ser enviado em CD por correio postal para:.. Comitê Editorial INFEIES - RM

Visão Sócio-jurídica da Arquitetura penitenciária.. CONNASP II CONESP Suzann Cordeiro Tipo de regime Níveis de Segurança.. Segurança Máxima Segurança Média Segurança

A rede de teste 118 IEEE representada na figura 4.3 foi a rede que serviu de base para a aplicação da metodologia descrita e para os estudos de Data Mining apresentados nos

Classificação biológica, Taxonomia e Sistemática são designações que tiveram origem em alturas distintas ao longo da história, e cujo significado por vezes

Poderá o azote ser absorvido, aprehendi- do directamente pelas vegetaes ? E' uma ques- tão que segundo creio está hoje resolvida af- íirmamente como veremos. Da exposição al- guma

A interação treinamento de natação aeróbico e dieta rica em carboidratos simples mostraram que só treinamento não é totalmente eficiente para manter abundância

Os resultados permitiram concluir que a cultivar Conquista apresentou a maior produtividade de grãos, no conjunto dos onze ambientes avaliados; entre as linhagens