• Nenhum resultado encontrado

5 JORNALISMO DE DADOS COMO PROCESSO

5.2 FILTRAGEM, ANÁLISE E EDIÇÃO

Mesmo nos casos em que os dados chegam até o jornalista em formatos manipuláveis, é praticamente impossível que eles estejam prontos para serem visualizados ou ordenados da forma ideal para interpretação. Até porque cada ângulo da notícia pode depender de uma configuração distinta das unidades de informação.

Assim como uma entrevista mais extensa e minuciosa com uma pessoa pode demandar edição e por vezes ser apresentada em uma forma narrativa, em oposição ao mais literal “pingue-pongue”, os dados também ganham valor jornalístico ao serem submetidos a um tratamento editorial. Alguns autores e jornalistas, como Stephen Quinn e Stephen Lamble (2008), Scott Klein (apud BHATIA, 2015), Sylke Gruhnwald (apud KIM, 2014) e Michelle Minkoff (2013), utilizam especificamente as expressões “entrevistar dados” e “entrevistar planilhas”.

Como o quadro 16 demonstra, diferentemente da etapa de extração, onde não identificamos nenhuma ferramenta claramente dominante, para os vencedores do DJA análise de dados é quase que um sinônimo de Excel. Dentre as 21 produções sobre as quais obtivemos menções de softwares utilizados para análise, 14 citaram Excel, ou seja, duas em cada três. Apenas uma instituição citou o “concorrente” open source do famoso editor de planilhas da Microsoft, o OpenOffice Calc.

Quadro 16 – Informações apuradas sobre as ferramentas de limpeza e análise de dados utilizadas pelos vencedores do DJA.

Projeto Como são feitas a limpeza e edição? Fonte

Boletins Escolares de Illinois em 2011 "A 'trituração' de dados foi feita com Python e MongoDB".

http://datadrivenjournalism.net/featured_projects/DJA_ nominee_of_the_day_2011_Illinois_School_Report_Ca rds

Subsídios para o ônibus: Sistema de transporte na Argentina

Várias ferramentas foram usadas: Visual Basic para aplicações, RegEx, Excel Macros, Google Spreadsheets,

Ruby on Rails e MySQL.

http://datadrivenjournalism.net/featured_projects/Data_ Journalism_Awards_Worthy_Mention_-

_Bus_Subsidies_in_Argentina

Terroristas para o FBI Foram utilizados MySQL e Excel.

http://datadrivenjournalism.net/featured_projects/Data_ Journalism_Awards_Featured_Winner_Terrorists_for_t he_FBI

Política transparente "A parte de programação é Ruby on Rails". https://review.wizehive.com/voting/view/dja2012/0/93

4485/0 Quão rápido a ajuda chegou onde você

vive? "Excel para limpar e analisar os dados".

https://review.wizehive.com/voting/view/dja2012/0/93 4035/0

Metadona e as políticas da dor "As ferramentas que nós usamos para a nossa análise incluíram Access, Excel e ArcGIS".

https://review.wizehive.com/voting/view/dja2012/0/93 3983/0

Acidentes com pedestres Novosibirsk 2011 Ferramentas utilizadas que permitem análise são Javascript e

Google FusionTables.

http://datadrivenjournalism.net/featured_projects/DJA_ nominee_of_the_day_Pedestrian_Crashes_in_Novosibi rsk_2011

Todas as mortes em todas as estradas na

Grã-Bretanha 1999-2010 A análise foi feita usando Excel e Python.

https://review.wizehive.com/voting/view/dja2012/0/93 4408/0

Rumores de tumultos: Como informações falsas se espalham no Twitter em tempos de crise

Os acadêmicos construíram ferramentas originais para a análise.

http://datajournalismhandbook.org/pt/estudos_de_caso _10.html

China Conectada

"Para avaliar os dados, nós usamos ferramentas exploratórias desenvolvidas pela Fathom que foram construídas utilizando

Processing, Java, Python e Excel".

https://review.wizehive.com/voting/view/dja2013/0/12 44496/0

Gastos do Senado da Argentina 2004-2013 Análise foi feita com Excel Macros. https://review.wizehive.com/voting/view/dja2013/0/12 44507/0

Projeto Como são feitas a limpeza e edição? Fonte

Direitos dos gays em cada estado Ferramentas citadas que permitem análise são Javascript e

Google Docs.

https://review.wizehive.com/voting/view/dja2013/0/12 44516/0

O Mercado de Arte para Leigos

Analise foi feita com Excel e Google Refine. Google API

Currency Converter foi usado para normalizar os valores

monetários.

https://review.wizehive.com/voting/view/dja2013/0/12 44458/0

Grande calculadora de classes britânica Nenhuma ferramenta de análise é mencionada. -

Crianças sob proteção Análise foi feita com OpenOffice Calc e Google Refine. https://review.wizehive.com/voting/view/dja2013/0/12 44529/0

A riqueza dos "Deuses de Faura" Análise foi feita com Excel. https://review.wizehive.com/voting/view/dja2013/0/12

44532/0

O Pareador Softwares de planilha e SQL não foram especificados. https://review.wizehive.com/voting/view/dja2013/0/12

44466/0

Remodelando Nova York Ferramenta citada que permite análise é ArcMap. http://dwtkns.com/portfolio/

Os arquivos dos migrantes

Originalmente, após limpeza com OpenRefine, Detective.io era usado na análise, mas foi descontinuado. Atualmente, os dados podem ser filtrados e ordenados com Google

Spreadsheets.

http://www.themigrantsfiles.com/

Para subir na escala social, o lugar importa Nenhuma ferramenta de análise é mencionada. - Lares para serem tomados: Penhores, Perdas

e Aproveitadores

"A maior parte da coleta, limpeza e análise de dados deste projeto foi realizada usando R, SPSS, Python, MySQL,

ArcGIS, Google Refine e Microsoft Excel."

http://community.globaleditorsnetwork.org/content/ho mes-taking-liens-loss-and-profiteers-0

Propublica (várias inscrições) "Google Refine e Excel para limpar os dados" http://datajournalismhandbook.org/pt/entendendo_os_d ados_6.html

NZZ Dados

Como um dos trabalhos teve vídeo como dado de entrada, nele o Final Cut Pro foi usado para a análise. Excel também é mencionado.

https://datavisualization.ch/showcases/interactively- explore-the-yolo-flip/

http://www.tableau.com/stories/customer/data- transparency-and-responsiveness-neue-zurcher-zeitung

Projeto Como são feitas a limpeza e edição? Fonte

Kiln Portfolio Nenhuma ferramenta de análise é mencionada. -

Chad Skelton - Portfólio individual Como ele leciona cursos de Excel, é razoável supor que ele

usou esta ferramenta nas análises. https://ca.linkedin.com/in/chad-skelton-95744821/pt

Declarações de bens abertas dos principais oficiais da Argentina

"Para desenvolver o projeto, nós trabalhamos de forma colaborativa no Google Drive (Google Docs e Spreadsheets) e Trello. Também com Excel para a análise de dados."

http://blogs.lanacion.com.ar/projects/data/news- application-statements-of-assets-from-argentinas-main- public-officials/

Outra ferramenta de manipulação de planilhas citada pelos autores dos trabalhos premiados, e às vezes utilizada como hospedagem pública para os dados, é o Google Spreadsheets. Este aplicativo online gratuito não dispõe de todos os recursos avançados do Excel, mas viabiliza as ações mais comuns – filtrar, ordenar, gerar gráficos, etc – com a vantagem da colaboração entre usuários em tempo real.

Mais do que ser um concorrente online gratuito e simplificado do Excel, o Google Spreadsheets representa o espírito do seu tempo em termos de metodologia de trabalho. Além de funcionar em navegadores, ele possui salvamento automático, versões móveis para Android e iOS, permite uso de add-ons166 e faz parte de um conjunto de programas produzidos ou suportados pela Google dentre os quais pelo menos quatro outros também são utilizados em nosso corpus. São eles: Google Refine / OpenRefine (o programa mudou de nome em 2012), Google Docs, Google Fusion Tables e Google API Currency Converter (Google Finance).

Apesar de muitos interpretarem erroneamente a palavra “dados” como se referindo exclusivamente a valores numéricos, tanto esta pesquisa como o próprio DJA trabalham com visões amplas sobre o tema. Tasneem Raja, editora digital da NPR e ex-editora interativa na revista Mother Jones, esclarece essa questão ao ser perguntada sobre qual é a principal coisa que as pessoas entendem errado sobre jornalismo de dados:

Que tudo é quantitativo. Isso é como se fosse o princípio orientador número três no meu time: tudo é dados. Palavras são dados. Gifs são dados. Se pode ser classificado, acompanhado, contado, mesclado, filtrado: provavelmente são dados. Eu diria que metade dos projetos que o meu time desenvolve é mais qualitativa do que quantitativa. Ou seja, a maioria das pessoas não os consideraria visualizações de dados tanto quanto ensaios fotográficos, jogos, testes, etc. Há um grande poder em desenvolver um conjunto de habilidades com dados – tanto técnicas quanto cognitivas – que lhe permitam fazer coisas legais com palavras e

166 O mesmo que plugin. Ver nota 108.

imagens também. (RAJA apud HOWARD, 2014, p. 94)167

E é por isso que além das ferramentas voltadas à administração de dados no sentido tradicional, seja em planilhas, em bases relacionais ou NoSQL, encontramos entre os recursos que os ganhadores do DJA desejaram destacar o editor de vídeo Final Cut Pro e o aplicativo de gerenciamento de projeto Trello. Enquanto o primeiro permitiu “fatiar” um vídeo em frames para análise, uma forma de informação mais granular, precisa e flexível, o segundo coordenou os esforços de pessoas com diferentes formações, motivações e conhecimentos em torno de um objetivo comum.