• Nenhum resultado encontrado

Ciência aberta na prática: Reproducibilidade, notebooks e tudo mais. Luiz Irber Michigan State University

N/A
N/A
Protected

Academic year: 2021

Share "Ciência aberta na prática: Reproducibilidade, notebooks e tudo mais. Luiz Irber Michigan State University"

Copied!
45
0
0

Texto

(1)

Ciência aberta na prática:

Reproducibilidade,

notebooks e tudo mais

Luiz Irber

Michigan State University

(2)
(3)

Meu primeiro projeto

● Efeitos de feromônios em insetos

● Software disponível para Windows

○ portar para Linux

● Borland C++ Builder/Kylix

● Python + GStreamer

● Sourceforge!

● ~2005-2007

(4)

SACAM

SACAM

https://github.com/luizirber/bugbrother

(5)

Python Brasil

● Primeira participação: 2007

● 2010

○ Recém-formado

○ "A gente tem um supercomputador novo e

precisamos de engenheiros, tá a fim?"

(6)

Tupã

(7)

Modelagem climática

Modelagem climática: processos envolvidos

https://www2.ucar.edu/sites/default/files/news/2011/CESM_final.jpg

(8)
(9)

Desenvolvimento

● Modelo escrito em Fortran

● Equipe

○ quatro integrantes inicialmente

○ cresceu para mais de quinze

● Como organizar o processo?

(10)

Desenvolvimento

● Sistema de controle de versões

○ Mercurial

● Redmine

● Google docs

● Lista de email

(11)

Thalassa

● Edição da grade oceânica

● Python

○ Numpy + Matplotlib + Basemap + PyQt

● Windows, OS X, Linux

(12)

Um grande designer de UI =P

(13)

Integração contínua

● Bosun

○ Fabric

● Jenkins

○ monitorar o repositório

○ disparar os scripts

○ monitorar os status dos

builds/runs

(14)

Operacionalização

● Execução diária

● Formatação dos dados

○ Entradas

○ Saídas

● Bosun

○ Python ~> Bash

○ Vários truques novos

(15)

● Modelo gera resultados condizentes com a realidade?

● Validação é necessária para disponibilização do modelo

● Análise humana leva muito tempo

○ E necessita de uma equipe muito maior

● Testes

○ Comparar com medições

○ Avaliar numericamente quão bom está

● Como fazer?

Validação do modelo

(16)

● Mercado

○ Ambiente técnico fantástico, mas...

○ Qual o objetivo?

● Academia

○ 'level up'

○ Muita autorreflexão…

○ Seguir na modelagem?

Buscando alternativas

(17)

Bioinformática?

(18)

Bioinformática?

(19)
(20)

Bioinformática!

● Chicken genome improvement project

○ Regiões não mapeadas

■ Microcromossomos

● khmer: HyperLogLog

○ estimativa de cardinalidade

● Treinamento

○ Software Carpentry

○ undergrads

○ 'pair support'

(21)

(slide: Titus Brown)

(22)

(slide: Titus Brown)

(23)
(24)

(slide: Titus Brown)

(25)

http://ged.msu.edu/papers/2012-diginorm/

(slide: Fernando Perez)

(26)

Better science through superior software

(slide: Titus Brown)

(27)

Licença e Makefile!

https://github.com/luizirber/galGal

(28)

Um notebook por passo

https://github.com/luizirber/galGal

(29)

Hmmmm….

https://github.com/luizirber/galGal

(30)

Visualizando notebooks

https://github.com/luizirber/galGal

(31)

Explicações, código e comandos

https://github.com/luizirber/galGal

(32)

Figuras também!

https://github.com/luizirber/galGal

(33)

(slide: Fernando Perez)

(34)

(slide: Fernando Perez)

(35)

http://reproducibility.cs.arizona.edu/

"Can a CS student build the software within 30 minutes, including finding and installing any

dependent software and libraries, and without bothering the authors?"

Reproducibilidade em

Ciência da Computação

(36)

Measuring Reproducibility in Computer Systems Research

http://reproducibility.cs.arizona.edu/

(37)

Measuring Reproducibility in Computer Systems Research

http://reproducibility.cs.arizona.edu/

(38)

(slide: Fernando Perez)

(39)

Open source como exemplo

https://wiki.debian.org/ReproducibleBuilds

"It should be possible to reproduce, byte for byte, every build of every package in Debian."

(quantos anos até o projeto Debian ter estrutura suficiente para isso?)

(40)

http://db-reproducibility.seas.harvard.edu/

(41)

(slide: Fernando Perez)

(42)

Make it work,

then make it better

● Soluções de baixo atrito

○ Pessoas devem ser capazes de usar!

○ e entender!

● Makefile

○ Pipeline

● Scripts

○ código reusável

● Notebooks

○ Análise

○ Figuras

○ "Amarrar"

(43)

Treinamento

● Como ensinar pensamento computacional para cientistas?

● Como evitar "push button research"?

(44)

Software Carpentry

● organização sem fins lucrativos

○ voluntários

● ensinar habilidades computacionais básicas para fazer cientistas mais produtivos e seu trabalho mais confiável a longo prazo

● Workshops curtos (e intensos!)

○ organização de programas, controle de versões,

testes e automação de tarefas.

(45)

Perguntas?

@luizirber

cienciaaberta@luizirber.org

Referências

Documentos relacionados

Num estudo realizado em Portugal sobre as causas das decisões do abandono da prática desportiva (Vasconcelos, 2003) nos atletas de elite seriam o cansaço do calendário desportivo, o

I - O servidor ou o Pedagogo Orientador Educacional, de acordo com sua área de concurso ou habilitação devidamente cadastrado no SIGRH, poderá optar por concorrer para atuar na

As paredes internas e a parte superior do forno são fabricadas em aço inox (AISI 430), com um revestimento de 40 mm para um melhor controlo da distribuição de calor e facilitar

Proteção respiratória: Recomenda-se a utilização de respirador com filtro para vapores orgânicos para exposições médias acima da metade do TLV-TWA.. Nos casos em que

O Conselho Monetário Nacional (CMN) aprovou a Resolução 4.415, que estabelece direcionamento obrigatório, para operações de crédito rural, dos recursos captados pelas

Nunca utilize uma chave de tubos, para que a porca de aperto rápido Kwik lock não seja danificada. Retire a ficha de rede

A produ^áo cronística de Rui de Pina oferece um formidável repositorio de informagóes que, especialmente para os reinados de D. Afonso V e D, Joáo II, ajuda a perceber tanto a

O objetivo do presente estudo foi determinar, por meio de intervenção experimental, a importância do trabalho de reforço muscular e do alongamento na razão entre músculos flexores