• Nenhum resultado encontrado

Data Wrangling. Juliano Mota

N/A
N/A
Protected

Academic year: 2022

Share "Data Wrangling. Juliano Mota"

Copied!
18
0
0

Texto

(1)1 1 76. 9 . 3 69. . 1 Data Wrangling 1 0. J. o n a i l u. ta o M.

(2) 1 1 76. 9 . 3 69. . 1 1Dados no R Preparação de 0 ta o M o n a i l u J. 2.

(3) Data wrangling • Utilizaremos, principalmente, o dplyr • O dplyr é um pacote contido no tidyverse. 1 1 76. 9 . 3 69. . 1 1 0 • Contém funções úteis para a manipulação/preparação de bancos de dados a t o M o n • Material para referência: a i l u J • https://dplyr.tidyverse.org/ • https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf • Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html. 3.

(4) Data wrangling • • • • • • • •. 1. 1 Pipe: encadeamento de diversas funções em sequência 6 7 9 Rename: alteração de nomes de variáveis 3. 9 e criação de novas variáveis 6 . Mutate: alteração de conteúdo das variáveis 1 1 0 em critérios lógicos Filter: seleção de observações com base a t o Select: seleção de variáveis M o n Summarise: criação deiatabelas com medidas resumo (estatísticas descritivas) l u Group by: agrupamento J das observações com base em critérios Join: junção (merge) de bancos de dados. 4.

(5) 1 1 76. 9 . 3 69. . 1 1 Criação de Projects e0Scripts R Markdown ta o M o n a i l u J. 5.

(6) R Markdown • • • • •. 1. 1 Introdução ao R Markdown 6 7 9 . Formatação básica do texto 3 9 6 . Inserção de fórmulas 1 1 0 Chunks a t o Gerando outputs (HTML; PDF, MDOC). o n a i l • Material para referência: Ju. • https://rmarkdown.rstudio.com/index.html. 6.

(7) 1 1 76. 9 . 3 69. . 1 Projetos de Data Science01& Analytics no GitHub ta o M o n a i l u J. 7.

(8) Git • Software útil para o controle de versões. 1 1 76. 9 . 3 9 • Registra as alterações feitas nos arquivos 6 . 1 1 0 a t o Mcom o Github • Vamos utilizá-lo em conjunto o n a i l u J. • Instalar o Git no computador (https://git-scm.com/downloads) • Basta avançar todas as etapas nas configurações sugeridas 8.

(9) Github • Site utilizado para hospedar os arquivos • https://github.com/. 1 1 76. 9 . 3 69. . 1 1 0 a. t que podem ser compartilhadas, • Organizado em repositórios (pastas) o inclusive, podem ser publicadas oM n a i ul. J e compartilhar seu portfólio de projetos • Útil para armazenar • Os arquivos do computador podem ser enviados ao Github (pelo Git) 9.

(10) Git e Github • Add e Commit • • • •. 1 1 76. 9 . Crie uma pasta na área de trabalho de seu computador 3 9 6 . No RStudio, crie um novo scrip e escreva apenas # Versão 1 1 1 0 Versão Exemplo.R Salve este arquivo na pasta com otanome o Dentro da pasta, clique com o Mbotão direito do mouse e escolha Git Bash Here o n a i l u. • No Git, escreva gitJinit (inicializa o Git na pasta selecionada) • Escreva git add “Versão Exemplo.R” (adiciona o arquivo para o índice) • Para gerar versões utilize o comando git commit -m “título” (são as versões) O nome do commit, exemplo: “Primeira Versão” 10.

(11) Git e Github • Push • • • •. 1 1 76. 9 como preferir . Em seu Github, crie um novo repositório e nomeie 3 9 6 . Copie o link do repositório criado 1 1 0 ..........(link de sua pasta).......... No Git, escreva git remote add origin a t o Por fim, digite git push –u origin M master (envia o arquivo para o repositório, o n ficando na ramificaçãoia principal) l u J. • Na primeira vez que for feito, solicitará login no Github. • Após atualizar, é possível verificar que o arquivo já está em seu Github! 11.

(12) Git e Github • Criando e comparando versões. 1 1 76. 9 linha: # Versão 2 . • Abra o arquivo Versão Exemplo e escreva mais uma 3 9 6 . • Após salvar, feche e com o botão direito abra o Git Bash Here na pasta 1 1 0 • Utilize os mesmos procedimentos: a t o M. o n • git add “Versão Exemplo.R” a i l Ju Versão” • git commit -m “Segunda • git push –u origin master. Note que não foi necessário informar novamente o endereço. • No Github, a nova versão já está disponível e podemos compará-las! 12.

(13) Git e Github • Criando ramificações no repositório. 1 1 76. 9 principal do repositório . • Nos comandos anteriores, alteramos a ramificação 3 9 6 . • Poderíamos criar ramificações novas no 11Github 0 a ot. • git checkout -b “nome da nova M branch” o • No Git, já há a indicação il ande mudança da “master” para a “nova”. Ju. • Os mesmos procedimentos de add e commit • git push -u origin “nome da nova branch”. 13.

(14) Git e Github • Importando repositórios (Clone e Pull). 1 1 76. 9 que estão no Github . • Pode ser útil trazer para seu computador arquivos 3 9 6 . • Uma forma de “baixar” tais arquivos é1por 1 meio da função clone • • • • • •. 0 a ot. Crie uma pasta em seu computador M o n direito do mouse, abra o Git Bash Here Dentro da pasta, comlo abotão i Ju de interesse, clique em code e copie o link No Github, no repositório No Git, digite git clone ..........(link do repositório).......... Para baixar novamente, após alterações no Github, indique cd “repositório” Na sequencia, digite git pull (o arquivo foi atualizado no computador) 14.

(15) Git e Github • Copiando repositórios públicos (Fork). 1 1 76. • É possível copiar repositórios que estão publicados 3.9 no Github. 9 6 . 1 1 0 • Procure por algum tema de interesse a t o • Acesse o repositório M o nexiste o botão Fork • No canto superior direito, a i l u • Após clicar, poderáJver o repositório em sua lista (em seu perfil). 15.

(16) Git, Github e RStudio • É possível integrar o Git, Github e RStudio. 1 1 76. 9 . 3 9 → Version Control → Git • No RStudio, clique em File → New Project 6 . 1 1 0 a t o link do repositório no Github o • Em “Repository URL” basta indicar M o n a i l u J • Após criar um documento (R Script, R Markdown), clique em Git e faça o commit e, em seguida, o push • Também é possível fazer o pull dos arquivos do repositório que foi indicado 16.

(17) 1 1 76. 9 . 3 69. . 1 Funções e Iterações01com Pacote Purrr ta o M o n a i l u J. 17.

(18) Functions, Purrr • Criando funções no R • Atribuindo condições (“IF”) • Iterações com Purrr (funções map) • Material para referência:. 1 1 76. 9 . 3 69. . 1 1 0 a. t o M. o n a i l Wickham, H. & Grolemund, G. R for Data Science: https://r4ds.had.co.nz/index.html Ju. • • https://github.com/rstudio/cheatsheets/blob/master/purrr.pdf. 18.

(19)

Referências

Documentos relacionados

Como entrada do algoritmo, são utilizadas as posições das exsudações na superfície do mar, onde foram detectadas. Os modelos consideram a advecção horizontal de óleo na

• git push -u origin main ou git push --set-upstream origin main – faz o upload de todas as modificações, que foram realizadas no repositório local, para

A grande vantagem de usar um sistema de controle de versões como o Git é poder voltar a qualquer momento para qualquer versão anterior do projeto de forma imediata,

c) BI e Cartão de contribuinte de um familiar (para se proceder à elaboração do contrato de prestação de serviços que deverá, além do utente ser também assinado por

RPC cc cc rprog.c prog_proc.c prog_clnt.c prog.h prog_svc.c rprog prog_svc procedimentos servidores cliente especificação RPC stub servidor stub cliente programa servidor

A seguir, focaremos nos seguintes ajustes das partes móveis do trato vocal: os movimentos de abaixamento e elevação da laringe; arqueamento do véu palatino; e

Identifica e fundamenta, com falhas no rigor científico, qual das variedades apresenta vantagem competitiva num ambiente sujeito a grandes variações de salinidade,

Fazer um push do clone com todas as tarefas da equipe integradas para o fork da equipe e fazer um pull request para o repositório central.. (observando as normas para dar