• Nenhum resultado encontrado

RECOLHA, TRATAMENTO E

N/A
N/A
Protected

Academic year: 2021

Share "RECOLHA, TRATAMENTO E"

Copied!
31
0
0

Texto

(1)

R

ECOLHA

,

TRATAMENTO

E

APRESENTAÇÃO

DE

DADOS

:

elementos chave

Carla Patrocínio Núcleo de Estatística e Prospectiva

(2)

INTRODUÇÃO À TEMÁTICA

… apenas discutir alguns aspetos essenciais sobre recolha e apresentação de dados

… sensibilizar para a interpretação do universo de números que nos rodeia diariamente … com exemplos práticos

… em nada substitui a aprendizagem académica e cientifica sobre a estatística

(3)

INTRODUÇÃO À TEMÁTICA

O nosso mundo é repleto de números, estatísticas, dados…

“As estatísticas são um instrumento poderoso de conhecimento da sociedade, essenciais à tomada de decisão, à definição e

avaliação de estratégias e até ao próprio debate político“ Aníbal Cavaco Silva, Presidente da República, 2007

… mas podem ser (in)devidamente usadas

“A fronteira para o terreno da manipulação é mínima e, pior, na maioria dos casos é, também, invisível.“

António Gomes Mota, Artigo de Opinião no Diário Económico de 28/05/2009

Exemplo (banal):

uma família tem um frango, outra não tem nenhum … em média cada uma tem meio frango e 50% tem 1 frango…

(4)

INTRODUÇÃO À TEMÁTICA

Sensibilizar para a necessidade do conhecimento do assunto sobre o qual

vamos falar, estudar, apresentar…

Discutir a razão pela qual a recolha

e o tratamento de dados é essencial e

tipicamente uma das partes de um

trabalho que demora tanto tempo

a realizar!

Genericamente perceber que tipos

de dados com que usualmente nos

confrontamos e alternativas para os

tratar…

Por fim, debater um pouco alternativas para apresentação de resultados e a

forma como elas influenciam a

mensagem a transmitir…

4

Neste workshop vamos:

No fim deste workshop, vamos tentar ser mais críticos sobre

(5)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Quando o nosso trabalho (profissional/académico) envolve a análise, tratamento e apresentação de resultados é essencial … o conhecimento do

assunto que vamos tratar

5

(6)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Exemplo 1: Taxa de desemprego por sexo (%)

(7)
(8)

8

Fonte: PORDATA (http://www.pordata.pt/)

 Análise prévia da forma como são calculadas e as mudanças ocorridas no tempo na forma de apuramento, permite explicar descontinuidades das series em análise…

(9)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Exemplo 2: ainda o desemprego…. Dados sobre a taxa de desemprego e o nº de desempregados…vêm todas da mesma fonte? São comparaveis?

9

Aprofundamento dos vários conceitos sobre a mesma temática é essencial …

(10)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Exemplo 3:

10

(11)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Exemplo 4: A (cor)relação entre variáveis

11 N º P ubl ic a ç ões C ie nt íf ic a s Nº Casamentos Indicador Fontes de Dados: Fonte: Última atualização:

Publicações científicas

DGEEC/MEC a partir de Thomson Reuters - InCitesTM,

Thomson Reuters (2013) PORDATA 21-02-2014 Casamentos INE - Estatísticas de Casamentos PORDATA 30-04-2013

(12)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Exemplo 5: A (cor)relação entre variáveis (cont.)

12 N º C a s a m e nt os

Indicador Fontes de Dados: Fonte: Última atualização: Gasolina Super com

Chumbo ou Aditiva

(Euro/litro) DGEG/MEE PORDATA 11-03-2014 Casamentos INE - Estatísticas de Casamentos PORDATA 30-04-2013

Preço Gasolina Super com Chumbo ou Aditiva (Euro/litro)

Nem todas as variáveis aparentemente “correlacionadas” estão de facto relacionadas, e só com um conhecimento efetivo do tema e dos eventos subjacentes se podem selecionar as variáveis adequadas (e explicáveis ) e perceber o que faz ou sentido….

(13)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

Exemplo 6: Nº Alunos do IST 2012/13

13

?

10143 10689 11232 11778

Nº Alunos do IST de 1º e 2º ciclo com vista à obtenção de um grau

Nº Alunos do IST de 1º-3º ciclo (incluindo alunos em programas de intercâmbio)

Nº Alunos do IST de 1º, 2º e 3º ciclo com vista à obtenção de um grau

Nº Alunos do IST de 1º e 2º ciclo (incluindo alunos em programas de intercâmbio)

(14)

A IMPORTÂNCIA DA DEFINIÇÃO DO OBJETO DE ESTUDO E DOS OBJETIVOS A ALCANÇAR

14

Em suma, é necessário (ESSENCIAL)

conhecermos bem o assunto sobre o qual vamos nos vamos debruçar, não só para podermos

explicar as descontinuidades e justificarmos as inflexões (ou a estabilidade das séries), como também para pedirmos os dados que

efetivamente precisamos e chegarmos à

confirmação ou infirmação da nossa hipótese de trabalho

(15)

MECANISMOS DE RECOLHA DE DADOS E FONTES DE INFORMAÇÃO

 Hoje em dia vivemos na era da informação e com o

acesso facilitado a dados, a informação…

 A internet permite rapidamente aceder a um

conjunto vasto de informação, a bases de dados bastante completas…

 A grande questão hoje em dia consiste em

selecionar a informação que se pretende (se já existe), estabelecer mecanismos de relacionar as várias fontes de informação, e como complementar, se possível, os elementos que dispomos

(16)

MECANISMOS DE RECOLHA DE DADOS E FONTES DE INFORMAÇÃO

 Fontes de informação devem ser oficiais e fidedignas.

Exemplos mais genéricos:

 INE – Instituto Nacional Estatística

 DGEEC - Direcção-Geral de Estatísticas da Educação e Ciência

 DGES - Direção-Geral de Ensino Superior

 PORDATA

 …

 Eurostat

 Eurydice Network

 OECD - Organisation for Economic Co-operation and Development

 ….

 Podemos usar outras Fontes de informação (e.g. dados

recolhidos nos websites das instituições), mas apenas para controle da nossa informação “oficial” e perceber as variações possíveis…

(17)

MECANISMOS DE RECOLHA DE DADOS E FONTES DE INFORMAÇÃO

Relação entre as várias fontes de informação:

 idealmente ter um identificador único que permita estabelecer essa ligação (numérico ou alfanumérico e sem espaços)

Por exemplo: 17 Dados Exames Português por Concelho (JNE) Densidade Populacional e Nº Escolas por Concelho (INE)

Existe um identificador do concelho (código)?????

É o mesmo em ambas as fontes???? E se não for ou não existir?? Podemos relacionar através do nome? Então e os acentos? Espaços? Mais que um

concelho com o mesmo nome…

 Não tendo….conforme a dimensão das bases de dados e tempo/recursos disponíveis

relacionar manualmente!

(18)

MECANISMOS DE RECOLHA DE DADOS E FONTES DE INFORMAÇÃO

Forma complementar de recolher informação: inquérito

Existem vários tipos de inquérito, várias formas de conduzir os inquéritos, as quais não são objeto deste workshop, mas em qualquer formato

adotado existem aspetos chave:

 Definir o público-alvo e a viabilidade de obtenção da base de dados dos

contactos (e, por conseguinte, a viabilidade de aplicabilidade do inquérito)

 Definir muito claramente os objetivos do inquérito e se o seu conteúdo

responde na integra às hipóteses de trabalho em análise (se nos

esquecermos de uma pergunta, não vamos voltar a aplicar um inquérito só com essa questão)

 Caso existam outras fontes de informação, avaliar se poderemos

posteriormente relacionar com a informação que estamos a recolher via inquérito, ou se esta pode servir de base para reduzir o tamanho do inquérito (anonimato, aumento taxa de resposta)

 Independentemente do mecanismo de aplicação do inquérito (online,

papel, entrevistas), é importante salvaguardar a correta imputação dos dados recolhidos…

mas sobre isto falaremos mais adiante…!

(19)

TIPOS DE DADOS E METODOLOGIAS DE TRATAMENTO DA INFORMAÇÃO

 Tipos de dados e tratamento a fazer….  Tipos mais comummente usados:

 Quantitativas: discretas, contínuas

 Qualitativas: nominais/categóricas e ordinais

 O tipo de dados deve determinar o tratamento e os

indicadores a construir:

 As variáveis discretas deve ter-se algum cuidado com os indicadores a

construir (vamos ver um exemplo mais adiante)

 As variáveis contínuas têm um leque maior de indicadores possíveis,

podendo inclusive ser agregadas para facilitar a apresentação do seu conteúdo (embora se perca a riqueza da informação disponível)

 Se as variáveis foram nominais/categóricas, mesmo codificadas com um

código numérico, não se devem calcular algumas medidas

 No caso das ordinais e tratando-se de uma escala de likert com vários

pontos por vezes usa-se a média como apoio à interpretação, mas requer algum cuidado (especialmente em trabalhos de investigação)

 Em qualquer uma das situações é extremamente importante

saber a escala de cada variável, não só para perceber potenciais erros na análise ou na prévia imputação dos dados, como também um melhor entendimento dos resultados

(20)

TIPOS DE DADOS E METODOLOGIAS DE TRATAMENTO DA INFORMAÇÃO

 Vários softwares tratamento dados (SPSS, R,

SAS, STATA, Excel, etc.), consoante as

necessidades, alguns podem ser mais uteis ou potentes

 Em qualquer um dos softwares existem alguns

aspetos a ter cuidado: sort’s (sem incluir todas as colunas), filtros, imputação de dados, find/replace’s

 Um ponto que é independente do software usado é

a importância de uma análise exploratória de todas as variáveis envolvidas na análise …. Deteção de erros imputação de dados, “outliers”, compreensão e explicação do fenómeno em estudo

(21)

TIPOS DE DADOS E METODOLOGIAS DE TRATAMENTO DA INFORMAÇÃO

Exemplo 1: Estudar os resultados das aprovações em 3 exames da mesma disciplina

21 Escala dos resultado s: [10;20]

Indicadores Exame 1 Exame 2 Exame 3

Minimo 10 10 10 Máximo 20 20 20 Média 16 16 16 Mediana 17 15 16 Desvio padrão 2,0 1,9 2,7 Exame 1 Exame 2 Exame 3

(22)

TIPOS DE DADOS E METODOLOGIAS DE TRATAMENTO DA INFORMAÇÃO

Exemplo 2: Analisar a distribuição da variável (fictícia) “Tempo (em minutos) demorado no trajeto entre salas de aula” 22 Curso A Curso B T e m p o ( e m m in u to s ) d e m o ra d o n o t ra je to e n tr e s a la s d e a u la

(23)

TIPOS DE DADOS E METODOLOGIAS DE TRATAMENTO DA INFORMAÇÃO

Exemplo 3: Analisar os resultados de um questionário com 3 perguntas 23 Escala dos Resultados em cada pergunta: 1 - Pouco Satisfeito 2 – Satisfeito 3 - Muito satisfeito

Indivíduo Pergunta 1 Pergunta 2 Pergunta 3

A1 1 1 3 A2 1 1 2 A3 2 2 1 A4 2 2 1 A5 2 2 1 A6 5 2 1 A7 3 2 3 A8 3 3 1 A9 3 3 1 A10 3 3 3 N 10 10 10 Minimo 1 1 1 Máximo 5 3 3 Média 2,5 2,1 1,7 Mediana 2,5 2 1 Desvio Padrão 1,1 0,7 0,9 Moda 3 2 1 % Pouco Satisfeito 20% 20% 60% % Satisfeito 30% 50% 10% % Muito Satisfeito 40% 30% 30%

(24)

TIPOS DE DADOS E METODOLOGIAS DE TRATAMENTO DA INFORMAÇÃO

24

 Os cuidados a ter com os dados com os quais

vamos trabalhar revelam-se de elevada importância, assim como o tratamento que lhe fazemos

(25)

APRESENTAÇÃO DE RESULTADOS

 Existem muitas formas de apresentar os resultados  As mais comuns: gráficos e tabelas!

 As tabelas tipicamente são mais “monótonas” do ponto

de vista do grafismo, e não permitem facilmente analisar tendências

 Os gráficos, quando bem construídos, podem ser

importantes para apresentar uma tendência, ou

evidenciar um resultado, ou simplesmente uma forma mais atrativa de apresentar resultados

 Qualquer uma destas formas pode influenciar/manipular

a interpretação dos resultados

(26)

APRESENTAÇÃO DE RESULTADOS

26

Exemplo 1: Analisar a % mulheres praticantes em cada desporto

Modalidade Total Praticantes Nº Mulheres % Mulheres

Desporto 1 15 5 33% Desporto 2 3 0 0% Desporto 3 150 120 80% Desporto 4 30 2 7% Desporto 5 50 50 100% Desporto 6 1 1 100% Tamanho bolha = Nº Mulheres Modalidade % Mulheres Desporto 1 33% Desporto 2 0% Desporto 3 80% Desporto 4 7% Desporto 5 100% Desporto 6 100%

(27)

APRESENTAÇÃO DE RESULTADOS

27

Exemplo 2: Análise Satisfação Utentes de um serviço com base em 6 perguntas, ao qual responderam 180 participantes

(28)

APRESENTAÇÃO DE RESULTADOS

28

Exemplo 3: Inquérito sobre o Algarve, com 250 respondentes

Pergunta 7 - Escolha de entre as seguintes opções as razões para fazer férias no Algarve Nº respostas

7.1 - Tempo 15 7.2 - i nfraestruturas hoteleiras 60 7.3 - Acessos 150 7.4 - Praias 250 7.5 - Hospitalidade 100

(29)

APRESENTAÇÃO DE RESULTADOS

29

(30)

APRESENTAÇÃO DE RESULTADOS

30

 A forma como apresentamos os conteúdos do

nosso trabalho influencia significativamente a mensagem a transmitir

(31)

R

ECOLHA

,

TRATAMENTO E APRESENTAÇÃO DE DADOS

:

elementos chave

Carla Patrocínio: carla.patrocinio@tecnico.ulisboa.pt

Núcleo de Estatística e Prospectiva: http://nep.tecnico.ulisboa.pt/

M

UITO

O

BRIGADA

PELA

Referências

Documentos relacionados

Considerando garantir a sustentabilidade e a eficiência operacional, em relação à gestão do processo de prestação de serviço na distribuição de água, a UGR Freguesia

Dessa forma, este clone do grupo TcII, considerado parcialmente resistente à quimioterapia com o BNZ e ITC empregados separadamente passa a ser classificado como

Resultados: a análise estatística de- monstrou que, no caso de crianças disfônicas, são registrados em prontuários, além dos dados específicos de voz: o padrão

Este artigo tem como objetivo identificar os requisitos necessários a uma plataforma multilateral que permita a indicação e encaminhamento de REEE, no final da

O SMPTE é o sinal de sincronismo como áudio, ou seja, dá para ouvir ou gravar este sinal em qualquer equipamento de áudio, e o MTC é o mesmo sinal convertido em MIDI, para usar com

A CORREGEDORIA GERAL DA JUSTIÇA determina aos Senhores Notários e Registradores do Estado de São Paulo que ao finalizarem o lançamento dos impressos de

 Por um lado essa epistemologia centra-se substancialmente no corte epistemológico necessário à nascitura de uma nova ciência (corte portanto com a falta anterior de matriz

Critérios justos de avaliação do servidor – garante ampla defesa e institui critérios justos para dispensa de servidor estável por insuficiência de desempenho.. Privatização