• Nenhum resultado encontrado

Estatística Aplicada à Informática e às suas Novas Tecnologias Volume 1

N/A
N/A
Protected

Academic year: 2021

Share "Estatística Aplicada à Informática e às suas Novas Tecnologias Volume 1"

Copied!
30
0
0

Texto

(1)Giovani Glaucio de Oliveira Costa. Estatística Aplicada à Informática e às suas Novas Tecnologias Volume 1.

(2)  

(3)             

(4)    !  # $%& '()*          

(5)         

(6)       !!" # $%&'%#()(%##*'+"    

(7)  ,  - '   "        '    .

(8) .  "  

(9)  /!'  "!0!'   1 !2   '"  3   - 46' ! '   8 

(10) 38  .  

(11) 9  . 

(12) : 8 +  

(13) ;    

(14) ;     :  :- 9,     !"    !    

(15)        . "

(16) "  

(17)      "    1"   ."          <

(18)  46'      " "   

(19)        "" '       !

(20)      

(21) -  "    1  '"=1 !<!

(22)    !    '" 461    

(23) - 46 >

(24) . "

(25) + 4 "" 2  ! !" ," !!?! !"#$%&' ! +, & - -    + %.  

(26)             ; @  ?!    ')&%A. %   !  ", ! ) ?!  "  46 B 

(27) . :C@#D*E*FEG##E&611E6F%# F &&A . )$+ +  ,-./0  1,1/2 34+5647864 #938:33487...3; <938:33487.=5. 7!$$>$+%+2  ???+$+%+24@;8-.

(28) À minha mãezinha querida, Oneida Barreto de Campos Costa; aos meus irmãos, amigos e companheiros André Luiz de Oliveira Costa e Andréa Viviane de Oliveira Costa; à minha afilhadinha e sobrinha amada, Juliana Paula Costa Lima, e à Editora Ciência Moderna, pela confiança que depositou em meu trabalho..

(29) Prefácio O professor Giovani Glaucio de Oliveira Costa é um militante na divulgação da estatística no país. A par de sua atuação docente ele tem uma produção bibliográfica que visa ampliar o acesso do público aos métodos estatísticos necessários a uma série de atividades profissionais. O conhecimento da estatística é cada vez mais demandado nos cursos superiores das mais diferentes áreas e apresentar esses conhecimentos de uma forma clara e acessível é um desafio que o autor enfrenta de forma admirável. O livro ‘Curso de Estatística Aplicada à Informática e às suas Novas Tecnologias’ tem o mérito de aproximar a estatística do público usuário das novas tecnologias de informação, utilizando uma linguagem acessível e exemplos antenados com o cotidiano do mundo virtual. Mais uma vez, Giovani Glaucio presta um serviço inestimável a todos os que necessitam utilizar métodos estatísticos em sua rotina profissional ou acadêmica, mas não possuem formação na área. Voltada especificamente para o uso no campo da informática, esta obra cumpre o papel de instrumentalizar os leitores para o uso dos métodos estatísticos, aproximando-os da linguagem e das técnicas usuais nessa área do conhecimento. Com certeza esta obra vem preencher uma lacuna importante e muito tem a contribuir com estudantes, professores e profissionais que atuam no campo da informática. Aproveitem a leitura!. José Airton Chaves Cavalcante Junior Doutor em Ciência, Tecnologia e Inovação Professor de Redes do Departamento de Tecnologias e Linguagens do Instituto Multidisciplinar da Universidade Federal Rural do Rio de Janeiro.

(30) Apresentação “Informática” é o termo usado para se descrever o conjunto das ciências da informação, estando incluídos neste grupo a ciência da computação, a teoria da informação, o processo de cálculo, a análise numérica e os métodos teóricos da representação dos conhecimentos e de modelagem dos problemas. Essa expressão tem sido usada no Brasil para se referir especificamente ao processo de tratamento da informação por meio de máquinas eletrônicas definidas como computadores. A estatística na atualidade tem contribuído de forma significativa para o processo de tomada de decisão, pois grande parte do que se faz é baseado em métodos quantitativos, sendo a estatística uma dessas áreas. Na era da informação e do conhecimento, essa utiliza a matemática para dar apoio aos profissionais da iniciativa privada, do governo e pesquisadores. O grande volume de informações produzido pelo mundo moderno precisa ser analisado de forma consistente e fidedigna. Esse suporte ocorre por meio da estatística. Onde houver incerteza, essa ferramenta pode ser usada. Assim, todas as áreas do conhecimento humano a requerem como técnica de análise de dados. A estatística é, então, a ciência que procura evidências do comportamento de variáveis associadas a populações ou universos. Trata de procurar regularidades em massas de informações, muito comuns em áreas da informática. É comum, na informática, encontrarmos populações em que podemos associar variáveis ou características que apresentam variações e seria muito interessante, senão relevante social e cientificamente, conhecer o comportamento destas variações. Por exemplo, de um conjunto de impressoras, poderemos observar altura, largura, profundidade e velocidade de impressão em preto. Poderemos também obter informações do tempo de vida de computadores digitais; do tempo de realização de uma tarefa por programas computacionais; da evolução do número de amigos de perfis de usuários do Orkut e do perfil de usuários do Facebook; do desempenho de programas computacionais na execução de tarefas, através de métricas formais, da quantidade de memória RAM em função do tempo de resposta de sistemas computacionais; das “vulnerabilidades” de segurança de sistemas.

(31) VIIIt&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. computacionais; estudo de impactos da informática na produtividade de empresas e países; entender as práticas e o contexto de trabalho em uma organização, um grupo ou em comunidades, como subsídio para especificar sistemas de informação para esta organização, grupo ou comunidade; da simulação de situações reais através de sistemas computacionais, com o uso de conhecimentos estocásticos. Nos casos em que a simples criação de um programa/sistema novo não é suficiente como pesquisa, é necessário encontrar algum “conhecimento” sobre o programa/sistema obtido de forma mais metodológica. Dito de outra forma, é preciso avaliar o programa/ sistema. Portanto, a estatística pode ser aplicada à informática em muitas situações do mundo real, com vistas a se conhecer o comportamento da variabilidade de características de populações alvos em sistemas de informação, em ciência da computação e em engenharia da computação. O livro que apresento tem o objetivo de disponibilizar em uma linguagem simples, objetiva e básica as aplicações da estatística na área da informática e suas novas tecnologias, com um texto didático e muitos exemplos práticos, incluindo o fascinante mundo da internet e suas redes sociais. As teorias e os conceitos são apresentados de forma sucintas, sem muitos formalismos ou demonstrações matemáticas, procurando focar nas aplicações na área, na realização de exercícios e na interpretação dos resultados, visando as tomadas de decisão. A obra está estruturada em três partes principais: estatística descritiva, probabilidades e inferência estatística-correlação linear-regressão linear simples. Estas três partes estão divididas em dois volumes. O volume 1 contempla a estatística descritiva, no qual o conceito de estatística, variáveis, amostragem, fases do método estatístico, séries estatísticas, números relativos, gráficos, medidas de tendência central, de posição, de dispersão, assimetria e curtose são abordados. O objetivo desta abordagem é fornecer técnicas para que o leitor possa reduzir e representar suas populações e dados estatísticos, com informações suficientes sobre as distribuições de frequências. O volume 2 versa sobre a teoria de probabilidades, noções de inferência estatística, correlação linear e regressão linear simples. A teoria das probabilidades é desenvolvida com seus conceitos básicos, axiomas, teoremas, probabilidade condicionada, teorema de Bayes, variáveis aleatórias.

(32) "QSFTFOUBÎÍPtIX. discretas, contínuas, as principais distribuições de probabilidades de variáveis aleatórias discretas e contínuas e simulação estocástica. Em noções de inferência estatística, é abordado estimação, com inclusão das técnicas de intervalos de confiança, e testes de significância de estimativas. Com a correlação linear e correlação linear simples, introduzi os conceitos de análise estatística de mais de uma variável simultaneamente, focando na análise da correlação e da modelagem funcional de variáveis quantitativas contínua em espaços bidimensionais. A conclusão desta abordagem embasará o leitor para modelagem de situações de incertezas, nomeadamente a inferência estatística, com técnicas de intervalo de confiança, testes de significância, correlação linear e regressão linear simples, o que permitirá ao analista e leitor sair do terreno puramente descritivo, ao efetuar suas pesquisas quantitativas. No final do volume 1 , apresento anexos com textos auxiliares e as tabelas estatísticas pertinentes ao curso e que serão utilizados também no volume 2. O livro pode ser usado em cursos de graduação em sistema de informação, ciência da computação e engenharia da computação, bem em cursos de graduação de matemática, estatística, engenharias e economia. Na pósgraduação, como mestrado e doutorado, pode ser livro texto em disciplinas de matemática aplicada ou estatística aplicada da formação de pesquisadores na área de informática. Aproveito a oportunidade para manifestar meus sinceros agradecimentos ao Professor José Airton Chaves Cavalcante Júnior, Doutor em Ciência, Tecnologia e Inovação e docente da Universidade Federal Rural do Rio de Janeiro, pelas preciosas revisões do texto da obra referente ao uso correto dos conceitos e termos da informática nas aplicações da estatística. Muito embora a revisão de um livro seja feita por muitas pessoas, alguns erros podem passar despercebidos, assim não se furtem em apontar erros e as avaliações críticas e sugestões dos leitores são muito bem vindas para o refino desta obra. Será muito gratificante para mim se meu livro tiver sido de alguma forma útil para o leitor, nem que tenha sido em somente um parágrafo e/ou uma página. Entretanto, espero de verdade que ele seja relevante em todo o seu conteúdo. Obrigado a todos e boa leitura. O Autor giovaniglaucio@ufrrj.br giovaniglaucio@hotmail.com.

(33) Sumário Capítulo 1 Conceitos Básicos de Estatística ............................ 1 Fenômeno ................................................................................... 1 Ciência ........................................................................................ 1 Ciência Estatística ........................................................................ 2 População .................................................................................... 2 Amostra....................................................................................... 3 Levantamentos Estatísticos............................................................ 4 Censo.......................................................................................... 4 Amostragem ................................................................................ 5 Razões para o Uso da Amostragem: .............................................. 5 Divisão da Estatística .................................................................... 6 Estatística Descritiva..................................................................... 6 Estatística Inferencial .................................................................... 6 Esquema Lógico de um Estudo Estatístico ..................................... 8 Atividades Propostas ...................................................................10. Capítulo 2 Variáveis e Classificações .....................................19 Variáveis .....................................................................................19 Variáveis Qualitativas ..................................................................20 Variável Qualitativa Nominal.......................................................21 Variável Qualitativa Ordinal ........................................................21 Variável Quantitativa ...................................................................22 Variável Quantitativa Discreta......................................................22 Variável Quantitativa Contínua ....................................................23 Atividades Propostas ...................................................................25. Capítulo 3 Noções de Amostragem ..................................... 39 Amostragem ...............................................................................39 Amostragens Probabilísticas .........................................................39 Tipos de Amostragens Probabilísticas ..........................................40.

(34) XIIt&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Amostragem Aleatória Simples ....................................................40 Amostragem Sistemática..............................................................42 Amostragem Estratificada ............................................................43 Amostragem por Conglomerados ................................................47 Amostragens Não Probabilísticas .................................................49 Tipos de Amostragens Não Probabilísticas....................................49 Tamanho de Amostras.................................................................51 Classificação da População ...........................................................51 Tamanho da Amostra para Populações Infinitas ...........................52 Cálculo Simplificado do Tamanho da Amostra .............................58 Tamanho de Amostra na Amostragem Aleatória Estratificada ........60 Amostragem por Quotas versus Amostragem Aleatória Estratificada ................................................................................69 Atividades Propostas ...................................................................70. Capítulo 4 Fases do Método Estatístico - Do Planejamento à Coleta de Dados ................................................ 83 Método ......................................................................................83 Método Estatístico ......................................................................83 Planejamento ..............................................................................84 Problema da Pesquisa ..................................................................84 Definição da Necessidade da Pesquisa com Trabalho de Campo ....86 Definição do Público-Alvo e das Variáveis da Pesquisa ..................87 Identificação do Esquema de Amostragem....................................87 Decidir o Método de Coleta de Dados .........................................88 Definição do Suporte Tecnológico da Pesquisa .............................88 Seleção e Treinamento dos Entrevistadores ..................................94 Projeto de Pesquisa......................................................................94 Proposta de Trabalho de Graduação em Ciência da Computação...95 Coleta de Dados (Trabalho de Campo) ........................................97 Fontes de Dados..........................................................................98 Pesquisado ..................................................................................98 Fontes que tenham Informações do Pesquisado ............................98 Situações Similares ......................................................................99 Dados Disponíveis ......................................................................99.

(35) 4VNÈSJPtXIII. Tipos de Dados .........................................................................100 Dados Primários ......................................................................100 Dados Secundários ....................................................................100 Sequência na Procura de Dados em Pesquisas em Informática ..... 101 Etapas para Definição dos Dados e das Fontes de Dados no Processo de Pesquisa em Informática ..........................................102 Atividades Propostas .................................................................104. Capítulo 5 Fases do Método Estatístico - Crítica de Dados à Comunicação dos Resultados ............................ 109 Crítica de Dados .......................................................................109 Apuração de Dados ...................................................................109 Análise de Dados ...................................................................... 110 Emissão de Relatório Final ........................................................ 111 Comunicação dos Resultados .................................................... 111 Método Estatístico em Ciência da Computação .......................... 112 Atividades Propostas .................................................................133. Capítulo 6 Séries Estatísticas ............................................. 147 Séries Estatísticas ....................................................................... 147 Tipos de Séries Estatísticas ......................................................... 147 Séries Temporais ....................................................................... 148 Séries Geográficas ..................................................................... 149 Séries Especificativas ................................................................. 149 Séries Mistas .............................................................................150 Distribuições de Frequência....................................................... 151 Atividades Propostas .................................................................159.

(36) XIVt&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Capítulo 7 Gráficos de Reclame ......................................... 171 Gráfico ..................................................................................... 171 Requisitos Fundamentais de um Gráfico .................................... 171 Finalidades dos Gráficos ............................................................ 171 Tipos de Gráficos ...................................................................... 172 Gráficos de Reclame ................................................................. 172 Tipos de Gráficos de Reclame ................................................... 172 Construção de Gráficos de Reclame .......................................... 172 Gráfico Linear........................................................................... 172 Gráficos de Colunas .................................................................. 173 Gráficos de Barras ..................................................................... 174 Atividades Propostas ................................................................. 181. Capítulo 8 Gráficos de Análise ........................................... 213 Gráficos de Análise ...................................................................213 Tipos de Gráficos de Análise...................................................... 214 Histograma ............................................................................... 214 Polígono de Frequência .............................................................215 Histograma com Polígono de Frequência Sobreposto.................. 217 Atividades Propostas .................................................................221. Capítulo 9 Números Relativos ...........................................233 Dados Absolutos .......................................................................233 Dados Relativos ........................................................................233 1) Coeficientes ..........................................................................234 2) Taxas ....................................................................................234 3) Percentagens .........................................................................234 4) Índices ..................................................................................237 5) Números-Índices .................................................................237 Atividades Propostas .................................................................240.

(37) 4VNÈSJPtXV. Capítulo 10 Medidas de Tendência Central ...........................253 Medidas de Tendência Central...................................................253 Média Aritmética ( x ) ...............................................................253 Mediana (Me)...........................................................................257 Moda (Mo) ...............................................................................263 Uso das Medidas de Tendência Central ......................................265 Atividades Propostas .................................................................266. Capítulo 11 Medidas de Posição .......................................... 277 Medidas de Posição ou Sepatrizes ..............................................277 Quartis (Qi) .............................................................................277 Percentis (Pi) ............................................................................283 Atividades Propostas .................................................................286. Capítulo 12 Medidas de Dispersão .......................................297 Medidas de Dispersão................................................................297 Amplitude Total (R) .................................................................297 Vantagens e Desvantagens da Amplitude Total ...........................299 Variância (S2) ............................................................................299 Variância para Dados Agrupados em Distribuições de Frequências Simples: .................................................................301 Variância para Dados Agrupados em Distribuições de Frequências por Classes ................................................................................302 Desvio Padrão (S)......................................................................304 Coeficiente de Variação (CV) ou Desvio Padrão Relativo ...........305 Atividades Propostas ................................................................. 313.

(38) XVIt&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Capítulo 13 Medidas da Forma de uma Distribuição Assimetria ...................................................... 327 Medidas da Forma de uma Distribuição .....................................327 Curva Normal ..........................................................................327 Assimetria ou Distorção (As): ....................................................328 Tipos de Assimetria...................................................................328 Assimetria Positiva ..................................................................328 Assimetria Negativa ..................................................................329 Curva Simétrica ou Normal ......................................................329 Coeficientes de Assimetria de Pearson .......................................332 Atividades Propostas .................................................................335. Capítulo 14 Medidas da Forma de uma Distribuição - Curtose 347 Curtose (K) ..............................................................................347 Coeficiente de Curtose (K)........................................................349 Diferenças entre Curva Normal Original e Curva Normal Padrão ......................................................................................352 Descrição de Dados Estatísticos: ................................................354 Atividades Propostas .................................................................355. Bibliografia ........................................................ 381 Anexos ..............................................................385.

(39) Capítulo 1. Conceitos Básicos de Estatística. Fenômeno É tudo que pode ser percebido pelos sentidos ou pela consciência, ou seja, é a definição de qualquer acontecimento observável. Exemplos: Uma fruta que cai de uma árvore; uma pessoa que nasce; a incidência de uma doença; o comportamento das pessoas em uma loja de informática virtual; o consumo de certo produto; o lucro de uma empresa; a duração da vida útil de computadores ; o tempo de realização de uma tarefa por um programa computacional; o aumento do número de amigos de um perfil de usuário do Facebook; a eficácia de programas computacionais na execução de uma tarefa através de reclamações no SAC de uma empresa; a quantidade de memória RAM em função do tempo de resposta do sistema;as capacidades dos HDs de desktops, netbooks e notebooks;o desempenho do processador do PC (cálculo por segundo),da memória RAM do PC (operações por segundo), dos elementos gráficos do PC (desempenho da área de trabalho para Windows) e do disco rígido do PC (taxa de transferência de dados de disco).. Ciência É o conjunto orgânico de conhecimentos sobre os fenômenos e suas relações recíprocas. É o processo racional usado pelo homem para se relacionar com a natureza e, assim, obter resultados úteis..

(40) 2t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Ciência Estatística A Estatística é uma ciência que estuda um determinado tipo de fenômeno: os fenômenos coletivos ou de massa. Fenômeno Coletivo ou de Massa Não possuem regularidade na observação de casos isolados, mas na massa de observações, ou seja, são aqueles que não podem ser definidos por uma simples observação, e sim por um conjunto de observações. Exemplo: Em geral, quando estudamos as características de um conjunto de elementos, estamos diante de um fenômeno coletivo ou de massa: as notas em matemática dos alunos de uma turma; o nível socioeconômico dos consumidores de um produto; a renda dos brasileiros; o lucro de empresas cariocas; o gênero dos torcedores de um clube de futebol; a oferta de notebooks por parte de lojas de departamentos; o nível da demanda de empréstimos consignados por servidores públicos; o sistema operacional de um conjunto de computadores; a velocidade de um conjunto de impressoras jatos de tinta colocadas à venda em um site; a largura, velocidade e profundidade de um conjunto de computadores colocado à venda em uma loja de departamento.. População Todo estudo estatístico consiste em associar uma ou mais características a um conjunto de elementos e observar seu comportamento em um espaço de análise. Este conjunto chama-se população. Portanto, população é o conjunto de elementos portadores de pelo menos uma característica comum de interesse para ser estudado pela ciência Estatística. Exemplos: t Em um estudo sobre tempo de execução de uma tarefa por diversos programas computacionais, a população é o conjunto dos programas computacionais tomados para a análise;.

(41) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt3. t Em um estudo sobre a capacidade de detectarem falhas de segurança por um conjunto de hackers, o conjunto de hackers é a população alvo do estudo; t Em um estudo sobre o tipo de antivírus (gratuitos ou gratuitos para teste) dentre um conjunto disponível na internet, a população é o conjunto de antivírus observados. t Em um estudo sobre o conteúdo dos e-mails de sua caixa-postal, o conjunto de e-mails de sua caixa postal é a população estatística.. Amostra É um subconjunto qualquer da população, selecionada para representá-la. Para que as conclusões sobre a população sejam fornecidas adequadamente pela amostra, é necessário que ela seja uma amostra representativa da população. Amostras representativas são aquelas que são verdadeiras miniaturas da população, isto é, têm todas as características da população, mas em menores proporções. Para obtermos amostras representativas existem várias tecnologias, mas as mais eficazes são aquelas em que os elementos que vão compor a amostra são selecionados por sorteio, de forma casual, aleatoriamente. Exemplos: t Em um estudo sobre tempo de execução de uma tarefa por diversos programas computacionais, a amostra será formada por uma parte representativa do conjunto dos programas computacionais tomados para análise; t Em um estudo sobre a capacidade de detectarem falhas de segurança por um conjunto de hackers, a amostra será formada por uma parte representativa do conjunto de hackers; t Em um estudo sobre o tipo de antivírus (gratuitos ou gratuitos para teste) dentre um conjunto disponível na internet, a amostra será formada por uma parte representativa do conjunto de antivírus observados; t Em um estudo sobre o conteúdo dos e-mails de sua caixa-postal, a.

(42) 4t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. amostra será formada por uma parte representativa do conjunto de e-mails de sua caixa postal; t Em um estudo sobre comportamento de compra de clientes de um site de produtos de informática, a amostra será formada por parte dos clientes deste site.. Levantamentos Estatísticos A Estatística possui dois tipos de levantamentos: Censo Amostragem. Censo É o estudo de uma população com base em todos os seus elementos. Caracteriza-se quando a amostra é igual à população. Exemplos: t Em um estudo sobre tempo de execução de uma tarefa por diversos programas computacionais, observando todos os programas computacionais tomados para a análise temos um censo; t Em um estudo sobre a capacidade de detectarem falhas de segurança por um conjunto de hackers, coletando a informação de todos os hackers temos um censo; t Em um estudo sobre o tipo de antivírus (gratuitos ou gratuitos para teste) dentre todos os disponíveis na internet temos um censo; t Em um estudo sobre “conteúdo” com todos os e-mails de sua caixa postal temos um censo. Observação: No Brasil, o Instituto Brasileiro de Geografia e Estatística (IBGE) realiza, de dez em dez anos, o traço do perfil demográfico e socioeconômico da população brasileira. Este estudo é um levantamento censitário porque.

(43) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt5. envolve todos os domicílios brasileiros. O objetivo principal do levantamento é renovar os dados estatísticos populacionais no intuito de orientar políticas e ações públicas com informações atualizadas sobre os habitantes.. Amostragem É o estudo de uma população com base em uma parte representativa da mesma, isto é, com base em uma amostra. Exemplos: t Em um estudo sobre o tempo de execução de uma tarefa por diversos programas computacionais, observando uma parte de todos os programas computacionais tomados para a análise temos uma amostragem; t Em um estudo sobre a capacidade de detectarem falhas de segurança por um conjunto de hackers, coletando a informação de uma parte de todos os hackers, temos uma amostragem; t Em um estudo sobre o tipo de antivírus (gratuitos ou gratuitos para teste) de uma amostra de todos os disponíveis na internet temos uma amostragem; t Em um estudo sobre “conteúdo” com uma parte dos e-mails de sua caixa postal temos uma amostragem.. Razões para o Uso da Amostragem: t Custo excessivo do processo de recolha e tratamento dos dados como resultado da grande dimensão da população ou da complexidade do processo de caracterização de todos os elementos da mesma; t Tempo excessivo para se obter os resultados da pesquisa; t A população é infinita, ou considerada como tal, não podendo, portanto, ser analisada na íntegra; t As populações são dinâmicas, logo, seus elementos ou objetos estão em constante renovação, de onde resulta a impossibilidade de analisar todos estes;.

(44) 6t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. t Recolha de informação através de processos destrutivos que, se aplicada exaustivamente, conduziria à completa destruição da população; t Inacessibilidade a alguns elementos da população, por diversas causas.. Divisão da Estatística A Estatística se divide em dois ramos: t Estatística Descritiva; t Estatística Inferencial.. Estatística Descritiva É a parte da Estatística que tem o objetivo de descrever os dados observados.Compreende as seguintes etapas: 1. Obtenção dos dados; 2. Redução dos dados; 3. Representação dos dados. São atributos da Estatística Descritiva a obtenção de informações como médias, proporções, dispersões, tendências, índices, taxas, que resumem e representam os fenômenos observados. Isto encerra as atribuições da Estatística Descritiva. No caso do estudo estatístico com amostras, a Estatística estabelece técnicas para se afirmar se a estimativa obtida junto à amostra é de qualidade. Este é o objetivo da Estatística Inferencial.. Estatística Inferencial É a parte da Estatística que tem o objetivo de estabelecer técnicas para avaliar se a estimativa obtida junto à amostra é de qualidade, isto é, se está próxima ao valor do parâmetro populacional. Portanto, é o método de tomar o parâmetro populacional pela estimativa, desde que ela seja de boa qualidade, ou seja, significante..

(45) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt7. A estatística Inferencial tem o objetivo de estabelecer níveis de confiança para a tomada de decisão de associar uma estimativa amostral a um parâmetro populacional de interesse. Exemplo 1: Suponha que tivéssemos interesse no tempo médio de downloads de uma população de 1.000 jogos computacionais. Para investigar o seu valor, optou-se pelo estudo por amostragem e, na amostra colhida, verificou-se uma estimativa de 40 segundos para o tempo médio de download dos jogos. Exemplo 2: Suponhamos que tivéssemos interesse em estimar a porcentagem de dias com falta de sinal do serviço de TV a Cabo de uma operadora através de uma amostra aleatória de 40 dias. Nos Exemplos 1 e 2, a inferência estatística estabelece técnicas para decidir se estas estatísticas são de boa qualidade, isto é, significante.. Esquema Síntese de um Estudo Estatístico. População. Estatística Descritiva. Amostra. Inferência Estatística.

(46) 8t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Nesta figura, temos uma população da qual é retirada uma amostra. Vê-se a Estatística Descritiva sendo aplicada para descrever e resumir o que ocorre na população ou na amostra. Quando a Estatística resume populações, ela faz Amostragem. Quando resume características, faz Estatística Descritiva e quando a(s) descritiva(s) está(ão) em um contexto de amostragem, é(são) gerada(s) estimativa(s). Esta(s) estimativa(s) deve(em) ser avaliada(s) quanto à sua qualidade de estimação, onde são feitos os Testes de Significância. Portanto, a Amostragem resume Populações e a Estatística Descritiva resume características, gerando quase sempre estimativas. O esquema a seguir mostra uma visão global das etapas envolvidas em um estudo estatístico:. Esquema Lógico de um Estudo Estatístico. POPULAÇÃO. ESTATÍSTICAS DESCRITIVAS: PARÂMETROS. AMOSTRA ALEATÓRIA. CÁLCULOS DE ESTIMATIVAS DE PARÂMETROS. CÁLCULO DAS PROBABILIDADES. ESTATÍSTICA INFERENCIAL: TESTES DE SIGNIFICÂNCIA. TOMADAS DE DECISÃO.

(47) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt9. Este esquema mostra que o estudo estatístico se inicia na população, passa pelas etapas de amostragem, geração de estimativas, testes de significância e é finalizado na tomada de decisão, a qual foi devidamente embasada pela metodologia estatística envolvida no processo, fato que irá assegurar maior credibilidade em um contexto de incertezas. Texto para Leitura “Teste de Preconceito nas Redes Sociais” O preconceito está muito mais presente em nosso cotidiano do que imaginamos”. O simples ato de aceitar ou recusar um convite de amizade nas redes sociais já pode dizer muita coisa sobre isso, como demonstrou o teste realizado pelo Museu Memória e Tolerância, uma instituição mexicana que tem o objetivo de ensinar a tolerância por meio da memória histórica. A instituição criou quatro perfis no Facebook. Camila Peralta, Britani Cadena, Alonso Piccard e Brayan Carlo Rublo. As duas mulheres eram representadas pela mesma modelo e os dois homens pelo mesmo rapaz. A diferença é que as fotos de Britani Cadena e Brayan Carlo Rublo foram digitalmente modificadas para que eles tivessem um tom de pele mais escuro. Fora isso, as características dos perfis eram exatamente iguais. As duas mulheres faziam um pedido de amizade para a mesma pessoa ao mesmo tempo. O mesmo acontecia com os homens. O resultado foi que Camila Peralta foi 100% de vezes mais aceita do que Britani e recebeu seis vezes mais comentários. No caso dos rapazes, a diferença foi ainda maior. Alonso obteve 300% de aceitação a mais do que Brayan. Além disso, o perfil de Brayan foi denunciado quatro vezes e o de Alonso apenas uma. Na última denúncia, a rede social apagou o perfil do rapaz. Características do Estudo: População: pessoas que tem perfil no Facebook Características Investigadas: aceitar ou não Camila Peralta, aceitar ou não Britani Cadena, aceitar ou não Alonso Piccard e aceitar ou não Brayan Carlo Rublo..

(48) 10t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Resultados Estatísticos do Estudo (Análise de Dados): O resultado foi que Camila Peralta foi 100% de vezes mais aceita do que Britani e recebeu seis vezes mais comentários. No caso dos rapazes, a diferença foi ainda maior. Alonso obteve 300% de aceitação a mais do que Brayan.. Atividades Propostas 1) Responda às questões abaixo: a) O que é Ciência? É o conjunto orgânico de conhecimentos sobre os fenômenos e suas relações recíprocas. b) O que é Estatística? É um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos ou de massa. c) O que você entende por população e amostra? População é o conjunto de elementos que contém pelo menos uma característica comum de interesse para ser estudado estatisticamente. E amostra é um subconjunto da população selecionado adequadamente para representá-la. d) Qual o objetivo da Estatística Descritiva? É a parte da Estatística que tem o objetivo de descrever os dados observados, isto é, obtenção dos dados; redução dos dados e representação dos dados. e) Qual o objetivo da Estatística Inferencial? Dê exemplos práticos. É a parte da Estatística que tem o objetivo de estabelecer técnicas de como tomar o parâmetro populacional por uma estimativa amostral, desde que esta seja significante. Suponha que baixássemos 50 softwares antivírus na internet e obtivéssemos a porcentagem destes pacotes gratuitos. É a função da Estatística Inferencial realizar testes para verificar a significância desta estimativa, isto é, apurar se esta estatística é uma boa estimativa do parâmetro populacional alvo..

(49) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt11. f) O que você entende por censo? É o estudo de uma população com base em todos os seus elementos. g) O que você entende por amostragem? É o estudo de uma população com base em uma parte representativa da mesma, isto é, com base em uma amostra. h) Para que as conclusões sejam válidas, como devem ser as amostras? Devem ser representativas da população. i) Para que as amostras sejam representativas da população em estudo, como devem ser extraídos os seus elementos? Os elementos devem ser extraídos aleatoriamente. j) Explique o esquema lógico de um estudo estatístico. De uma população é fixado um parâmetro de interesse para se obter informação. Por motivos operacionais de tempo e custo, o estudo descritivo do parâmetro é realizado com base em uma amostra aleatória, onde o que se obtém é uma estimativa do parâmetro. Com base no cálculo das probabilidades, pode-se realizar inferência estatística para o parâmetro, através da construção de intervalos de confiança e de testes de significância. 2) Obtenha a sequência correta para os passos realizados na execução de um estudo estatístico: ( ( ( ( ( ( (. ) Modelagem Probabilística das Estimativas ) Indicação de Parâmetros de Interesses ) Cálculo de Estimativas dos Parâmetros ) Definição da População Alvo ) Tomadas de Decisão ) Seleção de Amostras Aleatórias ) Testes de Significância de Estimativas.

(50) 12t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Solução: ( 5 ) Modelagem Probabilística das Estimativas ( 2 ) Indicação de Parâmetros de Interesses ( 4 ) Cálculo de Estimativas dos Parâmetros ( 1 ) Definição da População Alvo ( 7 ) Tomadas de Decisão ( 3 ) Seleção de Amostras Aleatórias ( 6 ) Testes de Significância de Estimativas 3) Uma pesquisa feita há dois anos pelo Departamento de Psicologia da Universidade de York, em Toronto, no Canadá, mostrou que internautas narcisistas com baixa auto-estima e necessidades de aceitação tendem a ser mais ativos nas redes sociais. Por que este estudo pode ser uma pesquisa estatística? Podemos dizer que se trata de um estudo estatístico porque a pesquisa envolve uma população alvo, usuários de internet e observa características desta população que revelam traços narcisistas e comportamento nesta rede. 4) Leia o texto abaixo: ”Uso Prolongado de Tablet para Criança pode Prejudicar Aprendizado” Apresentados como uma revolução para a educação, os tablets estão cada vez mais presentes no cotidiano das crianças. Porém, especialistas recomendam uso moderado para evitar problemas de conduta ou aprendizagem. O Brasil está investindo na instalação de fábricas de telas sensíveis ao toque. O investimento deve passar os US$ 4 bilhões. Segundo dados coletados no final de 2011 por uma agência de marketing para crianças com 2.200 pais e crianças nos Estados Unidos e Reino Unido, 15% dos menores entre três e oito anos utilizam o iPad de seus pais e 9% possuem o seu próprio; 20% deles têm o iPod Touch. “É uma questão que surgiu nos últimos dois anos. Eles não conseguem.

(51) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt13. tirá-los das mãos”, exclamou Warren Buckleitner, editor da publicação mensal na internet “Children’s Technology Review”, ao falar dos tablets e de sua atração para as crianças, num debate sobre o tema organizado nesta semana nos Estados Unidos. O mesmo estudo indica que 77% dos pais ouvidos acreditam que a experiência dos filhos com o tablet os ajudam a aprender a resolver problemas, além de contribuir para desenvolver um pensamento criativo. No entanto, a utilização desse tipo de artefato pelos pequenos desperta, ao mesmo tempo, temores de problemas como o autismo, o  transtorno por déficit de atenção com hiperatividade (TDAH) ou a falta de concentração. “Definitivamente trata-se de equilíbrio. É preciso ser muito cuidadoso porque se pode provocar muita histeria”, informou Rosemarie Truglio, vice-presidente e pesquisadora da Sesame Workshop, uma organização americana que cria programas de televisão para crianças. Para Lisa Guernsey, diretora da Iniciativa de Educação Prematura da New America Foundation, é necessário “diferenciar causa e associação” na hora de falar do aparecimento de problemas de conduta ou aprendizagem e pôr a “culpa” nos artefatos eletrônicos. Guernsey, autora de um livro sobre a influência das novas tecnologias nas crianças, destacou a necessidade de “estabelecer parâmetros” e tentar educar as crianças para que se autorregulem frente à avalanche de informações que aparecem ante seus olhos. Nesse sentido, lembrou o chamado “vídeo déficit”, segundo o qual a aprendizagem através de uma tela produz resultados inferiores ao “cara a cara” com outra pessoa e pôs em destaque a importância da comunicação com a criança. Annie Murphy Paul, autora do livro sobre a ciência da aprendizagem que será publicado em breve, afirmou que “o pânico não é bom” na hora de pensar em tablets eletrônicos e crianças, embora também advirta que ainda falta comprovar “o valor” desses artefatos para os menores. “O cérebro está mudando todo o tempo, cada vez que aprendemos algo novo”, relativizou Annie que, além de ser especialista, é mãe e afirma que controla estritamente o tempo que seus filhos passam com estes artefatos..

(52) 14t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Responda as perguntas abaixo: a) Qual o objetivo da pesquisa? b) Qual a população alvo? c) Qual o tipo de levantamento que foi utilizado na pesquisa? d) Quem é a amostra da pesquisa? e) Cite resultados descritivos da pesquisa. f) O estudo indica que 77% dos pais ouvidos acreditam que a experiência dos filhos com o tablet os ajudam a aprender a resolver problemas, além de contribuir para desenvolver um pensamento criativo. A proporção referida neste resultado é o parâmetro populacional ou uma estimativa possível deste? g) A Inferência Estatística poderia ser usada junto aos resultados da pesquisa? Por quê? Com que finalidade? Solução: a) Saber se o uso prolongado de tablet para criança pode prejudicar o seu aprendizado. b) Pais e crianças nos Estados Unidos e Reino Unido. c) Levantamento por amostragem. d) A amostra da pesquisa é composta por 2.200 pais e crianças nos Estados Unidos e Reino Unido. e) t Segundo dados coletados no final de 2011 por uma agência de marketing para crianças, 15% dos menores entre três e oito anos utilizam o iPad de seus pais e 9% possuem o seu próprio; 20% deles têm o iPod Touch. t O mesmo estudo indica que 77% dos pais ouvidos acreditam que a experiência dos filhos com o tablet os ajudam a aprender a resolver problemas, além de contribuir para desenvolver um pensamento criativo..

(53) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt15. f) É uma estimativa possível da verdadeira proporção populacional ou parâmetro. g) Sim, porque foi um estudo por amostragem. Para concluir sobre a significância dos resultados de estimativas. Se não está sujeita a um erro de amostragem muito grande. 5) O uso de recursos e aplicações de reconhecida capacidade estatística, e de fácil utilização, é determinante na gestão eficaz do processo de análise. O utilizador deverá recorrer a diferentes tipos de dados, com a flexibilidade de selecionar o conjunto de análises estatísticas mais adequadas às suas necessidades analíticas. Associe as colunas que implicam em uma eficiente gestão do sistema de informação estatística: (1) Análise descritiva e inferencial (2) Preparação e validação de dados (3) Apresentação e disponibilização dos resultados (4) Acesso e análise de conjuntos de dados (5) Criação de gráficos ( ) É fundamental coletar, gerir e analisar fácil e rapidamente qualquer tipo de dados, independentemente da sua origem. ( ) Antes de serem efetivamente analisados, os dados deverão ser preparados e considerados fidedignos. O acesso a diferentes técnicas (dicionário de dados, identificação de casos duplicados, transformação de variáveis, entre outras) garante dados com qualidade superior. ( ) O analista deverá ter acesso a uma ampla oferta de procedimentos estatísticos (tabelas de frequências, análise fatorial, estatísticas descritivas) que sejam facilmente exportáveis para outras aplicações. ( ) Técnicas estatísticas em formas geométricas fornecem uma leitura mais visual e direta dos dados, por isso é importante que a sua obtenção seja simplificada, independentemente da complexidade da informação (histogramas, pirâmides populacionais, diagramas de dispersão). ( ) O produto de qualquer análise deverá ser apresentado de forma perceptível, garantindo que o destinatário possa rapidamente compreender e atuar com base nessa informação..

(54) 16t&TUBUÓTUJDB"QMJDBEBË*OGPSNÈUJDBFËTTVBT/PWBT5FDOPMPHJBT. Solução: (4) É fundamental coletar, gerir e analisar fácil e rapidamente qualquer tipo de dados, independentemente da sua origem. (2) Antes de serem efetivamente analisados, os dados deverão ser preparados e considerados fidedignos. O acesso a diferentes técnicas (dicionário de dados, identificação de casos duplicados, transformação de variáveis, entre outras) garante dados com qualidade superior. (1) O analista deverá ter acesso a uma ampla oferta de procedimentos estatísticos (tabelas de frequências, análise fatorial, estatísticas descritivas) que sejam facilmente exportáveis para outras aplicações. (5) Técnicas estatísticas em formas geométricas fornecem uma leitura mais visual e direta dos dados, por isso é importante que a sua obtenção seja simplificada, independentemente da complexidade da informação(histogramas, pirâmides populacionais, diagramas de dispersão). (3) O produto de qualquer análise deverá ser apresentado de forma perceptível, garantindo que o destinatário possa rapidamente compreender e atuar com base nessa informação. 6) Classifique cada um dos exemplos abaixo como sendo casos de Censo ou Levantamento por amostragem: a) Um lote de 100 desktops considera-se em bom estado para venda se, ao serem testados 10 deles, não apresentarem qualquer defeito. b) Uma pesquisa de opinião revelou que 65% da população brasileira apoiava um determinado candidato para Presidente da República. Se esse candidato se apresentar às eleições, é de esperar que ele ganhe. c) Os 120 empregados de um fábrica ganham, em média, 400 reais por mês. d) Baseado em uma amostra de 500 trabalhadores de uma empresa de construção civil, acredita-se que a média dos salários dos trabalhadores desse ramo é de 400 reais. e) De 5.000 peças fabricadas em um dia por uma indústria verificou-se que 4% apresentavam defeitos..

(55) Capítulo 1$PODFJUPT#ÈTJDPTEF&TUBUÓTUJDBt17. Solução: a) Amostragem b)Amostragem c) Censo d) Amostragem e)Censo 7) Numere a segunda coluna, de acordo com a primeira, e registre a opção correta: 1) Estudo de números associados a fenômenos. 2) Parte da população observada. 3) Denominação dada a atributos ou a quantidades que variam quanto à grandeza. 4) Grupo de indivíduos ou coisas cujas características são estudadas em forma de um todo, não interessando um elemento em particular. 5) Cada valor observado de uma variável. ( ( ( ( (. ) Amostra ) Estatística ) População ) Variável ) Dado. Solução: (2) Amostra (1) Estatística (4) População (3) Variável (5) Dado.

(56)

Referências

Documentos relacionados

Here, we aim to understand how expression of RA degradation enzymes (Cyp26) can be correlated with RA distribution and functions during amphioxus (B. lanceolatum)

Quando o prêmio sorteado, ganho em concurso ou conferido mediante vale-brinde, não for reclamado no prazo de cento e oitenta (180) dias, contados, respectivamente, da data do

O Conselho Federal de Psicologia (CFP) apresenta à categoria e à sociedade em geral o documento de Referências Técnicas para a Prática de Psicólogas(os) em Programas de atenção

A partir de um levantamento de programas computacionais em fonoaudiologia e de das opiniões de fonoaudiólogos sobre a utilização de aplicativos computacionais nas

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

Dissertação (Mestrado em Psicologia) – Universidade de Brasília, 2007. A organização como fenômeno psicossocial: notas para uma redefinição da psicologia organizacional e

Por último, temos o vídeo que está sendo exibido dentro do celular, que é segurado e comentado por alguém, e compartilhado e comentado no perfil de BolsoWoman no Twitter. No

Ribeiro, M., Morgado, P., Miguel, S., Coutinho, P.and Correia, I.; Dextran based- hydrogel containing chitosan microparticles loaded with growth factors to be used in