• Nenhum resultado encontrado

2009 LIMA Estatística Aplicada

N/A
N/A
Protected

Academic year: 2021

Share "2009 LIMA Estatística Aplicada"

Copied!
85
0
0

Texto

(1)

MINISTÉRIO DA EDUCAÇÃO Universidade Aberta do Brasil

Instituto Federal de Educação, Ciência e Tecnologia do Ceará Diretoria de Educação a Distância

Fortaleza, CE 2009

Tecnologia em Hotelaria Estatística Aplicada

(2)

Créditos

Presidente

Luis Inácio Lula da Silva

Ministro da Educação

Fernando Haddad

Secretário da SEED

Carlos Eduardo Bielschowsky

Diretor de Educação a Distância

Celso Costa

Reitor do IFCE

Cláudio Ricardo Gomes de Lima

Pró-Reitor de Ensino

Gilmar Lopes Ribeiro

Diretora de EAD/IFCE e Coordenadora UAB/IFCE

Cassandra Ribeiro Joye

Vice-Coordenadora UAB

Régia Talina Silva Araujo

Coordenador do Curso de Tecnologia em Hotelaria

José Solon Sales e Silva

Coordenador do Curso de Licenciatura em Matemática

Zelalber Gondim Guimarães

Elaboração do conteúdo

Luciana de Lima

Colaborador

Regina Santos Young

Equipe Pedagógica e Design Instrucional

Ana Claúdia Uchôa Araújo Andrea Maria Rocha Rodrigues Cristiane Borges Braga

Eliana Moreira de Oliveira

Gina Maria Porto de Aguiar Vieira Jane Fontes Guedes

Jivago Silva Araújo

Lívia Maria de Lima Santiago Luciana Andrade Rodrigues Maria Vanda Silvino da Silva Marília Maia Moreira

Regina Santos Young

Equipe Arte, Criação e Produção Visual

Benghson da Silveira Dantas

Davi Jucimon Monteiro Diemano Bruno Lima Nóbrega Germano José Barros Pinheiro Hommel Almeida de Barros Lima José Albério Beserra

José Stelio Sampaio Bastos Neto Larissa Miranda Cunha

Marco Augusto M. Oliveira Júnior

Navar de Medeiros Mendonça e Nascimento Roland Gabriel Nogueira Molina

Equipe Web

Aline Mariana Bispo de Lima Benghson da Silveira Dantas Fabrice Marc Joye

Igor Flávio Simões de Sousa Luiz Alfredo Pereira Lima Lucas do Amaral Saboya Marcos do Nascimento Portela Ricardo Werlang

Samantha Onofre Lóssio Tibério Bezerra Soares Thuan Saraiva Nabuco

Revisão de Conteúdo

Narcelio Araújo Pereira

Revisão Textual

Aurea Suely Zavam

Nukácia Meyre Araujo de Almeida

Revisão Web

Débora Liberato Arruda Hissa Saulo Garcia

Logística

Francisco Roberto Dias de Aguiar Virgínia Ferreira Moreira

Secretários

Breno Giovanni Silva Araújo Francisca Venâncio da Silva

Auxiliar

Bernardo Matias de Carvalho Carla Anaíle Moreira de Oliveira Maria Tatiana Gomes da Silva Wagner Souto Fernandes Zuila Sâmea Vieira de Araújo

(3)

Lima, Luciana de

Estatística aplicada: semestre II/ Luciana de Lima; Coordenação Cassandra Ribeiro Joye. - Fortaleza: UAB/IFCE, 2009.

85p. : il. ; 27cm.

1. DISTRIBUIÇÃO DE FREQUÊNCIA. 2. GRÁFICOS. 3. MEDIDAS DE TENDÊNCIA CENTRAL E DISPERSÃO. 4. ESTATÍSTICA I. Joye, Cassandra Ribeiro. (Coord.). II. Centro Federal de Educação Tecnológica do Ceará - CEFETCE. III Universidade Aberta do Brasil - UAB. IV. Título.

CDD - 519.5 L732e

(4)

AULA 4

Tópico 1 Tópico 2

SUMÁRIO

AULA 1

AULA 2

AULA 3

Apresentação

5

Referências

84

Tópico 1 Tópico 2 Tópico 1 Tópico 2 Tópico 1 Tópico 2 Tópico 1 Tópico 2 Tópico 3

O surgimento da Estatística e a utilização das planilhas eletrônicas

6

A evolução da estatística

7

As planilhas eletrônicas e a estatística

10

AULA

Complementar

Conceitos básicos e distribuições de frequência

17

Conceitos básicos

18

Distribuição de frequência

22

Representação Gráfica

34

Diagramas, gráficos polares e outros

35

Histograma e polígonos de frequência

44

Medidas de posição: tendência central

50

Médias aritméticas: simples e ponderada

51

Mediana

57

Moda

63

Medidas separatrizes e Medidas de dispersão

69

Medidas separatrizes: Quartil

70

Medidas de dispersão

77

(5)

APRESENTAÇÃO

Caro(a) aluno(a):

O estudo da Estatística, de forma geral, possibilita que dados coletados em pesquisas sejam transformados em informações úteis para que decisões possam ser tomadas, seja qual for a área de atuação profissional.

Com o aumento do movimento turístico nas últimas décadas, sobretudo no Ceará, o estudo estatístico, por meio da coleta, organização e análise de dados, possibilita ao profissional do turismo tomar decisões coerentes e realizar projeções adequadas para empreendimentos de pequeno, médio ou grande porte.

Nesse sentido, nosso material didático contempla, inicialmente, uma pequena evolução histórica da Estatística. Em seguida, apresenta os primeiros conceitos: população, amostra, variável, para chegar à forma de desenvolvimento da coleta de dados, e à representação gráfica e análise dos dados coletados, recorrendo, para tanto, ao estudo das medidas de posição e de dispersão.

É importante ressaltar que a utilização de planilha eletrônica será necessária durante o curso. É por este motivo que o material desenvolvido para a aula presencial contempla a utilização de fórmulas e gráficos, obtidos a partir dessa ferramenta tecnológica.

Aproveitem o material o máximo possível, desenvolvendo não só as tarefas solicitadas, mas, também, as atividades de aprofundamento.

(6)

AULA

C

omplementar

O surgimento da Estatística

e a utilização das planilhas

eletrônicas

Nesta aula, você saberá como a Estatística surgiu e se firmou como ciência, acompanhamento a retomada da evolução histórica desse campo do saber. Aprenderá como utilizar as planilhas eletrônicas para o desenvolvimento de fórmulas matemáticas, tabelas e gráficos.

O uso da planilha eletrônica será necessário durante todo nosso curso. Por este motivo, a aprendizagem adequada dessa ferramenta é de suma importância para que você possa acompanhar as aulas com segurança e tranquilidade.

Objetivos

• Conhecer como a Estatística se desenvolveu ao longo da história • Desenvolver fórmulas, tabelas e gráficos utilizando planilhas eletrônicas

(7)

N

este tópico, serão apresentados alguns aspectos importantes da história da Estatística, desde seus primórdios até o momento em que foi reconhecida como ciência, quando deixou de apresentar apenas caráter descritivo.

A palavra estatística se origina do termo status em latim, que significa estado. Foi introduzida pela primeira vez na Alemanha em 1748. Antigamente, o Estado se beneficiava da coleta e da apresentação de dados quantitativos. Por este motivo, seu nome faz menção ao Estado como coletor e organizador dos dados de sua população.

De acordo com a Empresa Brasileira de Pesquisa Agropecuária – Embrapa (MEMÓRIA, 2004), a Estatística apresenta hoje um significado ainda maior. Caracteriza-se por apresentar um conjunto de métodos apropriados ao tratamento de dados numéricos que podem ser afetados por diferentes causas. Os métodos utilizados se baseiam em conteúdos matemáticos em todos os aspectos que permeiam o estudo estatístico: coleta, apresentação, análise e interpretação de dados quantitativos.

TÓPICO 1

A evolução da Estatística

ObjetivO

(8)

Mesmo tendo sua importância reconhecida, a Estatística, assim como outras áreas do conhecimento, também é alvo de piadas (o que não invalida a sua cientificidade), como a que vemos representada na Figura 1.

Apesar de apresentar nomenclatura própria a partir do século XVIII, a estatística tem sido utilizada desde os primórdios da civilização humana. Os governos interessados em obter informações sobre suas riquezas e sobre sua população encomendavam estudos numéricos com fins puramente militares e tributários. Imperadores chineses, faraós egípcios, civilizações maias, incas e astecas, utilizaram-se dos conhecimentos estatísticos. O império romano também utilizou os métodos estatísticos para contabilizar os registros de batismos, casamentos e óbitos que ocorriam no século XVI.

Ainda hoje utilizamos essa vertente estatística. O recenseamento realizado pela Fundação IBGE nos revela dados de suma importância, dados sobre a distribuição socioeconômica de nosso país caracterizando-o em diversos aspectos.

Durante a Idade Média, esse conhecimento foi puramente descritivo. Era formada por duas escolas: a alemã e a dos matemáticos sociais. A escola alemã, formada por Achenwall (1719-1772), considerado o pai da Estatística, tratava esse conhecimento de forma meramente descritiva. A escola dos matemáticos sociais se preocupava em buscar regularidades em fenômenos, confundindo-se geralmente com aspectos demográficos de enumeração e organização.

Os estudos realizados pelos alemães no século XVIII garantiram à Estatística uma sistematização que não existia até então. Os dados, porém, continuaram a ser tratados de forma descritiva, assim como o eram desde a antiguidade.

A Estatística só foi considerada como uma disciplina independente das demais no início do século XX, período que marca o início da Estatística Moderna. Desde então esse conhecimento tem se difundido de tal forma que a ciência em geral a utiliza com o intuito de produzir pesquisas que possam ser analisadas com cautela e precisão.

Ainda que a Estatística disponha de várias medidas que a ajudam na obtenção e consequente análise de dados, o senso comum costuma satirizar os cálculos estatísticos, como vemos em mais uma charge, reproduzida na figura 3.

Figura 1 – Charge sobre Estatística

Figura 2 – Gottfried Achenwall (1719-1772)

(9)

Com mais essa charge podemos perceber que o lado bem-humorado como, muitas vezes, a Estatística é vista revela, na realidade, que essa ciência está, de uma forma ou de outra, presente no nosso dia-a-dia.

Veremos a seguir como podemos utilizar as planilhas eletrônicas para trabalhar com aspectos matemáticos e estatísticos diante do desenvolvimento de fórmulas, tabelas e gráficos.

Figura 3 – Charge sobre a contribuição da Estatística

(10)

TÓPICO 2

As Planilhas Eletrônicas e a

Estatística

ObjetivO

• Desenvolver fórmulas, tabelas e gráficos utilizando uma planilha eletrônica

A

planilha eletrônica auxilia bastante o desenvolvimento de cálculos matemáticos. Ela pode ser utilizada como uma calculadora com diversas fórmulas pré-estabelecidas. Além disso, ela permite o desenvolvimento de novas fórmulas quando as existentes não forem suficientes para que objetivos traçados possam ser atingidos.

Um grande diferencial da planilha eletrônica está no desenvolvimento de tabelas e gráficos.

Você pode construir tabelas facilmente, desenvolver seus cálculos, e, ao final, construir gráficos com a utilização de todos os dados selecionados ou apenas uma parte deles.

Veremos, a seguir, como construir fórmulas, tabelas e gráficos utilizando a planilha eletrônica.

2.1 OPERAÇÕES BÁSICAS

Segundo Moraz (2006), para que desenvolva cálculos matemáticos, a planilha precisa reconhecê-los como fórmulas matemáticas. Desse modo, cada fórmula deve seguir uma sintaxe hierárquica de acordo com os requisitos utilizados na própria matemática e que aprendemos desde o Ensino Fundamental.

atenção!

A planilha eletrônica é formada por células. Isso mesmo, células. Elas são os espaços nos quais inserimos os dados que desejamos. Na figura 4, você pode observar que uma dessas células está sendo utilizada.

Para nomeá-la, utilizamos dois recursos: as colunas e as linhas. Observe que as colunas são formadas pelas letras do alfabeto e as linhas são determinadas por números naturais.

(11)

A prioridade é dada para as potências e raízes, seguidas das multiplicações e divisões e, por último, as adições e subtrações. Vale lembrar que essa hierarquia pode ser redefinida com o uso dos parênteses.

As regras gerais para o desenvolvimento de cálculos matemáticos são as seguintes:

a) todas as fórmulas devem ser iniciadas com o sinal de igual (=); b) não devem ser inseridos espaços entre os elementos da fórmula; c) as operações são representadas por operadores.

Os operadores utilizados são os apresentados no quadro a seguir (Quadro 5).

Operação Operadores Adição + Subtração -Multiplicação * Divisão / Potenciação ^

Raiz quadrada Raiz (número)

Quadro 1: Distribuição, por operação, dos operadores utilizados em planilhas eletrônicas

E

xEmplos

:

1. Para calcular a expressão ˙˙˙+

-10 , devemos escolher uma célula

qualquer da planilha eletrônica e digitar: “=(20+15-5*2)/10”. Inserindo a fórmula corretamente na planilha, obteremos como resposta 2,5.

2. Para calcular a expressão 32+42, devemos escolher uma célula qualquer da planilha eletrônica e digitar: “=raiz(3^2+4^2)”. Inserindo a fórmula corretamente na planilha, obteremos como resposta o número 5.

Agora é a sua vez. Observe os exercícios propostos abaixo, escreva uma fórmula matemática para cada um e aplique-a na planilha eletrônica. Aproveite para conferir os resultados.

E

xErcícios

:

1. Um grupo de 15 turistas comprou um pacote para visitar Fortaleza durante 10 dias. O valor total do pacote pago pelo grupo foi de R$ 13.500,00. Quantos reais cada turista pagou por dia? R.: R$ 90,00.

(12)

2. A sorveteria Gostosão cobra R$2,50 um sorvete de casquinha com 1 bola e R$ 4,00 um sorvete de 2 bolas, para qualquer sabor. Um grupo de 10 turistas foi à sorveteria Gostosão e comprou cada um o seu sorvete. Sabendo-se que 6 pessoas compraram sorvete de 1 bola, 3 pessoas compraram sorvete de 2 bolas e 1 pessoa não comprou sorvete, quanto gastaram no total? R.: R$ 27,00.

3. O hotel Brasil pretende decorar seu salão de festas para o Reveillon. Para isto precisa confeccionar 50 toalhas quadradas, cujo lado mede 30 cm. Calcule quantos metros quadrados de tecido serão necessários para a confecção das toalhas. R.: 4,50 m².

Agora que você já sabe como utilizar a planilha eletrônica para desenvolver cálculos matemáticos básicos, você vai aprender como construir tabelas aplicando o conhecimento adquirido.

2.2 TABELAS

Um dos aspectos bastante utilizados em planilhas eletrônicas é o desenvolvimento de tabelas. Isso se dá devido ao fato de a planilha apresentar uma estrutura cartesiana, dividindo o plano em linhas e colunas.

Construir tabelas de dados utilizando uma planilha eletrônica é muito simples. Basta você definir os elementos que constituem as linhas e as colunas nomeando-os adequadamente nas células da planilha como se fossem os cabeçalhos da tabela. Em seguida, você insere os dados numéricos nas respectivas células. Veja o exemplo a seguir.

E

xEmplo

:

Suponha que o hotel Brasil tenha como objetivo organizar seu orçamento em relação à compra de alimentos básicos para o café da manhã consumidos pelos hóspedes tomando como base uma tabela orçamentária de 2007, mês a mês (tabela 1). Orçamento 2007 (unidade)Pão Leite (litros) Café (kg) Queijo (kg) Margarina (unidade) Frutas (unidade) Janeiro 100 200 2 5 100 50 Fevereiro 150 300 3 7 150 75 Março 80 160 2 4 80 40 Abril 70 140 2 4 70 35 Maio 60 120 1 3 60 30

(13)

Junho 50 100 1 2 50 25 Julho 100 200 2 5 100 50 Agosto 80 160 2 4 80 40 Setembro 50 100 1 2 50 25 Outubro 30 60 1 1 30 15 Novembro 50 100 1 2 50 25 Dezembro 100 200 2 5 100 50 Total 920 1840 20 44 920 460

Tabela 1 – Quantidade de alimentos consumidos no café da manhã pelos hóspedes do hotel Brasil em 2007

Observe no exemplo acima que, ao final da última linha da tabela, foi calculada a soma dos alimentos consumidos mês a mês informando-nos o quanto aquele alimento foi consumido durante o ano. Essa informação poderá auxiliar nas próximas compras, não só do ano de 2008, mas também dos próximos anos.

Para calcular o total de qualquer alimento consumido, você não precisa fazer muito esforço. Basta você utilizar a função pré-programada da planilha eletrônica intitulada “SOMA”. Vamos supor que você queira calcular o total de café consumido durante o ano de 2007. Siga os seguintes passos:

a) posicione-se na célula da linha Total e da coluna Café; b) digite a seguinte informação “=SOMA

”;

c) observe que a planilha seleciona automaticamente para você o que será calculado com a seguinte sintaxe: “=SOMA(célula inicial:célula final)”.

d) Confirme apertando o ”enter”.

Dessa forma você não precisa perder tempo desenvolvendo pequenos cálculos. A planilha eletrônica já faz isso por você. Agora é sua vez. Observe o exercício abaixo e tente realizá-lo utilizando a planilha eletrônica.

E

xErcício

:

Tomando o exemplo acima como base, construa uma tabela orçamentária para o hotel Brasil, mês a mês, em relação aos produtos de limpeza que o hotel precisa adquirir para manter todos os quartos e ambientes limpos. Considere o hotel como sendo de médio porte. Para mensurar, faça estimativas e utilize seus conhecimentos já adquiridos na área da hotelaria. Ah! Lembre-se de calcular o total dos materiais utilizados.

Além das tabelas, os gráficos também podem ser desenvolvidos por meio de planilhas eletrônicas. Veremos a seguir como construí-los a partir de tabelas conhecidas.

(14)

2.3 GRÁFICOS

De acordo com Moraz (2006, p. 96) “uma planilha é interpretada com maior clareza quando os dados mais importantes são destacados com ferramentas de formatação”. Os gráficos são, portanto, um fator de relevância para os dados apresentados no formato de tabelas.

Existem situações nas quais as tabelas são repletas de palavras, dados e números, dificultando a compreensão e a análise da informação. Os gráficos têm como objetivo facilitar a compreensão dessas informações.

Veremos a seguir como construir elementos gráficos utilizando planilhas eletrônicas a fim de que você possa complementar as informações fornecidas pelas tabelas desenvolvidas.

Geralmente, as planilhas eletrônicas vêm com um assistente de construção de gráficos automático. Para construí-los adequadamente, siga os passos apresentados abaixo:

1. Selecione com o cursor a tabela de dados;

2. Clique sobre o botão Assistente de gráficos, localizado na barra de ferramentas;

3. Escolha o tipo de gráfico que você gostaria de desenvolver. Neste caso, existe uma variedade deles: colunas, barras, linha, setor, entre outros. Feita a escolha, clique em Avançar;

4. Veja a visualização prévia do gráfico desenvolvido que é exibida. Se considerar que as informações não estão corretas, você pode modificar a série de linha para coluna ou vice-versa ou cancelar o processo. Caso esteja tudo correto, você pode clicar em Avançar;

5. Agora é a vez de inserir o título do gráfico e os rótulos para os eixos x (horizontal) e y (vertical). Completada essa fase, clique em Avançar;

6. Clique em Concluir e você terá seu gráfico pronto para ser utilizado. É importante perceber que qualquer alteração na tabela base também modificará o gráfico de dados vinculado a essa tabela.

Vejamos um exemplo tomando como base a situação apresentada no exemplo do tópico 2.2.

E

xEmplo

:

A tabela utilizada para a construção do gráfico precisou ser simplificada para facilitar a confecção do gráfico. Observe que foram utilizados apenas dois tipos de

(15)

alimentos que apresentam as mesmas unidades de comparação. O rótulo de cada coluna também foi alterado, bem como o título da tabela.

Pão Frutas Janeiro 100 50 Fevereiro 150 75 Março 80 40 Abril 70 35 Maio 60 30 Junho 50 25 Julho 100 50 Agosto 80 40 Setembro 50 25 Outubro 30 15 Novembro 50 25 Dezembro 100 50

Tabela 2 – Quantidade de pão e frutas consumidos no café da manhã pelos hóspedes do hotel Brasil em 2007

Realizando todos os passos apresentados anteriormente, o gráfico construído se apresenta da seguinte forma:

Grafico 1 – Gráfico de colunas baseado nos dados do quadro 7)

O gráfico escolhido foi o de colunas. Você pode, dessa forma, comparar, mês a mês, como ocorreu o consumo de pão e frutas no café da manhã no ano de 2007. O “Alimentos consumidos pelos hóspedes do hotel Brasil em 2007” é considerado o título do gráfico, e, “Unidade” e “Mês” são os rótulos utilizados para os eixos y e x respectivamente.

Agora é a sua vez. Você vai construir um gráfico simples utilizando informações retiradas de uma tabela de dados. Veja a proposta a seguir.

(16)

E

xErcício

:

Uma empresa de pesquisa colheu a opinião de 1.200 pessoas e, posteriormente, elaborou um relatório especificando a preferência sobre qual região brasileira essas pessoas gostariam de conhecer. Os valores constam no quadro abaixo.

Região brasileira Número de pessoas

Centro-Oeste 140 Sul 170 Norte 190 Sudeste 320 Nordeste 380 Total 1.200

Tabela 3 – Preferência de escolha das Regiões brasileiras

Construa um gráfico de sua preferência para representar os dados da tabela. Lembre-se de seguir os passos apresentados neste tópico para construir seu gráfico adequadamente.

Nesta aula você conheceu um pouco da história da Estatística e de sua importância para o universo científico. Conheceu também as planilhas eletrônicas e como podem ser utilizadas para o desenvolvimento de fórmulas matemáticas, tabelas e gráficos. Nas próximas aulas, você estudará os conceitos básicos da Estatística, bem como o desenvolvimento das tabelas mais utilizadas nessa área do conhecimento.

(17)

Nesta aula estudaremos os conceitos básicos de Estatística. A compreensão desses conceitos permitirá que você compreenda a importância de se desenvolver um bom projeto de pesquisa a partir da definição da população, da amostra e das variáveis a serem utilizadas. Além disso, você aprenderá a organizar os dados coletados em tabelas específicas e a iniciar suas análises preliminares sobre o estudo estatístico a ser desenvolvido.

Objetivos

• Desenvolver e aplicar os conceitos básicos de Estatística

• Organizar e analisar informações utilizando tabelas de distribuição de frequência

AULA 1

Conceitos básicos

e distribuições de

frequência

(18)

TÓPICO 1

Conceitos básicos

ObjetivOs

• Definir os conceitos de população e amostra • Definir o conceito de variável

• Classificar variáveis

N

este tópico estudaremos os conceitos básicos da Estatística, sem os quais seria inviável sua aplicação. Para compreendê-los, é necessário estar atento a acontecimentos do cotidiano e à possibilidade de visualizar e compreender o fenômeno turístico em diferentes situações. Os conceitos básicos para a compreensão do conteúdo são os conceitos de População, Amostra e Variáveis.

De acordo com Tiboni (2003, p. 15), população é “o conjunto da totalidade de indivíduos que apresentam uma característica comum, cujo comportamento se quer analisar”. A população seria, portanto, um conjunto que forma o universo de estudo.

Se você quisesse pesquisar, por exemplo, a nacionalidade dos turistas brasileiros, o que você acharia de consultar todos os turistas que chegam ao Brasil, seja por terra, água ou ar? Seria difícil ter esse controle absoluto, não é verdade?

Para realizarmos estudos nessa perspectiva, devemos fazer uso do que chamamos de amostra. Para Tiboni (2003, p. 15), amostra “é um subconjunto finito de uma população”. Ela é utilizada quando a população apresenta muitos elementos e seu estudo se torna inviável.

(19)

Poderíamos, então, diante da população de turistas estrangeiros que visitam o Brasil, escolher uma amostra que pudesse viabilizar o estudo a ser realizado. Dessa forma, poderíamos reduzir nossa população ao escolher apenas cinco dos principais aeroportos brasileiros que recebem turistas estrangeiros. Teríamos, assim, uma amostra dessa população composta por um número menor de elementos a serem analisados.

Somente as amostras não são suficientes para definir uma investigação a partir de análises

estatísticas. É necessário que sejam definidas as variáveis do estudo. Para Tiboni (2003, p. 15), variáveis “são as características que podem ser observadas (ou medidas) em cada elemento da população”.

No caso da população de turistas estrangeiros, poderíamos definir variáveis como: idade, estado civil, nacionalidade, sexo, frequência de visitas ao Brasil, escolha da capital brasileira, entre outros. Cada uma delas representa uma característica a ser observada e estudada. A escolha dessas variáveis dependeria muito do tipo de estudo que você desejasse desenvolver.

Sua pergunta poderia ser: Que tipo de turista estrangeiro frequenta o litoral cearense? Você poderia classificá-lo em relação ao sexo. Sua resposta seria dada em função dos tipos sexuais masculino ou feminino. Você poderia também classificá-lo em relação ao local de origem. Neste caso, você poderia delimitar os continentes: Europa, África, Ásia, América e Oceania. De qualquer maneira, para que seja possível o estudo estatístico de uma amostra, você precisa definir o que vai investigar e quais são as variáveis a serem analisadas.

As variáveis podem ser qualitativas e quantitativas. No caso da situação citada acima, sexo, estado civil, nacionalidade, escolha da capital brasileira são variáveis qualitativas, pois são valores expressos por um atributo. O que se caracterizaria como variável quantitativa? A idade e a frequência de visitas ao Brasil, por exemplo. A maioria dos valores expressos por números é representada por variáveis quantitativas.

As variáveis qualitativas se classificam em nominais e ordinais. O estado civil, por exemplo, é uma variável qualitativa nominal, porque, ao dizer que uma pessoa é casada, solteira ou divorciada, não existe uma ordem de classificação.

atenção!

O trabalho da Estatística é voltado principalmente para as pesquisas com amostras, muito mais do que para aquelas que envolveriam populações completas. A compreensão dessa especificidade é de fundamental importância para a utilização dos recursos dessa ciência.

(20)

Porém, ao definir a variável qualitativa nível de instrução, trabalhamos com os resultados: ensino fundamental, médio e superior dentro de uma ordenação de resultados baseados no número de anos de escolaridade do indivíduo. Dessa forma, diferentemente da variável nominal, a variável ordinal apresenta como característica a ordenação dos resultados.

As variáveis quantitativas podem ser classificadas em variável contínua e variável discreta. A frequência de visitas do turista estrangeiro ao Brasil se classifica como uma variável quantitativa discreta, porque você diz que o turista visitou um determinado lugar 1 vez, 2 vezes, 3 vezes ou mais. Faz sentido dizer que esse turista visitou Fortaleza 2,5 vezes? O que isso significa? Ou ele visitou 2 vezes ou 3 vezes, não existe meio termo. Tiboni (2003, p. 16) afirma que uma variável discreta é aquela que “assume apenas os valores de um conjunto enumerável”. Bussab e Morettin (2004, p. 10) complementam o conceito de variáveis quantitativas discretas ao dizerem que “resultam, freqüentemente, de uma contagem”. As variáveis discretas representam valores que são elementos do conjunto dos números naturais ou conjunto dos números inteiros.

Quantos reais um turista gasta com alimentação em uma viagem de 10 dias à Fortaleza pode ser representado por uma variável quantitativa contínua. O turista pode gastar em média R$ 52,00 ou um pouco mais, R$ 52,35. Entre o intervalo de R$ 52,00 e R$ 52,35 existem várias possibilidades de valores. Faz sentido dizer que esse turista gastou em média R$ 99,99 em alimentação, por exemplo? Diferentemente do caso da variável discreta, esse valor faz sentido nessa situação de variável contínua. Tiboni (2003, p. 16) afirma que uma variável contínua é aquela que “assume inúmeros valores entre dois limites”. As variáveis contínuas representam valores que são elementos do conjunto dos números reais com exceção dos números naturais e inteiros.

atenção!

• O conjunto dos números naturais é representado por N = {0, 1, 2, 3, 4, 5, ...}.

• O conjunto dos números inteiros é representado por Z ={..., -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, ...} • O conjunto dos números reais é representado por  ={..., -5, ..., -4, ..., -3, ..., -2, ..., -1, ..., 0, ..., 1, ..., 2, ..., 3, ..., 4, ..., 5, ...}.

• As frações, por exemplo, ½ , ¾ , os números decimais, 0,25, 1,2333..., e, os números irracionais, 2, ,p 34 5678, ... são exemplos de números reais que não são naturais nem inteiros.

• O conjunto dos números racionais é representado por Q e são todos os números que podem ser escritos na forma de uma fração, ou seja, na forma

a

b , em que a e b são números inteiros e b¹0.

Exemplos: -3 4; ; 3;8;0,5; 10 5 Veja: -- =3 6;8=16;0,5= 5 . 2 2 10

(21)

E

xErcíciorEsolvido

:

Está sendo realizado um estudo estatístico sobre os funcionários de hotéis cinco estrelas do Ceará no qual são definidas as seguintes variáveis:

a) o grau de instrução; b) a idade;

c) a naturalidade;

d) o número de línguas faladas; e e) o salário mensal bruto.

Classifique essas variáveis em qualitativas (nominais ou ordinais) ou quantitativas (discretas ou contínuas).

s

olução

:

a) O grau de instrução pode ser: fundamental, médio ou superior. Isso significa que esses dados não são numéricos, caracterizando-o como variável qualitativa. Como existe uma hierarquia entre os resultados, essa variável é ordinal.

b) A idade é uma variável que representa dados numéricos, por isso é considerada uma variável quantitativa. Ela se classifica como variável discreta porque a idade é representada por números naturais.

c) A naturalidade é uma variável qualitativa nominal, porque os dados por ela representados não são numéricos e não dependem de uma ordem predefinida. O funcionário pode ter nascido em Fortaleza, Caucaia, Quixeramobim, Limoeiro do Norte, ou em qualquer outra cidade, sem necessidade de representação hierárquica entre elas.

d) O número de línguas faladas é uma variável quantitativa discreta. Ela representa números naturais, pois não é possível o profissional falar 2,3 línguas, por exemplo. Ou ele fala uma determinada língua ou ele não fala, não existe meio termo.

e) O salário mensal bruto é uma variável quantitativa contínua, geralmente ela representa números decimais.

Agora que você já estudou população, amostra e variáveis, ou seja, já conhece os conceitos básicos da Estatística, você está preparado para organizar os dados coletados de uma amostra em tabelas especiais, as distribuições de frequência. Elas nos ajudam a reconhecer o comportamento das variáveis a serem analisadas.

(22)

TÓPICO 2

Distribuição de frequências

ObjetivOs

• Conceituar distribuição de frequências

• Classificar as distribuições de frequências em absoluta, relativa, absoluta acumulada e relativa acumulada • Construir tabelas de distribuição de frequências

P

ara que você possa compreender melhor o processo de análise de dados estatísticos, é necessário que compreenda como os dados coletados nas amostras são agrupados e organizados. Você já deve ter percebido a necessidade da definição prévia das variáveis de estudo. São elas que representam as características dos dados coletados. Para conhecer o comportamento dessa variável, seja ela qualitativa ou quantitativa, é preciso analisar com que frequência os dados estão distribuídos dentro dessa variável. É justamente esse aspecto que estudaremos neste tópico.

2.1 FREQUÊNCIA ABSOLUTA

Os dados originais coletados e que não estão numericamente organizados são considerados por Tiboni (2003) dados brutos. Quando você os organiza em ordem crescente ou decrescente você transforma seus dados brutos em um “rol” de informações.

E

xEmplo

1:

As idades de 10 jovens que viajam para Guaramiranga nas férias de julho são: 16, 15, 12, 17, 18, 15, 13, 17, 16, 15. Esses dados, desorganizados, são considerados “dados brutos”.

(23)

Ao organizá-los, você tem o seguinte “rol” de informações em relação às idades dos jovens: 12, 13, 15, 15, 15, 16, 16, 17, 17, 18.

É a partir do rol que você pode construir a distribuição de frequência dos dados coletados.

De acordo com Tiboni (2003, p. 65), uma frequência é “a quantidade de vezes que um mesmo valor de um dado é repetido”. Assim, no exemplo 1, a frequência do número 12 é 1, enquanto a frequência do 15 é 3. Isso significa que, dos 10 alunos que viajam para Guaramiranga nas férias, 1 tem 12 anos, 3 têm 15 anos.

Para facilitar a visualização das repetições ocorridas para todas as idades, faz-se necessária a construção de uma tabela que apresente a concentração de jovens em cada faixa etária. Essa tabela é denominada “distribuição de frequência absoluta”.

E

xEmplo

2:

Vejamos como ficaria a distribuição de frequência das idades dos 10 jovens que viajam para Guaramiranga.

Idade Frequência Absoluta

12 1 13 1 14 0 15 3 16 2 17 2 18 1 Total 10

Tabela 1 - Distribuição da variável idade por frequência absoluta

Observe que a soma de todas as frequência resulta no total da amostra, 10 jovens.

Todos os tipos de variáveis podem ter uma tabela de distribuição de frequências. No exemplo acima, foi construída uma tabela para a variável idade, uma variável quantitativa discreta. Como seria então uma distribuição de frequências para variáveis qualitativas? Vejamos o exemplo a seguir.

E

xEmplo

3:

Suponha que dos 10 jovens citados anteriormente, 4 estejam cursando o ensino fundamental enquanto o restante cursa o ensino médio. Como seria a distribuição de frequência para a variável grau de instrução?

(24)

Grau de instrução Frequência Absoluta

Ensino fundamental 4

Ensino médio 6

Total 10

Tabela 2 – Distribuição da variável grau de instrução por frequência absoluta

Considerando que a variável grau de instrução é uma variável qualitativa ordinal, podemos verificar como é a distribuição para esse tipo de variável.

E

xEmplo

4:

Suponha que esses jovens de férias busquem em Guaramiranga um local para a prática de esportes radicais. Suponha também que a cidade ofereça apenas quatro modalidades desses esportes: escalada, caminhada, “mountain bike” e pára-quedismo. Veja como fica a distribuição de frequência para a variável esportes radicais.

Esportes radicais Frequência Absoluta

Caminhada 5

Escalada 3

Mountain bike 2

Pára-quedismo 0

Total 10

Tabela 3 – Distribuição das modalidades de esporte radical por preferência em frequência absoluta

É possível perceber, com essa distribuição, que a modalidade mais escolhida foi a caminhada. Neste caso, a variável esportes radicais é classificada como uma variável qualitativa nominal e também pode ter desenvolvida uma distribuição de frequência.

Vejamos agora um exemplo no qual a distribuição de frequência um a um pode não auxiliar na compreensão dos dados coletados.

saiba mais!

Para determinar a quantidade de classes (k), você pode utilizar as seguintes regras, considerando n o número total de elementos da amostra:

- Regra de Surges (Regra do logaritmo) k = 1 + 3,3log (n)

- Regra da potência de 2

k = menor valor inteiro tal que 2k ³n

- Regra da raiz quadrada k = n

- Regra sugerida por Bussab e Morettin (2004) 5 a 15 classes com amplitudes iguais

(25)

E

xEmplo

5:

Para a prática dos esportes radicais citados no exemplo 4, é necessária a aquisição de roupas especializadas a serem ajustadas de acordo com a altura de cada jovem. Foram, então, obtidos os seguintes resultados:

1,55m; 1,60m; 1,57m; 1,62m; 1,67m; 1,78m; 1,72m; 1,77m; 1,79m; 1,82m Veja como ficaria a distribuição de frequência para a variável altura.

Altura (m) Frequência Absoluta 1,55 1 1,57 1 1,60 1 1,62 1 1,67 1 1,72 1 1,77 1 1,78 1 1,79 1 1,82 1 Total 10

Tabela 4 – Distribuição da altura por frequência absoluta

O que nos revela esse tipo de distribuição? Apenas que não existem integrantes nesse grupo que tenham a mesma altura. Imagine que, se tivéssemos 50 pessoas, cada qual com uma altura diferente, ficaríamos com uma tabela de 50 linhas. Você acha que seria fácil analisá-la? Os estatísticos encontraram uma maneira mais simples de representar dados dessa natureza agrupando-os no que chamamos de classe.

Dessa forma, classes são “agrupamentos

de valores num intervalo de abrangência” (TIBONI, 2003, p. 67).

Como escolher a melhor classe? Existem fórmulas matemáticas que auxiliam na determinação da quantidade de classes a serem utilizadas. Muitas vezes, apenas o bom senso é indicado para a determinação do intervalo de classes a ser utilizado. Você deve levar em consideração que a nova representação deve contemplar a forma como os valores se distribuem dentro da amostra coletada. Os dados não podem estar tão dispersos quanto no tabela 4, mas, também, não podem estar totalmente agrupados, com apenas 2 classes, sem representar adequadamente as características dos dados coletados.

atenção!

As distribuições de frequência que apresentam classes são denominadas de distribuição de frequência com intervalos de classe.

(26)

Quando se utilizam classes numa distribuição de frequência, é necessário determinar:

• os limites dessa classe;

• a amplitude do intervalo de classe; • o ponto médio de cada classe.

Os limites de uma classe são representados pelos valores extremos de cada classe, ou seja, seu limite inferior e superior. A amplitude do intervalo de classe geralmente é calculada pela diferença entre os limites superior e inferior da classe. O ponto médio é um ponto que apresenta distâncias iguais em relação a seus extremos. Para obtê-lo, basta proceder da seguinte maneira:

a) Calcule a amplitude do intervalo de classe; b) Divida o resultado por 2;

c) Acrescente o valor obtido ao limite inferior da classe.

No caso do exemplo 5, podemos utilizar 4 classes com amplitude de 0,10m, ou seja, poderíamos agrupar os dados nos seguintes intervalos: [1,50; 1,60), [1,60; 1,70), [1,70; 1,80) e [1,80; 1,90). Teríamos, assim, uma distribuição de frequência absoluta com intervalos de classe (cf. tabela 5).

Classes Altura (m) FrequênciaAbsoluta

1ª 1,50 1,60 2

2ª 1,60 1,70 3

3ª 1,70 1,80 4

4ª 1,80 1,90 1

Total 10

Tabela 5 – Distribuição de classes por intervalo de altura e frequência absoluta

No caso da 1ª classe, os valores 1,50 e 1,60 representam, respectivamente, o limite inferior e o limite superior. Seu ponto médio seria calculado da seguinte maneira:

a) Cálculo da amplitude da 1ª classe: 1,60 – 1,50 = 0,10

b) Dividindo por 2: 0,10=0,05 2

c) Acréscimo do valor obtido ao limite inferior da classe: 0,05 + 1,50 = 1,55

O valor obtido para o ponto médio da 1ª classe é 1,55 m. O ponto médio da classe é muito utilizado no estudo das medidas de posição e de dispersão que estudaremos nas aulas 3 e 4. É

guarde bem isso!

A escolha da distribuição com intervalos de classe ou sem esses intervalos depende da quantidade de informação que você precisa analisar. Pode depender também do tipo de variável com a qual você trabalha.

Geralmente na distribuição de frequência de variáveis quantitativas contínuas, os dados são distribuídos em intervalos de classe.

(27)

importante que você compreenda o conceito e os procedimentos necessários para o desenvolvimento adequado das distribuições de frequência.

E

xErcício

:

Definir os limites inferiores e superiores e seus respectivos pontos médios para as outras classes (2ª, 3ª e 4ª) da distribuição da tabela 5.

A organização dos dados de forma absoluta nem sempre revela como a variável se comporta dentro do contexto geral da situação abordada. Estudaremos a seguir um tipo de frequência que pode resolver esse problema: a frequência relativa.

2.2 FREQUÊNCIA RELATIVA

O estudo desse tipo de frequência é fundamental para que você possa estabelecer valores a serem facilmente comparados.

A frequência relativa é definida como “a razão entre a frequência simples e a frequência total” (TIBONI, 2003, p. 76). Podemos defini-la matematicamente da seguinte forma:

Vejamos como podemos ampliar a capacidade de análise dos dados obtidos utilizando a situação apresentada nos exemplos anteriores.

E

xEmplo

6:

Considere novamente a distribuição de frequência das idades dos 10 jovens que viajam para Guaramiranga.

Idade FrequênciaAbsoluta FrequênciaRelativa

12 1 1 ˙˙˙ =100= 10 10 13 1 1 ˙˙˙ =100= 10 10 f f n

f frequ ncia relativa f frequ ncia absoluta

n n de elemen r r = → → → ê ê º ttos da amostra

(28)

14 0 0 x100= 0 =0% 10 10 15 3 3 ˙˙˙ =300= 10 10 16 2 2 ˙˙˙ =200= 10 10 17 2 2 ˙˙˙ =200= 10 10 18 1 1 ˙˙˙ =100= 10 10 Total 10 100%

Tabela 6 – Distribuição da variável idade por frequência (absoluta e relativa)

É possível observar, com a inserção da frequência relativa, que: • metade do grupo é formada por alunos entre 12 e 15 anos; • apenas 10% do grupo têm direito à carteira de motorista; • 90% do grupo precisam de autorização dos pais para viajar.

É por meio do estudo da frequência relativa que você consegue compreender os dados de forma universal e observá-los dentro de contextos diferenciados, ampliando, dessa forma, sua capacidade de análise.

Como seria o cálculo e a análise da frequência relativa para dados agrupados em classes? Vejamos como esse conceito se aplica na situação apresentada anteriormente.

E

xEmplo

7:

Segue no tabela 7 a distribuição de frequência da altura dos jovens que viajam para Guaramiranga nas férias.

Classes Altura (m) FrequênciaAbsoluta FrequênciaRelativa

1ª 1,50 1,60 2 2 ˙˙˙ =200= 10 10 2ª 1,60 1,70 3 3 ˙˙˙ =300= 10 10 3ª 1,70 1,80 4 4 ˙˙˙ =400= 10 10 4ª 1,80 1,90 1 1 ˙˙˙ =100= 10 10 Total 10 100%

(29)

É possível observar, com a inserção da frequência relativa, que: • 70% dos jovens apresentam estatura entre 1,60m e 1,80m;

• apenas 10% do grupo têm estatura superior a 1,80m e, portanto, são considerados altos em comparação à estatura dos brasileiros.

O que aconteceria se precisássemos calcular, no exemplo 6, quantos jovens apresentam idade entre 12 e 16 anos? Certamente você efetuaria os cálculos da seguinte forma: 1 + 1 + 0 + 3 + 2 = 7 pessoas. Porém, em estatística, geralmente trabalhamos com grandes volumes de informação.

Essa simples operação de adição poderia se tornar muito complexa e atrasar o andamento de seu trabalho, inviabilizando os prazos estipulados inicialmente se você precisasse, por exemplo, somar mais de 100 parcelas. Como contornar essa situação? Podemos utilizar as frequência acumuladas a partir dos dados obtidos na frequência absoluta ou na frequência relativa.

2.3 FREQUÊNCIA ACUMULADA

Para obter uma frequência acumulada a partir de uma frequência absoluta, basta adicionar a cada frequência absoluta os valores das frequência anteriores. Vejamos a aplicação desse procedimento utilizando a situação apresentada anteriormente.

E

xEmplo

8:

Considerando a distribuição de frequência absoluta em relação à variável idade, podemos desenvolver a frequência acumulada conforme o tabela 8.

Idade Frequência Absoluta

Frequência Absoluta Acumulada 12 1 1 13 1 1 + 1 = 2 14 0 2 + 0 = 2 15 3 2 + 3 = 5 16 2 5 + 2 = 7

guarde bem isso!

A frequência relativa geralmente é apresentada na forma de porcentagem.

A soma de todos os valores da frequência absoluta deve ser igual à quantidade da amostra.

A soma de todos os valores da frequência relativa deve ser igual a 100%.

(30)

17 2 7 + 2 = 9

18 1 9 + 1 = 10

Total 10

Tabela 8 – Distribuição da variável idade por frequência (absoluta e absoluta acumulada)

Caso haja necessidade de se conhecer quantos alunos estão entre 12 e 16 anos, basta observar a frequência acumulada que você encontrará o número 7. Você não precisa fazer cálculos em todas as situações, a tabela já fornece essas informações para você.

Já que é possível calcular a frequência acumulada a partir da frequência absoluta, então também será possível calcular a frequê-ncia acumulada a partir da frequêfrequê-ncia relativa? Claro que sim. Os resultados obtidos com o cálculo da frequência acumulada relativa são muito importantes para que você conheça bem o comportamento das variáveis e assim perceba o momento em que os resultados representam a maioria ou a minoria da amostra.

E

xEmplo

9:

Vamos considerar a distribuição de frequência relativa para a variável altura e desenvolver a distribuição de frequência relativa acumulada.

Classes Altura (m) FrequênciaAbsoluta FrequênciaRelativa

Frequência Relativa Acumulada 1ª 1,50 1,60 2 20% 20% 2ª 1,60 1,70 3 30% 20% + 30% = 50% 3ª 1,70 1,80 4 40% 50% + 40% = 90% 4ª 1,80 1,90 1 10% 90% + 10% = 100% Total 10 100%

Tabela 9 – Distribuição de classes por altura e frequência (absoluta, relativa e relativa acumulada)

Com as informações obtidas no desenvolvimento da frequência relativa acumulada, facilmente você percebe que metade da turma (50%) apresenta altura

atenção!

Você acredita que o total obtido na frequência absoluta e o resultado obtido com a última frequência absoluta acumulada são coincidentemente iguais? Na realidade, esse fenômeno sempre acontece. Observe que, no cálculo do total na frequência absoluta, todos os valores são somados de uma única vez. Na frequência acumulada, você vai observando os incrementos passo a passo, obtendo o mesmo resultado ao final do cálculo.

(31)

entre 1,50m e 1,70m. É possível ainda constatar que a grande maioria do grupo (90%) apresenta estatura baixa ou mediana em relação aos parâmetros brasileiros.

Cada distribuição de frequência apresenta uma característica importante que auxilia na organização dos dados coletados e nas análises iniciais do estudo estatístico em desenvolvimento. Para que você possa desenvolver uma distribuição de frequê-ncias mais completa possível, é necessário que em sua tabela constem as quatro frequência estudadas nesta aula:

• a distribuição de frequência absoluta;

• a distribuição de frequência absoluta acumulada: • a distribuição de frequência relativa;

• a distribuição de frequência relativa acumulada.

E

xErcíciorEsolvido

:

(TIBONI, 2003, p.77 – adaptado) Numa agência de viagens X, foi feita uma pesquisa sobre o salário recebido. Foram consultados 130 trabalhadores e obtidos os seguintes resultados:

Classes salários mínimosNúmero de (frequência absoluta)Trabalhadores

1ª 13 18 2ª 3 5 24 3ª 5 7 21 4ª 7 9 19 5ª 9 11 15 6ª 11 13 14 7ª 13 15 11 8ª 15 17 5 9ª 17 19 3 Total 130

Quadro 1: Pesquisa sobre salário

r

Esponda

:

a) De forma absoluta, qual é a quantidade de salários mínimos recebida pela maior quantidade de trabalhadores? E a de menor quantidade?

b) Quantos são os trabalhadores que ganham entre 1 e 13 salários mínimos? c) Qual é a porcentagem de trabalhadores que ganham entre 17 e 19 salários mínimos? O que isso pode representar?

d) Qual é o intervalo de salários mínimos recebidos pela maioria (75%) dos trabalhadores?

(32)

s

olução

:

Para que essas respostas sejam dadas, é necessária a confecção da distribuição de frequência considerando as frequência absolutas, relativas e acumuladas.

Número de salários mínimos Trabalhadores (frequência absoluta) Frequência absoluta acumulada Frequência relativa Frequência relativa acumulada 13 18 18 13,8% 13,8% 3 5 24 18 + 24 = 42 18,5% 13,8% + 18,5% = 32,3% 5 7 21 42 + 21 = 63 16,2% 32,3% + 16,2% = 48,5% 7 9 19 63 + 19 = 82 14,6% 48,5% + 14,6% = 63,1% 9 11 15 82 + 15 = 97 11,5% 63,1% + 11,5% = 74,6% 11 13 14 97 + 14 = 111 10,8% 74,6% + 10,8% = 85,4% 13 15 11 111 + 11 = 122 8,5% 85,4% + 8,5% = 93,9% 15 17 5 122 + 5 = 127 3,8% 93,9% + 3,8% = 97,7% 17 19 3 127 + 3 = 130 2,3% 97,7% + 2,3% = 100% Total 130 100%

Quadro 2: Distribuição de frequências da pesquisa sobre salário

a) De acordo com a frequência absoluta, 24 trabalhadores (maior quantidade absoluta) recebem entre 3 e 5 salários mínimos. São 3 os trabalhadores (menor quantidade absoluta) que recebem entre 17 e 19 salários mínimos.

b) Neste caso, basta observar a frequência acumulada na 6ª classe, entre 11 e 13. São 111 trabalhadores que ganham entre 1 e 13 salários mínimos.

c) Apenas 2,3% dos trabalhadores ganham entre 17 e 19 salários mínimos.

d) Basta observar a frequência relativa acumulada, 63,1%(maioria) dos trabalhadores recebem entre 1 e 9 salários mínimos.

Neste tópico foram apresentadas formas diferentes de organização de dados para diferentes tipos de informação. É importante você perceber que as distribuições de frequência

saiba mais!

Para se aprofundar mais sobre o assunto distribuição de frequência, visite os sites:

1. www.heliorocha.com.br/graduacao/sisinfo/ download/PES/DistribuicaoDeFrequencia.pdf 2. www.geocities.com/locksmithone/classroom/ prob_estatistica/2007_1/lecture_slides/aula04. pdf

(33)

podem ser utilizadas não só para variáveis quantitativas, mas, também, para variáveis qualitativas. Ao utilizar esse tipo de distribuição, você pode organizar melhor os dados coletados e compará-los com a finalidade de iniciar seu processo de análise.

guarde bem isso!

Veja um resumo esquemático dos assuntos abordados nesta aula:

Figura 1 – Conceitos básicos da Estatística

(34)

AULA 2

Representação

Gráfica

Os gráficos são utilizados em Estatística com a finalidade de representar os dados organizados, permitindo ao leitor ou pesquisador uma visão abrangente do estudo realizado. É possível, portanto, rapidamente e de forma resumida, informar como uma variável se comporta dentro da amostra.

São muitos os gráficos utilizados em Estatística. Serão abordados nesta aula apenas os mais simples e os frequentemente utilizados para análises superficiais do evento estudado. Dentre eles encontram-se os diagramas, os gráficos polares, os pictogramas, os histogramas e os polígonos de frequência. Cada um pode ser construído considerando-se o tipo de variável utilizada e o que se quer demonstrar sobre os dados coletados.

Objetivos

• Compreender como são construídos gráficos estatísticos • Analisar gráficos estatísticos

(35)

D

e acordo com Tiboni (2003, p. 43), os diagramas são “gráficos dispostos num universo máximo de duas dimensões”. Isso significa que, a princípio, os diagramas são gráficos construídos no plano cartesiano para relacionar duas variáveis.

Se você quiser estudar, por exemplo, o aumento de turistas estrangeiros no Brasil, será necessário trabalhar com duas variáveis: o número de turistas e o tempo, em anos. Veja o gráfico a seguir.

Gráfico 1 – Número de turistas estrangeiros no Brasil – 2004 a 2007

TÓPICO 1

Diagramas, gráficos

polares e outros

ObjetivOs

• Definir diagramas, gráficos polares, pictogramas e cartogramas • Classificar diagramas, gráficos polares, pictogramas e

cartogramas

(36)

Observando o eixo x (eixo das abscissas – eixo horizontal), você verifica que ele é composto pelos anos de 2004 a 2007, ou seja, são os dados relacionados à variável tempo. No eixo y (eixo das ordenadas – eixo vertical), você observa os valores de 0 a 7 milhões, representados pela variável número de turistas.

Ao relacionar os elementos do eixo x com os elementos do eixo y, tem-se uma nova informação. É possível determinar a cada ano quantos turistas estrangeiros visitaram o Brasil. Assim, em 2004, sabe-se que 2 milhões de turistas estrangeiros estiveram em nosso país. É perceptível também que houve um aumento do número de turistas estrangeiros no Brasil. Passou, nesse período, de 2 milhões para 6,1 milhões de pessoas, em 2007, ou seja, 4,1 milhões de pessoas a mais em nosso

território.

É por meio desse tipo de representação que você percebe rapidamente o comportamento de uma variável em relação à outra e pode avançar em suas primeiras inferências e percepções sobre o evento estudado.

Os diagramas podem ser classificados, de acordo com Tiboni (2003), da seguinte forma:

• Gráfico em colunas ou em barras; • Gráfico em setores;

A autora cita, ainda, outros tipos de gráfico que também podem ser utilizados para a representação de variáveis qualitativas. São eles:

• Gráfico Polar ou Radar; • Pictogramas;

• Cartogramas.

Veremos a seguir as definições mais importantes e comumente utilizadas e em quais contextos esses diagramas podem ser inseridos.

1.1 GRÁFICO EM LINHAS

O gráfico em linha (Gráfico 1) constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas.

São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico.

atenção!

Os diagramas geralmente são utilizados para representação de variáveis qualitativas, nominais ou ordinais, e variáveis quantitativas discretas, com distribuições sem intervalos de classe.

(37)

1.2 GRÁFICO EM COLUNAS OU EM BARRAS

Os gráficos em colunas ou em barras são representados por retângulos. No primeiro caso, o maior comprimento dos retângulos se encontra na posição vertical. No segundo caso, o maior comprimento dos retângulos é representado na posição horizontal.

Os gráficos permitem que o leitor tenha uma rápida visualização do fenômeno estudado por meio de uma comparação entre a variável e suas respectivas frequências.

Os retângulos apresentam características importantes e suas dimensões se relacionam diretamente com os resultados obtidos no estudo das frequências da variável determinada. Todos os retângulos devem apresentar a mesma largura, enquanto sua altura deve ser proporcional às frequências apresentadas no gráfico. Vejamos como isso acontece.

E

xEmplo

:

Vamos estudar a quantidade de brasileiros que saem de viagem para o exterior. Observe a distribuição de frequência representada no quadro abaixo:

Número de brasileiros

(em milhões) Ano

5,2 2000 5,6 2001 4,5 2002 3,9 2003 3,5 2004 3,1 2005

Quadro 1: Número de brasileiros que saem em viagem ao exterior – 2000 a 2005

Vejamos agora, como esses dados ficam representados no gráfico em colunas.

(38)

É importante você perceber que duas variáveis estão se relacionando, a variável tempo e a variável número de brasileiros. Cada coluna representa a quantidade de brasileiros que viajam para o exterior em um determinado ano específico dentro de um limite que varia entre 2000 e 2005.

O que você pode concluir ao observar o gráfico? Primeiramente, o ano de 2001 foi o ano no qual os brasileiros mais viajaram para o exterior. A explicação desse fenômeno não é apresentada no gráfico. Se você quiser compreender melhor o que aconteceu nesse ano, será necessário fazer novas investigações estatísticas ou outros tipos de investigação.

Você pode observar também que, após o ano de 2001, houve uma queda nas viagens dos brasileiros ao exterior, e continuou nesse ritmo até o ano de 2005.

O que mais você consegue visualizar nesse gráfico (Gráfico 2)? Outras observações ficam como exercício.

Como seria a configuração do gráfico em barras para essa mesma situação? Certamente, poucas modificações precisam ser realizadas. Vejamos.

Gráfico 3 – Número de brasileiros que viajam para o exterior - 2000 a 2005

Observe que os retângulos modificaram sua posição. Você tem a impressão que os retângulos estão na horizontal. Na realidade, a altura do retângulo ficou constante, enquanto que sua largura apresentou diferentes valores. As variáveis representadas pelos eixos x e y também sofreram uma inversão. No eixo y, tem-se, neste momento, a representação da variável tempo; enquanto no eixo x, tem-se a representação da variável número de brasileiros.

Qual das duas representações é a melhor para ser utilizada? Essa resposta depende de vários aspectos. Um deles diz respeito à quantidade de informações que você precisa apresentar no gráfico e o tamanho do papel de que dispõe. Outro aspecto relevante é a melhor disposição da informação para o leitor diante dos resultados obtidos. Algumas vezes, as colunas demonstram melhor os dados; em outras, a representação no formato de barras é mais indicada.

(39)

E

xErcício

:

Procure em jornais e revistas representações de informações no formato de gráficos. Faça um levantamento das situações nas quais os gráficos em coluna são utilizados. Faça o mesmo para os gráficos em barras.

Qual deles foi mais utilizado? Em quais situações o gráfico em colunas foi mais útil? E o gráfico em barras?

Tão utilizados quanto os gráficos em barras e em colunas são os gráficos em setores, especialmente na representação das frequências relativas. Este assunto será abordado a seguir.

1.3 GRÁFICO EM SETORES

O gráfico em setores é comumente utilizado no formato circular ou de “pizza” para representar “a composição, usualmente em porcentagem, de partes de um todo” (BUSSAB; MORETTIN, 2004, p. 16).

O tamanho do raio do círculo você mesmo pode escolher. A escolha pode depender também do local de apresentação. Caso você utilize apresentação em slides, é necessário desenvolver um gráfico maior. Caso você apresente-o no papel, ele pode ser menor. Geralmente, esse tipo de representação é utilizado para a apresentação das frequências relativas de variáveis qualitativas.

Suponha que tenha sido realizada uma pesquisa sobre as opções de hospedagem de turistas brasileiros quando visitam o Ceará. Veja o quadro 5 representativo das distribuições de frequência absoluta e relativa da variável local de hospedagem.

Local de hospedagem Número de turistas brasileiros Frequência relativa

Hotéis 300 30%

Pousadas 500 50%

Casa de Amigos 150 15%

Outros 50 5%

Total 1.000 100%

Quadro 2: Distribuição das frequências absoluta e relativa por local de hospedagem

A representação gráfica dessa distribuição se encontra no quadro 4 a seguir. A área pintada do gráfico é proporcional às frequências da variável escolhida para ser estudada. Observe que a área pintada relacionada à quantidade de pessoas que escolheu “Pousadas” como hospedagem equivale à metade do círculo, o que seria de se esperar já que essa quantidade equivale a 50% das pessoas entrevistadas.

Observe as demais situações e verifique essa relação entre a área pintada do círculo e os dados obtidos com a frequência relativa. Veja que quanto maior a

(40)

Gráfico 4 – Percentual de turistas brasileiros que freqüentam o Ceará por local de hospedagem

Existem softwares que calculam a área colorida automaticamente. Entretanto, se você estiver numa situação na qual não poderá fazer uso do computador e necessitar desenvolver um gráfico de setores, como você deve proceder?

É muito simples! Tudo se baseia na antiga e conhecida “regra de três”. Para saber exatamente que parte do gráfico você precisa pintar para caracterizar, por exemplo, a quantidade de pessoas que escolheu como hospedagem os hotéis do Ceará, você deve realizar os seguintes cálculos: ® ® 0 1.000 360 300 x = = = 0 0 1.000 x 300.360 ˙˙˙ x 108 1.000

Você deve ter percebido que o número 1.000 representa o total de pessoas entrevistadas, os turistas brasileiros que visitam o Ceará. E o que significa esse 360º? Você deve lembrar, das aulas de Geometria, que uma circunferência se subdivide em 360 partes, cada qual com 1 grau. Pode-se, então, fazer corresponder o total de pessoas, que é 1.000, com o total de graus que existe numa circunferência que é 360º.

Como você quer saber quantos graus equivale ao número de pessoas que escolheu hotel como opção de hospedagem, então a correspondência acontece entre 300 e um número desconhecido que denominei de x. Procedendo com os cálculos, descobrimos que o ângulo do círculo correspondente a 300 pessoas equivale a 108º.

O que fazer agora? Trace uma circunferência, o mais correto possível. Em seguida, escolha um raio qualquer e utilize o transferidor para medir o ângulo de

atenção!

Em relação ao exemplo da “regra de três” está se usando 360°, pois trata-se do valor de graus que possui esta circunferência.

(41)

108º. Trace um novo raio e pinte o espaço interno entre os dois raios determinados. Tente realizar essa tarefa no papel, como exercício. A figura 1 ilustra o passo a passo para a construção de um gráfico de setores manualmente.

Figura 1 – Sequência da confecção manual do gráfico em setores

Como você pode perceber, o gráfico em setores é bastante útil na interpretação dos dados e também muito utilizado na apresentação de resultados de pesquisa em revistas e jornais. É importante salientar que, caso você tenha mais de sete informações para representar em um gráfico, opte por outro formato. Tiboni (2003) afirma que esse tipo de gráfico é melhor compreendido quando são representados menos do que sete dados.

1.4 GRÁFICO POLAR

De acordo com Martins e Donaire (2006), os gráficos polares são utilizados para representar séries cronológicas com certas características de periodicidade. É possível ainda, de acordo com Tiboni (2003), comparar os valores da série com os valores de sua média aritmética.

É possível, com a análise desse tipo de gráfico, conhecer a variação da quantidade de turistas estrangeiros no Ceará durante um ano, identificando a situação mês a mês, ou semana a semana. A variação da frequência mensal dos funcionários de um hotel também pode ser explorada pelo gráfico polar ou radar.

Suponha que entre os meses de novembro de 2007 a fevereiro de 2008, os típicos meses de férias escolares dos brasileiros, mais de 10.000 turistas tenham visitado as praias de Caucaia: Icaraí, Tabuba, Cumbuco, entre outras. Observe a distribuição de frequências absolutas que caracteriza essa visitação na tabela a seguir.

Mês Número de turistas

Novembro 5.000

(42)

Janeiro 9.000

Fevereiro 8.000

Março 2.000

Quadro 3: Distribuição da frequência absoluta de turistas brasileiros que visitam o Ceará, por mês, do período das férias escolares

Verifique que a variável “número de turistas” está sendo analisada de acordo com uma ordem cronológica determinada pela variável “mês”, por um período determinado de novembro a março.

Com a observação dos dados representados no quadro, podemos perceber que o mês de janeiro foi o mais procurado pelos turistas brasileiros. Com a observação do gráfico polar, esses dados propõem uma compreensão diferenciada da situação. Observe o gráfico 5.

Gráfico 5 – Gráfico polar do número de turistas brasileiros no Ceará – 2007/2008

É possível compreender mais rapidamente que a tendência dos turistas brasileiros ao procurar as praias cearenses acontece com maior intensidade entre os meses de dezembro a fevereiro. O turista pode, com esses dados, decidir visitar as praias cearenses em meses mais movimentados ou pouco movimentados apenas observando o gráfico polar.

Além dos gráficos e tabelas vistos, existem outras formas de representação gráfica. Apresentamos, entre elas, os cartogramas e os pictogramas.

Os cartogramas são “ilustrações relativas a cartas geográficas, em que as representações são feitas diretamente sobre o desenho de uma área geográfica” (TIBONI, 2003, p. 51).

(43)

GLOSSÁRIO

Plano cartesiano – plano cujos pontos são localizados por meio de um sistema de coordenadas cartesianas (IMENES & LELLIS, 1998, p. 235).

Coordenada cartesiana – são dois números que indicam a localização de um ponto no plano cartesiano. (IMENES & LELLIS, 1998, p. 81)

No quadro abaixo, o ponto P tem coordenadas 1 e 3: A coordenada 1 dá a posição em relação ao eixo x, eixo horizontal, e é denominada de abscissa.

A coordenada 3 dá a posição em relação ao eixo y, eixo vertical, e é denominada de ordenada.

Figura 2 – Exemplo de Cartograma

Fonte: Martins; Donnaire, 2006, p. 96

Os pictogramas são “representações gráficas ilustradas por figuras”. (TIBONI, 2003, p. 52).

Figura 3 – Exemplos de Pictogramas

Fonte: Martins; Donaire, 2006, p. 95

Neste tópico você aprendeu sobre os gráficos utilizados para representação de dados cujas variáveis se classificam como qualitativas ou quantitativas discretas. Você adquiriu, portanto, alguns conhecimentos básicos para escolher um ou outro gráfico de forma justificada. Estudaremos no próximo tópico, gráficos que representam as variáveis quantitativas contínuas.

(44)

TÓPICO 2

Histograma e polígonos de

frequência

ObjetivOs

• Definir histogramas e polígonos de frequência • Analisar histogramas e polígonos de frequência

N

este tópico são apresentados os gráficos que representam variáveis quantitativas contínuas. Os histogramas e polígonos de frequência são comumente utilizados para este fim.

Em interpretações gráficas e análises estatísticas, esse tipo de representação gráfica é uma das mais utilizadas, sobretudo quando a distribuição de frequência é desenvolvida a partir da determinação de classes.

A construção dos polígonos de frequência pressupõe a construção prévia dos histogramas. Por este motivo, fique atento ao conceito de histograma e como ele deve ser desenvolvido. A compreensão dos polígonos de frequência será facilitada se você tiver uma boa compreensão sobre o assunto.

2.1 HISTOGRAMA

Tiboni (2003) afirma que um histograma é um diagrama em colunas, ou seja, um gráfico formado por retângulos verticais, um ao lado do outro. Um histograma também pode ser definido como um gráfico formado por retângulos justapostos. Assim, ao construir o histograma, cada retângulo deverá ter área proporcional à frequência relativa (ou à frequência absoluta, o que é indiferente) correspondente. No caso em que os intervalos são de tamanhos (amplitudes) iguais, as alturas dos retângulos serão iguais às frequências relativas (ou iguais às frequências absolutas)

(45)

dos intervalos correspondentes. Neste momento, você pode estar se perguntando: Qual é a diferença então entre um gráfico em colunas e um histograma?

A diferença é que no gráfico em colunas você representa dados de variáveis qualitativas ou quantitativas discretas, enquanto no histograma os dados são representados por variáveis quantitativas contínuas. No exemplo citado no item 1.2 do tópico 1, para cada ano apresentado, você dispunha de uma quantidade de pessoas que viajam para o exterior.

Com o histograma, você pode analisar dados de variáveis contínuas. Observe, na tabela a seguir, a distribuição de frequência das idades de 100 pessoas que se hospedaram no Hotel “Ceará da Luz” no mês de dezembro de 2007.

Idades Quantidade de pessoas

 16 18 10  18 20 20  20 22 25  22 24 15  24 26 25  26 28 5 Total 100

Tabela 1 – Distribuição de frequência da variável quantidade de pessoas em relação à variável idade

Observe que a variável “idade” representa dados numéricos contínuos. A distribuição é realizada em seis classes com amplitude 2, ou seja, contamos as idades das pessoas de 2 em 2 anos. O histograma dessa distribuição de frequência apresenta-se no gráfico a seguir.

Gráfico 6 – Histograma da variável quantidade de pessoas em relação à variável idade

É possível observar rapidamente que a menor concentração de pessoas acontece entre os 26 e 28 anos e as maiores concentrações, entre 20 e 22 anos, 24 e 26 anos. Além disso, as colunas não ficam espaçadas entre si. Num histograma,

Referências

Documentos relacionados