• Nenhum resultado encontrado

Apresentação da área. Coordenação da área de Matemática

N/A
N/A
Protected

Academic year: 2021

Share "Apresentação da área. Coordenação da área de Matemática"

Copied!
38
0
0

Texto

(1)
(2)
(3)

Apresentação

da área

[...] a Matemática procura compreender os modelos que permeiam o mundo que nos rodeia assim como a mente dentro de nós. […] Assim é necessário colocar a ênfase:

— em procurar soluções e não apenas em memorizar procedimentos; — em explorar modelos e não apenas em memorizar fórmulas; — em formular conjecturas e não apenas em fazer exercícios.

[...] com essas ênfases, os estudantes terão a oportunidade de estudar a Matemá-tica como uma disciplina exploradora, dinâmica, que se desenvolve, em lugar de ser uma disciplina que tem um corpo rígido, absoluto, fechado, cheio de regras que precisam ser memorizadas.

Shoenfeld (1992)1

Este curso de Matemática com duração de 4 meses está sendo oferecido a alunos do último ano do ensino médio da rede pública como um incentivo para continuarem seus estudos em direção ao ensino superior. Embora não cubra todo o programa do ensino médio, pretende-se estimular o interesse dos alunos pelos diversos temas de Matemática por meio de abordagens variadas. Serão estudados tópicos sobre Números, Estatística, Probabilidade e Aná-lise Combinatória, Geometria Plana e Espacial, Geometria Analítica, Sistemas Lineares e Funções, privilegiando o entendimento das possíveis facetas de um mesmo assunto, a análise de resultados obtidos e a interligação entre os diversos conteúdos.

Escolhas foram feitas de modo a priorizar sua formação, a discussão de idéias e a percepção de que a Matemática é uma disciplina viva que pode ser construída, e não um amontoado de fórmulas prontas para serem decoradas e usadas. Lembrando que realmente aprendemos quando trabalhamos o conhe-cimento, analisando-o de várias maneiras e usando-o com critério, considera-remos, sempre que possível, aplicações em problemas reais e interdisciplinares. Acreditando que o intercâmbio entre vocês, alunos do ensino médio, e os alunos da USP, que serão os seus professores, venha a aumentar a sua predis-posição para o ensino superior, desejamos a todos bons estudos!

Coordenação da área de Matemática

(4)

Uma das ferramentas mais utilizadas hoje em dia pelos cientistas, analistas econômico-sociais, profissionais liberais, jornalistas etc. é a Estatística, que descreve os dados observados e desenvolve a metodologia para a tomada de decisão em presença da incerteza. O verbete estatística foi introduzido no século XVIII, tendo origem na palavra latina status (Estado), e serviu inicial-mente a objetivos ligados à organização político-social, como o fornecimento de dados ao sistema de poder vigente. Hoje em dia, os modelos de aplicação da Teoria Estatística se estendem por todas as áreas do conhecimento, como testes educacionais, pesquisas eleitorais, análise de riscos ambientais, finan-ças, controle de qualidade, análises clínicas, data mining, índices de desen-volvimento, modelagem de fenômenos atmosféricos etc. Podemos informal-mente dizer que a Teoria Estatística é uma ferramenta que ajuda a tomar deci-sões com base na evidência disponível, decideci-sões essas afetadas por margens de erro, calculadas através de modelos de probabilidade.

No entanto, a probabilidade se desenvolveu muito antes de ser usada em aplicações da Teoria Estatística. Um dos marcos consagrados na literatura probabilística foi a correspondência entre B. Pascal (1623-1662) e P. Fermat (1601-1665), onde o tema era a probabilidade de ganhar em um jogo com dois jogadores, sob determinadas condições. Isso mostra que o desenvolvimento da teoria de probabilidades começou com uma paixão humana, que são os jogos de azar, mas evoluiu para uma área fortemente teórica, em uma perspectiva de modelar a incerteza, derivando probabilidades a partir de modelos matemáti-cos. A análise combinatória deve grande parte de seu desenvolvimento à ne-cessidade de resolver problemas probabilísticos ligados à contagem, mas hoje há diversas áreas em que seus resultados são fundamentais para o desenvolvi-mento de teorias, como, por exemplo, a área de sistemas de informação.

Esta apostila tratará das três áreas descritas na introdução: estatística, pro-babilidade e combinatória. Para o desenvolvimento dos temas, foi difícil a escolha da ordem e do conteúdo, limitados que fomos pelo tempo disponível para o desenvolvimento de cada assunto. Optamos por fazer um tratamento sucinto de dados, através da estatística descritiva, por oferecer algumas no-ções de probabilidade, a fim de trabalhar situano-ções ligadas à incerteza, bem como apresentar elementos de análise combinatória, visando desenvolver o raciocínio para solucionar certos tipos de problemas de contagem dando me-nos ênfase ao uso de fórmulas.

(5)

Estatística descritiva

Cada vez mais os meios de comunicação nos apresentam gráficos e medidas estatísticas resumidas de natureza descritiva. Esse é um material de apoio que deve ser utilizado para aprender os conceitos com base em notícias de nosso próprio cotidiano. Os gráficos e as estatísticas descritivas normalmente não são um fim em si mesmos, mas constituem uma parte importante do processo de análise.

A Estatística é um veículo para que os indivíduos, de modo geral, desen-volvam a capacidade de aproveitar as fontes disponíveis de informação para expressar e construir suas próprias idéias. Além disso, como já dissemos, es-sas noções são parte integrante de todas as áreas do conhecimento e certa-mente serão de grande utilidade para o curso universitário, qualquer que seja a área de interesse do estudante, pois praticamente todas as carreiras universi-tárias contêm uma disciplina de Estatística, a qual tornou-se um suporte para o desenvolvimento do conhecimento.

Esta seção tem como objetivo mostrar aos alunos como se trabalha um conjunto de dados simples, quer sejam de natureza numérica quer sejam de natureza qualitativa. Esses dados normalmente constituem uma amostra de determinada população de interesse de alguma área científica, econômica, social etc. É muito difícil uma pesquisa envolver todos os elementos de uma determinada população (o Censo faz isso), por motivos vários, e é por isso que se recorre às amostras (que são subconjuntos de populações).

POPULAÇÃO

Conjunto de todos os indivíduos (ou elementos) de interesse.

AMOSTRA

Qualquer subconjunto de uma população.

A

NÁLISE

DE

DADOS

Vamos iniciar a análise descritiva propondo uma tarefa para a classe: cada um deverá medir o palmo de sua mão direita (em cm) com uma régua e regis-trar o valor inteiro mais próximo. Se a leitura da régua informar uma medida com 5 como o primeiro decimal (ex. 18,5 cm), vamos propor um arredonda-mento rápido, mas grosseiro: considere 19 cm, se o dia de seu nasciarredonda-mento for par, e 18 cm, se for impar. A classe pode discutir esse critério, pensando com

(6)



Tabela 1 19 18 23 20 20 21 20 20 19 20 F F M F M M F M F M 20 20 21 21 20 21 19 17 19 19 M M M F F M F F F F 21 21 20 20 21 22 20 21 18 20 M M M F M M M M F F

o(a) professor(a) outras formas de arredondamento. Sempre que falarmos aqui da variável palmo, estaremos subentendendo que a medida é dada em cm. Os dados abaixo reproduzem as medidas do palmo da mão direita de uma amos-tra (que pertence a uma determinada população) de 30 adultos e está também representada a variável sexo (categorias M para masculino e F para feminino).

Estes mesmos dados estão representados no chamado Gráfico de pontos que se encontra a seguir. Observe como foi feita a marcação e marque o valor do palmo da sua mão direita na linha assinalada no gráfico (respeitando a or-dem numérica). Todos os alunos deverão informar seu valor em voz alta e, à medida que cada valor for informado, toda a classe marca tal valor na linha acima do gráfico já construído – quando houver repetições, sigam a sugestão do gráfico já feito, isto é, coloquem os valores um sobre o outro. Comparem o gráfico obtido com os dados da classe com o proveniente dos dados da Tabela 1.

Na situação a seguir, os mesmos dados de palmo da Tabela 1 foram sepa-rados por sexo e os gráficos de pontos têm a seguinte forma:

Neste exemplo estamos trabalhando com duas características, comprimento

do palmo da mão (palmo) e sexo. Em estatística, chamamos essas

(7)



de sexo em tabelas de freqüências e devem ser registrados, nas tabelas dispo-níveis, os valores obtidos na classe (f denota freqüência absoluta = número de pessoas). As variáveis numéricas podem ser classificadas como contínuas (provenientes de mensuração) ou discretas (provenientes de contagem), en-quanto que as qualitativas podem ser classificadas como ordinais (ordem im-plícita) ou nominais (sem ordem imim-plícita).

Vimos então duas maneiras de representar o conjunto de valores da variá-vel numérica palmo: através do gráfico de pontos e através de tabelas de fre-qüências. Também a variável qualitativa sexo foi contemplada, tanto na repre-sentação da tabela de freqüências, separando quantos indivíduos eram do sexo masculino e quantos eram do feminino, quanto na construção do gráfico de pontos para a variável palmo, em que houve uma estratificação para cada categoria da variável qualitativa sexo (M e F). Compare os valores de palmo para cada categoria de sexo.

SEXO M F f 16 14 PALMO 17 18 19 20 21 22 23 freqüência f 1 2 5 12 8 1 1 Tabela 2

Considerando novamente a variável palmo, além de usarmos todos os valores em um gráfico ou em uma tabela, podemos caracterizar o comporta-mento dos dados a partir de um (ou mais) valores que a caracterizem – são as chamadas medidas-resumo.

Medidas-resumo de variáveis numéricas podem ser de dois tipos: de posiçãoposiçãoposiçãoposiçãoposição e de variabilidade

variabilidadevariabilidade variabilidadevariabilidade.

(8)



17 18 18 19 19 19 19 19 20 20

20 20 20 20 20 20 20 20 20 20

21 21 21 21 21 21 21 21 22 23

A classe deverá fazer a média dos valores obtidos da variável PALMO de todos os seus alunos.

Tanto no caso dos dados da Tabela 1 como naqueles da Tabela 2, não houve nenhuma perda de informação e os valores da média são idênticos. Se a tabela de freqüências disponível fosse a Tabela 4 (que apresentaremos adiante) então haveria perda de informação, pois os dados estariam compactados em classes e o cálculo da média seria feito com o ponto médio de cada classe como valor de X – assim, com perda de informação, a média obtida não seria necessariamente igual à anterior. Não vamos aqui explorar esse conteúdo para o cálculo de me-didas descritivas, uma vez que com os recursos computacionais atuais não é necessário dividir os dados em classes com esse objetivo. No entanto, veremos uma aplicação gráfica com a Tabela 4, cujos dados estão divididos em classes. A mediana da variável palmo é um valor que divide o conjunto dos valo-res dessa variável em duas partes: metade dos valovalo-res é inferior (ou igual) à mediana e a outra metade apresenta valores maiores (ou iguais) à mediana. Para encontrar a mediana é então necessário ordenar os valores da variável e verificar o valor que ocupa a posição central. Se o número de elementos for par, e esse é o caso do exemplo (com n = 30), toma-se para mediana a média aritmética entre os dois valores centrais – neste caso será a média entre o 15o

e o 16o elementos. Ordenando os dados de palmo do menor para o maior

(pode ser também ao contrário), tem-se:

X= [(1. 17 + 2. 18 + 5. 19 + 12 . 20 + 8 . 21 + 1. 22 + 1. 23) / 30 ] 20 cm

Tabela 3 X X n i i n =

1 (1)

onde fi é a freqüência do valor Xi, n é a soma de f i e a média é evidentemente igual à anterior: (2) X f X n i i i k =

= . 1

representadas no gráfico de pontos). Começaremos pelas chamadas de ten-dência central: a média, a mediana e a moda.

A média (aritmética) da variável palmo é obtida através da somatória de todos os valores de palmo dividida por 30 (dados da Tabela 1). A notação usual é:

onde X é a representação para palmo (cada um pode escolher a sua represen-tação), é a notação usual para média de X e n é o número de elementos. Fazendo então o cálculo, vem:

= [(17 + 18 + 18 +……….+ 22 + 23) / 30] 20 cm

(aqui o resultado é uma dízima periódica e vamos trabalhar com este valor aproximado) Com os valores apresentados sob a forma de tabela de freqüências, a ex-pressão para a média aritmética fica:

X

X

(9)



O 15o valor é 20 e o 16o valor também é 20. Portanto, a mediana da variável

palmo é 20 cm. Verifiquem a mediana da variável palmo do conjunto da classe. A terceira medida de tendência central é a moda, que é definida como sendo o valor mais freqüente. No nosso exemplo é bem claro o valor da moda, pois o valor mais freqüente é 20 cm. Nem sempre a moda é tão evidente e há situações com mais de uma moda.

Depois de calcular a média, a mediana e a moda, posicionem esses valores no gráfico de pontos, feito inicialmente com os dados da classe. É fácil então entender por que elas se chamam medidas de tendência central – elas resumem os dados como se estivessem procurando um “equilíbrio” entre eles. Os dados da Tabela 1 mostram uma certa simetria, situação em que média, mediana e moda praticamente coincidem (rigidamente falando, a média não é exatamente 20 e sim 20,033...). Vejam qual a situação dos dados obtidos por vocês.

Há o costume de resumir um conjunto de dados pelo valor de alguma medida de tendência central – a média é geralmente a mais utilizada, embora em certos casos ela não reflita o comportamento dos dados. Como exemplo disso, pode-se citar o caso em que ocorre um valor muito extremo em relação aos demais: a média será afetada fortemente por ele e então se deslocará em sua direção, não sendo, portanto, a melhor opção para resumir tais dados. Neste caso, a mediana é mais eficiente.

Se temos uma discussão em uma empresa entre patrões e empregados, por exemplo, onde os salários são em sua grande parte (80%) iguais a um salário mínimo, e os demais mais do que 50 salários mínimos, o salário médio dará uma idéia distorcida do poder aquisitivo dos membros da empresa. Nesse caso, a mediana, que será igual a um salário mínimo, será mais informativa. Calculem, por exemplo, a média dos valores 1, 2, 5, 7 e 10: a resposta será 5. Se o número 10 for substituído pelo valor 100, a média será 23, de onde se percebe o quanto ela é influenciada pelo valor extremo 100. A mediana nos dois casos é 5, o que mostra que ela é uma medida “robusta” em relação a valores extremos.

Outras medidas descritivas de posição são: valor máximo, valor mínimo, 1o

quartil (Q1) e 3o quartil (Q3). As duas primeiras são auto-explicativas e passa-remos rapidamente pela definição das outras duas: o 1o quartil é como se fosse

a mediana da primeira metade dos dados e o 3o quartil é como se fosse a

medi-ana da segunda metade dos dados. As quatro medidas acima mais a medimedi-ana são suficientes para construir um gráfico de variáveis numéricas conhecido como boxplot ou gráfico de caixas, ou, ainda, gráfico dos cinco pontos. O leitor interessado irá encontrar a sua construção nas referências desta apostila.

No entanto, apesar de as medidas de posição ajudarem na compreensão do comportamento dos dados, elas são incompletas para caracterizar o com-portamento das variáveis, como mostra o próximo exemplo.

Exemplo 1: Imagine que 3 pessoas da família A apresentem para a variável

palmo os valores 19, 23 e 24 e que 3 pessoas da família B apresentem os valores 22, 22 e 22. Vamos calcular a média dessa variável para ambas as famílias:

Média da família A = A = [(19 + 23 + 24) / 3] = 22 Média da família B = B = [(22+22+22) / 3] = 22

(10)



Concluímos então que ambas as famílias apresentam a mesma média. Será que isso basta? Vamos continuar trabalhando com esses dados. Marque os valores da variável palmo de cada família na linha abaixo (isto é, faça um gráfico de pontos), e note a diferença de comportamento entre os mesmos.

Você deve ter percebido que na família B todos os valores estão concen-trados e na família A os valores estão dispersos. Esse aspecto não é percebido se calcularmos somente a média, pois, como vimos, ela é igual para ambas as famílias. Isso mostra que devemos complementar a medida de posição com mais alguma coisa a fim de caracterizar as famílias quanto à variável palmo. Voltaremos a este exemplo oportunamente.

Há uma idéia permeando esta discussão que diz respeito à diferença de comportamento entre os dois grupos: é a idéia de variabilidade. Medidas des-critivas de variabilidade representam a dispersão dos dados e podem ser defi-nidas também por medidas resumo das variáveis numéricas em estudo. Fala-remos aqui da amplitude, variância e desvio padrão.

A amplitude é a medida mais simples de variabilidade e é obtida através da diferença entre os valores máximo e mínimo da variável em estudo, ou seja:

AMPLITUDE = MÁXIMO – MÍNIMO (3) Para os dados da Tabela 1, a amplitude é igual a 23 – 17 = 6 cm (ser tão simples é, ao mesmo tempo, uma vantagem – fácil de aprender e de aplicar –, e uma desvantagem – só trabalha com os valores extremos, ignorando o resto).

Uma medida de dispersão mais rica de informação do que a amplitude, deveria utilizar todos os dados disponíveis e uma idéia poderia ser o cálculo das diferenças entre cada valor e a média. Só que tais diferenças, ao serem somadas (para se obter uma dispersão total), dão como resultado o valor zero, qualquer que seja o conjunto de dados (experimente!), o que inviabilizaria o seu uso. Um modo de contornar esse problema seria considerar essas diferen-ças ao quadrado e outro seria considerar o módulo das diferendiferen-ças. Cada um deles levará a uma medida de dispersão: considerando o quadrado, tem-se a

Variância e considerando o módulo tem-se o Desvio Médio Absoluto (este

não será discutido aqui – ver referências). A Variância é uma média dos qua-drados das diferenças e calcula-se através da expressão:

Aqui é bom frisar que o intuitivo seria fazer esta média com n no denomina-dor – questões teóricas, fora do escopo deste texto, nos levam a usar (n – 1), principalmente em casos onde estamos usando amostras. Quanto à unidade associada à variância, ela não é a mesma unidade dos dados originais e sim o quadrado dela – neste exemplo, a unidade da variância é cm2. Com os dados

(11)



No entanto, é desejável termos características da variável apresentadas na mesma unidade dos dados coletados, o que neste caso significa ter uma medi-da de variabilimedi-dade em cm. Define-se, então, uma medimedi-da resumo para varia-bilidade, o Desvio Padrão, que é a raiz quadrada da variância.

Com os dados da Tabela 1, temos Desvio Padrão 1,22 cm (resgatando a unidade de medida original, que era cm).

Exemplo 1 (cont.): continuando com a análise das famílias A e B, verifique

que a amplitude da família A é 5 cm e que a da família B é 0 cm. Isso já dá uma boa idéia da diferença entre as famílias, diferença esta que não havia sido detectada pela média! Daí a importância do cálculo de medidas de variabili-dade, as quais, acopladas com a média (ou com outras medidas de posição), permitem uma boa caracterização das variáveis de interesse.

Neste caso, a amplitude já seria suficiente para caracterizar a variabilida-de, uma vez que temos somente 3 valores. Mas vamos aproveitá-los para o cálculo do desvio padrão e, para isso, precisamos calcular primeiro a variância.

A:VariânciaA= = = =

A:VariânciaA= 7 cm2

D.P.A=

7

2,65 cm e D.P.

B= 0 cm.

Verifique que a variância dos dados da família B é igual a zero. A partir da variância podemos calcular os desvios-padrão (D.P.). Assim:

.

Quando a variável apresenta uma certa simetria, o intervalo [média – 1 desvio padrão; média + 1 desvio padrão] contém aproximadamente 70% dos dados; o intervalo [média – 2 desvios padrão; média + 2 desvios padrão] contém aproximadamente 95% dos dados e o intervalo [média – 3 desvios padrão; média + 3 desvios padrão] contém aproximadamente 99% dos dados. Este é um resultado que possibilita ter idéia da amplitude dos dados quando se conhece a média e o desvio padrão dos mesmos.

Exemplo 2: com os dados da Tabela 1 vamos verificar o que foi dito acima. A

média ( ) é 20 e vamos considerar o desvio padrão como sendo 1,2. Daí vem:

a) – 1 D.P. = 20 – 1,2 = 18,8 + 1 D.P. = 20 + 1,2 = 21,2 b) – 2 D.P. = 20 – 2. 1,2 = 17,6 + 2 D.P. = 20 + 2 . 1,2 = 22,4 c) – 3 D.P. = 20 – 3.1,2 = 16,4 + 3 D.P. = 20 + 3 . 1,2 = 23,6 X X X X X X X (5)

=

Desvio Padrão Variância

(19 - 22)2+ (23 - 22)2+ (24 - 22)2 (-3)2 + ( 1)2+ (2)2 9 + 1 + 4

(12)



Para verificar quantos são os valores que estão nos intervalos de interesse, podemos nos reportar à Tabela 3, que representa os dados da Tabela 1 de modo ordenado. Verifica-se assim que:

- no intervalo em a, (18,8; 21,2), encontramos 25 valores na Tabela 3 (83%). - no intervalo em b, (17,6; 22,4), encontramos 28 valores na Tabela 3 (93%). - no intervalo em c, (16,4; 23,6), encontramos 30 valores na Tabela 3 (100%).

Voltando à análise gráfica, vamos terminar a abordagem descritiva com mais três gráficos, um para variáveis qualitativas e dois deles para variáveis numéricas. O primeiro será o chamado Gráfico de Setores (informalmente chamado de gráfico em pizza) que mostramos a seguir e que representa a proporção de homens e mulheres nos dados apresentados na Tabela 1. Faça, no espaço em branco, um gráfico de setores utilizando as freqüências da va-riável (sexo) coletada em classe.

O próximo gráfico é utilizado para variáveis numéricas, como a variável palmo, em que os valores estão dispostos em classes, numa tabela de freqüên-cias (Tabela 4). A Tabela 2 é também uma tabela de freqüênfreqüên-cias, porém, os dados não estão dispostos em classes, como na Tabela 4. Então, com os da-dos da Tabela 1, vamos construir uma tabela de freqüências a partir de classes (ou intervalos), construídas de preferência com a mesma amplitude, com suas respectivas freqüências. A Tabela 4 dará origem ao gráfico denominado

His-tograma: um gráfico cuja abscissa é formada pelas classes justapostas e cuja

(13)



O último gráfico que veremos neste tópico é aquele que relaciona duas variáveis numéricas: diagrama de dispersão, que nada mais é do que a repre-sentação em um eixo de coordenadas cartesianas de pares associados a duas variáveis numéricas. A Tabela 5 mostra mais duas variáveis coletadas na amos-tra dos trinta adultos: a altura e o peso. Normalmente (mas não obrigatoria-mente) o gráfico de dispersão das variáveis peso e altura mostra um compor-tamento crescente (aproximadamente linear), com a possível interpretação de que peso e altura são diretamente proporcionais.

C C C C

Construa um histograma para os dados da variável palmopalmopalmopalmopalmo coletados na classe.

Sexo SexoSexo

(14)



Vê-se acima o gráfico de dispersão das variáveis (peso(x), altura(y)) e, neste caso, os valores foram separados pela variável sexo. É possível ampliar o estudo das relações entre duas variáveis numéricas, quer ajustando uma função, como, por exemplo, uma reta neste caso (ou mesmo duas, uma para o SEXO masculino e outra para o SEXO feminino), quer calculando a “força” da relação entre as variáveis através de algum coeficiente (por exemplo, o coeficiente de correlação linear de Pearson). No entanto, essas abordagens não serão feitas neste texto, e as referências bibliográficas podem ser consul-tadas para este fim.

Finalizando, gostaríamos de mencionar um gráfico de dispersão especial em que a abscissa é o tempo (anos, meses, dias etc) e a ordenada é o valor da variável de interesse (cotação do dólar, risco-país, acompanhamento das marés, vendas de eletrodo-mésticos etc.) em cada instante: são as chamadas

Séries de Tempo usadas para descrever o

compor-tamento de variáveis ao longo do tempo. A área de economia é uma das que mais fazem uso das Séries de Tempo, principalmente para variáveis associa-das ao mercado financeiro. A seguir, apresentamos uma Série de Tempo (Folha de São Paulo, 24 de maio de 2004) que mostra o crescimento dos veí-culos convertidos para o Gás Natural Veicular (GNV) no Brasil ao longo dos anos (com ** significando o valor de uma previsão).

.

(15)

Mais do que um arcabouço técnico, o racio-cínio estatístico é uma forma de pensar e, asso-ciado ao Cálculo de probabilidades, permite a investigação de certas regularidades, de padrões de comportamento, com conclusões tomadas levando em conta um risco associado. Se estivermos interessados em saber qual a probabilidade de obter 10 Caras em 10 lançamentos independentes de uma moeda honesta temos um problema de probabilidade a ser resolvido (e a resposta é exata: (1/2)10). Por outro lado, se temos em mãos uma moeda e

queremos saber se ela é honesta, podemos, por exemplo, jogá-la 10 vezes (jogadas independentes uma da outra) e observar o resultado. Se o resultado for 10 Caras, o que podemos concluir sobre a “honestidade” da moeda? Tere-mos uma conclusão tão precisa quanto a obtida na resposta anterior? A res-posta é não, pois qualquer que seja nossa decisão sobre a moeda, temos um risco associado (ou seja, posso dizer que ela não é honesta – e ela ser honesta – ou posso dizer que ela é honesta – e ela não ser honesta). O primeiro exem-plo refere-se a um problema de probabilidade e o segundo é um problema estatístico. De fato, neste segundo exemplo temos uma informação de uma amostra (resultado de 10 lances de uma moeda) e queremos tirar uma conclu-são para a população (probabilidade de Cara) – esta operação é chamada de

inferência estatística, e é construída levando-se em conta uma margem de

erro na conclusão, obtida através de raciocínio probabilístico. Na seção ante-rior vimos como trabalhar com amostras, sob o ponto de vista de análise de dados. Não abordaremos aqui nesta apostila a análise inferencial (que pode ser vista nas referências bibliográficas) e passaremos a desenvolver noções básicas de probabilidade.

Como já comentamos na introdução, a área de probabilidade começou a ser desenvolvida para responder questões propostas em jogos de azar, desde o sé-culo XVII, mas a área desenvolveu-se muitíssimo desde então. O termo pro-babilidade faz parte do senso comum e as pessoas vivem o cotidiano calculan-do tacitamente algumas probabilidades: desde situações de sua vida pessoal (organizando-se para chegar ao trabalho no horário, levando em conta as cir-cunstâncias do tráfego; agasalhando-se ao sair de casa se a previsão do tempo indicar uma frente fria; não tomando determinados remédios que possam ter efeitos colaterais em parte das pessoas etc) até tomadas de decisão em sua vida profissional (abrir um negócio, aplicar dinheiro na Bolsa de Valores etc.).

Trabalharemos aqui algumas noções elementares do cálculo de probabili-dades, para começar a pensar a incerteza. Antes mesmo de definir o termo probabilidade, vamos caracterizar três situações distintas:

(16)



Normalmente as pessoas sugerem como resposta o valor 50% (1/2) para a Situação A, e argumentam que esta resposta se deve ao fato de os valores possíveis serem dois (Cara ou Coroa) e os favoráveis apenas um (Cara), o que produziria o quociente 1/2. Quando se passa à Situação B, em que há também dois valores possíveis (germinar, não germinar) a resposta imediata é igual à anterior, mas após uma pequena discussão, perguntando se elas comprariam uma saca de sementes, em que a probabilidade de germinação por semente fosse igual a 1/2, imediatamente percebem que não faz sentido aplicar a mes-ma regra. Geralmente alguém sugere fazer um experimento plantando um número grande de sementes, para observar quantas germinam. Já com a Situ-ação C, começam a perceber que os três problemas têm naturezas diferentes e que nem a primeira situação nem a segunda poderiam ajudar a responder a pergunta formulada na terceira situação.

A resposta 1/2 para a pergunta da Situação A deve-se, possivelmente, ao costume de ser usada uma moeda para decidir qual time começa jogando determinada partida – isso “atestaria” a qualidade de “honestidade” intrínseca da moeda, dando a mesma chance para qualquer dos dois resultados. Está aqui então implícita a premissa que deve ser colocada para que a resposta dada à Situação A seja verdadeira: ambos os resultados (Cara e Coroa) têm a mesma chance de ocorrer, o que naturalmente levaria ao cálculo da probabili-dade de Cara no lançamento de uma moeda honesta uma vez, através da cha-mada definição clássica de probabilidade:

Situação A: Situação A:Situação A:

Situação A:Situação A: qual a probabilidade de sair Cara no lançamento de uma moeda uma vez?

Situação C: Situação C: Situação C:

Situação C: Situação C: qual a probabilidade de o Brasil ganhar a próxima Copa do Mundo de futebol?

Situação B: Situação B: Situação B: Situação B:

Situação B: qual a probabilidade de uma semente germinar ao ser plantada?

Para a situação B, ao se fazer o experimento com as sementes, toma-se como probabilidade o valor para o qual tende a freqüência relativa de semen-tes germinadas (aqui está implícita a noção de limite, que não será explorada neste texto) após um número muito grande de ensaios. Assim temos a

defini-ção freqüentista de probabilidade:

Esta definição leva em conta um resultado (Lei dos Grandes Números – Bernoulli, séc. XVII) que diz que à medida que os ensaios vão aumentando

número de casos favoráveis número de casos possíveis

P(Cara) =

número de sementes germinadas número de sementes plantadas

P(germinar) ≅

(17)



(sementes idênticas plantadas sob as mesma condições), a freqüência relativa vai se estabilizando e aproximando-se do valor teórico da probabilidade de germinar.

Nessa tabela os valores 200 e 200 significam o total de funcionários tanto do sexo masculino quanto do feminino, sem levar em conta opinião. De modo análogo, 190 e 210 representam a quantidade de sim e não, respectivamente, sem levar em conta o sexo. Os valores internos representam conjuntamente sexo e opinião – por exemplo, há 140 funcionários que são do sexo feminino e que responderam sim.

Opinião Opinião Opinião Opinião Opinião Sexo SexoSexo Sexo Sexo M MM M M 50 150 200200200200200 F FF F F 140 60 200200200200200 total totaltotal total total 190190190190190 210210210210210 400400400400400 sim simsim sim

sim nãonãonãonãonão totaltotaltotaltotaltotal

Bem diferente dessas duas abordagens é a Situação C, sobre a probabili-dade de o Brasil ganhar a próxima Copa do Mundo de futebol. Neste caso, não é razoável pensar nem em aplicar a definição clássica (que teria que su-por que as possibilidades têm igual chance de ocorrer) e nem a def inição freqüentista (pois não há como gerar dados através de repetição). A resposta será de caráter individual, baseada tanto em desempenhos anteriores (regis-tros históricos) da seleção brasileira e das demais participantes, como no co-nhecimento do estágio atual das mesmas e ainda em um “sentimento” particu-lar, que pode mudar de indivíduo para indivíduo. O caráter subjetivo desta situação sugere a definição de probabilidade subjetiva, que é a opinião indivi-dual sobre determinado resultado, a qual pode ou não ser baseada em infor-mação anterior (inforinfor-mação a priori). Assim, podemos chamar genericamen-te de p a Probabilidade (Brasil ganhar a próxima Copa do Mundo de Fugenericamen-te-

Fute-bol) – alguém pode colocar 0,8 (80%) ou 0,30 (30%) ou qualquer outro valor

entre 0 e 1 (ou entre 0% e 100%) .

O que há de comum entre essas três abordagens é que, para todos, a pro-babilidade (p) é um número entre 0 e 1 que goza de algumas propriedades e, em cada situação, devemos verificar o processo mais adequado para calculá-la. Resumindo, temos que 0 p 1.

Exemplo 3: havia um boato na empresa MEX de que os funcionários estariam

descontentes com o salário. O diretor de RH resolveu fazer uma pesquisa entre os seus 400 funcionários, os quais foram chamados a responder sim ou não à seguinte pergunta:

Você aceita uma redução de jornada com redução de salário?

Os resultados foram registrados na chamada tabela de contingência como segue:

(18)



O gerente faz um sorteio aleatório de uma viagem entre todos os 400 funcionários. Por sorteio aleatório entende-se um processo em que todos os elementos têm igual probabilidade de serem sorteados – por exemplo, nume-rar todos os funcionários, colocar os números em uma urna e sortear um ele-mento da urna. Este sorteio é encarado como um processo normalmente de-nominado de experimento.

Vamos olhar os resultados possíveis dentro de três perspectivas: a) sexo do sorteado; b) opinião do sorteado; c) sexo e opinião do sorteado. Na primei-ra perspectiva, o conjunto de todos os resultados possíveis seria {M,F}. Na segunda, o conjunto de todos os resultados possíveis seria {SIM, NÃO} – nessas duas primeiras perspectivas estamos somente interessados no compor-tamento marginal do elemento sorteado, ou seja, quero saber algo sobre a variável sexo ou algo sobre a variável opinião. A terceira perspectiva é relaci-onada ao elemento sorteado sob o ponto de vista de sexo conjuntamente com opinião e o conjunto de todos os resultados possíveis seria {M SIM, M NÃO, F SIM, F NÃO}. Esses elementos descritos no último conjunto são os compo-nentes do interior da tabela deste exemplo.

Trabalhar com probabilidades pode ser simplificado se usarmos os dados dispostos em tabelas, ou ainda se considerarmos diagramas de árvore. Vamos considerar o experimento de sortear ao acaso um funcionário dentre os 400 funcionários (já descrevemos o sorteio) e como o sorteio é aleatório (por su-posição) todos os funcionários têm a mesma chance de serem sorteados. En-tão, nesse caso, para o cálculo de probabilidades, faz sentido pensar na defi-nição clássica já vista anteriormente e é este esquema que vamos adotar. Va-mos responder, uma a uma, às seis perguntas seguintes, sempre com referên-cia ao sorteio do funcionário e você, em alguns casos, poderá se reportar implicitamente a elementos da teoria de conjuntos (como, por exemplo, as noções de união e intersecção):

1 – qual a probabilidade de o sorteado ser do sexo feminino? 2 – qual a probabilidade de o sorteado ter dito não?

3 – qual a probabilidade de o sorteado dizer não ou ser do sexo feminino? 4 – qual a probabilidade de o sorteado ter dito não e ser do sexo feminino? 5 – qual a probabilidade de o sorteado ter dito sim e ser do sexo feminino? 6 – qual a probabilidade de o sorteado ser do sexo feminino dado que

respon-deu não?

Respostas:

1 – P(F) = ? Resposta: P(F) = (200/400) = 1/2 = 0,5 (ou 50%) 2 – P(NÃO) = ? Resposta: P(NÃO) = (210/400) = 0,525 (ou 52,5%)

As respostas às questões 1 e 2 foram obtidas diretamente dos valores marginais, ou seja, 200 funcionários do sexo feminino entre os 400 funcionários e 210 funcionários que responderam não à pergunta entre os 400 funcionários.

3 –P ( NÃO ou F) = ? (União )

Resposta: P (NÃO ou F)= (210 + 200 – 60)/400 = (350/400)= (7/8) = = 0,875 (ou 87,5%)

(19)



A resposta à questão 3 foi obtida através da verificação de quantos funcionários podem ser ou NÃO ou F, ou mesmo ambos, ou seja, é a união entre os funcionários NÃO com os funcionários F. Veja que são retirados da soma os 60 funcionários que foram contados duas vezes.

A resposta à questão 4 foi obtida diretamente do valor do interior da tabela, ou seja, dentre os 400 funcionários, 60 responderam não e ao mesmo tempo são do sexo feminino. A questão 5 tem raciocínio análogo. Verifique!

A resposta à questão 6 levou em conta a informação, ou seja, podemos pensar que, quando foi feito o sorteio o diretor olhou o resultado e avisou: o funcionário sorteado respondeu não! Com essa informação, o total de funcionários diminuiu de 400 para 210, que é o total marginal para as respostas não e então o denominador para o cálculo da probabilidade fica sendo 210 e o numerador é igual ao número mulheres na categoria não (60).

Vamos agora dar uma forma alternativa à resposta da questão – P (F | NÃO) – através da definição de probabilidade condicional (sabendo que = condicionado a)

P (F | NÃO) = [ P (F e NÃO)] / (P(NÃO)] (8)

4 – P(NÃO e F) = ? (Intersecção )

Resposta: P(NÃO e F) = (60/400) = 0,15 (ou 15%).

U

5 – P(SIM e F) = ? Resposta: P (SIM e F) = (140/400) = 0,35 (35%) Antes de passarmos a discutir a próxima questão, vamos voltar à questão 3, que trata da probabilidade da união de dois eventos. Genericamente, para dois eventos A e B, a probabilidade de A ou B (A união B) é dada por

P(A B) = P(A) +P(B) – P(A B)

Evidentemente, se a intersecção for vazia, temos que a probabilidade as-sociada é nula, e dizemos que A e B são eventos disjuntos. Vem então que, se A e B forem eventos disjuntos (ou mutuamente exclusivos),

P(A B) = P(A) + P(B)

Como responder à questão 6? Aqui surge uma linguagem nova: dado que. Isso significa que queremos um valor de probabilidade, mas temos alguma informação adicional (dado que = sabendo que). A notação que usaremos para dado que será uma barra vertical | , como a seguir:

6 – P (F dado NÃO) = P (F | NÃO) = ?

Resposta: P (F | NÃO) = (60/210) 0,286 (ou 28,6%).

(20)



Com os resultados já calculados, e com P (F e NÃO) = P (NÃO e F) (veri-fique!), vem

P (F | NÃO) = [0,15 / 0,525] 0,286 (ou 28,6%),

com resposta igual à já obtida diretamente da tabela.

Através da expressão (6) podemos derivar uma expressão formal para a

probabilidade conjunta, como nas questões 4 e 5, ou seja:

Verifique que P (NÃO | F) é igual a (60/200) = 0,30 (ou 30%)!

(9) P(NÃO e F) = P(F e NÃO) = P(F |NÃO).P(NÃO) = P(NÃO |F).P(F)

P(SIM e F) = P(F e SIM ) = P(F |SIM).P(SIM) = P(SIM |F).P(F)

Vamos retomar a questão 6 para introduzir um novo conceito:

indepen-dência entre eventos. Nessa questão, calculamos a probabilidade condicional

de o sorteado ser do sexo feminino sabendo que a resposta foi não, isto é, P (F | NÃO). O resultado foi aproximadamente 0,286 ou, em termos percentuais, 28,6%, o que significa que sabendo que a resposta foi não, a probabilidade de o sorteado ser do sexo feminino é de 28,6%. Na questão 1, vimos que a proba-bilidade de o sorteado ser do sexo feminino é de 50%, o que mostra que quan-do damos a informação de que a resposta foi não, a probabilidade de ser quan-do sexo feminino diminui substancialmente (de 50% para 28,6%). Isso significa que os eventos resposta não e sexo feminino são dependentes, pois a informa-ção de que um ocorreu muda a probabilidade de o outro ocorrer.

Voltando à explicação dada na questão 6, quando o diretor avisou que o funcionário sorteado tinha respondido não, os funcionários do sexo feminino já viram suas chances diminuírem, pois com resposta não havia 150 homens e somente 60 mulheres, ou seja, repetindo, saber que a resposta do funcioná-rio sorteado foi não diminuiu a chance do sorteado ser do sexo feminino. Sob o ponto de vista da pesquisa que deu origem à tabela, é fácil ver então que as mulheres, diferentemente dos homens, aceitam, em sua maioria, a redução de jornada com redução de salário.

De um modo geral, dizemos que dois eventos A e B são

independentes independentesindependentes

independentesindependentes quando a informação de que B ocorreu não altera a probabilidade da ocorrência de A, isto é, (P(A|B) = P(A))(P(A|B) = P(A))(P(A|B) = P(A))(P(A|B) = P(A))(P(A|B) = P(A)). No caso descrito acima, os eventos FFFFF e NÃONÃONÃONÃONÃO são dependentes.

(10)

A última afirmação implica que se A e B forem eventos independentes, então

pois, de acordo com a definição de independência, P(A|B) = P(A). A expres-são (11) pode ser usada como alternativa à definição (10) para verificar se dois eventos são independentes.

(21)



.

Ao conjunto de todos os resultados possíveis associados a um experimen-to dá-se o nome de Espaço Amostral (S) e os subconjunexperimen-tos do espaço amostral são chamados de Eventos (ver pág. 26). Se o experimento relacionar-se a características numéricas contínuas – por exemplo, o tempo de duração de uma lâmpada sorteada ao acaso de um lote de lâmpadas –, o espaço amostral poderia ser descrito como {t | t 0}. Contudo, nesta apostila só abordaremos situações numéricas discretas.

.

Podemos começar o diagrama por uma ou por outra característica – va-mos começar pela opinião. Partindo do princípio de que o sorteado ou é do sexo feminino ou do sexo masculino, construiremos dois ramos iniciais partin-do partin-do mesmo ponto e depois prosseguimos com os outros ramos referentes à característica sexo (M ou F), conforme segue:

(22)



. .

O diagrama de árvore tem todos os ramos e probabilidades associados ao experimento de sortear um indivíduo da tabela inicialmente apresentada. Os ramos iniciais, antes do “traço” vertical, representam eventos marginais da tabela e as probabilidades também podem ser chamadas de marginais. Como já havia sido visto na questão 2, P(NÃO) = (210/400) = 0,525. Como com relação à OPINIÃO há somente duas possibilidades, podemos encontrar a P(SIM) pelo complementar, ou seja, P(SIM) = 1 – P(NÃO) = 1 – 0,525 = 0,475 (= 190/400). Depois do “traço”, os eventos são considerados condicionais e devem levar em conta a ocorrência antes do “traço”. Assim, o valor 50/190 é P(M|SIM). O valor da probabilidade pedida na questão 6 é obtido diretamente no último ramo após o traço, ou seja, P(F|NÃO) = 60/210 0,286 (28,6%).

Ainda observando a árvore, vemos que ao percorrer os caminhos, desde o nó inicial, temos quatro resultados, SIM M, SIM F, NÃO M e NÃO F, cujas probabilidades podem ser obtidas através do produto dos ramos correspon-dentes. Na verdade, isso não é novidade, pois as relações vistas anteriormente permitem fazê-lo, ou seja, cada probabilidade pode ser calculada pelo produ-to entre uma probabilidade marginal e uma condicional. De faprodu-to, temos, por exemplo, para cálculo de P(NÃO e F) o produto (210/400).(60/210) = 0,15 (ou 15%, valor já obtido como resposta à questão 4).

Veremos a seguir uma aplicação do diagrama de árvore para um problema da área financeira.

Exemplo 4

(FUVEST 2000). Um investidor quer aplicar 120 mil reais. Seu corretor lhe

oferece um investimento em duas fases, com as seguintes regras:

I) Na primeira fase do investimento, ocorrerá um entre os dois eventos seguin-tes: com probabilidade p, o investidor ganha metade do que investiu; com probabilidade (1-p), o investidor perde 1/3 do que investiu.

(23)



II) Na segunda fase do investimento, a quantia f inal da primeira fase será reinvestida, de forma independente da primeira fase. Neste novo investimen-to, ocorrerá um dentre os dois eventos seguintes: com probabilidade 1/2, o investidor ganha a quarta parte do que foi reinvestido; com probabilidade 1/2, o investidor perde metade do que foi reinvestido.

a) Se o investidor aplicar seu dinheiro desta forma, com que valores pode ficar ao término do investimento? Qual a probabilidade, em função de p, de ficar com cada um desses valores?

b) Uma revista especializada informa que, neste investimento, a probabilida-de probabilida-de perprobabilida-der dinheiro é probabilida-de 70%. Admitindo como correta a informação da revista, calcule p.

Vamos resolver esse problema aplicando o diagrama de árvore:

Ganha: (1/2)p Perde: (1/2)p Ganha: (1/2)p (1-p) Perde: (1/2)p (1-p) 225.000 90.000 100.000 40.000 180.000 80.000 p (1-p) 1/2 1/2 1/2 1/2 Quantia inicial: R$ 120.000,00

Observação: A premissa de que a segunda fase é independente da primeira fase permite colocar na segunda parte dos ramos os valores 1/2 e 1/2 direta-mente.

Resposta:

a) O investidor pode ficar com qualquer dos seguintes valores (e respectivas probabilidades): R$ 225 000,00 [(½)p], R$ 90 000,00 [(½)p], R$ 100 000,00 [½(1-p)] ou R$ 40 000,00 [½(1-p)].

b) Levando em conta as quatro possibilidades, o investidor só não perde na primeira delas. Como, segundo a revista, a probabilidade de perder é de 70%, a probabilidade de não perder (complementar!) é de 30% e temos então que (½) p = 0,30. Portanto p = 0,60.

Outra maneira de chegar a este resultado é igualar a probabilidade de

perder a 70%, ou seja,

P(perder) = [(½)p+ (½)(1-p)+( ½)(1-p)] = 0,70,

(24)



Os exemplos analisados neste tópico de probabilidades procuraram dar sentido aos conceitos, através de esquemas simples quer seja com tabelas ou através de diagramas de árvore, sempre no contexto discreto. No entanto, para experimentos mais sofisticados, ainda no âmbito do discreto, por exem-plo, o caso em que o número de ramos se torna proibitivo, temos que recorrer a técnicas de contagem para o cálculo de probabilidades e a área de análise combinatória, que será desenvolvida na próxima seção, fornecerá elementos para que esses cálculos sejam facilitados. O leitor, interessado em probabili-dades associadas a experimentos em que a característica medida é contínua, achará material nas referências bibliográficas.

A seguir, temos um resumo dos principais resultados descritos nesta seção para eventos genéricos A e B (associados a um espaço amostral S).

Probabilidade da União Probabilidade da União Probabilidade da União Probabilidade da União Probabilidade da União

P(A ou B) = P(A B) = P(A) +P(B) – P(A B) Probabilidade Condicional

Probabilidade Condicional Probabilidade Condicional Probabilidade Condicional Probabilidade Condicional

P(A | B) = P(A B) / P(B) para P (B) 0 Probabilidade Conjunta

Probabilidade Conjunta Probabilidade Conjunta Probabilidade Conjunta Probabilidade Conjunta

(25)

Qual é a chance de se ganhar na Loto ou na Mega-Sena? E na Loteria Esportiva? Calcular a probabilidade de se ganhar num jogo de azar passa muitas vezes por conhecer todos os elementos com os quais se está lidando e depois quais desses são os elementos “ganhadores”. Por exemplo, se uma moeda é lançada duas vezes, sucessivamente, temos quatro possíveis resulta-dos: (cara, cara), (coroa, cara), (cara, coroa) e (coroa, coroa). Se “ganhamos” quando obtivermos exatamente duas caras, então, se a moeda for honesta, só temos uma chance em quatro de ganhar. Neste caso foi fácil contar quantos são os casos possíveis (espaço amostral) e quantos são os (eventos) favorá-veis. E se fossem 50 lançamentos? E no caso de jogos como da Loto ou da Mega-Sena, quantas são todas as combinações possíveis de números?

Assim, para a resolução de problemas desse tipo, é essencial conhecer a quantidade de elementos de determinados conjuntos, sem ter que, efetiva-mente, listá-los e contá-los. Em outras situações concretas também é necessá-rio saber o número de elementos de determinados conjuntos.

Combinatória*

Quantos carros podem ser lacrados na cidade de São Paulo com placas com 3 letras e 4 algarismos?

Problemas relacionados à contagem de elementos de um conjunto são trata-dos numa área da matemática conhecida como Análise Combinatória, ou ape-nas Combinatória. O estudo de problemas desse tipo é muito antigo e chamou a atenção de muitos matemáticos importantes como L. Euler (1707-1783) e B. Pascal (1625-1662), entre outros. Essa área tem tido um grande crescimento nas últimas décadas, devido ao desenvolvimento da ciência da computação. Problemas de enumeração (contagem) aparecem com muita freqüência em teoria dos grafos, em análise de algoritmos etc. Muitos problemas importan-tes podem ser modelados matematicamente usando a teoria dos grafos (pro-blemas de pesquisa operacional, de armazenamento de informações em ban-cos de dados nos computadores e também problemas matemátiban-cos teóriban-cos, como o famoso problema das 4 cores, que veremos mais adiante).

(26)



que muitos problemas de contagem podem ser tratados usando apenas alguns princípios básicos. Vamos enfatizar a compreensão plena do problema trata-do e o reconhecimento da técnica adequada em cada caso, não as fórmulas, que são muito úteis, mas resolvem apenas tipos especiais de problemas.

Vamos começar discutindo um problema simples de contagem. Em um car-dápio de um restaurante italiano estão listados 5 tipos de massas e 7 tipos de molhos distintos. Quantos pedidos distintos podem ser feitos? É fácil obter a resposta: 35. Foi utilizado um princípio básico de contagem: para cada tipo de massa escolhida tem-se 7 molhos diferentes para escolher, e assim, temos 5 x 7 diferentes pratos.

Vamos retomar o problema das placas de carros na cidade de São Paulo. Quantas placas de automóveis podem ser formadas usando-se três letras (in-clusive K, Y e W) e quatro algarismos? Veja o esquema abaixo de uma placa de automóvel:

Para formar uma placa, temos que escolher uma letra entre 26 para colo-car na primeira posição. Escolhida essa letra, temos 26 escolhas possíveis para a segunda posição. Então temos 26 x 26 = 676 possibilidades de preen-chimento das duas primeiras letras da placa. Mas ainda temos que preencher mais uma casa com uma letra. Assim podemos ter 26 x 26 x 26 = 17.576 maneiras de preencher a placa com 3 letras. Falta ainda colocar os 4 algaris-mos. Em cada posição temos 10 escolhas de algarisalgaris-mos. Então temos 10 x 10 x 10 x 10 x 10 = 10.000 possibilidades. Portanto, no total teremos 175.760.000 placas. Como para cada carro temos apenas uma placa, esta é a quantidade de carros que podem ser lacrados na cidade de São Paulo!

Neste caso, esta técnica de efetuar a contagem foi eficiente.

Vejamos mais um exemplo.

Uma bandeira é formada por quatro listras que devem ser coloridas com até 4 cores, por exemplo, amarelo, vermelho, branco e preto, não devendo ter listras adjacentes com a mesma cor. De quantos modos a bandeira pode ser colorida?

Podemos pintar a primeira listra com 4 cores diferentes e a segunda listra com 3 cores. Mas 3 cores podem ser usadas para pintar a terceira listra, pois pode-se repetir a cor usada na primeira listra. E finalmente podemos usar 3 cores para pintar a quarta listra. Portanto temos 4 x 3 x 3 x 3 = 108 bandeiras diferentes.

Nos problemas acima, usamos um princípio básico de contagem que pode ser escrito, na forma geral, da seguinte maneira.

1a 2a 3a 1o 2o 3o 4o

letra letra letra algarismo algarismo algarismo algarismo

1a 2a 3a 4a

(27)



Princípio da Multiplicação Princípio da MultiplicaçãoPrincípio da Multiplicação Princípio da MultiplicaçãoPrincípio da Multiplicação

Se uma decisão d1 pode ser tomada de p1 maneiras e se, uma vez tomada a decisão d1, a decisão d2 puder ser tomada de p2 maneiras, então o número de maneiras de se tomarem as decisões d1 e d2 é p1 x p2 maneiras.

Facilmente, o princípio acima pode ser generalizado para uma quantidade finita de decisões.

Agora, usando o princípio da multiplicação, resolva alguns problemas de contagem.

Um outro princípio elementar de contagem diz respeito ao número de elementos da união de conjuntos.

Um problema de contagem muito interessante é o seguinte: ao se colorir um mapa, pode-se usar a mesma cor mais de uma vez, desde que dois países que têm fronteira comum sejam pintados de cores diferentes. Usando no

má-ximo 4 cores

, de quantas maneiras se pode colorir um mapa formado pelos seguintes países: Brasil, Uruguai, Argentina e Paraguai? E um mapa formado por Brasil, Uruguai, Argentina, Paraguai e Chile? E pelos países Brasil, Ar-gentina, Paraguai e Bolívia?

Usando no máximo 3 cores, seria possível pintar um mapa formado pelos países Brasil, Uruguai, Argentina e Paraguai? E o mapa formado por Brasil, Argentina, Paraguai e Bolívia?

O Problema das 4 Cores O Problema das 4 CoresO Problema das 4 Cores O Problema das 4 CoresO Problema das 4 Cores.

Na resolução do problema anterior, você percebeu que, em alguns casos, não se pode usar menos de 4 cores para pintar um determinado mapa. Mas, fazendo alguns testes, percebe-se que é possível pintar vários mapas com até 4 cores. Será possível pintar qualquer mapa com até 4 cores? Este atraente problema pode ser formulado matematicamente, já que “mapas” não deixam de ser subdivisões do plano que não se sobrepõem. O Problema das 4 Cores, como é conhecido hoje, foi proposto pela primeira vez em 1852, por Francis Guthrie. Contudo, só foi publicado em 1878, após ter sido estudado por vários matemáticos da época. Em 1879, Kempe apresentou a primeira “demonstração” da conjectura, cujo erro foi descoberto por Heawood, que provou que o resultado era verdadeiro para 5 cores. Finalmente, depois de

(28)



O problema das 4 cores é um típico problema de Teoria dos Grafos. Um “grafo” é um tipo de diagrama com vértices e linhas. Podemos fazer um es-quema do problema das 4 cores usando um diagrama do tipo,

onde cada vértice é um país. Uma linha ligando os vértices significa que os países têm fronteiras em comum. Um outro problema fascinante deste tipo é o

Problema das Sete Pontes de Königsberg, que foi resolvido por L. Euler em

1735. Como este é um assunto bastante vasto, não o discutiremos aqui. Se você ficou interessado, leia sobre o problema na Revista do Professor de Ma-temática (Alguns problemas clássico sobre grafos, n. 12, 1988) ou no site http://www.prof2000.pt/users/agnelo/pontesh.htm.

Voltemos aos problemas de contagem.

Vamos fazer algumas generalizações. Consideremos n objetos distintos. De quantas maneiras n objetos diferentes podem ser ordenados? De quantas for-mas podemos permutá-los? A resposta é fácil agora: n(n-1).(n-2)...3.2.1=n! Se, por outro lado, desejamos saber de quantos modos podemos ordenar m objetos dentre os n, logo m n, a resposta é de

maneiras.

E

LIMINANDO

REPETIÇÕES

Vamos ver agora outros tipos de problemas de contagem.

Quantas comissões de 4 alunos podem ser formadas numa classe de 7 alunos?

Para o primeiro lugar da comissão temos 7 escolhas, para o segundo lugar 6 escolhas, para o terceiro lugar 5 escolhas e para o quarto lugar 4 escolhas, o que nos dá, pelo princípio da multiplicação, 7.6.5.4 = 840 escolhas de 4 alu-nos. Entretanto, 840 não é a quantidade total de comissões! Note que a co-missão formada pelos alunos A, B, C e D é a mesma daquela formada por B, D, C e A. Precisamos saber quantas vezes cada comissão foi contada

repe-tidamente. Fixemos 4 alunos (uma comissão). De quantas maneiras podemos

formá-la? Chamando um aluno por vez, para a primeira chamada temos 4 opções, para a segunda 3, para a terceira 2 e para a quarta apenas 1. Logo

(29)



10 2 2 3 ! ! ! ! 840 24 =35 4 2 12 ! !=

podemos chamar os alunos de 4.3.2.1=24 maneiras diferentes. Assim temos que, das 840 escolhas, cada grupo de 24 representa a mesma comissão. Portanto, o total de comissões será de .

A seguir, vamos ver outra situação onde se deve usar a divisão para elimi-nar repetições e efetuar a contagem.

Um anagrama é um código formado pela permutação das letras de uma palavra, podendo ou não originar palavras com significado.

Quantos são os anagramas da palavra CASA?

Se as 4 letras fossem distintas então teríamos 4! = 24 anagramas. Neste caso, estamos pensando que A C S A é diferente de A C S A. Só que temos a

mesma palavra A C S A. Assim, como cada anagrama foi contado duas vezes (que é o número de permutações dos dois A’s) temos na verdade anagra-mas diferentes.

Quantos são os anagramas da palavra MATEMATICA?

Se as 10 letras fossem todas diferentes, uma aplicação simples do princí-pio da multiplicação forneceria 10! anagramas. Entretanto, podemos permu-tar os 2 T’s, os 2 M’s e, ignorando o acento, também os 2 A’s. Isso significa que cada anagrama está sendo contado 2!2!3! vezes. Portanto, existem

anagramas distintos.

Vamos analisar mais uma situação.

Qual é o número de rodas de ciranda distintas que podem ser formadas com 6 crianças?

Temos certamente 6! filas de crianças. Entretanto, quan-do organizadas em um círculo, duas filas formam a mesma roda de ciranda se houver coincidência das crianças após uma rotação de uma das rodas (ver o diagrama a seguir). Podíamos dizer que tais filas são “equivalentes”.

Dessa forma, 6 filas distintas originam uma mesma roda de ciranda. Portanto, o número de rodas de ciranda é6

6 5 !

!

=

Em cada situação anterior, a divisão foi utilizada aqui para eliminar as repetições. Identificando os elementos que são “iguais” podemos, usando a divisão, eliminá-los da contagem.

Examinando mais detalhadamente os últimos exemplos, percebemos que podemos dar um tratamento mais geral para situações onde a divisão é usada para eliminar repetições em problemas de contagem.

Considere a seguinte situação: um conjunto A contém elementos de

diver-sos tipos distintos, digamos, tipo 1, tipo 2, tipo 3, ... tipo k. Se o número de

(30)



F

AZENDO

GENERALIZAÇÕES

Do que discutimos até aqui podemos ver que alguns problemas de contagem são muito semelhantes e envolvem sempre o mesmo tipo de raciocínio e cálculo. Numa escolha de m objetos dentre n objetos distintos, no qual m < n, a ordem em que fazemos a escolha determina objetos diferentes. Em todas essas situações, o número de escolhas possíveis é n(n-1).(n-2)...(n-m+1). Por serem muito freqüentes recebem um nome especial: arranjo simples de m elementos em n, ou como é mais comum, arranjo de n elementos tomados m a m. Uma notação bastante usada para indicar esse resultado é

Em outras situações, temos que fazer uma escolha de m objetos dentre n objetos, onde m < n, e a ordem em que fazemos a escolha não determina obje-tos diferentes. Se a ordem fosse relevante, obteríamos n(n-1).(n-2)...(n-m+1) coleções de objetos. Só que essa quantidade de coleções é maior do que a correta, já que as coleções estão sendo contadas várias vezes. Para eliminar essas repetições usamos, então, a divisão, como nos exemplos vistos anterior-mente. O número de coleções é:

Como também essa situação é bastante comum, ela recebe um nome espe-cial: combinação simples de m elementos em n, ou ainda, combinação de n elementos tomados m a m. E o resultado é denotado por

C

n

m n

m

n

m

n m

=

=





!

!(

)!

Agora, se o número total n de elementos de A e o número m de objetos de cada tipo são conhecidos, então o número de tipos distintos é . Ocorre que, como nos exemplos anteriores, em muitas situações, estamos interessa-dos em calcular o número de tipos de elementos distintos.

Agora, usando este novo “princípio” e tudo que já discutimos, você certa-mente poderá resolver mais problemas de contagem.

(31)



Apesar dos problemas anteriores aparecerem com freqüência, a ponto de terem um nome especial (e uma fórmula), os problemas de contagem não são, em geral, do tipo arranjo ou combinação. Por isso, quando se deparar com um problema de contagem, não se preocupe de imediato em qual fórmula usar. Em geral, muita engenhosidade e várias fórmulas serão utilizadas para resolvê-los.

D

ESAFIOS

Vamos propor alguns problemas de contagem de diferentes graus de difi-culdade. Ao tentar resolvê-los, lembre-se: problemas de aparência simples podem ser difíceis. Para resolvê-los procure fazer uma representação. Lem-bre-se que o objetivo é o de contar o número de objetos de uma certa classe. Tente identificar precisamente quando um objeto pertence à classe e quando dois deles devem ser considerados distintos. Examine quantas decisões você deve tomar para executar a contagem.

Caso ainda não esteja claro como proceder, tente outras estratégias. Tente dividir em subcasos que você saiba resolver. Pode ser útil “esquecer” algumas das condições exigidas para que um objeto pertença à coleção. Isso, em geral, dará origem a uma classe maior que a desejada. É necessário, portanto, ex-cluir posteriormente os objetos “indesejados”. Depois que, aparentemente, o problema foi resolvido, repense na sua solução, veja se você não está contan-do alguns casos mais de uma vez ou está se esquecencontan-do de algum.

1. No quadro abaixo, de quantos modos é possível formar a palavra MATEMATICA, partindo de M e indo sempre para a direita ou para baixo?

M MM MM M M M M M AAAAA M MM MM AAAAA TTTTT M M M M M AAAAA TTTTT EEEEE M MM MM AAAAA TTTTT EEEEE MMMMM M M M M M AAAAA TTTTT EEEEE MMMMM AAAAA M MM M M AAAAA TTTTT EEEEE MMMMM AAAAA TTTTT M M M M M AAAAA TTTTT EEEEE MMMMM AAAAA TTTTT IIIII M MM M M AAAAA TTTTT EEEEE MMMMM AAAAA TTTTT IIIII CCCCC M M M M M AAAAA TTTTT EEEEE MMMMM AAAAA TTTTT IIIII CCCCC AAAAA

2. Um vagão de metrô tem 10 bancos individuais, sendo 5 de frente e 5 de costas. De 10 passageiros, 4 preferem sentar de frente, 3 preferem sentar de costas e os demais não têm preferência. De quantas maneiras os passageiros podem sentar, respeitando as preferências? (Resposta 43200)

3. Quantos números inteiros entre 100 e 999 são ímpares e possuem três dígi-tos distindígi-tos? (Resposta 320).

O T

RIÂNGULO

DE

P

ASCAL

(32)



Vamos denotar por K a face “cara” da moeda e por C a face “coroa”. Assim, temos KKKC, KKCK, KCKK e CKKK combinações vencedoras. Na verdade, já vimos este tipo de problema: esta é a quantidade de anagramas formados por KKKC. Assim, temos exatamente combinações. Mas se as combinações ganhadoras são as com exatamente 2 caras e 2 coroas? Neste caso são combinações. Note também que o número de combinações

com exatamente 3 coroas é também 4.

4 3 4 ! != 4 2 2 6 ! ! !=

Você já notou que se n é o número de moedas a serem jogadas e se m é o número de caras (ou coroas) que se deseja, então o número de combinações “vencedoras” é exatamente:

É claro que se m é o número de caras (ou coroas), então n-m é o número de coroas (ou caras) e assim temos facilmente que,

Esses números aparecem em muitas situações e possuem várias relações surpreendentes. Tais relações foram observadas por vários matemáticos como o árabe Al-Karaji (fins do século X) e Niccoló Fontana de Brescia, conhecido por Tartaglia (1499-1557).

(33)



Foi B. Pascal (1623-1662) quem popularizou este “triângulo” quando pu-blicou, em 1654, um tratado mostrando a relação dos coeficientes de (a+b)n com os valores que aparecem nas linhas do triângulo. Apesar de ser conheci-do antes, o triângulo aritmético passou a ser conheciconheci-do como o Triângulo de

Pascal.

Calculando os valores em cada linha e coluna, temos:

Triângulo de Pascal

1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 1 0 1 0 5 1 1 6 1 5 2 0 1 5 6 1 1 7 2 1 3 5 3 2 2 1 7 1 ... ...

Note algumas propriedades interessantes. Se selecionarmos uma linha n qualquer e adicionamos ao elemento da coluna p o elemento da coluna p+1 o resultado está na (n+1)-linha e (p+1)-coluna. Veja neste exemplo.

1. Michael Stifel (1486-1567) é considerado como o maior algebrista alemão do século XVI.

1 3 + 3 1 1 4 6 4 1

C

C

C

C

n

n

n

n

n

n n n n n 0 1 2

0

1

2

+

+

+ +

=





+





+





+ +



...

...

 =

2

n

Esta relação é também conhecida como a Relação de Stifel1.

 = + ++ 1 1 1 2 1 1

Retornemos ao jogo de moedas. Sabemos que quando lançamos n moe-das, o número total de resultados possíveis é 2n. Vimos que cada combinação de m caras (ou coroas) aparece vezes. Portanto, somando-se todas as com-binações temos que:

Vamos agora representar os resultados dos lançamentos das moedas de outra maneira.

(34)



Se jogarmos 2 moedas, temos 4 resultados possíveis. Se usarmos o símbo-lo de soma e a propriedade distributiva, todas as combinações possíveis po-dem ser representadas por:

KK + KC + CK + CC = (K + C) (K + C)

Mas neste jogo, KC = CK, isto é, ambas são combinações “vencedoras”. Então:

KK + 2KC + CC = (K + C) (K + C)

No caso de jogarmos 3 moedas, sabemos que existem 8 possíveis resulta-dos, mas as combinações KKC, KCK e CKK são “iguais” para o nosso propó-sito. Assim também são “iguais” as combinações: CCK, CKC, KCC. Portanto:

KKK + 3 KKC + 3 KCC+ CCC = (K + C) (K + C) (K + C)

Podemos ainda simplificar a notação e escrever as seqüências de K ou C na forma de potência. Por exemplo, escrevemos KKK da forma K3.

Assim:

K3 + 3 K2 C + 3 KC 2+ C 3 = (K + C)3

Mas isso pode ser feito sempre. Se jogarmos n moedas e se as combina-ções que têm o mesmo número de K (caras) e C (coroas) são identificadas, ou seja, são “iguais”, então cada combinação aparece vezes. Portanto, em geral, temos que:

Esta é a conhecida fórmula do Binômio de Newton. Isaac Newton (1642-1727) mostrou como desenvolver expressões do tipo (a+b)r, com r racional, e assim a fórmula acabou sendo conhecida com o seu nome. Contudo, o desen-volvimento de uma expressão do tipo (a+b)n já era conhecida e usada antes.

n

m





(K C) n K n K C n K C ... n n n n n n + =    +     +     + + −  − − 0 1 2 1 1 1 2    +     − KC n n C n 1 n n

Observe que as linhas do Triângulo de Pascal são os coeficientes da ex-pressão do binômio.

(35)



Bibliografia

BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica. São Paulo: ed. Saraiva, 2002.

CARNEIRO, V.C. Colorindo Mapas. Revista do Professor de Matemática. São Paulo: SBM, n. 29, 31-35, 1995.

CERRI, C.; DRUCK, I. F.; PEREIRA, A. L. Combinatória Sem Fórmulas. Pro-jeto Pró-Ciências, São Paulo: Fapesp, 2002.

CERRI, C.; DRUCK, I .F. Combinatória Sem Fórmulas. Projeto PEC – Cons-truindo Sempre – PEB II, São Paulo: USP-SEE, 2003.

EVES, H. Introdução à História da Matemática.3. ed. Tradução de H. Domingues. Campinas: ed. Unicamp, 2002.

IEZZI, G. et al. Matemática: Ciência e Aplicações., v. 1, 2 e 3. São Paulo: ed. Atual, 2001.

MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística. São Paulo: Edusp, 2004.

MACHADO, A. S. Matemática na escola do segundo grau. vol 1, 2 e 3. São Paulo: ed. Atual, 1996.

MORGADO et al. Análise Combinatória e Probabilidades. Rio de Janeiro: SBM, 1991.

(36)
(37)
(38)

Referências

Documentos relacionados

Assim, concordamos com Bianchetti (2008), para quem.. Uma educação que forme para a mudança social não pode ser medida como sendo de ‘boa ou má qualidade’, já que a sua

Quando se fala do risco biotecnológico como uma comunicação que viabiliza a formação de uma multiplicidade de estados internos em diversos sistemas sociais, pode-se perceber a

Partindo dos elementos focais que se apresentam nesse trabalho como, o absenteísmo docente nas escolas da rede municipal de ensino; a falta de controle dessas

A Escola Estadual Médio Solimões (EEMS), objeto deste estudo, é considerada uma escola de médio porte, segundo a classificação estabelecida pela Secretaria de

O Fórum de Integração Estadual: Repensando o Ensino Médio se efetiva como ação inovadora para o debate entre os atores internos e externos da escola quanto às

O pesquisador, licenciado em Estudos Sociais com Habilitação Plena em História, pelo Centro de Ensino Superior de Juiz de Fora (CES/JF), concluiu, ainda, o curso de

Assim, almeja-se que as ações propostas para a reformulação do sistema sejam implementadas na SEDUC/AM e que esse processo seja algo construtivo não apenas para os

o estudo das relações entre duas variáveis numéricas, quer ajustando uma função, como, por exemplo, uma reta neste caso (ou mesmo duas, uma para o SEXO masculino e outra para o