Gaussiana - Parˆametros - Cálculo Numérico

4.3 Parˆametros

4.3.6 Gaussiana

Suponha que várias medidas foram feitas de um mesmo fenômeno, por exemplo, o tempo de queda de um objeto que é solto, a partir do repouso, sempre da mesma altura. São feitas n medidas T1, . . . , Tn, e dessas medidas constrói-se um histograma. Para fazer o histograma,

escolhe-se um intervalo ∆t e divide-se a reta dos tempos em intervalos de tamanho ∆t. Esses intervalos podem ser numerados:

I1, . . . , IN, mas para a numera¸c˜ao ser

finita é preciso não incluir aqueles que estão longe dos tempos medidos. Para cada intervalo Ij conta-se o número de

medidas Ti que incidem em Ij, cha-

mando esse n´umero de nj. O histo-

grama ´e desenhado construindo-se barras de base Ij e altura igual a nj.

I₁ I₂ I_j I_N

n

∆t

Nesse problema e em vários outros, a tendência do histograma é adotar o formato apro- ximado de um “sino”. O valor mais provável do que deve ser o tempo de queda (que servirá por exemplo para se estimar a acelera¸cão da gravidade) se situa próximo dos intervalos que apresentam maiores valores de nj, isto é, no “cume” do sino.

Se o experimento não tiver erros sistemáticos, o formato de sino será tanto melhor apro- ximado quanto mais medidas forem feitas e quanto menor forem os intervalos. É claro que a diminui¸cão dos intervalos e o aumento do número de medidas devem ser feitos de forma acoplada, mas isso já é outra história...

O leitor mais atento pode estar pensando que ao mudarmos o número n de experimentos ou o tamanho do intervalo básico ∆t não poderemos comparar um histograma com outro. É claro que se aumentarmos o número n então em média os nj’s devem aumentar, o que dará

histogramas radicalmente diferentes quando n = 500 ou n = 5000, por exemplo, mantidos iguais os ∆t’s. Por outro lado, se mantivermos n mas, digamos, diminuirmos pela metade o tamanho dos intervalos, isso far´a com que em m´edia os nj’s caiam pela metade. Assim, seria

interessante ter um histograma que n˜ao dependesse demais de n e ∆t, e permitisse comparar histogramas do mesmo fenˆomeno constru´ıdos de formas diferentes.

ordenada, colocando as barras `a altura

n∆t.

Com isso, a soma total da área das barras será igual a 1, pois cada barra terá área

∆t · _n∆tnj =nj n

e a soma da ´area de todas as barras ser´a

N X j=1 nj n = 1 n N X j=1 nj= 1 n· n = 1 .

Além disso, o histograma passa a ter a seguinte fun¸cão utilitária. Se quisermos saber a propor¸cão de eventos Tique caiu num determinado conjunto de Ij’s, basta medir a área total

das barras sobre esses intervalos. Esse número será um número entre 0 e 1 (que multiplicado por 100 dará a porcentagem de eventos ocorridos nos intervalos considerados).

A medida em que se dimui ∆t e se aumenta n, o formato do histograma se aproxima cada vez mais de um formato de sino, agora fixo. Esse formato de sino ´e tipicamente descrito pela fun¸c˜ao Gaussiana

f (t) = 1

σ√2πexp{−

(t − τ)2

2σ2 } .

Observe que essa fun¸cão depende de dois parâmetros, σ e τ , então seria mais correto denotá-la por

fσ,τ(t) .

O fator que multiplica a exponencial está colocado para normalizar a fun¸cão, isto é, fazer com que a área debaixo de seu gráfico seja sempre igual a 1, não importando os valores de σ e τ .

Para entender melhor essa fun¸cão, observe que ela é uma varia¸cão de

h(t) = exp{−t2_{} = e}−t2_.

A fun¸cão h(t) tem um máximo em t = 0 e h(0) = 1, e decresce à direita e à esquerda (simetricamente), indo a zero quando t vai a +∞ ou −∞. Se agora tomarmos hτ(t) =

exp{−(t − τ)2_{}, a fun¸cão valerá 1 e atingirá}

o máximo em t = τ , e decrescerá à direita e esquerda de τ . Então o parâmetro τ tem o papel de “deslocar o sino” para a direita ou para a esquerda, conforme for positivo ou ne- gativo, e seu valor sempre representa a posi¸cão do “cume”.

h_τ(t)

t

0

1 τ

t

1

0 h(t) = e−t

Por outro lado, se considerarmos hσ(t) = exp{− t2 2σ2} = exp{− _t √ 2σ 2 } = h(√t 2σ)

então teremos o seguinte efeito: se√2σ > 1, então o valor de hσ(t) será o valor de h em √t_2σ,

que é menor do que t. Isso fará com que a curva decres¸ca mais lentamente, alargando o sino. Se, ao contrário,√2σ < 1, a curva decrescerá mais rapidamente.

h

_σ

h

_σ 2σ t

h

_σ 2σ t

(t)=h( )

2σ t

h

_σ 2σ t

(t)=h( )

2σ

₂σ

t

0 t

h

t t

< 1

_{> 1}

Em resumo, combinando os dois parâmetros, τ indica a posi¸cão horizontal do cume, enquanto que σ indica o quão “agudo” é o pico. A altura do pico é dada pelo fator de

normaliza¸c˜ao _σ√1

2π, escolhido de forma que a integral de f seja igual a 1.

Finalmente, estando de posse de um histograma, e admitindo as considera¸cões acima, queremos saber qual é o melhor par de parâmetros (σ, τ ) que aproxima o formato delineado pelas barras. Para isso, podemos tratar as barras como pontos, tomando t1, . . . , tN como os

pontos centrais dos intervalos I1, . . . , IN, e y1, . . . , yN a altura das respectivas barras. Com

esses dados, podemos sempre estimar o qui-quadrado Q(fσ,τ), procurando o par (σ, τ ) que o

minimize.

A fun¸c˜ao fσ,τ encontrada serve como um preditor do experimento. Se quisermos saber

em média qual é a propor¸cão de medidas que ocorrerá entre ta e tb, bastará encontrar a área

do histograma entre ta e tb, que ´e aproximadamente o mesmo que calcular a integral

Z tb

fσ,τ(t)dt .

Pode-se mostrar (isso também já é outra história...) que os melhores parâmetros τ e σ são a média e o desvio-padrão da cole¸cão de dados t1, . . . , tn. Ou seja,

τ = 1 n n X i=1 ti, e σ2₌ 1 n n X i=1 (ti− τ)2.

Isso resolve o problema de se achar o menor qui-quadrado, mas raros são os casos em que a solu¸cão é tão expl´ıcita!

Fun¸c˜oes lineares nos parˆametros

5.1 Dependˆencia linear dos parˆametros

Estaremos particularmente interessados nos casos em que a dependência da fun¸cão nos parâmetros é linear. Colocando de forma geral, isso significa que, se a fun¸cão tiver k parâmetros a1, a2, . . . , ak, então f = fa1,...,ak se escreve como

f (x) = a1g1(x) + a2g2(x) + . . . + akgk(x) .

Por exemplo, na fun¸c˜ao

ax + b sen x

identificamos a1= a, a2= b, g1(x) = x e g2(x) = sen x. Ou sen˜ao na fun¸c˜ao afim

a + bx

identificamos a1= a, a2= b, g1(x) = 1 (isto ´e, a fun¸c˜ao identicamente igual a 1) e g2(x) = x.

Mesmo uma fun¸c˜ao linear

ax tem apenas um parˆametro: a1= a e g1(x) = x.

E preciso não confundir entre “fun¸cão linear nos parâmetros” e “fun¸cão linear”. Uma fun¸cão linear de uma variável é sempre da forma ax, e reservamos o termo fun¸cão afim para fun¸cões da forma a + bx. Já uma fun¸cão linear nos parâmetros não é necessariamente linear em x, basta ver os exemplos que demos acima.

Analisemos, sob essa ´otica, com que tipos de problemas nos deparamos nos exemplos do Cap´ıtulo anterior.

No exemplo do cálculo da densidade temos uma fun¸cão do tipo f (x) = ax, que é linear no parâmetro a e na variável x. A fun¸cão da catenária f (x) = 1_c(cosh(cx) − 1) é um exemplo de fun¸cão com apenas 1 parâmetro que porém não é linear nesse parâmetro. As fun¸cões afins das naftalinas são lineares nos parâmetros. Já o decaimento exponencial f (x) = ae−bx _não

é, mas o problema pode ser transformado num problema de fun¸cão afim (e portanto linear nos parâmetros), pois

log f (x) = log a − bx . 59

Já f (x) = c+ae−bx_{tem três parˆ}_{ametros e não é linear em b: se b fosse fixado (não considerado}

como parˆametro), ent˜ao sim ter´ıamos a linearidade.

A lei de potência f (x) = axb _{também não é linear no parˆ}_{ametro b, mas pode ser trans-}

formada num problema linear atrav´es do logaritmo.

Finalmente, a fun¸cão Gaussiana não é linear nos parâmetros “média” e “desvio-padrão”, mas estes podem ser encontrados, para se ajustarem aos dados experimentais, da maneira tradicional.

Trataremos a partir de agora apenas do ajuste de fun¸cões lineares nos parâmetros. Vários casos onde a dependência no parâmetro é não linear podem ser adaptados, mas sem dúvida deve-se pensar caso a caso. Destacam-se entre os ajustes lineares os ajustes por polinômios

f (x) = a0+ a1x + a2x2+ . . . + akxk

e os ajustes por fun¸c˜oes trigonom´etricas

f (x) = a0+ a1cos(x) + a2cos(2x) + . . . + akcos(kx)+

+b1sen(x) + b2sen(2x) + . . . + bksen(lx) .

No documento Cálculo Numérico — Fundamentos e Aplicações (páginas 55-60)