4.3 Parˆametros
4.3.6 Gaussiana
Suponha que v´arias medidas foram feitas de um mesmo fenˆomeno, por exemplo, o tempo de queda de um objeto que ´e solto, a partir do repouso, sempre da mesma altura. S˜ao feitas n medidas T1, . . . , Tn, e dessas medidas constr´oi-se um histograma. Para fazer o histograma,
escolhe-se um intervalo ∆t e divide-se a reta dos tempos em intervalos de tamanho ∆t. Esses intervalos podem ser numerados:
I1, . . . , IN, mas para a numera¸c˜ao ser
finita ´e preciso n˜ao incluir aqueles que est˜ao longe dos tempos medidos. Para cada intervalo Ij conta-se o n´umero de
medidas Ti que incidem em Ij, cha-
mando esse n´umero de nj. O histo-
grama ´e desenhado construindo-se bar- ras de base Ij e altura igual a nj.
I1 I2 Ij IN
n
j∆t
Nesse problema e em v´arios outros, a tendˆencia do histograma ´e adotar o formato apro- ximado de um “sino”. O valor mais prov´avel do que deve ser o tempo de queda (que servir´a por exemplo para se estimar a acelera¸c˜ao da gravidade) se situa pr´oximo dos intervalos que apresentam maiores valores de nj, isto ´e, no “cume” do sino.
Se o experimento n˜ao tiver erros sistem´aticos, o formato de sino ser´a tanto melhor apro- ximado quanto mais medidas forem feitas e quanto menor forem os intervalos. ´E claro que a diminui¸c˜ao dos intervalos e o aumento do n´umero de medidas devem ser feitos de forma acoplada, mas isso j´a ´e outra hist´oria...
O leitor mais atento pode estar pensando que ao mudarmos o n´umero n de experimentos ou o tamanho do intervalo b´asico ∆t n˜ao poderemos comparar um histograma com outro. ´E claro que se aumentarmos o n´umero n ent˜ao em m´edia os nj’s devem aumentar, o que dar´a
histogramas radicalmente diferentes quando n = 500 ou n = 5000, por exemplo, mantidos iguais os ∆t’s. Por outro lado, se mantivermos n mas, digamos, diminuirmos pela metade o tamanho dos intervalos, isso far´a com que em m´edia os nj’s caiam pela metade. Assim, seria
interessante ter um histograma que n˜ao dependesse demais de n e ∆t, e permitisse comparar histogramas do mesmo fenˆomeno constru´ıdos de formas diferentes.
ordenada, colocando as barras `a altura
nj
n∆t.
Com isso, a soma total da ´area das barras ser´a igual a 1, pois cada barra ter´a ´area
∆t · n∆tnj =nj n
e a soma da ´area de todas as barras ser´a
N X j=1 nj n = 1 n N X j=1 nj= 1 n· n = 1 .
Al´em disso, o histograma passa a ter a seguinte fun¸c˜ao utilit´aria. Se quisermos saber a propor¸c˜ao de eventos Tique caiu num determinado conjunto de Ij’s, basta medir a ´area total
das barras sobre esses intervalos. Esse n´umero ser´a um n´umero entre 0 e 1 (que multiplicado por 100 dar´a a porcentagem de eventos ocorridos nos intervalos considerados).
`
A medida em que se dimui ∆t e se aumenta n, o formato do histograma se aproxima cada vez mais de um formato de sino, agora fixo. Esse formato de sino ´e tipicamente descrito pela fun¸c˜ao Gaussiana
f (t) = 1
σ√2πexp{−
(t − τ)2
2σ2 } .
Observe que essa fun¸c˜ao depende de dois parˆametros, σ e τ , ent˜ao seria mais correto denot´a-la por
fσ,τ(t) .
O fator que multiplica a exponencial est´a colocado para normalizar a fun¸c˜ao, isto ´e, fazer com que a ´area debaixo de seu gr´afico seja sempre igual a 1, n˜ao importando os valores de σ e τ .
Para entender melhor essa fun¸c˜ao, observe que ela ´e uma varia¸c˜ao de
h(t) = exp{−t2} = e−t2.
A fun¸c˜ao h(t) tem um m´aximo em t = 0 e h(0) = 1, e decresce `a direita e `a esquerda (simetricamente), indo a zero quando t vai a +∞ ou −∞. Se agora tomarmos hτ(t) =
exp{−(t − τ)2}, a fun¸c˜ao valer´a 1 e atingir´a
o m´aximo em t = τ , e decrescer´a `a direita e esquerda de τ . Ent˜ao o parˆametro τ tem o papel de “deslocar o sino” para a direita ou para a esquerda, conforme for positivo ou ne- gativo, e seu valor sempre representa a posi¸c˜ao do “cume”.
hτ(t)
t
0
1
τ
t
1
0
h(t) = e−t
2Por outro lado, se considerarmos hσ(t) = exp{− t2 2σ2} = exp{− t √ 2σ 2 } = h(√t 2σ)
ent˜ao teremos o seguinte efeito: se√2σ > 1, ent˜ao o valor de hσ(t) ser´a o valor de h em √t2σ,
que ´e menor do que t. Isso far´a com que a curva decres¸ca mais lentamente, alargando o sino. Se, ao contr´ario,√2σ < 1, a curva decrescer´a mais rapidamente.
h
σh
σ 2σ th
σ 2σ t(t)=h( )
2σ th
σ 2σ t(t)=h( )
2σ
2σ
t
0
t
h
h
t t< 1
> 1
Em resumo, combinando os dois parˆametros, τ indica a posi¸c˜ao horizontal do cume, enquanto que σ indica o qu˜ao “agudo” ´e o pico. A altura do pico ´e dada pelo fator de
normaliza¸c˜ao σ√1
2π, escolhido de forma que a integral de f seja igual a 1.
Finalmente, estando de posse de um histograma, e admitindo as considera¸c˜oes acima, queremos saber qual ´e o melhor par de parˆametros (σ, τ ) que aproxima o formato delineado pelas barras. Para isso, podemos tratar as barras como pontos, tomando t1, . . . , tN como os
pontos centrais dos intervalos I1, . . . , IN, e y1, . . . , yN a altura das respectivas barras. Com
esses dados, podemos sempre estimar o qui-quadrado Q(fσ,τ), procurando o par (σ, τ ) que o
minimize.
A fun¸c˜ao fσ,τ encontrada serve como um preditor do experimento. Se quisermos saber
em m´edia qual ´e a propor¸c˜ao de medidas que ocorrer´a entre ta e tb, bastar´a encontrar a ´area
do histograma entre ta e tb, que ´e aproximadamente o mesmo que calcular a integral
Z tb
ta
fσ,τ(t)dt .
Pode-se mostrar (isso tamb´em j´a ´e outra hist´oria...) que os melhores parˆametros τ e σ s˜ao a m´edia e o desvio-padr˜ao da cole¸c˜ao de dados t1, . . . , tn. Ou seja,
τ = 1 n n X i=1 ti, e σ2= 1 n n X i=1 (ti− τ)2.
Isso resolve o problema de se achar o menor qui-quadrado, mas raros s˜ao os casos em que a solu¸c˜ao ´e t˜ao expl´ıcita!
Fun¸c˜oes lineares nos parˆametros
5.1
Dependˆencia linear dos parˆametros
Estaremos particularmente interessados nos casos em que a dependˆencia da fun¸c˜ao nos parˆametros ´e linear. Colocando de forma geral, isso significa que, se a fun¸c˜ao tiver k parˆametros a1, a2, . . . , ak, ent˜ao f = fa1,...,ak se escreve como
f (x) = a1g1(x) + a2g2(x) + . . . + akgk(x) .
Por exemplo, na fun¸c˜ao
ax + b sen x
identificamos a1= a, a2= b, g1(x) = x e g2(x) = sen x. Ou sen˜ao na fun¸c˜ao afim
a + bx
identificamos a1= a, a2= b, g1(x) = 1 (isto ´e, a fun¸c˜ao identicamente igual a 1) e g2(x) = x.
Mesmo uma fun¸c˜ao linear
ax tem apenas um parˆametro: a1= a e g1(x) = x.
´
E preciso n˜ao confundir entre “fun¸c˜ao linear nos parˆametros” e “fun¸c˜ao linear”. Uma fun¸c˜ao linear de uma vari´avel ´e sempre da forma ax, e reservamos o termo fun¸c˜ao afim para fun¸c˜oes da forma a + bx. J´a uma fun¸c˜ao linear nos parˆametros n˜ao ´e necessariamente linear em x, basta ver os exemplos que demos acima.
Analisemos, sob essa ´otica, com que tipos de problemas nos deparamos nos exemplos do Cap´ıtulo anterior.
No exemplo do c´alculo da densidade temos uma fun¸c˜ao do tipo f (x) = ax, que ´e linear no parˆametro a e na vari´avel x. A fun¸c˜ao da caten´aria f (x) = 1c(cosh(cx) − 1) ´e um exemplo de fun¸c˜ao com apenas 1 parˆametro que por´em n˜ao ´e linear nesse parˆametro. As fun¸c˜oes afins das naftalinas s˜ao lineares nos parˆametros. J´a o decaimento exponencial f (x) = ae−bx n˜ao
´e, mas o problema pode ser transformado num problema de fun¸c˜ao afim (e portanto linear nos parˆametros), pois
log f (x) = log a − bx . 59
J´a f (x) = c+ae−bxtem trˆes parˆametros e n˜ao ´e linear em b: se b fosse fixado (n˜ao considerado
como parˆametro), ent˜ao sim ter´ıamos a linearidade.
A lei de potˆencia f (x) = axb tamb´em n˜ao ´e linear no parˆametro b, mas pode ser trans-
formada num problema linear atrav´es do logaritmo.
Finalmente, a fun¸c˜ao Gaussiana n˜ao ´e linear nos parˆametros “m´edia” e “desvio-padr˜ao”, mas estes podem ser encontrados, para se ajustarem aos dados experimentais, da maneira tradicional.
Trataremos a partir de agora apenas do ajuste de fun¸c˜oes lineares nos parˆametros. V´arios casos onde a dependˆencia no parˆametro ´e n˜ao linear podem ser adaptados, mas sem d´uvida deve-se pensar caso a caso. Destacam-se entre os ajustes lineares os ajustes por polinˆomios
f (x) = a0+ a1x + a2x2+ . . . + akxk
e os ajustes por fun¸c˜oes trigonom´etricas
f (x) = a0+ a1cos(x) + a2cos(2x) + . . . + akcos(kx)+
+b1sen(x) + b2sen(2x) + . . . + bksen(lx) .