• Nenhum resultado encontrado

Análise de dados em Fisica de Particulas

N/A
N/A
Protected

Academic year: 2021

Share "Análise de dados em Fisica de Particulas"

Copied!
26
0
0

Texto

(1)

An´

alise de dados em Fisica de Particulas

Magno V.T. Machado

Instituto de Fisica - UFRGS

Escola de Fisica de Particulas e Campos. Agosto 05-09, 2013

(2)

Programa do Minicurso

• Brevissima introdu¸c˜ao

• Propaga¸c˜ao de erros em medidas indiretas e/ou predi¸c˜oes te´oricas

• Ajuste de modelos te´oricos aos dados experimentais

• Introdu¸c˜ao a t´ecnicas de Monte Carlo

• Sum´ario

• Referˆencias B´asicas:

1. A. Santoro et. a., Estimativas e Erros em Experimentos de Fisica, Rio de Janeiro: EdUERJ (2005).

2. Luca Lista, Statistical Methods for Data Analysis in Particle Physics, Proc. of the IN2P3 School of Statistics (2012).

3. Gerhard Bohm, Gnter Zech, Introduction to Statistics and Data Analysis for Physicists, ISBN 978-3-935702-41-6.

(3)

Brevissima Motiva¸c˜

ao

• Na Fisica Nuclear/Particulas os observ´aveis, de maneira geral, s˜ao medidas indiretas.

• Exemplos: se¸c˜oes de choque, larguras de decaimento, energias e momentos, ...

• Modelos te´oricos em geral s˜ao parametrizados e comparados aos dados (usando m´etodos de ajuste).

• Os parˆametros dos modelos s˜ao ajustados aos dados experimentais.

• Se comparamos v´arios modelos deve haver um crit´erio para sabermos qual deles ´e mais consistente com dados experimentais.

• Simula¸c˜ao de eventos requer t´ecnicas de gera¸c˜ao de amostras de eventos aleatoriamente (Monte Carlo).

(4)

Propaga¸c˜

ao de erros em medidas indiretas

• Nas medidas experimentais indiretas ou nas predi¸c˜oes te´oricas fenomenol´ogicas uma quantidade ´o obtida utilizando os inputs experimentais de entrada.

• O problema da estimativa do valor esperado e de sua incerteza ´e chamado de propaga¸c˜ao de erros.

• Motiva¸c˜ao: caso did´atico de Laborat´orio de Mecˆanica.

? Em um experimento de MRUV, uma particula percorre uma distˆancia d em um tempo t. Foram medidos a distˆancia e v´arias medidas do tempo: d = ¯d ± σd¯ = 12.0 ± 0.4 m (inc. tipo B) e

t = ¯t ± σ¯t= 4.0 ± 0.2 s. (inc. tipo A)

? Qual ´e o valor da acelera¸c˜ao ?

⇒ Pelo m´etodo aproximado dos valores limite temos (discutir): a = ¯a ± σ¯a = 1.5 ± 0.2 m/s2.

(5)

Propaga¸c˜

ao de Erros - Motiva¸c˜

ao

• Seja uma amostra de N pares (xi, yi) de medidas de duas

grandezas x e y , em condi¸c˜os experimentais inalteradas. A partir de uma express˜ao do tipo u = f (x , y ), como estimar o valor esperado de uma grandeza (indireta) u ?

• No caso geral, u = f (x , y ) ´e dada por express˜ao complexa.

• O seu valor esperado e seu erro-padr˜ao s˜ao dados por, u = ¯u ± σ¯u,

com: ¯ u = f (¯x , ¯y ), σu2¯ =  ∂f ∂x 2 σx2¯+ ∂f ∂y 2 σ2¯y+ 2 N  ∂f ∂x   ∂f ∂y  σxy.

Aqui, ¯x e ¯y s˜ao as m´edias das medidas das medidas eσ¯x e σ¯y , os

seus respectivos erros. Derivadas consideradas no ponto (¯x , ¯y ).

• A covariˆancia entre as medidas de x e y ´e dado por σxy.

(6)

Interl´

udio - parˆ

ametros de correla¸c˜

ao

• Em algumas situa¸c˜oes, a varia¸c˜ao das medidas associadas a uma grandeza parece acompanhar a varia¸c˜ao dos dados associados a uma outra grandeza.

• Diz-se que existe correla¸c˜ao entre as grandezas comparadas.

• A correla¸c˜ao entre as medidas de um par de grandezas (x , y ) ´e visualizada num gr´afico y × x denominado diagrama de dipers˜ao.

• A interdependˆencia de duas cole¸c˜oes de dados pode ser

quantificada, por exemplo, pela covariˆancia e pelo coeficiente de correla¸c˜ao linear de Pearson.

A Covariˆancia (σxy) ´e a m´edia dos produtos dos respectivos

desvios em rela¸c˜ao a m´edia (δxi e δyi):

σxy = 1 N N X i =1 δxiδyi = 1 N N X i =1 (xi − ¯x )(yi − ¯y ) = σyx 6 of 26

(7)

Interl´

udio - parˆ

ametros de correla¸c˜

ao

• Exemplo de Diagrama de Dispers˜ao.

(8)

Interl´

udio - parˆ

ametros de correla¸c˜

ao

• Covariˆancia pode ser positiva, negativa ou nula.

No caso de covariˆancia nula, diz-se que as medidas das grandezas

n˜ao s˜ao correlacionadas.

• O Coeficiente de correla¸c˜ao linear de Pearson (r ) ´e o parˆametro adimensional que quantifica o grau de linearidade de uma distribui¸c˜ao de dados mostrada em um diagrama de dispers˜ao.

r = σxy σxσy

, −1 ≤ r ≤ 1

• Quanto mais robusta a correla¸c˜ao, mais pr´oximo da unidade ´e valor do coeficiente de correla¸c˜ao.

OBS.: Covariˆancia nula entre 2 conjuntos de medidas n˜ao implica a

independˆencia entre as grandezas correspondentes. Tamb´em, uma correla¸c˜ao robusta n˜ao implica rela¸c˜ao causal entre as vari´aveis. 8 of 26

(9)

Interl´

udio - Parˆ

ametros de Dispers˜

ao

• Seja uma cole¸c˜ao {x1, x2, . . . , xN} de N dados num´ericos. A

variabilidade e a dispers˜ao desses dados podem ser avaliadas pelos parˆametros Variˆancia e Desvio Padr˜ao.

• A variˆancia (σ2x) ´e a m´edia dos quadrados dos desvios em relacc˜ao a m´edia. σ2x = N X i =1 (xi − ¯x )2 N = 1 N N X i =1 xi2− 1 N N X i =1 xi !2 = x2− ¯x2

• O desvio-padr˜ao (σx) ´e a m´edia quadr´atica dos desvios (raiz

quadrada da variˆancia).

σx = v u u t N X i =1 (xi − ¯x )2 N = q x2− ¯x2 9 of 26

(10)

Interl´

udio - Parˆ

ametros de Dispers˜

ao

• Na estimativa da incerteza (Tipo A) de uma grandeza

experimental x , utiliza-se o seu desvio padr˜ao da m´edia dado por: σ¯x =

σx

√ N

• Qualquer que seja a distribui¸c˜ao da vari´avel de interesse para grande amostras, a distribui¸c˜ao das m´edias amostrais ser˜ao aproximadamente normalmente distribuidas (Teorema Central do Limite).

• Neste sentido, poderiamos ter uma vari´avel original com uma distribui¸c˜ao completamente diferente da Normal, mas se tomarmos v´arias amostras grandes desta distribui¸c˜ao, e ento fizermos um histograma das m´edias amostrais, a forma tender´a para uma curva Normal.

(11)

Propaga¸c˜

ao de Erro - Desenvolvimento

• Seja u uma grandeza que se relaciona com outras M grandezas (x1, x2, . . . , xM) por uma dada fun¸c˜ao u = f (x1, x2, . . . , xM).

• A partir de M conjuntos de amostras de N medidas diretas de cada grandeza xk, {xk1, xk2, . . . , xkN} (com k = 1, 2, . . . , M) deseja-se estimar seu valor esperado e o erro associado.

• Caso de uma vari´avel se u depende linearmente de x , u = f (x ) = ax + b, a cada medida (xi) de x corresponde uma

medida indireta de u, ui = axi + b.

• A estimativa para o valor esperado de u, dada pela m´edia: 1 N N X i =1 ui | {z } ¯ u = a 1 N N X i =1 xi | {z } ¯ x +b = a¯x + b 11 of 26

(12)

Propaga¸c˜

ao de Erro - Desenvolvimento

• A m´edia de u ´e igual ao valor da fun¸c˜ao f no ponto m´edio das medidas de x , ou seja:

¯

u = f (¯x ).

Desse modo, como ui − ¯u = a(xi − ¯x ), a variˆancia (σu2) das

medidas de u ´e: 1 N N X i =1 (ui − ¯u)2 | {z } σ2 u = a2 1 N N X i =1 (xi − ¯x )2 | {z } σ2 x

• Ent˜ao o erro associado a cada medida indireta de u ´e dado por σu= |a|σx, e o erro da m´edia ser´a:

σu¯ = σu √ N = |a| σx √ N = |a|σx¯ 12 of 26

(13)

Propaga¸c˜

ao de Erro - Desenvolvimento

• No caso geral, a grandeza u depende de outra grandeza x , segundo uma fun¸c˜ao gen´erica u = f (x ).

Se as medidas de x se distribuem em torno da m´edia ¯x , tal que,

nessa vizinhan¸ca ela possa ser representada pelos primeiros termos de sua s´erie de Taylor, ou seja, uma fun¸c˜ao linear de x ,

u = f (x ) ≈ f (¯x ) + df dx  ¯ x (x − ¯x ),

A estimativa para o valor esperado de u, dada pela m´edia, ´e:

1 N N X i =1 ui | {z } ¯ u = f (¯x ) + df dx  ¯ x 1 N N X i =1 (xi− ¯x ) | {z } 0 13 of 26

(14)

Propaga¸c˜

ao de Erro - Representa¸c˜

ao

(15)

Propaga¸c˜

ao de Erro - Desenvolvimento

• Ent˜ao o valor esperado de u ´e igual ao valor da fun¸c˜ao f no ponto m´edio das medidas de x ,

¯

u = f (¯x )

Assim, o erro associado a cada medida direta de u ser´a dado por:

σu= df dx ¯ x σx

• O erro da m´edia ser´a dado ent˜ao por: σ¯u= σu √ N = df dx ¯ x σx √ N = df dx ¯ x σ¯x 15 of 26

(16)

Propaga¸c˜

ao de Erro - Desenvolvimento

• Seja a grandeza u fun¸c˜ao de duas outras grandezas, x1 = x e

x2= y , e as varia¸c˜oes de u s˜ao proporcionais as de x e y , isto ´e,

u = f (x , y ) = ax + by + c.

• De modo an´alogo aos caso de uma vari´avel, a estimativa para o valor esperado de u ´e dado por ¯u = a¯x + b¯y + c = f (¯x , ¯y ).

• A variˆancia das medidas indiretas de u ser´a: 1 N N X i =1 (ui− ¯u)2 = a2 1 N N X i =1 (xi− ¯x )2+ b2 1 N N X i =1 (yi − ¯y )2 + 2ab1 N N X i =1 (xi− ¯x )(yi − ¯y ) σu2 = a2σx2+ b2σy2+ 2abσxy 16 of 26

(17)

Propaga¸c˜

ao de Erro - Desenvolvimento

• O erro associado a cada medida indireta de u e o erro da m´edia ser˜ao, respectivamente:

σu = q a2σ2 x+ b2σy2+ 2abσxy σ¯u = σu √ N = r a2σ2 ¯ x+ b2σ¯y2+ 2ab σxy N

• Assim, al´em dos erros associados a cada conjunto de medidas diretas, os erros associados `as medidas indiretas dependem tamb´em da covariˆancia entre os conjuntos.

Se as medidas das grandezas x e y s˜ao independentes, ou seja, s˜ao

n˜ao-correlacionadas (σxy = 0), a incerteza em cada medida

indireta de u e de seu valor esperado ser˜ao: 17 of 26

(18)

Propaga¸c˜

ao de Erro - Desenvolvimento

σu= q a2σ2 x+ b2σy2 ⇒ σ¯u= σu √ N = q a2σ2 ¯ x+ b2σy2¯

No caso geral se a grandeza u depende das grandezas y e y

segundo uma fun¸c˜ao gen´erica u = f (x , y ), mas as medidas de x e y se distribuem em torno do ponto m´edio (¯x , ¯y ) tal que, nessa vizinhan¸ca, ela pode ser representada pelos primeiros termos de sua s´erie de Taylor:

u = f (x , y ) ≈ f (¯x , ¯y ) + ∂f ∂x  ¯ x ,¯y (x − ¯x ) + ∂f ∂y  ¯ x ,¯y (y − ¯y )

• A estimativa para o valor esperado de u ser´a dada pela m´edia: 18 of 26

(19)

Propaga¸c˜

ao de Erro - Desenvolvimento

• A estimativa para o valor esperado de u ser´a dada pela m´edia: 1 N N X i =1 ui | {z } ¯ u = f (¯x , ¯y ) + ∂f ∂x  ¯ x ,¯y 1 N N X i =1 (xi− ¯x ) | {z } 0 +  ∂f ∂y  ¯ x ,¯y 1 N N X i =1 (yi − ¯y ) | {z } 0

• Ent˜ao ¯u = f (¯x , ¯y ) e os erros associados a cada medida indireta de u e a sua m´edia ser˜ao:

σu= s  ∂f ∂x 2 ¯ x ,¯y σ2 x +  ∂f ∂y 2 ¯ x ,¯y σ2 y + 2  ∂f ∂x  ¯ x ,¯y  ∂f ∂y  ¯ x ,¯y σxy 19 of 26

(20)

Propaga¸c˜

ao de Erro - Desenvolvimento

σu¯ = s  ∂f ∂x 2 ¯ x ,¯y σ¯x2+ ∂f ∂y 2 ¯ x ,¯y σ¯y2+ 2 N  ∂f ∂x  ¯ x ,¯y  ∂f ∂y  ¯ x ,¯y σxy

• Considerando-se a matriz (2 × 2) de covariˆancia: V =  σxx σyx σxy σyy  =  σ2 x σxy σxy σy2 

Considerando a matriz (2 × 1) das derivadas parciais de u:

Du =  ∂f ∂x ∂f ∂y  ¯ x ,¯y ⇒ DuT = ∂f ∂x ∂f ∂y  ¯ x ,¯y 20 of 26

(21)

Propaga¸c˜

ao de Erro - Desenvolvimento

• A variˆancia de u pode ser escrita compactamente como σ2u= DuTVDu.

• Se as medidas de x e y s˜ao n˜ao-correlacionadas (σxy = 0), ent˜ao a

matriz V ser´a diagonal: V =



σx2 0 0 σy2



Neste caso, a incerteza na m´edia de u ser´a:

σ¯u= s  ∂f ∂x 2 ¯ x ,¯y σ2 ¯ x+  ∂f ∂y 2 ¯ x ,¯y σ2 ¯ y 21 of 26

(22)

Propaga¸c˜

ao de Erro - Caso Geral Final

• Seja a grandeza u que depende de M outras grandezas, X = (x1, x2, . . . , xM), segundo uma dada fun¸c˜ao f (X ), e as N

medidas de cada uma das grandezas se distribuem em torno do ponto m´edio ¯X = (¯x1, ¯x2, . . . , ¯xM), de modo que nessa vizinhan¸ca,

ela possa ser dada pelos primeiros termos de sua s´erie de Taylor: u = f (X ) ≈ f ( ¯X ) + M X k=1  ∂f ∂xk  ¯ X (xk − ¯xk)

A generaliza¸ao dos resultados anteriores ´e tal que a estimativa

para o valor esperado de u ´e dada pelo valor da fun¸c˜ao f no ponto m´edio ¯X , ¯u = f ( ¯X ) e o erro associado a esta estimativa ´e:

σ¯u= v u u t 1 N N X k,l  ∂f ∂xk  ¯ X Vkl  ∂f ∂xl  ¯ X 22 of 26

(23)

Propaga¸c˜

ao de Erro - Caso Geral Final

• Temos que Vkl = σxkxl = 1 N PN i (xki − ¯xk)(xli − ¯xl) ´e o termo kl da matriz de covariˆancia (M × M):

V =      σx1x1 σx1x2 · · · σx1xM σx2x1 σx2x2 · · · σx2xM .. . ... . .. ... σxMx1 σxMx2 · · · σxMxM     

• A matriz Du (M × 1) das derivadas calculadas no ponto ¯X ´e,

DuT = ∂x∂f 1 ∂f ∂x2 . . . ∂f ∂xM  ¯ X

• O erro associado ao valor esperado da grandeza u pode ser escrito compactamente como: σ¯u= r 1 ND T u VDu 23 of 26

(24)

Propaga¸c˜

ao de Erro - Caso Geral Final

• Se as estimativas das grandezas xk forem independentes, ou seja,

n˜ao-correlacionadas (σxkxl = 0), a incerteza no valor esperado de u ´ e dada por: σ¯u= v u u t M X k=1  ∂f ∂xk 2 ¯ X σ2 ¯ xk = s  ∂f ∂x1 2 ¯ X σ2 ¯ x1+ . . . +  ∂f ∂xM 2 ¯ X σ2 ¯ xM

• O resultado final para a quantidade indireta u ´e ent˜ao escrita como:

u = ¯u ± σ¯u= f ( ¯X ) ± v u u t M X k=1  ∂f ∂xk 2 ¯ X σ2 ¯ xk 24 of 26

(25)

Propaga¸c˜

ao de Erro - Problemas Exemplo

• Seja o m´eson π(1300) cuja massa ´e determinada como sendo 1300 ± 100 MeV/c2 (PDG). Uma reconstru¸c˜ao cinem´atica experimental determina que o momento linear do m´eson ´e p = 5000 ± 250 MeV/c (assumiremos sem correla¸c˜ao).

• Determine o valor esperado da sua energia total relativistica, E =p(pc)2+ (mc2)2, e sua incerteza.

? Aqui temos quantidade E = (m, p) dependente de dois quantidades experimentais, massa e momento. Temos ent˜ao:

¯ m = 1300MeV c2 , σm¯ = 100 MeV c2 , ¯p = 5000 MeV c , σ¯p= 250 MeV c ¯ E = E ( ¯m, ¯p) = q (¯pc)2+ ( ¯mc2)2 = 5166 MeV ∂E ∂m( ¯m, ¯p) = ( ¯mc2) c2 p(¯pc)2+ ( ¯mc2)2, ∂E ∂p( ¯m, ¯p) = (¯pc) c p(¯pc)2+ ( ¯mc2)2 25 of 26

(26)

Propaga¸c˜

ao de Erro - Problemas Exemplo

• A incerteza na energia total ´e, ent˜ao, dada por:

σE¯ = s  ∂E ∂m 2 ¯ m,¯p σm2¯ + ∂E ∂p 2 ¯ m,¯p σ2¯p

• Aqui assumiremos que as grandezas massa e momento n˜ao s˜ao correlacionadas, ou seja, σmp= 0.

• A express˜ao final para a energia relativistica ´e: E = ¯E ± σE¯ = 5166 ± 243 MeV

Referências

Documentos relacionados

Neste contexto, para cada diferente situa¸ c˜ ao apresentada a seguir, defina a vari´ avel aleat´ oria, sua distribui¸ c˜ ao de probabilidades e calcule a probabilidade

Em decorrência dos referidos acordos de colaboração, foram tomados 19(dezenove) termos de colaboração de MÔNICA MOURA, 10(dez) de JOÃO SANTANA e 04(quatro) termos

Quanto maior o tamanho da amostra, a distribui¸ c˜ ao amostral da m´ edia mais se aproxima da distribui¸ c˜ ao normal, qualquer que seja a distribui¸c˜ ao original da popula¸c˜

Reunindo as defini¸c˜ oes acima de derivada de uma distribui¸c˜ ao e produto de uma distribui¸c˜ ao com uma fun¸c˜ ao infinitamente diferenci´ avel, podemos introduzir a no¸c˜

O Serviço Nacional de Lepra ficou incumbido da organização do programa do curso de lepra, bem como da fixação do periodo de estudos, e de acordo com o diretor geral do

(2013) foi empregado Constructal Design para a otimização geométrica de um sistema de conversão de energia das ondas do mar em energia elétrica do tipo CAO, variando o

As tabelas abaixo demonstram a evolução do número de pacientes com COVID-19 confirmada nas UTIs de Porto Alegre nos últimos 45 dias. Os dados, monitorados desde o início

Relação tributária como relação complexa: consequências práticas Relação jurídico- tributária Obrigação principal Obrigações acessórias à obrigação