CE062 - Tópicos em Biometria
Silva, J.P; Taconeli, C.A.
Módulo 4 - Curvas de referência (curvas centílicas)
Módulo 4 - Curvas de referência (curvas
centílicas)
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Na construção de faixas de referência, é comum os valores da variável de interesse dependerem de alguma covariável contínua;
O caso mais típico é quando a covariável em questão trata-se da idade do indivíduo;
Neste caso, variáveis referentes ao crescimento, composição corporal e estado nutricional têm suas distribuições alteradas ao longo da infância, adolescência,. . . ;
Chamamos de curvas de referência (ou curvas centílicas) a representação gráfica das faixas de referência que variam conforme os valores de uma covariável contínua.
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
O centil 100p de uma variável aleatória y é o valor yp tal que
P(y ≤ yp) = p;
Assim, yp= F−1(p), 0 < p < 1 é a função quantil de y ;
Na construção de curvas centílicas consideramos os centis de y condicionais ao valor de uma covariável x , representados por
yp(x ) = Fy |x−1(p);
Variando o valor de x , obtemos uma sequência de valores para yp(x )
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
A Organização Mundial de Saúde utiliza as seguintes curvas centílicas como referência para padronização de medidas antropométricas:
100p = (3, 15, 50, 85, 97), em seus gráficos;
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Introdução
Módulo 4 - Curvas de referência (curvas centílicas)
Construção de curvas de referência
O método LMS, proposto originalmente em Cole and Green (1992), é referência para a construção de curvas de referência;
As curvas de referência são obtidas modelando a locação, a dispersão e a assimetria da variável de interesse como funções suaves (não paramétricas) da covariável x ;
Dessa forma, é permitido que não apenas a locação (ou mediana) da distribuição da resposta (chamemos de w ) varie conforme x , mas também sua escala e forma;
Adicionalmente, o ajuste de funções suaves (splines, por exemplo) de x permite maior flexibilidade e a modelagem de relações não lineares.
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
Suponha que w uma variável aleatória que assume valores positivos
com mediana µ, e que yν (ou ln(y ), para ν = 0) tenha distribuição
Normal;
Nesse contexto podemos considerar a família de transformações de Box-Cox: y = (w /µ) ν− 1 ν , ν 6= 0 ou y = ln(w /µ), ν = 0.
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
A variável transformada y tem distribuição Box-Cox Cole and Gren (BCCG) de parâmetros µ, σ e ν, com função densidade de
probabilidade: f (y ; µ, σ, ν) = √1 2πσ yν−1 µν exp − z2 2 ! ,
onde z = [(y /µ)ν − 1] /(νσ), se ν 6= 0, ou z = ln(y /µ)/σ, se ν = 0, para
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
O método LMS baseia-se no ajuste do seguinte modelo:
y |x ∼ BCCG (µ, σ, ν); g1(µ) = s1(u)
g2(σ) = s2(u)
g3(ν) = s3(u)
u = x
em que g1, g2 e g3 são funções de ligação, e s1, s2 e s3 são funções
suavizadoras (splines).
O parâmetro permite transformar também a covariável usando uma transformação do tipo potência, e também deve ser estimado.
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
Como alternativas à distribuição BCCG, temos outros modelos construídos a partir da introdução de um parâmetro de potência (ν) a distribuições alternativas à normal.
Dependendo da alternativa usada, temos condições de modelar não apenas locação, escala e assimetria, mas também a curtose de y como função suave de x ;
Os casos mais usuais são as distribuições Box-Cox t (BCT) e Box-Cox power exponential (BCPE), brevemente descritas na sequência.
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
A variável aleatória y , com distribuição BCT de parâmetros µ, σ, ν e
τ , tem função densidade de probabilidade:
f (y ; µ, σ, ν, τ ) = y ν−1 µνσ Γ [(τ + 1)/2] Γ(1/2)Γ(τ /2)τ0.5 h 1 + (1/τ )z2i−(τ +1)/2,
onde z = [(y /µ)ν − 1] /(νσ), se ν 6= 0, e z = log(y /µ)/σ se ν = 0, para
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
A variável aleatória y , com distribuição BCPE de parâmetros µ, σ, ν e
τ , tem função densidade de probabilidade:
f (y ; µ, σ, ν, τ ) = y ν−1τ exph−1 2 z c τ i µνσ2(1+1/τ )Γ1 τ ,
onde c =h2(−2/τ )Γ(1/τ )/Γ(3/τ )i0.5, e z = [(y /µ)ν− 1] /(νσ), se ν 6= 0, e z = log(y /µ)/σ se ν = 0, para y > 0, µ > 0, σ > 0, ν ∈ (−∞, +∞) e
Módulo 4 - Curvas de referência (curvas centílicas)
O método LMS
Para ambas as distribuições BCT e BCPE, curvas de referência podem ser obtidas ajustando o modelo:
y |x ∼ BCT(ou BCPE)(µ, σ, ν, τ ); g1(µ) = s1(u) g2(σ) = s2(u) g3(ν) = s3(u) g4(τ ) = s4(u) u = x
em que g1, g2, g3 e g4 são funções de ligação, e s1, s2, s3 e s4 são funções
Módulo 4 - Curvas de referência (curvas centílicas)
Seleção de modelos na construção de curvas
centílicas
A seleção do modelo para construção de curvas centílicas requer a especificação da distribuição (D), da suavização aplicada em cada parâmetro (definida pelos respectivos graus de liberdade,
dfµ, dfσ, dfν, dfτ), e o parâmetro de potência ();
Diferentes procedimentos foram propostos para seleção de modelos, baseados, dentre outros, na minimização de AIC, BIC ou na
maximização da verossimilhança penalizada.
A penalização atua sobre a falta de suavidade dos ajustes, prevenindo
overfitting (excesso de ajuste);
A função lms() do pacote gamlss implementa a seleção de modelos e ajuste de curvas centílicas;
Módulo 4 - Curvas de referência (curvas centílicas)
Curvas centílicas
Uma vez ajustado o modelo, para cada particular valor x para a covariável, a faixa de referência de ordem p (0 < p < 0.5) fica definida por: (l1; l2) = F−1(p; ˆµx, ˆσx, ˆνx, ˆτx); F−1(1 − p; ˆµx, ˆσx, ˆνx, ˆτx) ,
Módulo 4 - Curvas de referência (curvas centílicas)
Predição
No contexto de curvas centílicas, as seguintes formas de predição são possíveis:
1 Para novos valores de x , predizer níveis de referência (centis de ordem)
p de y , ou seja:
Determinar yp tal que P(Y ≤ yp) = p;
2 Para novos valores de x , predizer escores normalizados (centis z), de
ordem p:
Módulo 4 - Curvas de referência (curvas centílicas)