• Nenhum resultado encontrado

Slides - Parte 1

N/A
N/A
Protected

Academic year: 2021

Share "Slides - Parte 1"

Copied!
96
0
0

Texto

(1)

CE062 - Tópicos em Biometria

Silva, J.P; Taconeli, C.A. 10 de setembro, 2019

(2)
(3)
(4)

Definição

Paracelso, cientista suiço-alemão - século XVI

All substances are poisons; there is none which is not a poison. The right dose differentiates a poison and a remedy

(5)

Introdução

Ensaios biológicos(ou bioensaios) são estudos usados para

determinar o efeito de alguma substância em organismos vivos ou em órgãos isolados;

Como exemplos de substâncias investigadas em ensaios biológicos, temos medicamentos, fertilizantes, pesticidas, radiação, dentre outros. Ensaios biológicos podem ser classificados em duas categorias:

Ensaios biológicos qualitativos: usados quando os efeitos produzidos

pela substância não puderem ser quantificados;

Ensaios biológicos quantitativos: neste caso, os efeitos podem ser

mensurados, e o interesse é analisar o efeito de aumentar a dose da substância na resposta mensurada.

(6)

Modelos de dose resposta

Uma importante ferramenta estatística na análise de ensaios biológicos são os modelos de dose resposta.

Os modelos de dose-resposta são modelos de regressão aplicados na análise do efeito de diferentes doses (concentrações) da substância na resposta de interesse;

Diferentes modelos estão disponíveis com tal finalidade, e um dos pontos a serem considerados na escolha do modelo é o tipo de resposta que se dispõe.

Na sequência apresentamos alguns exemplos de estudos de dose-resposta e possíveis modelos apropriados.

(7)

Modelos de dose resposta

Exemplo 1: Efeito de diferentes doses de uma medicação na redução

da pressão arterial de pacientes hipertensos. Resposta: Pressão arterial (contínua);

Modelo: Modelo não linear, resposta com distribuição normal.

Exemplo 2: Efeito de diferentes doses de um inseticida na mortalidade

de besouros.

Resposta: Morte/sobrevivência dos insetos (dicotômica); Modelo: Modelo linear generalizado, resposta com distribuição

(8)

Modelos de dose resposta

Exemplo 3: Efeito de diferentes concentrações de um anticonvulsivo

na frequência de ataques epilépticos.

Resposta: Número de ataques epilépticos (contagem);

Modelo: Modelo linear generalizado, resposta com distribuição Poisson.

Exemplo 4: Efeito de diferentes tipos e doses de analgésicos no tempo

até alívio de sintomas de enxaqueca.

Resposta: Tempo até alívio dos sintomas (contínua, possivelmente

censurada);

(9)

Modelos de dose resposta

Modelos de dose resposta descrevem como a resposta varia (em média) conforme se aumenta a dose do tratamento;

A dose é inserida no modelo por meio de alguma função que envolve parâmetros;

Os parâmetros devem ser estimados com base nos dados experimentais disponíveis;

Em geral, a relação dose-resposta tem forma sigmoide, crescente ou decrescente.

(10)

Modelos de dose resposta

Dose

Resposta

(11)

Modelos de dose resposta

Dose Resposta Simétrica Dose Resposta

Assimétrica − crescimento rápido

Dose

Resposta

Assimétrica − crescimento lento

Dose

Resposta

Assimétrica − crescimento seguido por queda

(12)

Planejamento do estudo

O planejamento de um estudo de dose-resposta requer, além da especificação das variáveis (resposta, covariáveis), que se defina:

Quais doses serão consideradas;

Quantas replicações serão realizadas sob cada dose.

A definição das doses depende:

Dos objetivos do estudo;

Do conhecimento de uma faixa de doses que sejam viáveis (por motivos biológicos, clínicos, econômicos)

(13)

Planejamento do estudo

O número de replicações deverá ser suficiente para estimação dos parâmetros do modelo (teoricamente, o modelo logístico com quatro parâmetros pode ser ajustado caso se planeje quatro doses).

Se possível, dar preferência a um menor número de réplicas em maior número de doses;

As replicações nas doses estabelecidas permitem testar a falta de ajuste do modelo proposto.

(14)
(15)

Definição

Vamos considerar, neste momento, a seguinte formulação geral para um modelo de dose-resposta:

yi = f (xi, θ) + i, i = 1, 2, ..., n,

em que:

xi representa a dose aplicada ao i−ésimo indivíduo;

yi é a resposta apresentada pelo i−ésimo indivíduo;

θ0= (θ1, θ2, ..., θk) é o vetor de parâmetros do modelo;

i representa os erros aleatórios independentes, aos quais supomos

(16)

Definição

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Dose Resposta Variância constante ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● Dose Resposta

Variância não constante

(17)

Definição

Como consequências da especificação do modelo, temos:

E(yi|xi) = f (xi, θ);

Var(yi|xi) = σ2,

(18)

Recursos computacionais

O R dispõe de funções e pacotes para ajuste de modelos de dose-resposta (não lineares) (ex: função nls, pacotes nlstools e nlme);

Além disso, há diversos pacotes com rescursos para análise de dados produzidos por estudos do tipo dose-resposta, como DoseFinding e drfit;

Nesta disciplina vamos usar o pacote drc, que tem alguns modelos importantes implementados para estudos do tipo dose-resposta. Na sequência apresentamos alguns dos modelos mais usados na área.

(19)

Modelo log-logístico de quatro parâmetros

O modelo mais comumente usado para a modelagem de dados de dose-resposta é o modelo log-logístico com três, quatro ou cinco parâmetros.

Modelo log-logístico de quatro parâmetros

f(x, θ) = c + d − c

1 + exp[b(log x − log e)], em que:

c e d são os limites inferior e superior;

e é a dose efetiva 50% (ED50);

(20)

Modelo log-logístico de três parâmetros

Neste caso, assumimos limite inferior (c) igual a zero:

Modelo log-logístico de três parâmetros

f(x, θ) = d

1 + exp[b(log x − log e)].

O modelo log-logístico de três parâmetros é um caso particular do modelo log-logístico de quatro parâmetros quando fixamos c = 0.

(21)

Modelo log-logístico de cinco parâmetros

O modelo log-logístico de cinco parâmetros tem um parâmetro adicional de potência (f ):

Modelo log-logístico de cinco parâmetros

f(x, θ) = c + d − c

(1 + exp[b(log x − log e)])f.

O modelo log-logístico de cinco parâmetros se resume ao modelo log-logístico de quatro parâmetros quando f = 1.

(22)

Modelo Weibull de quatro parâmetros

O modelo Weibull de quatro parâmetros, diferente do modelo log-logístico, não é simétrico em torno de qualquer ponto. Modelo Weibull de quatro parâmetros

f(x, θ) = c + (d − c) exp(− exp(b(log x − log e))), em que:

c e d são os limites inferior e superior;

e é o ponto de inflexão da curva;

b é a inclinação da curva em ED50.

Assim como o modelo log-logístico, o modelo Weibull também tem seus casos particulares e generalizações.

(23)

Outros modelos

A biblioteca drc tem diversos outros modelos disponíveis para ajuste de curvas de dose-resposta; dentre os quais os seguintes:

Log-normal; Gamma;

Log-logístico polinomial fracionário; Cedergreen-Ritz-Streibig, dentre outros.

(24)

Estimação

Os modelos de dose-resposta, em geral, são não lineares (f (x, θ) é uma função não linear dos parâmetros);

O ajuste do modelo requer a estimação de θ, que usualmente é realizada pelo método de mínimos quadrados.

O método de mínimos quadrados consiste na determinação de

ˆ

θ0= (ˆθ1, ˆθ2, ..., ˆθk) que minimiza a soma de quadrados dos erros

(SQE), dada por:

SQE = n X i =1 2i = n X i =1 (yi − f(xi, θ))2.

(25)

Estimação

Os estimadores de mínimos quadrados dos θ’s satisfazem:

∂SQE ∂θ1 = Pn i =1(yi − f(xi, θ))2 ∂θ1 = 0 ∂SQE ∂θ2 = Pn i =1(yi − f(xi, θ))2 ∂θ2 = 0 ... ∂SQE ∂θk = Pn i =1(yi − f(xi, θ))2 ∂θk = 0

(26)

Estimação

Ao contrário do que ocorre para modelos lineares, para modelos não lineares o sistema apresentado não tem solução analítica (os

estimadores dos θ’s não têm forma fechada)

Neste caso, a estimação por mínimos quadrados requer o uso de algum algoritmo numérico, como o método de Newton Raphson.

(27)

Estimação

Uma vez estimados os parâmetros, o modelo ajustado fica representado por:

ˆy = \E(y|x) = f (xi, ˆθ)

Os resíduos são definidos pelas diferenças entre valores observados e ajustados:

ri = yiˆyi, i = 1, 2, ..., n.

Os resíduos são importantes para o diagnóstico do ajuste do modelo (ver pacote nlstools).

(28)

Inferência

As variâncias dos ˆθ0s são obtidas da matriz de derivadas parciais de

segunda ordem (matriz de informação observada): Cov(ˆθ) = ˆσ2 ( 2f ∂θkθk0 )!−1 = ˆσ2 2f ∂θkθk0 !−1 .

Neste caso, ˆσ2 é estimado de maneira similar à usada em modelos

lineares, ou seja, usando os quadrados médios de resíduos:

ˆσ2 = SQRes

n − k =

Pn

i =1(yiˆyi)2

(29)

Inferência

O erro padrão assintótico de ˆθj é dado por:

ep(ˆθj) = q

Covθ)jj, j = 1, 2, ..., k,

onde V (ˆθ)jj representa o j−ésimo termo da diagonal de V (ˆθ).

Um intervalo de confiança para θj, um particular parâmetro do modelo,

é obtido da seguinte maneira:

IC(θj,100γ%) = ˆθj ± tn−k;1−γ 2 ep(ˆθj),

onde 100γ% é o nível de confiança do intervalo (0 < γ < 1) e tn−k;1−γ 2 é o

quantil 1−γ

(30)

Inferência

Pode-se testar a hipótese de nulidade de H0 : θj = 0 vs H1 : θj 6= 0. A

estatística do teste é:

t = ˆθj

ep(ˆθj)

. (1)

A hipótese nula deve ser rejeitada, para um nível de significância α, se |t| > |tn−k;α

(31)

Comparação de ajustes

Em geral, não ajustamos apenas um modelo aos dados, mas sim fazemos duas ou mais tentativas.

Dessa forma, é necessário comparar os ajustes produzidos pelos diferentes modelos, a fim de selecionar um deles.

A seleção do modelo pode ser baseada em diferentes critérios. Se os modelos comparados têm o mesmo número de parâmetros, pode-se optar por aquele que produz menor soma de quadrados de resíduos.

(32)

Comparação de ajustes

Ao comparar modelos com diferentes números de parâmetros, o mais adequado é usar algum critério que penalize pela complexidade (número de parâmetros) do modelo;

Neste caso, os chamados critérios de informação podem ser usados na comparação dos modelos;

O Critério de Informação de Akaike (AIC) é definido por:

AIC = −2l(ˆθ; y) + 2k,

(33)

Comparação de ajustes

Para os modelos de dose-resposta tratados até o momento, a

log-verossimilhança pode ser escrita com base na soma de quadrados de resíduos do ajuste: AIC = −2  −n 2 + ln(2π) − n 2ln SQRes n  −  1 2 ∗ SQRes/n  SQRes+2k.

Menores valores de AIC serão produzidos por modelos que aliem melhor ajuste (menor soma de quadrado de resíduos) e menor complexidade (menor número de parâmetros).

Assim, se esse for o critério de comparação de ajustes, o modelo com menor valor de AIC deve ser escolhido.

(34)

Comparação de ajustes

Como alternativa ao AIC temos o Critério de Informação Bayesiano

(BIC), definido por:

BIC = −2l(ˆθ; y) + ln(n)k.

O BIC penaliza mais fortemente a complexidade (número de parâmetros) do modelo a medida que n aumenta;

Dessa forma, optar pelo ajuste que produz menor BIC tende à seleção de um modelo com menor número de parâmetros, em relação à seleção via AIC.

(35)

Doses efetivas

Um dos objetivos principais num estudo de dose-resposta é a estimação de doses efetivas.

A dose efetiva p, denotada por EDp é definida como a dose que produz resposta igual a (100 − p)% da resposta maximal d (ou seja, redução de p%).

Uma dose efetiva bastante usual é ED50, a dose que resulta na resposta central entre os limites inferior e superior.

(36)

Doses efetivas

DE10% DE50% DE90% 10% 50% 90% 90% 50% 10% Dose Resposta

(37)

Estimação de doses efetivas

De maneira geral, para f (x, θ) uma função decrescente, com c e d os limites inferior e superior, respectivamente, a dose efetiva ED100α (0 < α < 1) é a solução da seguinte equação:

f(ED100α, θ) = (1 − α)c + αd,

e, para o caso em que f (x, θ) é crescente:

f(ED100α, θ) = αc + (1 − α)d.

Em alguns casos, EDp tem forma fechada e pode ser obtido analiticamente. Em outros, é necessário usar algoritmos numéricos.

(38)

Estimação de doses efetivas

O erro padrão das doses efetivas estimadas, ep(EDpd), pode ser obtido

de diferentes formas:

Reparametrizando o modelo, de forma que a dose efetiva desejada seja um dos parâmetros do modelo reparametrizado;

Usar método delta, para obtenção de uma aproximação para

VarEDpd



;

(39)

Estimação de doses efetivas

Dispondo-se do ep(EDpd), um intervalo de confiança para EDp pode

ser obtido da seguinte maneira:

IC(EDp, 100γ%) =EDp ± td

n−k;1−γ2 ep(EDpd),

onde 100γ% é o nível de confiança do intervalo (0 < γ < 1) e tn−k;1−γ 2 é o

quantil 1−γ

(40)

Diagnóstico do ajuste

Dois gráficos bastante úteis no diagnóstico do ajuste de modelos de dose-resposta são os seguintes:

1 Resíduos vs valores ajustados:

Verificar padrões sistemáticos que podem indicar especificação incorreta do preditor do modelo;

Avaliar se os erros têm variância constante; Identificar outliers.

2 Gráfico quantil-quantil:

Checar se os erros têm distribuição normal; Identificar outliers.

(41)

Análise de resíduos

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.0 0.2 0.4 0.6 0.8 1.0 −3 −2 −1 0 1 2 3 Valores ajustados Resíduos −2 −1 0 1 2 −2 −1 0 1 2 Quantis t−Student Resíduos studentizados ● ● ●●●● ●● ●●●● ●●●●●●● ●●●●● ●●●●●●●●●●●●●●●●●●●●● ●●●●●●● ● ●●●●●●●● ●●●●●●●●●●●●●●● ●●●●●●●●●● ●●●●● ●●●● ● ● ●● ●

(42)

Análise de resíduos

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.0 0.2 0.4 0.6 0.8 1.0 −1 0 1 2 Valores ajustados Resíduos −2 −1 0 1 2 −4 −3 −2 −1 0 1 2 Quantis t−Student Resíduos studentizados ● ● ● ● ●● ● ●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●● ●●●● ● ●

(43)

Análise de resíduos

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.0 0.2 0.4 0.6 0.8 1.0 −0.2 −0.1 0.0 0.1 0.2 Valores ajustados Resíduos −2 −1 0 1 2 −2 −1 0 1 2 3 Quantis t−Student Resíduos studentizados ● ●● ●●●● ●●● ●● ●●●●●●●●●●●●● ●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●● ●●●●●● ●● ●● ● ● ●

(44)

Análise de resíduos

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.0 0.2 0.4 0.6 0.8 1.0 −4 −2 0 2 4 Valores ajustados Resíduos −2 −1 0 1 2 −3 −2 −1 0 1 2 3 Quantis t−Student Resíduos studentizados ● ● ●●●● ●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●● ●●● ●

(45)

Análise de resíduos

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.1 0.2 0.3 Valores ajustados Resíduos −2 −1 0 1 2 −2 −1 0 1 2 Quantis t−Student Resíduos studentizados ● ● ●●● ●● ●●●●● ●●●●● ●●●●● ●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●● ●●●●●●●● ●●●●● ● ● ●

(46)

Análise de resíduos

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● 0.0 0.2 0.4 0.6 0.8 1.0 −1 0 1 2 3 4 Valores ajustados Resíduos −2 −1 0 1 2 −1 0 1 2 3 Quantis t−Student Resíduos studentizados ● ● ●●● ●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●● ●●● ●●●●●●●● ●● ● ●●● ●● ● ● ● ●

(47)

Medidas corretivas

No caso em que os erros não têm variância constante, podemos usar o método de mínimos quadrados, minimizando:

WSQE =

n X

i =1

ωi(yi − f(xi, θ))2,

em que os ωi’s são pesos, que representam a precisão (inverso da variância)

(48)

Medidas corretivas

Uma alternativa para os casos em que a resposta tem variância heterogênea e/ou distribuição assimétrica é o uso de alguma

transformação apropriada, denotada por gλ.

Em geral, a função gλ corresponde a uma transformação do tipo

Box-Cox gλ(y) = (yλ1)/λ, para algum valor de λ:

g(y; λ) =

(

(yλ)/λ, se λ 6= 0

ln(y), se λ = 0

O valor de λ é estimado de maneira a melhor induzir normalidade e variância constante para os erros.

(49)

Medidas corretivas

Em estudos de dose-resposta, é usual considerar a transformação tanto na resposta quanto na função de regressão (transform both sides

approach): g(yi; λ) = g (f (xi, θ)) + 0i, tal que 0 i iid ∼ N(0, σ2 η).

Ao aplicar a mesma transformação tanto para a resposta quanto para a função de regressão, as interpretações dos parâmetros ficam

preservadas.

Merece destaque, no entanto, que tranformar ambos os lados do modelo pode gerar complexidade adicional no ajuste do modelo.

(50)

Múltiplas curvas de dose-resposta

Em algumas aplicações, podemos ter mais de dois grupos e, por consequência, múltiplas curvas de dose-resposta. Alguns exemplos:

Curvas de dose-resposta para duas medicações diferentes (A e B) usadas no controle de hipertensão;

Curvas de dose-resposta para um fertilizante aplicado a três variedades de tomate (I, II e III);

Curvas de dose resposta para a redução no nível de colesterol, produzida por certa medicação, para indivíduos obesos, com sobrepeso, eutróficos e magros. . .

(51)

Múltiplas curvas de dose-resposta

No caso de múltiplos grupos (digamos q), podemos considerar os seguintes cenários:

Uma única curva é capaz de explicar a relação dose-resposta para os q grupos;

Precisamos de q curvas, com todos os parâmetros diferentes entre si (diferentes assíntotas, diferentes inclinações. . . ) para explicar a relação dose-resposta nos q grupos;

Alguma situação intermediária (ex: curvas com assíntotas iguais, mas inclinações e locação diferentes).

(52)

Múltiplas curvas de dose-resposta

Dose Resposta Diferentes assíntotas Dose Resposta Diferentes inclinações Dose Resposta Diferentes locações Dose Resposta

Modelos completamente diferentes

(53)

Múltiplas curvas de dose-resposta

Neste caso, podemos escrever o modelo, numa formulação mais geral, por:

yij = f (xij, θi) + ij, j = 1, 2, ..., mi; i = 1, 2, ..., n,

em que:

xij denota a j−ésima dose para a i−ésima curva de dose-resposta;

yij representa a resposta para a j−ésima dose para a i−ésima curva de

dose-resposta;

θi é o vetor de parâmetros para a curva de dose-resposta i;

(54)

Múltiplas curvas de dose-resposta

Podemos testar a igualdade de parâmetros para q curvas de

dose-resposta com base no aumento da soma de quadrado de resíduos produzida ao fixar (igualar) tais parâmetros;

Neste caso, temos dois modelos: o não restrito, em que os

parâmetros são estimados livremente para cada curva; e o restrito, em que alguns dos parâmetros são fixados;

A função anova do R, quando aplicada a dois modelos de

dose-resposta, produz um teste F aproximado para a hipótese nula referente ao modelo restrito;

Nesse caso, a rejeição a H0 indica que o modelo não restrito (com

maior número de parâmetros) seja considerado. Caso contrário, pode-se optar pelo modelo restrito (com menos parâmetros estimados).

(55)

Múltiplas curvas de dose-resposta

A potência relativa (PR) é uma medida usada na comparação de duas curvas (dois grupos, A e B), sendo definida por:

PR(A, B) = EDp(A)

EDp(B)

, 0 < p < 1.

A potência relativa é usualmente interpretada como uma medida que quantifica a força de um grupo (substância) sobre a outra.

No caso de paralelismo, a potência relativa se mantém constante para todo 0 < p < 1.

(56)
(57)

Modelos de dose-resposta para dados binários

Em diversas situações, a resposta de interesse em estudos de dose resposta é binária (morte ou não morte; cura ou não cura. . . ). Considere um experimento em que grupos de animais são expostos a diferentes doses de uma substância tóxica;

A resposta consiste no número de animais que respondem à dose (responder, no caso, pode ser a manifestação de algum efeito, ou mesmo o óbito);

Em geral, o número de animais que respondem à dose administrada em um particular grupo pode ser modelado segundo a distribuição

(58)

A distribuição da tolerância

Considere um experimento em que diferentes doses de uma substância são aplicadas a grupos de indivíduos;

Para cada indivíduo haverá uma dose abaixo da qual a resposta não ocorre, e acima da qual ela ocorre;

Na terminologia farmacológica e toxicológica, esse valor é denominado

tolerância;

A tolerância varia de indivíduo para indivíduo, de maneira que podemos especificar algum modelo probabilístico para a distribuição das

(59)

A distribuição da tolerância

Seja U a variável aleatória que representa a tolerância de indivíduos de certa população, e f (u) a correspondente função densidade de

probabilidade.

A probabilidade de um indivíduo, selecionado ao acaso dessa população,

responder à medicação quando administrada numa dose di é:

πi = P(U ≤ di) =

Z di

(60)

A distribuição da tolerância

(61)

Modelo probito

Como primeira alternativa para a distribuição das tolerâncias, vamos

assumir que U ∼ N(µ, σ2), de maneira que Z = U−µ

σ ∼ N(0, 1). Dessa forma: πi = P(U ≤ di) = P  Z ≤ −µ σ + 1 σdi  = P(Z ≤ β0+ β1di), em que β0 = −µ/σ e β1 = 1/σ.

(62)

Modelo probito

Logo, a curva de dose-resposta resultante fica dada por:

πi = Φ(β0+ β1di),

em que Φ(z) = P(Z ≤ z) denota a acumulada da distribuição normal padrão.

A forma linearizada do modelo é dada por:

(63)

Modelo logito

Diversas alternativas à distribuição normal podem ser consideradas para a tolerância.

Uma dessas alternativas é a distribuição logística, com função densidade de probabilidade:

f(u) = exp {(u − µ)/τ}

τ[1 + exp {(u − µ)/τ}]2, −∞ < u < ∞,

onde −∞ < µ < ∞ e τ > 0.

Como propriedades da distribuição logística temos E(U) = µ e

(64)

Modelo logito

Ao considerar a distribuição logística para as tolerâncias, temos:

πi = P(U ≤ di) = Z di −∞ exp {(u − µ)/τ} τ[1 + exp {(u − µ)/τ}]2du = exp {(di − µ)/τ} 1 + exp {(di − µ)/τ} .

(65)

Modelo logito

Tomando β0= −µ/τ e β1= 1/τ a curva de dose-resposta fica dada

por:

πi = exp(β0+ β1

di)

1 + exp(β0+ β1di)

,

e sua forma linearizada é dada por: logito(πi) = ln  π i 1 − πi  = β0+ β1di.

(66)

A distribuição da tolerância

A distribuição das tolerâncias, muitas vezes, é assimétrica, com alguns indivíduos respondenso apenas com doses bastante elevadas.

Tanto a distribuição normal quanto a logística configuram modelos simétricos, produzindo curvas de dose-resposta simétricas;

Nesses casos, a distribuição do logaritmo das resistências pode apresentar melhor simetria do que as resistências na escala original. É comum, em tais situações, trabalhar com as log-doses, ao invés das doses originais.

(67)

Modelo cloglog

Uma distribuição de tolerância assimétrica frequentemente considerada baseia-se na distribuição Gumbel, com função densidade de

probabilidade dada por:

f(u) = 1

κe

(u−α)/κexpn

−e(u−α)/κo, −∞ < u < ∞,

(68)

Modelo cloglog

O modelo de dose-resposta induzido pela distribuição Gumbel para as tolerâncias é dados por:

ln {− ln(1 − πi)} = β0+ β1di.

Podemos expressar o modelo de maneira equivalente, para a probabilidade de resposta, por:

(69)

Modelo Cauchy

O modelo Cauchy baseia-se na distribuição de mesmo nome para as tolerâncias

A função densidade de probabilidade da distribuição Cauchy é dada por: f(u) = 1 πγ  1 + u−x0 γ 2, −∞ < u < ∞, onde −∞ < x0< ∞, γ > 0 e π = 3.14159....

A distribuição de Cauchy tem caudas mais pesadas, se comparado às relacionadas anteriormente.

(70)

Modelo Cauchy

O modelo de dose-resposta induzido pela distribuição Cauchy para as tolerâncias é dados por:

tanπ  πi −1 2  = β0+ β1di.

De maneira equivalente, o modelo pode ser expresso para a probabilidade de resposta por:

πi = arctan(β0+ β1

di)

π +

1 2.

(71)

Modelos de dose-resposta para dados binários

(72)

Modelos de dose-resposta para dados binários

Num ensaio de dose-resposta com resposta binária, temos ni indivíduos

submetidos a cada dose di da substância, i = 1, 2, ..., m;

Ao término do experimento, registra-se yi, o número de indivíduos que

respondem à substância sob cada dose.

Tabela 1: Ilustração de dados de dose-resposta para desfecho binário Dose (d) nº expostos (n) nº respondem (y)

d1 n1 y1

d2 n2 y2

... ... ...

(73)

Modelos de dose-resposta para dados binários

Os modelos de dose-resposta para dados binários configuram modelos

lineares generalizados.

A estimação dos parâmetros (β0s) de um modelo linear generalizado se

dá por um algoritmo de mínimos quadrados ponderados, com pesos iterados repetidamente.

Os estimadores obtidos têm distribuição assintótica normal, e intervalos de confiança (95%) para os respectivos parâmetros podem ser obtidos por:

IC(95%; β0) = ˆβ1.96 × ep( ˆβ0) ; IC(95%; β1) = ˆβ1.96 × ep( ˆβ1),

(74)

Estimação de doses efetivas

Para dados binários, a dose efetiva p, denotada por EDp é aquela que

produz a resposta de interesse para p% dos indivíduos (0 < p < 1);

Por exemplo, ED90 é a dose que produz a resposta de interesse em

90% dos indivíduos, e não produz essa resposta nos demais 10%;

A estimação de doses efetivas é um dos principais objetivos em estudos de dose-resposta.

(75)

Estimação de doses efetivas

Considere novamente o modelo com função logito:

ln πi

1 − πi 

= β0+ β1di

Para a dose efetiva p0 (fixada), temos:

ln p0 1 − p0  = β0+ β1EDp0, de maneira que: EDp0 = ln p 0 1−p0  − β0 β1 .

(76)

Estimação de doses efetivas

A título de ilustração, a dose efetiva 50% é dada por:

ED50 = ln  0.5 1−0.5  − β0 β1 = − β0 β1 .

Já para a dose efetiva 90%:

ED90 = ln  0.9 1−0.9  − β0 β1 = 2.1972 − β0 β1 .

(77)

Estimação de doses efetivas

Se o modelo for ajustado em função da log(dose), suponhamos na base

exponencial, então a dose efetiva p0 pode ser obtida da seguinte

maneira: EDp0 = exp    ln p 0 1−p0  − β0 β1    .

Para o modelo com função probito, a dose efetiva p0 fica dada por:

EDp0 =

φ−1(p0) − β0 β1

,

(78)

Estimação de doses efetivas

Para a função complemento log-log:

EDp0= ln {− ln(1 − p0)} − β0 β1

,

que, como nos casos anteriores, deve ser adequadamente exponenciada na análise das log(doses).

Também para respostas binárias é comum calcular potências relativas como razões de doses efetivas avaliadas em diferentes grupos.

(79)

Erros padrões aproximados para doses efetivas

Sejam ˆβ0 e ˆβ1 os estimadores de β0 e β1, e g(β0, β1) uma função a ser

estimada (que, no caso, pode ser uma dose efetiva);

A variância aproximada de \g(β0, β1) é: ∂g ∂ ˆβ0 !2 Var( ˆβ0) + ∂g ∂ ˆβ1 !2 Var( ˆβ1) + 2 ∂g ∂ ˆβ0 ∂g ∂ ˆβ1 ! Cov( ˆβ0, ˆβ1)

(80)

Erros padrões aproximados para doses efetivas

A título de ilustração, considere o estimador da dose efetiva 50%: [ ED50= − ˆβ0 ˆβ1 . Assim: ∂g( ˆβ0, ˆβ1) ˆβ0 = −ˆβ1 1 e ∂g( ˆβ0, ˆβ1) ˆβ1 = ˆβ0 ˆβ2 1

(81)

Erros padrões aproximados para doses efetivas

Desta maneira,Var([ED50) é aproximada por:

−1 ˆβ1 !2 Var( ˆβ0) + ˆβ0 ˆβ2 1 !2 Var( ˆβ1) − 2 ˆβ0 ˆβ3 1 ! Cov( ˆβ0, ˆβ1),

que pode ser reescrita da seguinte forma:

Var([ED50) ≈ Var( ˆβ0) + 2[

ED50Cov( ˆβ0, ˆβ1) + ([ED50)2Var( ˆβ1)

ˆβ2 1

(82)

Erros padrões aproximados para doses efetivas

Finalmente, o erro padrão de [ED50 fica dado por:

EP([ED50) ≈ v u u tVar( ˆβ0) + 2[ED50Cov( ˆβ0, ˆβ1) + ([ED50) 2Var( ˆβ 1) ˆβ2 1 .

Um intervalo de confiança (aproximada) 95% para EP(EDdp) fica dado

por:

d

EDp± zα/2EP(EDdp).

Caso a análise tenha sido feita usando as log(doses), basta exponenciar os limites do intervalo obtido.

(83)

Ajustando a resposta natural

Em muitos experimentos, alguns indivíduos vão apresentar a resposta de interesse, mas por causas externas ao tratamento.

Como exemplo, insetos submetidos a uma substância tóxica podem morrer por alguma causa independente à toxina.

Nesses casos, dizemos que o indivíduo apresentou uma resposta

natural, ou morte natural, que precisa ser considerada no ajuste do

modelo de dose-resposta.

A probabilidade de resposta natural pode ser estimada com base nos resultados de um grupo controle (não tratado).

(84)

Ajustando a resposta natural

Seja π a probabilidade de resposta na ausência da toxina, e pi a

probabilidade de um indivíduo responder à dose di, i = 1, 2, ..., n.

Neste caso, a probabilidade de um indivíduo apresentar a resposta de

interesse ao longo do experimento é p0

i, dado por:

p0i = π + (1 − π)pi.

Observe que π é a probabilidade mínima de resposta, no caso em que a

(85)

Ajustando a resposta natural

Uma maneira simples de ajustar pela probabilidade de resposta natural 0) é assumir que:

O número efetivo de indivíduos suscetíveis à toxina sob dose di é ni= ni(1 − π0);

O número de indivíduos que efetivamente respondem à toxina sob dose

di é yi= yi− niπ0.

Dessa forma, as proporções ajustadas p

i/ni são usadas para modelar a

(86)

O caso de múltiplas curvas de dose resposta

Vamos considerar agora o caso de ensaios de dose respostas com k grupos.

Neste caso, para cada grupo tem-se um conjunto de indivíduos

submetidos a cada uma de mi doses, i = 1, 2, ..., k.

Novamente, ao término do experimento conta-se o número de

indivíduos que respondem à dose j no grupo i (yij), para i = 1, 2, ..., k

e j = 1, 2, ..., mk.

Observe que o conjunto de doses, bem como o número de indivíduos submetidos a cada uma delas, não precisam ser os mesmos nos diferentes grupos.

(87)

O caso de múltiplas curvas de dose resposta

Tabela 2: Ilustração de dados de dose-resposta para desfecho binário - k grupos Dose (d) nº expostos (n) nº respondem (y)

d11 n11 y11 d12 n12 y12 ... ... ... d1m1 n1m1 y1m1 ... ... ... dk1 nk1 yk1 dk2 nk2 yk2 ... ... ... dkmk nkmk ykmk

(88)

O caso de múltiplas curvas de dose resposta

Vamos considerar o modelo de dose resposta com função logito (tolerância com distribuição logística). Nota: todos os

desenvolvimentos valem para as demais funções e distribuções de tolerância.

ln1 − ππ = β0+ β1d .

(89)

Cenário 1 - retas coincidentes

(90)

Cenário 1 - retas coincidentes

Neste caso, uma única curva de dose-resposta é suficiente para o ajuste nos três grupos.

Assim, um único par de valores de β0 e β1 são suficientes, produzindo

o modelo:

ln πij

1 − πij !

= β0+ β1dj, para i = 1, 2, ..., k,

em que πij é a probabilidade de resposta para um indivíduo do grupo i

submetido à dose j, j = 1, 2, ..., mi.

Para o caso em que uma única curva não é suficiente, podemos considerar os cenários de retas paralelas e retas concorrentes.

(91)

Cenário 2 - retas paralelas

(92)

Cenário 2 - retas paralelas

Neste caso, precisamos de k curvas de dose-resposta que diferem

apenas com relação aos interceptos (diferentes β0, mas mesmo β1).

O modelo produzido fica dado por:

ln πij

1 − πij !

(93)

Cenário 3 - retas concorrentes

(94)

Cenário 3 - retas concorrentes

Neste caso, precisamos de k curvas de dose-resposta que diferem tanto

nos interceptos quanto nas inclinações (diferentes β0 e β1).

O modelo produzido fica dado por:

ln πij

1 − πij !

(95)

No R

Modelo de retas coincidentes:

aj_coinc <- glm(y/n ~ d, weights = n, family = binomial(link = '...'))

Modelo de retas paralelas:

aj_paral <- glm(y/n ~ d + grupo, weights = n, family = binomial(link = '...'))

Modelo de retas concorrentes:

aj_concor <-glm(y/n ~ d * grupo, weights = n, family = binomial(link = '...'))

(96)

No R

Podemos testar a hipótese de retas concorrentes vs retas paralelas, via teste da razão de verossimilhanças, usando:

anova(aj_concor, aj_paral, test = 'Chisq')

A hipótese nula é a de paralelismo, e a rejeição da hipótese nula implica na hipótese de retas concorrentes.

Podemos testar a hipótese de retas paralelas vs retas coincidentes, via teste da razão de verossimilhanças, usando:

anova(aj_paral, aj_coinc, test = 'Chisq')

A hipótese nula é a de retas coincidentes, e a rejeição da hipótese nula implica na hipótese de retas paralelas.

Referências

Documentos relacionados

AtravŽs dessas iniciativas, Paula e Cristiano buscam atingir o quanto antes a vis‹o da Onodera EstŽtica - Unidade Bela Vista ÒSer referncia no ramo de estŽtica

A pecuária de corte no Brasil passa por rápidas e intensas transformações que acionam, diretamente, diversos segmentos de sua estrutura de produção, passando pelos geradores

Acredita-se que as pes- soas especiais devem estar presentes não só como ouvintes, mas como agentes que possam estar envolvidos nas discussões e decisões sobre uma

Assim, a presente pesquisa objetiva apresentar uma proposta voltada à re- ferida zona de esperança, que pressuponha o uso correto dos direitos do homem, a partir de uma

3.2 Objetivos específicos a utilizar técnicas de sensoriamento remoto para determinar índices de vegetação e avaliar a dinâmica da cobertura vegetal no Alto Ipanema ao longo dos anos

Professor André: A questão da robótica na licenciatura eu tive uma introdução mas foi bem rápida, não foi bem detalhada não, mas a questão de trabalhar na escola foi quando chegou

Os desfechos pesquisados foram o impacto do diabetes mellitus tipo 1 sobre a qualidade de vida de crianças e adolescentes com esse problema e os principais

tratando do ambiente escolar, quando a criança se desvincula do seio familiar para inserir na escola ela já trás consigo um referencial de aprendizagem referente aos