• Nenhum resultado encontrado

Processus de comptage et censure à droite

2.4.1 Définitions

Définition 6 Une variable de censure U est définie par la possible non-observation de l’événement. Si l’on observe U, et non T, et que l’on sait que T > U (respectivement T < U,U1 < T < U2), on dit qu’il y a censure à droite (respectivement censure à gauche, censure par intervalle).

X peut être considérée comme la durée séparant un événement initialAd’un événement finalB, ou comme la durée pendant laquelle un sujet reste dans un état donné (auquel casA désigne l’entrée dans cet état etBla sortie de cet état – par exemple le chômage). La censure à droite, dont il sera essentiellement question par la suite, est due à la non-observation de B, dont on sait seulement qu’il sera postérieur à la dernière date d’observation du sujet.

Dans les études de cohorte, on rencontre la censure à droite pour deux raisons :

(i) le sujet n’est pas rentré dans un état absorbant avant la fin de l’étude (date de point), on parle « d’exclu vivant »,

(ii) le sujet a quitté l’étude en cours pour différentes raisons, par exemple un déménagement ou un refus de continuer à participer à la cohorte, c’est ce que l’on nomme des « perdus de vue ».

Par ailleurs, la censure se distingue de la troncature : une observation est dite tronquée si elle est conditionnelle à un autre événement. Par exemple, pour des données de survie, on dit qu’il y a troncature à gauche (respectivement à droite) lorsque la variable d’intérêt Ti (durée de vie dui`eme individu) n’est observable qu’à la conditionTi > c (respectivement Ti< c), oùc >0est un seuil fixé. La troncature élimine de l’étude une partie desTi, ce qui a pour conséquence de faire porter l’analyse uniquement sur la loi deT conditionnellement à l’événement {T < c}(respectivement {T > c})

Dans ce qui suit, nous verrons comment la censure à droite, une forme de données incomplètes parmi les plus courantes, peut être prise en compte dans les modèles basés sur les processus de comptage.

2.4.2 Notations

Afin d’aborder la censure par les processus de comptage, considérons :

– N(t) le processus de comptage multivarié non censuré par rapport à la filtration naturelle Ft=σ(N(u), 06u6t),

N(t) = (Nhj(t), h, j= 1, ..., k, h6=j), où

Nhj(t) = 11{Thj6t}

avec Thj le temps d’apparition de la transition de l’état h versj.

– Yh(t) les indicateurs permettant de savoir si le processus X est dans l’état h juste avant le tempst,

Yh(t) = 11{X(t−)=h}, h= 1, . . . , k.

– C(t) le processus de censure à droite,

C(t) = (Ch(t), h= 1, ..., k), avec

Ch(t) =I{t6Uh}, où Uh est le temps de censure par rapport à l’étath.

Remarque 14 Dans la plupart des études épidémiologiques, le processus de censure ne dépend que de l’individu et non du type d’événement. C’est pourquoi, dans la suite, l’indice h est suprimé . Les résultats obtenus peuvent facilement être adaptés au cas de différents mécanismes de censure pour différents types d’événements.

L’objectif est d’étudier le processus de comptageN(.)en tenant compte de la censure à droite. Celle-ci introduit une variation aléatoire supplémentaire que la tribuFtne prend pas en compte. Cette dernière a donc besoin d’être élargie. NotonsGt cette nouvelle filtration :

Gt=Ft∨σ(C(u),06u6t), Considérons, les processus réellement observés après censure :

– Nc(.) le processus de comptage censuré à droite qui représente la partie observable de N(.) :

Nc(t) =¡

Nhjc (t), h, j = 1, ..., k, h6=j¢ , avec

Nhjc (t) = Z t

0

C(s)dNhj(s), – Yhc(t) tel que,

Yhc(t) =C(t)Yh(t), h= 1, . . . , k.

2.4.3 Censure à droite indépendante

Un problème fréquent avec la censure à droite est qu’elle peut modifier les intensités des événements d’interêt. Si, par exemple, dans un essai clinique, les patients particulièrement malades sont enlevés de l’étude, les patients qui restent à risque ne sont plus représentatifs de l’échantillon total et ainsi les intensités sont différentes d’une situation sans censure. La notion de censure à droite indépendante permet d’éviter ce problème.

Définition 7 Soit N(.) un processus de comptage multivarié de compensateur Λ(.) par rapport à la filtrationFt. SoitC(.) un processus de censure à droite prévisible par rapport àGt⊇ Ft.

Alors, la censure à droite générée par C(.) est indépendante si le compensateur de N(.) par rapport à Gt est aussiΛ(.).

Autrement dit, la connaissance des temps de censure juste avant t ne modifie pas l’in- tensité du processus Nau temps t. Lorsque la censure est indépendante, la répartition des temps de décès est la même pour les patients censurés et pour les patients non censurés.

En pratique, cela signifie, que les individus ne doivent pas être censurés parce qu’ils ont un risque de décès particulièrement élévé ou faible. La censure devient dépendante si, par exemple, certains patients ne sont plus suivis car leur état s’est sérieusement dégradé (les personnes les plus à risque sont enlevées de l’étude).

Proposition 2 Sous l’hypothèse de censure à droite indépendante, (1) la mesure d’intensité (le compensateur) de Nc(.) par rapport à Gtest

Λchj(t) = Z t

0

C(s)dΛhj(s).

(2) si le processus N(.) a une intensité multiplicative par rapport à Gt alorsNc(.) a aussi une intensité multiplicative par rapport à Gt.

Proposition 3 SoitNc(t) =³

Nhjc (t) ;h, j = 1, ..., k, h6=j´

un processus de comptage cen- suré. Si la censure à droite est indépendante alors la vraisemblance du modèle s’écrit

Lc= P

t∈[0,τ]

Qk h=1

Q

j6=h

£dΛchj(t)¤∆Nhjc (t)

[1−dΛc..(t)]1−∆N..c(t). (IV.8) où

Λc..= Pk

h=1

P

j6=h

Λchj, et

N..c(t) = Pk

h=1

P

j6=h

Nhjc (t).

A la vue des propositions précédentes, la vraisemblance partielle avec censure a la même forme que la vraisemblance sans censure (IV.6). Le fait que la forme de la vraisemblance soit préservée par la censure indépendante implique que les propriétés des martingales restent les mêmes. Ainsi, lorsque la censure est indépendante, l’inférence et la théorie asymptotique sont toujours applicables de la même manière que pour des données non censurées (par la structure de martingale).

Des résultats complémentaires sur la censure indépendante sont donnés page 172. En particulier, le principe général de la vraisemblance partielle est décrit page 167. Ce dernier est utilisé pour construire la vraisemblance associée à un processus censuré (IV.8). La notion de censure non-informative est également définie page 174.

Désormais, nous nous placerons dans le cadre d’un mécanisme de censure indépen- dante. Dans tout ce qui suit, les processus considérés seront des versions censurées mêmes si les notations ne le feront plus apparaître.

Remarque 15 Dans certaines situations, la censure apporte une information sur l’état de santé du patient est devient dépendante. L’expression de la vraisemblance ne correspond plus à une vraisemblance complète car toute l’information n’est pas utilisée. Cette vraisemblance peut toujours être utilisée mais cela entraîne un biais dans l’estimation.

2.4.4 Caractéristique de la censure à droite

Afin de simplifier les différentes définitions et les exemples, les mécanismes de censure à droite sont décrits dans le cadre des données de survie. En effet, les mêmes principes s’appliquent aux processus Markov.

Dans le cas de l’analyse de la survie, les données observées sont :

³T˜i, Di, i= 1, ..., n´ avec

– Ti est la date de survenue de l’événement chez l’individui;

– Ui la date de censure correspondante ; – T˜i = min (Ti, Ui),le temps d’observation ; – Di = 11{T˜i=Ti},un indicateur de censure.

Quand l’événement se produit, Ti est « réalisée » (Di = 1). Quand il ne se produit pas (individu étant perdu de vue ou bien exclu vivant), c’estUi qui est « réalisée » (Di = 0).

Censure non aléatoire de type I :

Les observations pour chaque individu sont arrêtées à un temps fixéu commun à tous,

i.e. ½ T˜i= min (Ti, u)

Di= 11{Ti6u}

Ce mécanisme de censure est couramment utilisé dans l’industrie pour tester la durée de vie denobjets identiques sur un intervalle d’observation fixé [0, u].En biologie, afin de tester l’efficacité d’une molécule sur un lot de souris, les souris survivantes sont sacrifiées au bout d’un temps déterminéu.

Remarque 16 Bien que similaires dans l’écriture de leur définition, la censure non-aléatoire de type I à droite et la troncature à droite doivent être distinguées : en effet, l’inférence statis- tique diffère selon qu’elle s’applique à l’un ou l’autre de ces deux types de données de survie.

Dans le cas de données censurées, la vraisemblance sera le produit d’un nombre aléatoire de facteurs ; dans le cas de données tronquées, la vraisemblance sera le produit d’un nombre fixe de facteurs.

Censure aléatoire de type I :

Les observations pour chaque individu sont :

½ T˜i = min (Ti, Ui) Di =I{Ti6Ui}

où Ui est un temps de censure aléatoire indépendant deTi.Si, de plus, les(Ui)i=1,...,n sont i.i.d. la censure aléatoire de type I est dite « classique ».

Cette censure est l’une des plus utilisées pour l’analyse de données de survie. Par exemple, dans un essai thérapeutique, on admet que les sujets entrent de façon aléatoire. Si la date d’analyse est fixée a priori, le délai entre la date d’entrée et la date de point, c’est-à-dire le temps de participation des exclus-vivants, est aléatoire. La censure aléatoire de type I est indépendante quand le processus d’événement et le processus de censure sont indépendants.

Censure de type II :

Les observations pour chaque individu sont arrêtées à un temps aléatoire commun à

tous, i.e. (

i= min¡

Ti, T(r)¢ Di=I{Ti6T(r)}

où r est un entier fixé, 1 6 r 6 n. T(1), ..., T(r), ..., T(n) est la statistique d’ordre, i.e. T(r) correspond auri`eme temps de décès.

Ce mécanisme de censure est utilisé dans le monde industriel, par exemple lorsque l’on veut observer la durée de fonctionnement denmachines tant quer d’entre elles ne tombent pas en panne. En biologie, pour tester l’efficacité d’un poison sur un lot de souris, la durée de l’étude correspond au temps que mettent r souris à mourir.

Notons, que dans le cas des processus de Markov, la censure peut dépendre des condi- tions initiales. Par exemple, on pourrait avoir une censure aléatoire avec des distributions différentes suivant l’état de l’individu au temps 0.

Par la suite, nous considérerons un mécanisme de censure aléatoire de type I et indépendante.

3 Estimation non-paramétrique