Méthodologie statistique pour un essai thérapeutique

Méthodologie statistique
pour un essai thérapeutique
Antoine Pariente
Département de Pharmacologie - Université Bordeaux 2
Plan
• Schéma classique
–
–
–
–
types d’analyses possibles
signification et significativité de la différence
puissance et Nombre de Sujets Nécessaire
analyse per protocol, analyse en intention de traiter
• Particularités des autres grands schémas
– essais d’équivalence et de non-infériorité
– essais pragmatiques
– essais croisés
Schéma classique
• Essai de supériorité, explicatif, en groupes parallèles
• Essai contrôlé et comparatif (phase III)
– attribution aléatoire du traitement
– comparaison
• au placebo / au traitement de référence
– réalisation en aveugle
• Statistique
– hypothèse nulle : pas de différence entre les traitements
– hypothèse alternative : il existe une différence
• En l’absence de résultats significatifs :
« Nous n’avons pas mis en évidence de différence… »
Types d’analyses possibles
• Comparaison de proportions
– proportions de sujets guéris à 1 mois, 1 an, etc.
• Comparaison de moyennes
– moyennes du Peak-Flow après traitement
– différence de moyennes comparée à 0
• Analyses de survie
– proportion de sujets vivants / décédés
– prenant en compte le délai avant survenue de
l’événement
Comparaison de proportions
• Chi2, Test exact de Fisher
• Calcul de Risque Relatif brut
–
–
–
–
tableau de contingence à 4 cases
aucun ajustement
pas de prise en compte des autres facteurs
licite
• dans un essai randomisé
• après vérification du bon fonctionnement de la procédure
de randomisation
• Régression logistique : analyse
multifactorielle ajustée
Rizoli S et al. Recombinant activated factor VII as
an adjunctive therapy for bleeding control in severe
trauma patients with coagulopathy. Crit Care. 2006.
Temsirolimus, Interferon alpha or both for advanced
renal cell carcinoma. NEJM; 2007; 356:2271-81
Comparaison de moyennes
• Test Z, test de Student, ANOVA
– analyses unifactorielles
– éventuellement bifactorielles pour ANOVA
• Test de Wilcoxon Mann-Whitney
• Test de Rang
• Régression linéaire multiple : analyse
multifactorielle
Rizoli S et al. (2)
Efficacy and safety of corticosteroids for persistent
acute respiratory distress syndrome. NEJM 2006; 354:1671-
Analyses de survie
• Courbes de Kaplan-Meier et test du
Log-Rank
– analyse de survie unifactorielle
• Modèle des risques proportionnels de
Cox
– analyse multifactorielle
Temsirolimus, etc.
Une différence, des significations
• Signification clinique
– pertinence clinique
• Signification statistique
– « réalité » statistique
• Pb : une différence statistique est
parfois beaucoup plus facile à obtenir
qu’une différence clinique
Une différence, des significations
Nombre de sujets nécessaire (NSN) par groupe pour mettre en
évidence une différence significative entre deux proportions
Différence P2-P1
Probabilité
P1 = 0,5
0,05
0,1
0,15
0,2
0,25
NSN
1605
407
183
103
66
Pour une puissance de 80% …
Puissance et
Nombre de Sujets Nécessaire
• Puissance : capacité statistique à
détecter une différence si elle existe
– Minimum légal : 80 %
– = 1- risque de 2ème espèce ß
• Nombre de sujets nécessaire
– doit être déterminé a priori
– en fonction des risques statistiques (α et ß)
– ET de la différence à mettre en évidence
Evaluation par la
Commission de Transparence
• Service Médical Rendu
– performance du médicament
•
•
•
•
niveau de preuve
importance de l’efficacité
pertinence des critères utilisés
effets indésirables
– gravité de la maladie, place dans la thérapeutique
– intérêt pour la santé publique
• SMR majeur ou important
• SMR modéré ou faible
• SMR insuffisant
Evaluation par la
Commission de Transparence
• Amélioration du SMR
– Progrès thérapeutique
• nouvelle modalité de prise en charge
• réponse à un besoin non ou peu couvert
• apport d’un progrès clinique significatif
–
–
–
–
–
I : majeur
II : important
III : modéré
IV : minime
V : absence de progrès (admis au remboursement
que s’ils induisent des économies)
Per protocol et intention de traiter
• Analyse per protocol
– ne porte que sur les sujets ayant complété l’essai
– +/- que sur les sujets observants
• Analyse en intention de traiter
– porte sur tous les sujets inclus
– statut défini a priori pour les perdus de vus
• tout échec
• LOCF : last observation carried forward
• risque maximal :
– échec pour le traitement à évaluer
– succès pour le traitement de comparaison
Schéma classique
• Essai explicatif de supériorité
randomisé en groupes parallèles
• Conclusion
– différence significative
OU
– pas de mise en évidence de différence
significative
• différent d’une conclusion d’équivalence
Essais d’équivalence
Essais de non infériorité
• Hypothèse nulle
– il existe une différence
• Hypothèse alternative :
– les traitements comparés sont équivalents
• Conclusion
– équivalence statistiquement significative
OU
– pas de mise en évidence d’équivalence significative
• Essais d’équivalence
– traitements de référence très efficaces
– objectif : bénéfice autre à efficacité comparable
Essais d’équivalence
• Equivalence parfaite impossible à
démontrer (probabilité nulle)
• Equivalence entre 2 traitements
démontrée si la différence vraie est
négligeable sur le plan clinique
Equivalence / Non infériorité
• A et B équivalents si différence vraie δ
– inférieure à une borne clinique ∆c
– IδI < ∆c
-∆c
– zone d’équivalence
∆c
B
δ
– aucun des traitements n’est supérieur à l’autre
• Non infériorité
– A non inférieur à B
– A peut-être supérieur à B
– zone de non infériorité
-∆c
B
δ
Traitement de comparaison
• traitement de référence
• même principe actif, mais avec galénique
différente
• le traitement de comparaison doit avoir vue
son efficacité démontrée dans un essai de
supériorité
– contre placebo
– contre ancien produit de référence
Critère de jugement
• critère pour l’équivalence / non infériorité
– validé
– reconnu
– SENSIBLE AU CHANGEMENT
dans l’indication
• primordial pour essais d’équivalence
• doit avoir bonne capacité à détecter différence clinique
signifiante
• +++ celui sur lequel l’efficacité du traitement de
comparaison a été démontrée
Choix de la borne d’équivalence
• consensus d’experts
• de taille inférieure à la taille d’effet considéré dans les
essais de supériorité
– ne peut être jugée significative en supériorité
– …et négligeable en équivalence / non inf
• en l’absence d’autre hypothèse, on retient une fraction
de la borne de supériorité (+++1/2, +2/3)
• possibilités prendre en compte le contexte
Schéma expérimental
• pas de schéma spécifique aux essais d’équivalence / de
non infériorité
• reproduire schéma utilisé pour démontrer efficacité du
traitement de référence (+++)
– traitements comparés à utiliser dans leurs conditions maximales
d’activité
– randomisation, administration en double aveugle +++
• schéma de supériorité et analyse d’équivalence :
absence de différence attribuable au traitement
Validation de l’essai d’équivalence
• conclusion : « deux traitements sont également
efficaces » sous-entend qu’ils sont efficaces
• validation interne de l’essai : idéal
– introduction groupe placebo
• problèmes éthiques
• permet de vérifier la sensibilité de l’étude
• validation externe
– quand validation interne non éthique
– comparaison de l’efficacité du traitement de
référence dans l’essai à celle observée auparavant
Répétition des essais
d’équivalence
• Vient un moment où ça dépasse les
bornes
Répétition des essais de
non-infériorité
• Non-inferiority margin creeping
-∆c
A B
Essai 1
-∆c
Essai 2
-∆c
δ
A’ A
δ
A’’ A’
Essai 3
δ
Essai pragmatique : objectifs
• évaluation d’un traitement
– pour guider le choix thérapeutique
• dans une indication donnée
• pour un type de patients donné
• détermine l’utilité d’un traitement
– rapport complexe entre avantages et
inconvénients
– variable entre patient
Conséquences pratiques
• définition radicalement opposée entre
essais explicatifs et pragmatiques pour
– traitement
– patient
– comparaison
– effet
dans la construction du protocole
Traitements et contextes
• objectif : évaluer l’utilité d’un médicament
• utilité peut combiner
– activité biologique propre (essai explicatif)
– modulation de l’activité par le contexte du traitement
•
•
•
•
effet placebo
tolérance
facilité d’emploi
observance
• principe d’intégration des contextes
• approche optimale de la situation clinique réelle
Traitements et contextes (2)
• référence permanente : attitude pratique
– définition flexible des traitements
• possibilité de modulation de posologie
• possibilité d’arrêt du traitement
• possibilité de changement de traitement
• implications
– insu non obligatoire
– placebo non obligatoire
Patients
• définition des patients à inclure ne doit pas se faire
dans l’objectif de déterminer au mieux l’efficacité
propre du traitement
AU CONTRAIRE
• patients représentatifs des patients qui seront traités
– polypathologiques
– terrains variables
– observance moins « contrainte »
• définition « naturelle »
Choix des critères de jugement
• assez simple pour essais explicatifs
– symptôme principal de la maladie
– survie
– anomalie biologique
• plus difficile pour essais pragmatiques
– utilité = rapport complexe
– critère privilégié (efficacité) + handicap résumant l’ensemble
des inconvénients
– combinaison pondérée de différents critères
Comparaison principe d’une essai explicatif
• objectif : démontrer une efficacité
• risque principal : identifier une différence qui
n’existe pas
– risque de 1ère espèce α
– seuil d’acceptabilité fixé pour α : 0,05 (5%)
• risque secondaire : ne pas mettre en évidence
une différence qui existe
– risque de 2ème espèce β
– seuil maximal pour β : 0,2 (20%)
– puissance = 1- β ; seuil minimal = 0,8 (80%)
• nombre de sujets nécessaire minimise α et β
Comparaison (2) principe d’un essai pragmatique
• comparaison de 2 stratégies souples
– sur un ensemble de critères
– hypothèse d’égalité des effets très improbable
• risque α non impliqué
• risque β d’ignorer une différence existante doit être nul
– apparition d’un nouveau risque d’erreur : type III ou γ
• conclure à la supériorité de A sur B quand B est supérieur à A
• erreur de signe
• calcul du NSN pour minimiser γ
Comparaison et conclusion
d’un essai pragmatique
• pas de test statistique de comparaison
• vérification a posteriori de la probabilité
d’erreur de signe γ
– si γ grande
• on conserve le traitement le mieux classé
• mais nécessité immédiate de reconduire des
essais pragmatiques
Choix de l’approche
• fonction du niveau de connaissances accumulées et de
l’objectif
• différences beaucoup moins tranchées en pratique
– essais moins purement explicatifs
– essais moins typiquement pragmatiques
• continuum entre essais cliniques et pragmatiques
• un même protocole ne permettra pas d’évaluer
correctement efficacité et utilité
Essais Croisés
(ou pourquoi vous devriez en rencontrer peu)
Un essai croisé est un essai dans lequel les
sujets reçoivent séquentiellement différents
traitements dans l’objectif d’étudier les
différences entre traitement ou séquences de
traitement
Représentation schématique d’un
essai croisé de type AB/BA
Répartition des valeurs du critère
de jugement par traitement
Essais croisés : utilisation
• fréquemment utilisé pour le
développement de médicament
• domaines variés
– maladie chronique
– expression relativement stable
(exp : asthme, hypertension, troubles du
sommeil, angor, diabète, migraine, épilepsie
ou rhumatismes inflammatoires).
Essais croisés : utilisation
• non adaptés pour les maladies mettant en jeu
le pronostic vital
(pas très chronique comme maladie non ?)
• non adaptés quand des soins continus sont
nécessaires
Essais croisés : utilisation
• avantage principal : efficience +++
• car chaque sujet est son propre témoin
– source importante de variation dans les essais en
groupe parallèles : variabilité entre patients ou
variabilité inter-individuelle
– conséquence : nombre de sujets nécessaire
généralement inférieur dans les essais croisés à
celui d’un schéma parallèle :
• à différence égale
• pour une puissance égale
Calcul de l’effet du traitement
•
•
recherche d’un effet du traitement :
comparaison à 0 de la différence entre les 2 moyennes de
différences intra-sujets
évaluation des différences intra-groupes
– données non indépendantes
– nécessité de recours à des techniques pour séries appariées (tests
de rang)
•
comparaison de la différence des différences à 0
– si pas de différence entre traitement A-B = B-A
– donc (A-B)-(B-A)=0
– comparaison par tests habituels car les 2 différences sont
indépendantes entre elles