- Universitätsklinikum Freiburg

Statistische Analysen am Beispiel
unterschiedlicher Fragestellungen der NAKO
Martin Schumacher
Institut für Medizinische Biometrie und Statistik
Universitätsklinikum Freiburg
1. Beiratssitzung der NAKO Freiburg, 14. Dezember 2015
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen … 14. Dezember 2015
No. 2
• Kurzfristige Perspektive:
Querschnittsstudien mit „Freiburger“ Daten
• Längerfristige Perspektive:
Longitudinalstudien in der Gesamt-Kohorte
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 3
Querschnittsuntersuchungen mit „Freiburger Daten“ (1)
Beispiele
• Schätzung der Prävalenz von vorliegenden Grunderkrankungen
• Schätzung der Verteilung von Gesundheits- /
Krankheitsindikatoren
• Schätzung der Verteilung von Exposition- /
Risikofaktorkonstellationen
Vorteil: Repräsentative Stichprobe der Bevölkerung in FR / EM im
Altersbereich 20 – 69 Jahre
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 4
NAKO, Informationsbroschüre, Level 1
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 5
Querschnittsuntersuchungen mit „Freiburger Daten“ (2)
• Genauigkeit von Prävalenzschätzungen (N = 10.000)
(95%-Konfidenzintervall: geschätzte Prävalenz  (2  Standardfehler))
Absolute Genauigkeit
Prävalenz = 10% :  0,6%
Prävalenz =
Martin Schumacher
1% :  0,2%
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 6
Querschnittsuntersuchungen mit „Freiburger Daten“ (2)
• Genauigkeit von Prävalenzschätzungen (N = 10.000)
(95%-Konfidenzintervall: geschätzte Prävalenz  (2  Standardfehler))
Absolute Genauigkeit
Relative Genauigkeit
Prävalenz = 10% :  0,6%
 6%
1% :  0,2%
 20%
Prävalenz =
• Relative Genauigkeit
Martin Schumacher
(  2  Standardfehler / Prävalenz)
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 7
Querschnittsuntersuchungen mit „Freiburger Daten“ (3)
• Abgestimmtes Vorgehen in der NAKO ist notwendig
• „Antragsverfahren“ zur Überlassung und Auswertung der Daten
• Frühzeitig planen, welche Daten zur Beantwortung welcher
Fragestellungen (insbes. in welchem Detaillierungsgrad)
vorhanden sind
• Prüfen, ob Fragestellung nur für FR / EM oder für die gesamte
NAKO von Interesse ist
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 8
Longitudinalstudien in der Gesamt-Kohorte (1)
• Die Rekrutierungsphase der NAKO wird noch bis Mitte 2018
(geplant) dauern.
• Alle Teilnehmer werden engmaschig nachbeobachtet (bis 2042)
hinsichtlich Auftreten von Erkrankungen, Änderung in
Risikofaktoren, Mortalität
• Mit einer gewissen Drop-out-Rate muss man trotzdem rechnen
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 9
German National Cohort (GNC) Consortium. Eur J Epidemiol 2014;29:371-382
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 10
Longitudinalstudien in der Gesamt-Kohorte (2)
Szenario 1: Terminales Nierenversagen
(End stage renal disease, ESRD), nach 15 Jahren
Tod
(ohne ESRD)
ESRD
Drop-out
M
F
M
F
M
F
410
210
13.600
8.000
3.320
3.470
Szenario 2: Lungenkarzinom (Lung cancer), nach 15 Jahren
Lung cancer
Tod
(ohne lung cancer)
Drop-out
M
F
M
F
M
F
1.600
620
13.200
7.960
3.300
3.450
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 11
Longitudinalstudien in der Gesamt-Kohorte (3)
• Power, um moderate Gen-Effekte nachzuweisen, ist im ESRD
Szenario zu gering, im Lung Cancer Szenario ausreichend
• Studie ist besonders geeignet um Gen-Umweltinteraktionen
(Interaktionen zwischen genetischen und nicht genetischen
„Umwelt“-Faktoren) zu untersuchen. Power ist bei realistischen,
erwarteten Effekten ausreichend.
• Es gibt verschiedene, simulationsbasierte Tools, die Bestimmung
von Power und notwendigen Fallzahlen auch für komplexe
Fragestellungen und unter komplexen Bedingungen wie in der
NAKO erlauben.
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 12
Longitudinalstudien in der Gesamt-Kohorte (4)
• Für jede Fragestellung muß geprüft werden, ob genetische Faktoren bei
allen Teilnehmern der Kohorte bestimmt werden sollen, oder nur bei einem
„Subsample“
 Nested case-control study
Alle „Fälle“ (z.B. Teilnehmer mit ESRD, etwa 620) und gemäß
Incidence Density Sampling gezogene „Kontrollen“ (etwa 620 – 2080)
 Case-cohort study
Alle „Fälle“ (z.B. Teilnehmer mit Lung cancer, etwa 2420) und eine
Zufallsstichprobe der Gesamtkohorte (etwa 2500 – 5000)
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 13
Schlussbemerkung
• Hinsichtlich der kurzfristigen Perspektive sollte man sich schon bald
überlegen, welche Fragestellungen man mit den „Freiburger“ Daten (evtl.
auch Teildaten) untersuchen möchte.
• Zu langfristig durchzuführenden Longitudinalstudien ist es wichtig sich
rechtzeitig in standortübergreifenden Arbeitsgruppen zusammen zu
schliessen und detaillierte Pläne auszuarbeiten.
• Mit dem CO-PI, Dr. Claudia Schmoor, ist eine studienerfahrene Statistikerin
im Freiburger NAKO-Team, die gern auch von weiteren
Wissenschaftler/innen des IMBI unterstützt wird.
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015
No. 14
Referenzen
• German National Cohort (GNC) Consortium. The German National Cohort: aims, study design and
organization. Eur J Epidemiol 2014; 29: 371-382.
• Inormationsbroschüre zur Teilnahme an der NAKO (Pilot-und Hauptstudie) 2013 – 2018, Level 1.
•
Ohneberg K, Wolkewitz M, Beyersmann J, Palomar-Martinez M, Olaechea-Astigarraga P, AlvarezLerma F, Schumacher M: Analysis of Clinical Cohort Data Using Nested Case-control and Case-cohort
Sampling Designs: A Powerful and Economical Tool. Method Inform Med, 2015; 54: 505-514.
• Gaye A, Burton TWY, Burton PR. ESPRESSO: taking into account assessment errors on outcome and
exposures in power analysis for association studies. Bioinformatics 2015; 31: 2691-2696.
• Burton PR, Hansell AL, Fortier I, Manolio TA, Khoury MJ, Little J, Elliott p: Size matters: just how big is
BIG?: Quantifying realistic sample size requirements for human genome epidemiology. Int J Epidemiol
2009; 38: 263-273.
• Brown P, Jiang H. Simulation-based power calculations for large cohort studies. Biometrical J 2010;
52: 604-615.
Martin Schumacher
Statistische Analysen am Beispiel unterschiedlicher Fragestellungen …
14. Dezember 2015