th3+fr3

VII. Querschnitt- und
Längsschnitterhebungen
MEHMET HAKAN ER M
9552674
Querschnitt- und
Längsschnitterhebungen
Zielsetzung: Sammlung aussagekräftiger Daten
zur Prüfung von Hypothesen.
• Querschnitterhebungen
→
Erfassung von
Bestandsgrößen
→
Vergleichbar mit
Bilanz
(Momentaufnahme)
• Längsschnitterhebungen
→
Erfassung von
Stromgrößen
→
Vergleichbar mit G&V
(Veränderung im
Zeitablauf)
Quer- und Längsschnitt (graphisch)
• Querschnitterhebung
• Längsschnitterhebung
(X)
(X)
(t)
(t)
Erhebungsdesign
• dient der Festlegung des zeitlichen Modus der
Datenerhebung
• 3 Arten von Erhebungsdesign:
→
Querschnittdesign
→
Trenddesign
→
Paneldesign
• Informationshierarchie zwischen den Designtypen
•
(Panel>Trend>Querschnitt)
Querschnittdesign
• Die Datenerhebung bezieht sich auf einen
Zeitpunkt oder eine kurze Zeitspanne, in der
eine einmalige Erhebung der Eigenschaften
(Variablenwerte) bei N Untersuchungseinheiten
vorgenommen wird.
• → Bsp.: Es werden die Einkommenswerte von
verschiedenen Personen zu einem
Zeitpunkt erhoben.
Trenddesign
• Bei einem Trenddesign werden die Werte der
gleichen Variablen zu mehreren Zeitpunkten
mit jeweils unterschiedlichen Stichproben
erhoben.
→
Bsp.: Es werden die Einkommen von
jeweils anderen Personen zu
verschiedenen Zeitpunkten erhoben.
Über die Zeit lassen sich hier nur
aggregierte Werte verfolgen, (z.B.
Durchschnittseinkommen)!
Paneldesign
• Mit einem Paneldesign werden die Werte der
gleichen Variablen zu mehreren Zeitpunkten,
jedoch auf der Grundlage einer identischen
Stichprobe erhoben (Panelwellen).
→
Bsp.: Es werden die Einkommen von den
gleichen Personen zu verschiedenen
Zeitpunkten erhoben.
Damit können Veränderungen auf der
individuellen Ebene nachvollzogen werden!
Tabelle VII.1: Armutsquoten in
Westdeutschland 1984 bis 1989
Jahr
1984
1985
1986
1987
1988
1989
Alle
11,0
11,0
12,4
10,6
10,7
10,7
Deutsche
10,3
10,2
11,5
9,9
10,1
8,8
Ausländer
24,1
24,8
29,4
24,4
22,9
24,3
Dateninterpretation/
Trendschätzungen
• Trenddesign
→
Stichproben- und Meßfehler
• Paneldesign
→
Stichprobenfehler entfällt (Meßfehler nicht)
→
Eingeschränkte Informationshierarchie
→
Panelmortalität (Schwundquote/Welle), wg.
Sterblichkeit, Wegzügen, Verweigerung.....
→
Mittelschichtbias (Unterrepräsentation
Einkommensschwacher)
Eingeschränkte Informationshierarchie
• In der Tabelle VII.1 wurden die Werte tatsächlich mit
Paneldesign erhoben
• Wäre es eine Trendstudie
Armutsquote 86 max.
danach sinkend
• ? Falsche Aussage: Die kleinen Differenzen könnten
Stichproben- und Messfehler reflektieren
• ! Die aggregierten Trendschätzungen mit einer
Panelstudie und einer Trendstudie können auseinander
fallen (auch ohne Stichproben- und Messfehler). Diese
Diskrepanz entsteht, wenn sich die Zusammensetzung
der Population im Beobachtungszeitraum verändert. (Die
1984er Stichprobe ist keine Zufallsstichprobe aus der
Bevölkerung 1989.)
Zwischen Ergebnis
• Möchte man die Entwicklung von Armutsquoten der
Bevölkerung untersuchen: Trendschätzung mittels
Trenddesign besser als Paneldesign
• Zielt man auf die Abschätzung des Armutstrends bei der
gleichen Ausgangspopulation: Paneldesign besser
(Zusammensetzung der Bevölkerung ändert sich +
Analyse der Veränderungsdynamik auf individueller
Ebene besser möglich)
Daten und Designs
• Bisherige Annahme:
Bestimmte Designs „produzieren“
entsprechende Datentypen
• Gilt nur wenn:
Der Zeitpunkt, auf den sich eine Messung
bezieht = Erhebungszeitpunkt
Datendesign und Datenhierarchie
• Querschnittdesign→
Querschnittdaten
• Trenddesign
→
→
Querschnittdaten
Trenddaten
• Paneldesign
→
→
→
Querschnittdaten
Trenddaten
Paneldaten
Retrospektivfragen
• (Beim Interview) beziehen sich auf Handlungen
die in der Vergangenheit liegen:
Bildungsabschluss, Berufsbeginn, Jahr der
Eheschließung........
• Der Zeitpunkt, auf den sich die Messung bezieht
= Erhebungszeitpunkt
• Datentyp und Datendesign müssen nicht
notwendigerweise übereinstimmen
• Auch Längsschnittdaten können mit
Querschnitterhebungen erfaßt werden → Frage
des Erinnerungsvermögens von Personen
Datentypen
• Querschnittdaten
• Längsschnittdaten → Zeitreihendaten
→ Paneldaten
→ Verlaufs- oder
Ereignisdaten
Querschnittdaten
• Die Variablenwerte (X) der
Untersuchungseinheiten (i) beziehen sich
auf einen Zeitpunkt (t)
Xit
→
i=1,2…N, t=1
Bsp.: Einkommenswerte (X) für 3
Personen (i=3) im Jahr 2000 (t=1)
Zeitreihendaten (Trenddaten)
• Sequenz von Werten einer Variablen bei einer
Untersuchungseinheit zu T verschiedenen
Zeitpunkten
Xit
→
→
i=1, t=1,2…T
Bsp.: Durchschnittliche Einkommenswerte
(X) der Untersuchungseinheit (i=1) in den
Jahren 1984 bis 1989 (t=6)
verschiedene Stichproben!
Paneldaten
• Für N Untersuchungseinheiten liegen die Werte
einer Variablen zu mindestens zwei Zeitpunkten
(T>1) vor
Xit
→
→
i=1,2…N,
t=1,2…T
Bsp.: Einkommenswerte (X) für 50 Personen
(i=50) für die Jahre 1984 bis 1989 (t=6)
Zeitintervall identisch!
Verlaufs- oder Ereignisdaten
• Verlaufsdaten liefern das Zeitintervall zwischen
zwei Ereignissen
→
Bsp.: Dauer der Arbeitslosigkeit, Dauer
einer Ehe, die Lebensdauer eines
Unternehmens etc...
→
Informationsgehalt von Ereignisdaten ist
noch höher als derjenige von Paneldaten!
Verlaufs- oder Ereignisdaten
• Spielen bei der Analyse sozialer Prozesse
eine wachsende Rolle
• Zur Erhebung von Ereignisdaten kommen
sowohl Querschnitt- als auch Paneldaten
in Frage
• Ereignisgeschichte muss retrospektiv
erfasst werden.
• Oftmals sind derartige Studien als
Kohortenuntersuchungen angelegt
Kohortenuntersuchungen
• Kohorte = eine Bevölkerungsgruppe, die durch
ein zeitlich gemeinsames, längerfristig
prägendes Startereignis definiert wird.
→
Bsp.: Geburts-, Eheschließungs- und
Berufseintrittskohorten
→
Die Zugehörigkeit zu einer Geburtskohorte
z.B. wird dabei durch das Geburtsjahr
festgelegt in das die Geburt fällt
→
Kohortenkonzept grundlegend für die
Untersuchung des sozialen Wandels
Kohortendesign
• Kohortendesign = wichtiger Sonderfall der
Erhebung von Längsschnittdaten
• Gewinnung von Kohortendaten:
→ kein neues Erhebungsdesign
erforderlich
→ Daten können mittels Querschnitt- oder
Paneldesigns erhoben werden
→ Ex-ante-Kohortendesign vs. ex-postKohortendesign
Ex-ante- und ex-postKohortendesign
• Ex-ante-Kohortendesign:
→ Bsp.: Bestimmte zu vergleichende
Geburtskohorten werden gezielt für
eine Befragung ausgewählt
• Ex-post-Kohortendesign:
→ Bsp.: Nachträglich können die
Befragten einzelner Geburtsjahrgänge
zu Kohorten zusammengefasst werden
Kohortenuntersuchungen und
deren Effekte
• Kohorteneffekte
• Lebenszykluseffekte
• Periodeneffekte
Kohorteneffekte
• Das Kohortenkonzept unterstellt, dass z.B. die
Mitglieder einer Geburtskohorte gemeinsamen
kulturellen und sozioökonomischen Einflüssen
ausgesetzt sind, die sich auch in einem mehr
oder minder starken Grad auf den Lebensverlauf
auswirken. Soweit dies der Fall ist, wird von
Kohorteneffekten gesprochen.
• Kohorteneffekte verweisen daher auf
systematische Unterschiede zwischen den
Kohorten.
Lebenszykluseffekte
• Lebenszykluseffekte verweisen auf
systematische Zusammenhänge zwischen
den interessierenden Merkmalen und der
seit dem Startereignis verstrichenen Zeit.
• Lebenszykluseffekte abhängig von der
„Prozeßzeit“ (nicht von der Kalenderzeit).
→ Bsp.: Wird z.B. das Scheidungsrisiko
untersucht, sind Lebenszykluseffekte
abhängig von der Ehedauer.
Periodeneffekte
• Effekte die auf historisch einmaligen
Ereignissen beruhen z.B. Geburtenrate
sinkt während des II. Weltkriegs
Identifizierung von
Kohorten-, Lebenszyklusund Periodeneffekten
• Längsschnittdaten erforderlich!
• Aufgrund von Datenmangel werden in der
Praxis Lebenszykluseffekte häufig nur
anhand von Querschnittdaten geschätzt
→ Problem: „Lebenszyklus-Fehlschluß“
→ Bsp.: Vermeintlicher Intelligenzabbau
im Alter
Zusammenfassung
• Auswahl des Erhebungsdesigns abhängig von
der zu prüfenden Hypothese
• Allgemein gilt, daß zur Prüfung einer Hypothese
→
der erforderliche Datentyp ermittelt
werden muss
→
und dann jenes Erhebungsdesign zu
wählen ist, mit dem diese Daten zuverlässig
und kostengünstig erfaßt werden können
3 Fragen
• 1. Was wird unter dem Begriff
„Panelmortalität“ verstanden?
• 2. Nehmen Sie zu folgender Aussage
kritisch Stellung:
„Querschnitt- und Längsschnittdesigns
produzieren bestimmte Datentypen.“
• 3. Erläutern Sie anhand eines Beispiels die
Problematik des „Lebenszyklus-Fehlschluß“.