VO 2 Skalenniveaus

Mayer
Horst
(2004):
Interview
und
schriftliche
Befragung. Entwicklung, Durchführung und Auswertung,
München-Wien; Seite 68-70
Daten und Skalen
Die in einer Stichprobe enthaltenen Untersuchungseinheiten wie Personen, Unternehmen, etc.
stellen Merkmalsträger dar, die bestimmte Ausprägungen aufweisen (Geschlecht, Alter, Größe,
Einstellungen, Motivation, ...). Messen bedeutet nun, die Merkmalsausprägungen systematisch zu
erfassen und ihnen nach ganz bestimmten Regeln numerische Werte zuzuordnen (vgl. dazu z.B.
Schnell u.a. 1999, S. 132 ff). Durch diesen Vorgang entstehen Daten, das sind zahlenmäßig
erfasste Merkmalsausprägungen, d.h. Messwerte einer bestimmten Variable (vgl. Berekhoven
u.a. 1999, S. 69). Diese Daten bilden in Form einer Datenmatrix die Grundlage für die weitere
Auswertung.
Beim Messen werden den beobachteten Merkmalsausprägungen nach bestimmten Verfahren
Zahlen zugeordnet. In der Physik existieren zur Bestimmung von Länge, Gewicht, Zeit etc.
entsprechende Abbildungsvorschriften. Solche Abbildungsvorschriften bzw. Zuordnungsregeln
werden als Skalen bezeichnet (Meterstab, Anzeige an einer Waage bzw. einer Uhr etc.). Auch zur
Messung von Einstellungen, Motivation, Bildungsstand, Schichtzugehörigkeit, Image,
Involvement etc. in der Sozial-, Markt- und Meinungsforschung sind entsprechende Abbildungsvorschriften bzw. Skalen notwendig. Unterschiedliche Abbildungsvorschriften führen zu
unterschiedlichen Skalen, wodurch die Messung auf unterschiedlichem Niveau erfolgen kann.
Die Bestimmung des verwendeten Messniveaus (oder Skalenniveaus) ist daher wichtig für die
weitere Verwendung der Daten.
"Der Informationsgehalt von Daten wird u.a. durch das Messniveau festgelegt, mit dem die
Merkmalsausprägungen der Untersuchungsobjekte gemessen werden. Die verschiedenen
Messniveaus sind durch eine Reihe von formalen Eigenschaften charakterisiert, die zugleich die
bei der Datenanalyse verwendeten Methoden bestimmen." (Mayntz u.a. 1978, S. 38)
So ist es bei einer Befragung zu Ausgaben für das Telefonieren sicherlich von Interesse, wie hoch
die durchschnittlichen Telefonkosten pro Monat sind, es macht jedoch keinen Sinn, den
Mittelwert der Staatsangehörigkeit der Befragten zu berechnen.
Beispiele für verschiedene Skalen:
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
1
Skalenniveaus
Die Skalentypen lassen sich nach dem Messniveau in vier Kategorien einteilen: Nominalskalen,
Ordinalskalen, Intervallskalen und Ratioskala. Für jede Skalenart gelten bestimmte mathematische Eigenschaften.
Eigenschaften
gleich/ungleich
Ordinalniveau
größer/kleiner
quantitativ
Messniveau
Nominalniveau
Intervallniveau
Abstand (+/-)
Rationalniveau
Verhältnis (./:)
Beschreibung
Messwerte sind gleich oder
ungleich
Messwerte lassen sich der
Größe nach ordnen
Abstände zwischen den
Messwerten sind angebbar
Messwertverhältnisse
können berechnet werden
Beispiele
Geschlecht,
Nationalität
Noten, Schicht,
Bildung
IQ-Punkte
Alter
Der Informationsgehalt der Daten hängt ganz wesentlich von ihrem Messniveau ab. So besteht
für Daten auf Nominalskalenniveau lediglich die Möglichkeit sie auf ihre Gleichheit hin zu unterscheiden (z.B. männlich/weiblich). Daten auf Ordinalskalenniveau bieten zusätzlich die
Möglichkeit einer Rangordnung (z.B. Unterschicht, Mittelschicht, Oberschicht). Bei Daten auf
Intervallskalenniveau sind die Abstände (Intervalle) zwischen den einzelnen Merkmalsklassen
gleich groß. Daten auf Rationalskalenniveau haben neben der Unterscheidungs- und
Rangordnungsmöglichkeit sowie der gleichen Intervallgröße einen absoluten Nullpunkt. Der
Messwert Null entspricht der tatsächlichen Abwesenheit des Merkmals. Daten auf Intervallsowie Ratioskalenniveau werden vielfach auch als quantitative bzw. metrische Daten bezeichnet.
Mit zunehmendem Messniveau steigen die Aussagekraft und der Informationsgehalt der Daten
wobei jedes Messniveau neben seinen charakteristischen Eigenschaften auch alle Eigenschaften
der unteren Skalentypen besitzt. Die zentrale Bedeutung der mathematischen Eigenschaften der
Skalenniveaus ist, dass sie auch die Rechenmöglichkeiten bestimmen. Alle statistischen
Verfahren in der Datenauswertung richten sich nach dem Skalenniveau.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
2
Zöfel Peter (2002): Statistik verstehen.
Ein Begleitbuch zur computergestützten Anwendung. Eine
Datenmenge – was tun? Ein Leitfaden zu statistischen
Lösungen, Addison-Wesley Verlag; Seite 11-20
Variablenklassifikation
Statistische Analysen können unter Zugrundelegung der verschiedensten Variablen vorgenommen werden. Da gibt es auf der einen Seite die quantitativen Variablen mit stetigen
Messwerten wie z. B. Körpergröße oder Körpergewicht, welche im Prinzip beliebig genau
gemessen werden können, und auf der anderen Seite qualitative Variablen wie z. B. Schulnoten
oder die Codierung eines Merkmals wie den Familienstand in vier Kategorien. Diese qualitativen
Variablen können nur diskrete Werte annehmen.
Eine genauere Einteilung der Variablen als die in qualitativ - quantitativ oder diskret - stetig ist
diejenige nach vier verschiedenen Skalenniveaus (auch Messniveaus genannt), Bevor auf diese
grundlegend wichtige Einteilung ausführlich eingegangen wird, soll zunächst der Begriff des
Messens erläutert werden.
Das Messen
Der Begriff des „Messens” soll anhand einer in einer Klinik erhobenen Datenmenge erklärt
werden. Von einem bestimmten Patientenkollektiv seien die folgenden Angaben erhoben worden:
•
•
•
•
•
•
•
•
•
•
•
Geschlecht (männlich - weiblich)
Alter
Familienstand (ledig - verheiratet - verwitwet - geschieden)
Körpergröße
Körpergewicht
systolischer Blutdruck
diastolischer Blutdruck
Cholesterin
Triglyzeride
Alkoholkonsum (keiner - mäßig - häufig - sehr häufig)
Nikotinkonsum (Nichtraucher - mäßig - stark - sehr stark)
Die Werte dieser Variablen bei den einzelnen Fällen (hier: Patienten) bezeichnet man als
Variablenwerte. Die Zuordnung der aktuellen Variablenwerte bei den einzelnen Fällen erfolgt mit
einem Vorgang, den man „Messen” nennt. Betrachtet man etwa die Variable „Körpergröße”, so
ist klar, wie diese zu messen ist: Man legt ein Messband an und nimmt die Größe ab, wobei in der
Regel eine Messgenauigkeit von 1 cm ausreichend ist. Das Körpergewicht misst man mit einer
Waage, den Blutdruck mit einem Blutdruckmessgerät usw.
Etwas anders liegt der Fall bei der Variablen „Alter”. Dieses misst man nicht mit Hilfe einer
technischen Apparatur; man muss es erfragen oder etwa aus der Geburtsurkunde oder dem
Personalausweis erschließen. Trotzdem kann man auch hier von „Messen” reden, wenn man die
Definition des Messens wie folgt fasst:
Das Messen einer Variablen ist die Zuordnung von Zahlen zu den einzelnen Fällen.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
3
Mit dieser Definition kann man auch Variablen wie das Geschlecht, den Familienstand oder den
Alkohol- und Nikotinkonsum „messen”. Beim Geschlecht ordnet man z. B. den Männern die
Zahl 1 und den Frauen die Zahl 2 zu; beim Familienstand vergibt man für die gegebenen vier
Kategorien die Zahlen 1 bis 4. Ebenso verfährt man beim Alkohol und Nikotinkonsum:
Geschlecht:
1 = männlich
2 = weiblich
Familienstand:
1 = ledig
2 = verheiratet
3 = verwitwet
4 = geschieden
Alkoholkonsum:
1 = keiner
2 = mäßig
3 = häufig
4 = sehr häufig
Nikotinkonsum:
1 = Nichtraucher
2 = mäßig
3 = stark
4 = sehr stark
Bei diesen Variablen erfolgt das „Messen” per Augenschein (Geschlecht) oder durch eine
entsprechende Befragung. Die Zuordnung („Codierung”) von Zahlen zu solchen „kategorialen”
Variablen ist spätestens dann notwendig, wenn die statistische Analyse nicht per Hand, sondern
unter Einsatz eines entsprechenden Statistik-Programmsystems mit Hilfe eines Computers
erfolgen soll.
Skalenniveaus
Von entscheidender Wichtigkeit für die Auswahl eines korrekten statistischen Verfahrens ist die
Feststellung des sogenannten Skalenniveaus (auch: Messniveaus) der beteiligten Variablen. Hier
unterscheidet man das Nominal-, Ordinal-, Intervall- und Verhältnisniveau. Dabei werden diese
Skalenniveaus wie folgt unterschieden.
Skalenniveau
Nominal
Ordinal
Intervall
Rational
empirische Relevanz
Gleich - ungleich
Ordnung der Zahlen
Differenzen der Zahlen
Verhältnisse der Zahlen
Nominalniveau
Betrachten wir zunächst das Geschlecht, so stellen wir fest, dass die Zuordnung der beiden
Ziffern 1 und 2 willkürlich ist; man hätte sie auch anders herum oder mit anderen Ziffern
vornehmen können.
Keinesfalls soll schließlich damit ausgedrückt werden, dass Frauen nach den Männern
einzustufen sind; auch soll andererseits nicht die Bedeutung unterlegt werden, dass Frauen mehr
wert sind als Männer. Den einzelnen Zahlen kommt also keinerlei empirische Bedeutung zu. Man
spricht in diesem Falle von einer nominalskalierten Variablen. In dem hier vorliegenden
Spezialfall einer nominalskalierten Variablen mit nur zwei Kategorien spricht man auch von einer
dichotomen Variablen.
Eine nominalskalierte Variable ist auch der Familienstand; auch hier hat die Zuordnung der
Ziffern zu den Kategorien des Familienstandes keinerlei empirische Relevanz. Im Gegensatz zum
Geschlecht ist die Variable aber nicht dichotom; sie beinhaltet vier statt zwei Kategorien.
Nominalskalierte Variablen sind in ihrer Auswertungsmöglichkeit sehr eingeschränkt. Genau
genommen können sie nur einer Häufigkeitsauszählung unterzogen werden, Die Berechnung
etwa eines Mittelwertes, zumindest bei nicht-dichotomen Variablen, ist sinnlos.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
4
Ordinalniveau
Betrachten wir als Nächstes die Rauchgewohnheit, so kommt den vergebenen Codezahlen
insofern eine empirische Bedeutung zu, als sie eine Ordnungsrelation wiedergeben. Die Variable
Rauchgewohnheit ist schließlich nach ihrer Wertigkeit aufsteigend geordnet: Ein mäßiger
Raucher raucht mehr als ein Nichtraucher, ein starker Raucher mehr als ein mäßiger Raucher und
ein sehr starker Raucher mehr als ein starker Raucher. Solche Variablen, bei denen den
verwendeten Codezahlen eine empirische Bedeutung hinsichtlich ihrer Ordnung zukommt, nennt
man ordinalskaliert.
Die empirische Relevanz dieser Codierung bezieht sich aber nicht auf die Differenz zweier
Codezahlen. So ist zwar die Differenz zweier Codezahlen zwischen einem Nichtraucher und
einem mäßigen Raucher einerseits und zwischen einem mäßigen Raucher und einem starken
Raucher andererseits jeweils 1, man wird aber nicht sagen können, dass der tatsächliche
Unterschied zwischen einem Nichtraucher und einem mäßigen Raucher einerseits und einem
mäßigen Raucher und einem starken Raucher andererseits gleich ist; dafür sind die Begriffe zu
vage. Entsprechendes gilt für den Alkoholkonsum; auch dies ist eine solche ordinalskalierte
Variable.
Intervallniveau
Betrachten wir nun etwa die Körpergröße, so geben deren Werte nicht nur eine Rangordnung der
beteiligten Personen wieder, auch den Differenzen zweier Werte kommt eine empirische
Bedeutung zu. Hat etwa August ein Körpergewicht von 70 kg, Bertram eines von 80 kg und
Christian von 90 kg, so kann man sagen, dass Bertram im Vergleich zu August um ebenso viel
schwerer ist wie Christian im Vergleich zu Bertram (nämlich um 10 kg). Solche Variablen, bei
denen der Differenz (dem Intervall) zwischen zwei Werten eine empirische Bedeutung zukommt,
nennt man intervallskaliert. Ihre Bearbeitung unterliegt keinen Einschränkungen; so ist z. B. der
Mittelwert ein sinnvoller statistischer Kennwert zur Beschreibung dieser Variablen. Weitere
intervallskalierte Variablen im Beispiel der gegebenen Datenmenge sind das Alter, die
Körpergröße, systolischer und diastolischer Blutdruck, das Cholesterin und die Triglyzeride.
Verhältnisniveau
Bei allen diesen Variablen kommt nicht nur der Differenz zweier Werte, sondern auch dem
Verhältnis zweier Werte empirische Bedeutung zu. Ist etwa Emil 20 Jahre und Fritz 40 Jahre alt,
so wird man sagen können, dass Fritz doppelt so alt ist wie Emil. Solche Variablen nennt man
verhältnisskaliert. Es sind dies alle intervallskalierten Variablen, die den Wert Null annehmen
können und dieser gleichzeitig der niedrigste denkbare Wert ist. Beispiele, bei denen dies nicht
der Fall ist, sind etwa die in Grad Celsius gemessene Temperatur (wegen der möglichen Werte
kleiner als Null) und der Intelligenzquotient (wegen des nicht möglichen Wertes von Null). Bei
den in diesem Buch behandelten statistischen Verfahren kommt der Unterscheidung zwischen
intervall- und verhältnisskalierten Variablen keine Bedeutung zu; es gibt nämlich darunter keine
Verfahren, die Verhältnisniveau voraussetzen.
Weitere Beispiele für Nominal- und Ordinalniveau
Die Bestimmung des korrekten Skalenniveaus ist eine entscheidende Voraussetzung zur Auswahl
des korrekten statistischen Verfahrens. Im folgenden Kapitel wird anhand passender Beispiele
noch einmal etwas ausführlicher auf die Unterscheidung von Nominal und Ordinalniveau
eingegangen. Häufig ist es nämlich möglich, nominalskaliert erscheinende Variablen durch
geschickte Codierung auf Ordinalniveau zu bringen. Eine typische nominalskalierte Variable ist
die Angabe des Berufs. Hier könnte etwa folgende Codierung gewählt werden, die beim besten
Willen nicht in eine sinnvolle Ordnungsrelation gebracht werden kann:
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
5
1 = Angestellter
2 = Beamter
3 = Arbeiter
4 = Selbstständiger
5 = Hausfrau
6 = Auszubildender
7 = Rentner
Auch die Frage nach der Religionsgemeinschaft kann nur mit einer nominalskalierten Variablen
realisiert werden, etwa mit folgender Codierung:
1 = evangelisch
2 = katholisch
3 = sonstige christliche Gemeinschaft
4 = andere Religionen
5 = ohne Religionsgemeinschaft
In einer Studie über Einschlafprobleme wurden die Gründe für die Schlafstörungen wie folgt
codiert:
1 = Probleme
2 = Geräusche
3 = Tagesereignisse
4 = ungewohnte Umgebung
5 = Sonstiges
Auch hier ist eine andere als eine nominale Skalierung nicht denkbar.
Dichotome nominale Skalierungen sind häufig von der Art
1 =ja
2 = nein
1 = richtig
2 = falsch
1 = trifft zu
2 = trifft nicht zu
1 = stimme ich zu
2 = stimme ich nicht zu
So wie bekanntlich zwei Punkte eine Gerade bestimmen, die ansteigt oder geneigt ist, kann man
bei dichotomen nominalskalierten Variablen stets von einer gegebenen Ordnungsrelation
sprechen. So bedeutet etwa im Fall des letzten Beispiels eine niedrige Codierung Zustimmung,
eine hohe Codierung Ablehnung. Dichotome nominalskalierte Variablen bilden also sozusagen
den Übergang zwischen Nominal- und Ordinalniveau. Diesem wollen wir uns nun zuwenden.
Eine häufig gestellte Frage in einem Fragebogen ist die nach der Schulbildung. Eine ordinale
Skalierung liegt etwa bei folgender Codierung vor:
1 = Volksschule
2 = Berufsschule
3 = Mittlere Reife
4 = Abitur
5 = Hochschule
Ein typisches Beispiel einer ordinalskalierten Variablen ist die Vorgabe einer AltersklassenEinteilung in einem Fragebogen:
1 = bis 30 Jahre
2 = 31 - 50 Jahre
3 = über 50 Jahre
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
6
Ein solches Vorgehen ist eigentlich nicht empfehlenswert. Da jeder sein eigenes Alter sicherlich
ohne Mühe exakt (in Jahren) angeben kann, sollte man dies auch so erfassen. Spätere
Klasseneinteilungen können von einem Auswertungsprogramm gegebenenfalls immer noch
vorgenommen werden; Sie haben dann aber Variationsmöglichkeiten und können bei Bedarf
auch auf den genauen Wert zurückgreifen.
Klasseneinteilungen sollte man nur dann vorgeben, wenn die Ermittlung genauer Angaben zu
umständlich oder gar nicht möglich ist. So wurde in einer Erhebung zum allgemeinärztlichen
Vorgehen bei psychischen Erkrankungen bei den befragten Ärzten die Anzahl der Patienten pro
Quartal abgefragt; dabei wurde folgende Codierung vorgegeben:
1 = unter 500
2 = 500 - 1000
3 = 1 000 -1500
4 = über 1500
Diese grobe Einteilung erscheint vernünftig, da genaue Zahlen wegen der Schwankungen von
Quartal zu Quartal nicht angebbar sind. Aus diesem Grund stört es auch nicht, dass die Zahl 1000
einmal als Ober- und einmal als Untergrenze einer Klasse auftritt.
Ordinalskalierte Items treten häufig in psychologischen bzw. psychiatrischen Fragebögen auf. Im
Freiburger Fragebogen zur Krankheitsverarbeitung z. B. werden 35 Aussagen der folgenden Art
vorgegeben:
•
•
•
•
•
Herunterspielen der Bedeutung und Tragweite
Wunschdenken und Tagträumen nachhängen
Aktive Anstrengungen zur Lösung des Problems unternehmen
Stimmungsverbesserung durch Alkohol oder Beruhigungsmittel suchen
Trost im religiösen Glauben suchen
Die befragten Personen sollen dann über eine Punktzahl zwischen 1 und 5 angeben, wie weit
diese Aussagen für sie zutreffen oder nicht:
1 = gar nicht
2 = wenig
3 = mittelmäßig
4 = ziemlich
5 = sehr stark
In einem anderen Fragebogen über Gefühlslagen, wie man sie bezüglich Arbeit und Beruf haben
kann (MBI), werden Aussagen wie die folgenden vorgegeben:
•
•
•
•
•
Nach der Arbeit bin ich völlig fertig.
Wenn ich zur Arbeit muss, bin ich schon morgens beim Aufstehen müde.
Ich fühle mich energiegeladen.
Mein Beruf frustriert mich.
Ich finde, dass ich in meinem Beruf zu viel arbeite.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
7
Hier wird zur Beantwortung eine Siebenerskala verwandt:
1 = völlig unzutreffend
2 = weitgehend unzutreffend
3 = eher unzutreffend
4 = weder noch bzw. weiß nicht
5 = eher zutreffend
6 = weitgehend zutreffend
7 = völlig zutreffend
Die Codierung bei den beiden letztgenannten Beispielen ist sozusagen um die jeweils mittlere
Codierung symmetrisch. Dies ist nicht bei allen solchen Fragebögen der Fall. Betrachten wir etwa
einige Aussagen aus dem Trierer Persönlichkeitsfragebogen:
•
Ich fühle mich einsam.
•
Ich bin unbeschwert und gut aufgelegt.
•
Es macht mir Freude, anderen behilflich zu sein.
•
Ich bin ein ruhiger, ausgeglichener Mensch.
•
Meine Art kommt bei anderen gut an.
Diese Aussagen sind mit Hilfe einer Viererskala zu beantworten:
1 = immer
2 = oft
3 = manchmal
4 = nie
Überzeugungen in verschiedenen Lebenssituationen werden in einem Fragebogen der folgenden
Art abgefragt (FKK):
•
Ich komme mir manchmal taten- und ideenlos vor.
•
Andere Menschen verhindern oft die Verwirklichung meiner Pläne.
•
Ich weiß oft nicht, wie ich meine Wünsche verwirklichen soll.
•
Ich kann sehr viel von dem, was in meinem Leben passiert, selbst bestimmen.
•
Auch in schwierigen Situationen fallen mir immer viele Handlungsalternativen ein.
Hier ist zur Beantwortung eine symmetrische Sechserskala vorgesehen, die aber keine Codierung
für eine unentschiedene Beurteilung enthält:
1 = völlig falsch
2 = weitgehend falsch
3 = eher falsch
4 = eher richtig
5 = weitgehend richtig
6 = völlig richtig
Immer wieder auftretende ordinalskalierte Variablen bei zahnmedizinischen Studien sind z. B.
der Plaque-Index und der CPITN Wert. Letzterer ist ein pro Sextant ermittelter BehandlungsBedürftigkeits-Index mit folgender Codierung:
0 = gesundes Parodont
1 = Blutung
2 = Zahnstein
3 = Taschenbildung von 3,5 bis 5,5 mm
4 = Taschenbildung von 6 mm und mehr
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
8
Ähnliches gilt für die Codierung des Plaque-Indexes:
0 = keine Plaque
1 = vereinzelt Plaque-Inseln
2 = deutliche Plaque-Linie entlang des Gingiva-Randes
3 = Plaque-Ausdehnung im zervikalen Drittel des Zahnes
4 = Plaque-Ausdehnung bis ins zweite Zahndrittel
5 = Plaque-Ausdehnung bis über das zweite Drittel hinaus
Bei allen bisher genannten Beispielen liegt die ordinale Skalierung unmittelbar auf der Hand. In
vielen anderen Fällen kann man eine solche nach etwas Nachdenken erkennen bzw. durch
geschickte Codierung erreichen.
In einer Fragebogen-Untersuchung über die Heimatverbundenheit der Marburger Bevölkerung
wurde u.a. nach dem Wohnort gefragt, wobei folgende Antwortmöglichkeiten vorgegeben waren:
1 = Kernstadt
2 = Stadtteil
3 = innerhalb des Landkreises
4 = außerhalb des Landkreises
Diese Variable ist ordinalskaliert, wenn man als Kriterium die Entfernung des Wohnortes vom
Stadtzentrum zugrunde legt.
Eine andere Frage lautete „Freuen Sie sich, wenn Sie im Ausland Marburger treffen?”
Die vorgegebenen Antwortmöglichkeiten waren
1 =ja
2 = nein
3 = kommt drauf an
Dies ist eine ungeschickte Codierung; besser wäre die folgende:
1 =ja
2 = kommt drauf an
3 = nein
Dies wäre dann eine ordinale Skalierung: je höher die Codierung, desto geringer die Freude.
In einer biologischen Untersuchung über das Auftreten von Schmetterlingen wurden die
meteorologischen Gegebenheiten abgefragt:
1 = Sonne
2 = leicht bewölkt
3 = Wolken
Legt man als Kriterium den Bewölkungsgrad zugrunde, so ist dies eine ordinalskalierte Variable:
je höher die Codierung, desto größer der Bewölkungsgrad.
Der Übergang von Ordinal- zu Intervallniveau ist fliegend und eine Einordnung in eines der
beiden Niveaus manchmal durchaus strittig. Während man beispielsweise die zwischen den
Zahlen 1 und 6 vergebenen Schulnoten als ordinalskaliert ansieht, ist man bei den in der
Oberstufe vergebenen Punktwerten von 0 bis 15 wohl eher geneigt, Intervallniveau anzunehmen.
Auch bei Variablen, die bestimmte Anzahlen wiedergeben (z. B. Anzahl der Kinder in einer
Familie), kann von Intervallniveau ausgegangen werden.
Der Thematik des Skalenniveaus wurde ein breiter Raum eingeräumt, da dessen korrekte
Beachtung für die Auswahl des jeweils adäquaten statistischen Verfahrens entscheidend ist.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
9
Elisabeth Aufhauser, unveröffentlichter Text
Unterrichtsmaterial Statistik-UE für Soziologie
Datenniveaus
Die Zeilen unserer Datenmatrix enthalten die Informationen zu den einzelnen Beobachtungen, die
Spalten Information zur Variation der Werte auf den einzelnen Variablen über die verschiedenen
Beobachtungen hinweg. Die k;i sind die zahlenmäßigen Werte, die für Beobachtung i(i=1,...,I)
auf der Variablen k(k=1,...,K) gemessen wurden. I soll die Zahl der Beobachtungen (die Größe
der Stichprobe) sein, K die Zahl der erhobenen Variablen.
Computer und Taschenrechner liefern uns im Regelfall nur zahlenmäßige Ergebnisse und
benötigen für die statistische Analyse im Allgemeinen auch Zahlen als Ausgangsmaterial. Für
unsere statistischen Analysen ist es daher sinnvoll, dass wir unseren Informationen zu den
verschiedenen Erhebungsmerkmalen 'zahlenmäßige' Werte zuordnen. Wir müssen uns dabei
immer folgende Fragen stellen:
• Mittels welcher Merkmalsvariablen kann das, was wir untersuchen wollen, grundsätzlich erfasst
werden? Das entspricht der wichtigen Frage nach der Operationalisierung der Forschungsfrage
bzw. einzelner Forschungshypothesen.
• Wie sollen die zu erfassenden Merkmale gemessen werden? Das entspricht der wichtigen Frage
nach der Skala, auf der die verschiedenen Variablen gemessen werden sollen.
• Wie und auf welchem Genauigkeitsniveau sollen die gemessenen Werte (zahlenmäßig)
verkodet werden? Das entspricht der wichtigen Frage, welche Merkmalsausprägungen wir
unterscheiden wollen und wie wir sie in der Datenmatrix (zahlenmäßig) eingeben.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
10
Bedeutung des Datenniveaus für die statistische Analyse
Zahlen haben grundsätzlich die Eigenschaft, dass sie addiert, multipliziert, dividiert .... werden
können. Für die den Zahlen zugrundeliegenden (inhaltlichen) Sachverhalte können die
Rechenoperationen aber unter Umständen sinnlos sein. Wichtig ist, dass der Computer mit
Zahlenwerten alles rechnet, was wir anfordern, und von alleine nie weiß, ob die
Rechenoperationen für die Variablen eigentlich auch inhaltlich Sinn machen. Diese Denkarbeit
bleibt auch im Zeitalter der Supercomputer noch uns selbst überlassen. Welche statistischen
Methoden dürfen wir daher für welche Daten verwenden?
Nach den erlaubten mathematischen Operationen sollten wir zwischen folgenden Typen an
Datenniveaus unterscheiden:
(1) Nominaldaten
Beschreiben die Ausprägungen (Werte) einer Variablen nur verschiedene Zustände, Situationen
usw. und sind die Ausprägungen nicht im Sinne einer Größer/Kleiner-Relation vergleichbar,
handelt es sich um nominalskalierte Variablen. Im Regelfall können wir die einzelnen
Ausprägungen dann auch nur verbal aufgrund unterschiedlicher Wertnamen (Worte, Buchstaben
oder Zahlen) unterscheiden. Beispiele für Variablen, die typischerweise Nominaldatenniveau
besitzen, wären etwa Geschlecht, Beruf, Bundesland u.ä. Ordnen wir den verschiedenen
Wertausprägungen auf diesen Variablen Zahlen zu (etwa beim Geschlecht 1 für weiblich und 2
für männlich), so haben diese Zahlen keine inhaltliche Bedeutung und dienen nur dazu, das
Rechnen im Computer zu erleichtern. Die Höhe der zahlenmäßigen Werte sagt inhaltlich absolut
nichts aus, die Berechnung von Wertabständen ist sinnlos. Insbesonders ist es sinnlos zu sagen,
die 2 sei größer oder mehr wert als die 1.
Außer den Vergleichsoperationen = und x dürfen für derartige Variablen aus inhaltlichen
Gründen keine mathematischen Operationen durchgeführt werden. Wie wir oben gesehen haben,
sind sogar Ordnungsrelationen (kleiner, größer) unsinnig. Auch die Addition ergibt keine
sinnvollen und interpretierbaren Werte: !(weiblich) + 2 (männlich) = 3 (Das ergibt maximal ein
heterosexuelles Paar, aber noch lange kein Geschlecht). Da die Addition nicht erlaubt ist, ist auch
die Berechnung von Mittelwerten u.ä. völlig sinnlos. Wie sähe wohl ein Geschlecht mit dem
Wert 1.4 aus? Dennoch gibt es eine Reihe an statistischen Analysemöglichkeiten. So ist es etwa
möglich, für/mit nominale/n Variablen
•
•
•
•
•
•
Häufigkeitsauszählungen durchzuführen,
den Modus (häufigsten Wert) zu berechnen,
Kreuztabellen zu erstellen,
einen Chi-Quadrat-Tests auf Unabhängigkeit durchzuführen,
sog. Assoziationsmaße zu berechnen,
sie als unabhängige Faktoren in der Varianzanalyse zu verwenden.
(2) Ordinaldaten
Können die Ausprägungen einer Variable im Sinne von Größer/Kleiner-Relationen miteinander
verglichen und in eine Rangordnung gebracht werden, so sprechen wir von ordinal- oder
rangskalierten Variablen. Beispiele für Variablen, die typischerweise Ordinaldatenniveau
besitzen, sind etwa die Höhe des Schulabschlusses, die Bewertung der Umweltbelastung entlang
einer mehrstufigen Skala (von gar nicht bis extrem), Einstellungsmessungen entlang einer Skala
der Form stimme zu - stimme eher zu - unentschieden - stimme eher nicht zu - stimme gar nicht
zu. Die Zahlen, die den verschiedenen Wertausprägungen auf derartigen Variablen zugeordnet
werden, müssen im Sinne einer größenmäßigen Ordnung interpretierbar sein, die größenmäßigen
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
11
Abstände zwischen den Werten sagen aber nichts über die tatsächlichen Wertunterschiede aus.
Das bedeutet dann vor allem, dass bei rangskalierten Variablen auch keine sinnvollen
Differenzen gebildet werden können. Beispiel Schulabschluss: 1 Pflichtschule, 2 Lehre, 3
berufsbildende mittlere Schule, 4 allgemeinbildende höhere Schule, 5 berufsbildende höhere
Schule, 6 akademische Ausbildung. Sowohl die Differenz zwischen akademischer Ausbildung (6)
und allgemeinbildender höherer Schulbildung (4) als auch die Differenz zwischen
berufsbildender mittlerer Schule (3) und Pflichtschule (1) beträgt rein rechnerisch 2. Dennoch
sind die beiden Differenzen nicht zu vergleichen - und selbstverständlich auch nicht dem Variablenwert 2 (Lehre) gleichzusetzen.
Ordnungsrelationen =, <, > sind die einzigen mathematischen Operationen, die für Variablen auf
dem Ordinaldatenniveau erlaubt sind. Addition, Mittelwertbildung u.ä. sind auch für
Ordinaldaten nicht erlaubt. So ergibt etwa ein Lehrabschluss (2) plus ein AHS-Abschluss (4)
keinen akademischen Titel (6). Und ein mittlerer Ausbildungsgrad von 2.3 in der österreichischen
Bevölkerung ist natürlich ebenfalls nicht sehr aussagekräftig. Zusätzlich zu all den statistischen
Verfahren, fahren, die mit Nominaldaten möglich sind, können wir mit Variablen auf
Ordinaldatenniveau u.a. noch folgende statistische Analysen vornehmen:
•
•
•
den Median (50% Wertes) und andere Percentil-Werte berechnen;
Rangkorrelationskoeffizienten berechnen;
nichtparametrischer Rang- und Verteilungstests durchführen.
Nominal- und Ordinaldaten werden gemeinsam auch als nicht-metrische, diskrete, kategoriale
oder qualitative Datenniveaus bezeichnet. Im Unterschied dazu werden Intervall- und
Absolutdaten gemeinsam als metrische, kontinuierliche oder quantitative Datenniveaus
bezeichnet. Generell gilt, dass metrischen Skalen konstante Messeinheiten (Grad, Schilling,
Altersjahre ...) zugrunde liegen müssen, damit die Berechnung von Wertdifferenzen und
Wertsummen inhaltlich Sinn macht. Es kann daher für metrische Daten nicht nur festgestellt
werden, ob eine Beobachtung einen größeren Variablenwert aufweist als eine andere, sondern
auch, wie groß der Unterschied zwischen den beobachteten Werten ist.
(3) Intervalldaten
Sog. intervallskalierte Variablen besitzen keinen absoluten Nullpunkt, es wird höchstens per
Übereinkunft irgendwo ein Nullpunkt festgelegt. Ein typisches Beispiel wären etwa
Temperaturskalen. Während Additionen und Subtraktionen für derartige Variablen auch
inhaltlich Sinn machen, sind Multiplikationen und Divisionen von Variablenwerten inhaltlich
sinnlos! Die Differenz zwischen 15 und 30 Grad Celsius beträgt 15 Grad Celsius, bei 30 Grad
Celsius ist es aber physikalisch gesehen nicht doppelt so warm wie bei 15 Grad Celsius. Für die
Differenzierung bei den komplexeren statistischen Verfahren ist die Unterscheidung zwischen
Intervall- und Absolutdatenniveau an sich unwesentlich.
(4) Daten mit Absolutniveau
Bei Variablen mit Absolutdatenniveau ist der Wert 0 auch der absolute Nullpunkt. Typische
Variablen mit Intervalldatenniveau sind etwa Lebensalter, monatliches Erwerbseinkommen, die
Einwohnerzahl einer Gemeinde, Distanzen in Kilometer u.ä. Das Vielfache eines
Variablenwertes kann auch inhaltlich als Vielfaches interpretiert werden. Es sind damit auch
Multiplikationen und Divisionen von Variablenwerten möglich, sinnvoll und interpretierbar.
Zumindest vom Datenniveau her dürfen mit derartigen Variablen alle möglichen statistischen
Verfahren durchgeführt werden. Aber Achtung: Den meisten statistischen Verfahren liegen neben
dem Datenniveau auch noch andere wichtige Annahmen zugrunde, die nicht unbedingt erfüllt
sein müssen.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
12
Die Skalenniveaus bilden in der genannten Reihenfolge eine Hierarchie mit zunehmendem
Informationsgehalt. Eine Variable mit einem bestimmten Skalenniveau kann immer in eine
Variable mit einem niedrigeren Skalenniveau umgewandelt werden. Der umgekehrte Schritt ist
nicht möglich.
(5) (0,1) Dummy-Variablen
Dichotome 0-1 oder Dummy-Variablen haben nur zwei Wertausprägungen, etwa ja/nein, trifft
zu/trifft nicht zu u.ä. Für die statistische Analyse ist es sinnvoll, die Ausprägungen derartiger
Variablen mit den Werten 0(für nein, trifft nicht zu u.ä.) bzw. 1(für ja, trifft zu u.ä.) zu verkoden.
Wichtig ist nun, dass derartige 0-1 Variablen metrisches Datenniveau besitzen. Die Addition als
grundlegende mathematische Operation und eine darauf basierende Mittelwertbildung machen
auch inhaltlich Sinn: Die Summe aller Beobachtungswerte einer (0,1) Variable dividiert durch die
Zahl der Beobachtungen entspricht dem Anteil der 1-Werte (der Ja-, Trifft zu-Werte) im
Datensatz. Und: Anteils- oder Prozentwerte weisen metrisches Datenniveau auf.
Die Umwandlung von Variablen mit kategorialem Datenniveau (Nominal- oder
Ordinaldatenniveau) in eine Reihe von (0,1)-Variablen ist ein durchaus üblicher statistischer
Trick, um kategoriale Variablen auch in Methoden verwenden zu können., die eigentlich nur für
metrische Variablen geeignet sind (etwa als erklärende, unabhängige Variablen in der
Regressionsanalyse).
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
13
aus der Vorlesung: Datenniveaus
Die folgende Übersicht zeigt die vier Datenniveaus mit ihren charakteristischen Eigenschaften:
erlaubte
TransAussage Beispiel formation
Operationen
Messwerte
Zuordnung
nominal
kategorial
ordinal
Kategorien
sind verbal
benannt
Kategorien sind verbal
benannt und nach
Größe/Ausmaß gereiht;
Abstände zwischen den
Kategorien sind NICHT
MESSBAR
metrisch
intervall
rational
breite Punkteskala, nur die
Endpunkte bezeichnet;
Oder: Standardisierte Skala
aus mehreren Items
zusammengesetzt
Abstände zwischen den
Messwerten sind GLEICH
Messeinheit vorgegeben
(Jahre, Stunden, Kilo...)
Absolut: Anzahl (Stück)
gleich – ungleich
gleich – ungleich
mehr – weniger
gleich – ungleich
mehr – weniger
gleiche Abstände
Häufigkeitsvergl.
Häufigkeitsvergleich
Rangordnungsrelation
Häufigkeitsvergleich
Rangordnungsrelation
Intervallrelation
gleich/ungleich
gleich/ungleich
größer/kleiner als
gleich/ungleich
größer/kleiner als
addieren, subtrahieren
Familienstand
Lebenssituation
Geschlecht
Herkunftsland
Zufriedenheit 1-5
Schulnoten, Bildung
Alkoholkonsum
(unspezifisch)
Zufriedenheit 0-10
IQ-Skala
Berufsprestigescore
Martin ist ledig,
Josefine ist
geschieden. .
Martin trinkt mehrmals
pro Woche Alkohol,
Josefine seltener.
Martins IQ-Wert beträgt
120 Punkte, Josefine hat
um 20 Punkte weniger,
nämlich 100 Punkte.
gleich – ungleich
mehr – weniger
gleiche Abstände
„natürlicher“ Nullpunkt
Häufigkeitsvergleich
Rangordnungsrelation
Intervallrelation
Verhältnisrelation
gleich/ungleich
größer/kleiner als
addieren, subtrahieren
multiplizieren/dividieren
Alter, Einkommen,
Reaktionszeit, Anzahl
Stunden pro Tag im
Internet
Martin ist halb so alt wie
Josefine.
….. dafür verdient er
viermal soviel wie sie….
Die Daten, mit denen wir es zu tun haben, sind immer numerisch, also Zahlen. Bei kategorialen
Skalen sind die Zahlen Codes (Werte), welchen Bezeichnungen (Wertelabels) zugeordnet
werden, bei metrischen Variablen sind die Zahlen Messwerte. Die Zahl "2" kann also – je nach
Informationsgehalt – verschiedenes bedeuten. Beispielsweise bedeutet "2"…..
…auf einer Nominalskala etwa: „weiblich“ oder "geschieden" oder „evangelisch“;
…auf einer Ordinalskala zur Häufigkeit vom Kirchenbesuch „mehrmals im Jahr“ oder „selten“;
…auf einer Intervallskala könnte es zwei Punkte auf einer Skala zwischen 0-10 zur
Arbeitsbelastung sein;
…auf einer Rationalskala könnten es 2 Kinder, 2 Personen im Haushalt, oder 2 Bier pro Tag sein.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
14
Nominalskala (kategorial)
Auf der ersten Stufe des Informationsgehalts stehen nominal skalierte Daten. Die einzelnen Fälle
der Stichprobe werden auf dieser Skala Gruppen zugeordnet, welche ein Merkmal messen,
welches keine Reihenfolge zulässt. Hierzu gehören Merkmale wie Familienstand,
Religionszugehörigkeit, Nationalität, Parteizugehörigkeit, Muttersprache, Geschlecht und
ähnliche Eigenschaften. Wichtig dabei ist: Jede der Antwortmöglichkeiten/Kategorien hat eine
verbale Bezeichnung. Dazu ein typisches Beispiel:
Zulässig sind folgende Aussagen: Frau Nowak lebt ohne PartnerIn, Herr Nowak ist ledig und
lebt alleine. Beide gehören laut obiger Definition der Lebenssituation in die Kategorie 1.
Ein Spezialfall der Nominalskala ist eine dichotome Variable, diese hat immer nur zwei
Ausprägungen: eine (beliebige) Eigenschaft „trifft zu“ (=1) oder „trifft nicht zu“ (=1). Weniger
Informationsgehalt einer Variable geht nicht. Dichotome Variablen werden als „DummyVariablen“ bei multivariaten Verfahren verwendet, z.B. bei der Regressionsanalyse.
Ordinalskala oder Rangskala (kategorial)
Bei der Messung auf ordinalem Datenniveau werden ebenfalls alle Antwortmöglichkeiten verbal
bezeichnet, jedoch kann bei dieser Skala angegeben werden, wer mehr oder weniger von dem
erhobenen Merkmal besitzt. Die Reihenfolge der Kategorien/Antwortmöglichkeiten ist somit
festgelegt. Die Daten, mit denen wir es in der Sozialwissenschaft zu tun haben, sind meist
ordinalskaliert. Dazu ein typisches Beispiel:
Zulässig ist folgende Aussage: Frau Nowak trinkt mehrmals im Monat Alkohol, Herr Maier
trinkt mehrmals pro Woche Alkohol. Sicher ist, dass Frau Nowak seltener Alkohol trinkt als Herr
Nowak, wir wissen aber nicht, um wie viel weniger. Wir wissen also, wer in der gegebenen
Reihenfolge weiter vorne oder weiter hinten steht, die Abstände zwischen den einzelnen
Kategorien sind allerdings nicht messbar.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
15
Intervallskala (metrisch)
Mit der Intervallskala befinden wir uns bereits auf dem metrischen Datenniveau, wir „messen“
Eigenschaft und ordnen diese nicht mehr in einzelne Kategorien. Entscheidend bei der
Intervallskala im Unterschied zur Ordinalskala ist, dass nicht nur eine Reihenfolge vorliegt,
vielmehr ist diese Reihenfolge ein Kontinuum mit gleichen Abständen zwischen den einzelnen
Messwerten. Und daher sind die einzelnen Ausprägungen auch nicht mehr verbal bezeichnet,
sondern nur noch die Endpunkte der Skala. Beispielsweise würde man die folgende Skala als
intervallskaliert bezeichnen:
Sagen Sie mir bitte zu jeder Einrichtung und Organisation,
wie groß das Vertrauen ist, das Sie ihr entgegenbringen.
Auch bei der folgenden Skala zum körperlichen Wohlbefinden kann man gleiche Abstände
zwischen den Ausprägungen postulieren und diese als intervallskaliert verwenden.
Auch "standardisierte Skalen", wie etwa der in der Soziologie verwendete „Berufsprestigescore“
oder der in der Psychologie verwendete IQ-Test, welcher sich aus mehreren Items zusammensetz,
gelten als intervallskaliert. In unserem Beispiel hat Frau Nowak einen IQ von 100 Punkten und
Herr Maier hat um 20 Punkte mehr, nämlich 120 Punkte. (Das bedeutet lediglich, dass Herr
Maier bei dem Test 20 Punkte mehr erreicht hat. Wie es um seine „tatsächliche Intelligenz“ – die
wir nicht messen können – bestellt ist, sagt dies nichts aus. Zur Erinnerung: Wir messen keine
Realität sondern theoretische Konstrukte.)
Der entscheidende Unterschied zwischen Ordinal- und Intervallskala ist also, dass bei der
Ordinalskala die Antwortkategorien verbal bezeichnet und die Abstände zwischen diesen nicht
messbar sind, bei der Intervallskala jedoch sind nur die Endpunkte bezeichnet und die Abstände
zwischen den Messwerten sind mit einer Punkteskala messbar und damit gleich.
Darüber, ab wann eine Skala noch ordinal- oder bereits intervallskaliert ist, bestehen
unterschiedliche Auffassungen. In etlichen wissenschaftlichen Arbeiten werden sogar eindeutig
ordinale Skalen zu metrischen Verfahren herangezogen. In meiner wissenschaftlichen Praxis
verwende ich 6er-Skalen (wie die oben dargestellte) bereits als intervallskaliert, Skalen mit 5
Ausprägungen empfehle ich als kategorisiert (also ordinal) zu bezeichnen und auch jede dieser
Kategorien verbal zu benennen.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
16
Rationalskala oder Verhältnisskala (metrisch)
Die Rationalskala besitzt eine genormte Messeinheit sowie einen sogenannten „natürlichen“
Nullpunkt, welcher einer Abwesenheit des Merkmals entspricht.
Hierzu gehören Messungen wie das Alter in Jahren, das Körpergewicht in Kilogramm, die
Reaktionszeit in Sekunden und Ähnliches. Auch die Anzahl der im Haushalt lebenden Personen,
die Anzahl der Kinder, die Anzahl der Stunden, die man täglich im Internet verbringt oder an wie
vielen Tagen in der Woche man Bier konsumiert sind rationalskaliert. Alle Beispiele haben eine
Messeinheit und einen Nullpunkt. Im Unterschied zur Intervallskala weiß man hier genau, wann
die Skala beginnt – nämlich bei 0 Jahren oder bei 0 Kilogramm. Vergleiche: Beim mittels IQTest gemessenen Intelligenzquotienten ist nicht bestimmbar, wo die auf diese Weise gemessene
„Intelligenz“ beginnt. Und daher können wir auch Verhältnisse (Relationen) bilden, wir können
sagen: Herr Maier ist 26 Jahre, Frau Nowak ist doppelt so alt, nämlich 52 Jahre alt. Frau Nowak
verdient 800.- € und Herr Maier verdient viermal so viel, nämlich 3.200.- €.
Beachte: Das Einkommen wird
jedoch meist in ordinalskalierter
Form erhoben, etwa so:
ordinal
Selten fragt man Befragte nach
ihrem Nettoeinkommen mit
einer genauen Zahlenangabe in
Euro.
Kriterien einer Antwortskala
Bevor wir unser Erhebungsinstrument inklusive Antwortskalen fertigstellen, sind noch wichtige
Kriterien bei der Skalierung zu beachten. Kategoriale Skalen müssen präzise (= exakt definiert),
erschöpfend (= keine Kategorie fehlt), disjunkt (= die Kategorien überschneiden sich nicht) und
eindimensional (= einen Sachverhalt betreffend) sein.
Aus einer Studie über häusliche Gewalt im Rahmen des außergerichtlichen Tatausgleichs:
„Gewaltgeschichte“
lange Phase von Übergriffen
kurze Phase von Übergriffen
lange Phase von Übergriffen, habe mich auch gewehrt
erster Übergriff
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
17
Diese Antwortskala ist nicht präzise (Was heißt „lang“ und „kurz“? Was genau ist unter „habe
mich gewehrt“ zu verstehen?), nicht erschöpfend (Was kreuze ich an, wenn ich zweimal
geschlagen wurde?), nicht disjunkt (Kategorie 1 und 3 schließen einander nicht aus) und nicht
eindimensional (Dauer und Gegenwehr sind zwei voneinander unabhängige Dimensionen).
In solchen Fällen empfiehlt es sich, lange darüber nachzudenken, was man eigentlich wissen will.
Eine Aufteilung in zwei Fragen erscheint hier sinnvoll:
Dauer der gewalttätigen Übergriffe: Seit wann dauern die Übergriffe an?
Gewalttätige Übergriffe seit etwa einem Monat
Gewalttätige Übergriffe seit länger als einem Monat bis zu etwa einem halben Jahr
Gewalttätige Übergriffe seit länger als einem halben Jahr
Maßnahmen gegen die Übergriffe: Haben Sie etwas gegen die Übergriffe unternommen?
nein / ja
wenn ja, weiter nächste Frage: Mehrfachantwort: Was haben Sie dagegen
unternommen?
…habe mich körperlich gewehrt
…habe mich meinem Umfeld/Freundeskreis anvertraut
…habe mir bei professionellen Einrichtungen Rat/Unterstützung geholt
… habe die Polizei gerufen
…habe …..Liste fortsetzen
…sonstiges, und zwar: …………………………………………….
Dieses Beispiel zeigt, wie sorgfältig bei der Operationalisierung vorgegangen werden muss, um
verwertbare Ergebnisse zu erhalten. Sehr häufig werden dabei – wie in obigem Beispiel
vorgeführt – Mehrfach-antworten verwendet, mit jeweils den Ausprägungen“0=trifft nicht zu“
und „1=trifft zu“. Um die Vollständigkeit solcher Aufzählungen sicherzustellen, verwendet man
an letzter Stelle ein „Sonstiges“ mit Textantwort.
Die gleichen Kriterien (wie oben) gelten auch für ordinale und metrische Antwortskalen, hier
sind jedoch besonders die Eindimensionalität (Frage betrifft nur einen Sachverhalt) sowie die
Symmetrie (gleich viele Ausprägungen in die positive bzw. negative Bedeutungsrichtung) der
Skala zu beachten.
Aus einer Dokumentation der Lebensumstände drogenabhängiger PatientInnen:
Bitte beurteilen Sie Ihre berufliche Situation: Welche Kategorie trifft auf Sie zu?
sehr schlecht /
schlecht /
eher schlecht /
mittelmäßig /
gut /
sich
verbessert
Diese Skala ist nicht symmetrisch: Es gibt mehr „schlechte“ Bewertungen als „gute“. Sie ist nicht
disjunkt: Kategorie 2 überschneidet sich mit Kategorie 1 und 3. Aber vor allem ist diese Skala
nicht eindimensional: Die Verbesserung der beruflichen Situation gehört in eine zweite, extra
formulierte Frage verpackt.
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
18
Arten von Antwortskalen
Eine Antwortskala hat vielfältige Erscheinungsformen:
→ Spezifisch versus unspezifisch: Eine Antwortskala kann unspezifische Bezeichnungen
(„immer“/ „häufig“/ „manchmal“/ „selten“/ „nie“), bezeichnete Endpunkte (1=“immer“ 2
– 3 – 4 – 5 – 6=“nie“ – hier ist besonders auf die Eindimensionalität zu achten) oder exakt
spezifizierte Angaben enthalten („An wie viel Tagen in der Woche…..“);
→ Unipolar versus bipolar: Eine Skala kann unipolar von der Abwesenheit des Merkmals bis
zu seinem höchsten Ausmaß reichen (Angst: „gar keine“ bis „sehr große“) oder bipolar von
einer negativen (über eine neutrale) zu einer positiven Bewertung reichen („stimme sehr zu“
– „weder noch“ - „stimme gar nicht zu“) hier ist besonders die Symmetrie zu beachten);
→ „Grob“ versus „fein“: Eine Skala kann gering differenziert (Aufzählung einzelner
Arbeitsbelastungen als Mehrfachantwort oder: „stark“ – „gering“ – „gar nicht belastet“)
oder stark differenziert sein (Arbeitsbelastung von 0 = gar nicht bis 10 = sehr stark belastet,
Arbeitsbelastung als Zähl-Index nach abzählen der genannten Items einer Mehrfachantwort
oder als Summen-Index einiger abgestufter Items zur Arbeitsbelastung);
Textantworten
Textantworten haben keine Skala, sie resultieren aus „offenen Fragen“, wie etwa:
…………………………………………………………………………………………………………..……………………………
………………………………………………………….
Bei solchen offenen Antworten steht der explorative Charakter im Vordergrund. Die daraus
gewonnenen Informationen können kategorisiert werden, wurden es auch in diesem Fall:
Typische Textantworten
„die Versorgung meiner Familie“, „Geldnot“
„fehlende soziale Kontakte“
„Ungewissheit, Angst“, „innerer Druck“,
„Stimmungsschwankung“
„zum Nichtstun verurteilt“, „Tatenlosigkeit“
„Kurse, die mir nichts bringen“, „von oben herab behandelt“
„ständige Absagen“, „Leben ohne Arbeit“
„schlechtes Vorbild für die Kinder zu sein“, „schäme mich“
„dem System ausgeliefert sein“, „Gewichtszunahme“
Kategorisierte neue Variable (0/1)
Finanzen
Einsamkeit/Isolation
seelische Belastungen/Depressionen
Untätigkeit/Langeweile
Ämter (AMS)
Arbeitslosigkeit per se
kein nützliches Mitglied der Gesellschaft
Sonstiges
Diese Weiterverarbeitung von Textantworten ist sehr arbeitsintensiv und quantitativ nicht
verwertbar, da erfahrungsgemäß meist nur etwa die Hälfte der Befragten auf solche Fragen
antwortet.
Grundsätzlich gilt: Je differenzierter die Antwortskala, desto mehr Variation resultiert über
die Band-breite der Skala, desto differenziertere Auswertungen und Ergebnisse sind möglich.
Für die Konstruktion eines Messinstrumentes bedeutet das: Jene Messdimensionen, die im
Mittelpunkt der Fragestellung stehen, sollten möglichst differenziert gemessen werden, jene
Messdimensionen, die relevant, aber weniger wichtig sind, als Mehrfachantwort oder mit einer
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
19
groben Skala erheben. Denn wichtig ist auch, die Befragten mit dem Ausfüllen nicht zu
überfordern, da sonst viele Fragen ausgelassen werden.
Zur Verwendung einer „neutralen“ Mittelkategorie
Bei metrischen oder kategorialen Skalen ist die Anwendung einer neutralen Mittelkategorie zu
überlegen. Eine gerade bzw. ungerade Antwortskala hat jeweils Vor- und Nachteile.
Das Vorhandensein einer Mittelkategorie oder „neutralen“ Mitte hat den Vorteil, dass den
Befragten eine Ausweichmöglichkeit bei ihrer Antwort ermöglicht wird, sofern sie sich nicht für
eine Richtung auf der Skala entscheiden wollen oder können. Auf diese Weise erzielt man
weniger fehlende Antworten. Der Nachteil ist, dass dann eben neutrale Antworten vorliegen, die
weder als zustimmend noch als ablehnend einzuordnen sind. Die Befragten verwenden die
mittlere Antwortmöglichkeit nicht immer im Sinne des vorgegebenen Kontinuums sondern auch
als Antwortvermeidung.
Stellt man den Befragten keine neutrale Mitte als Antwortmöglichkeit zur Verfügung („forcedchoice“), dann „zwingt“ man die Befragten dazu, sich für eine der beiden Bedeutungsrichtungen
zu entscheiden, was bei der Auswertung ein Vorteil ist, da in diesem Fall klar ist, auf welcher
„Seite“ sich die Befragten zugeordnet haben. Der Nachteil ist, dass in diesem Fall mehr fehlende
Antworten zu verzeichnen sind.
So kann man beispielsweise bei Zufriedenheitsfragen auf eine Mittelkategorie verzichten, bei
Themen wie „Gentechnik“ oder „politische Partizipation“ jedoch eine "meinungslose" Mitte
akzeptieren.
Die folgende Gegenüberstellung zeigt die Ergebnisse aus einer experimentellen, methodischen
Studie zur Messung von Lebenszufriedenheit, wie die gleichen 500 Befragten antworten, einmal
bei Skala 1 mit nur 4 gültigen Antwortkategorien und einmal bei Skala 2 mit 5 gültigen
Antwortkategorien. Es zeigt sich dabei, dass ein nicht unbeträchtliche Anteil (nahezu ein Fünftel
der Stichprobe) zur Mitte hin tendiert, während im anderen Fall mehr „Weiß-nicht“-Antworten zu
verzeichnen sind, sowie auch ein höherer Anteil in den gemäßigteren Antwortkategorien („eher
zufrieden“ und „eher unzufrieden“).
Skala 1
sehr zufrieden
eher zufrieden
eher unzufrieden
sehr unzufrieden
weiß nicht
%
%
17
62
13
3
5
100%
17
52
18
9
3
1
100%
Skala 2
sehr zufrieden
eher zufrieden
weder noch
eher unzufrieden
sehr unzufrieden
weiß nicht
Quelle: Eder/Hager/Hudler 2002: „Alles in allem, wie zufrieden sind Sie mit Ihrem Leben? (n = 500)
VO 2 Statistik für Pflegewissenschaft (Hager) Skalenniveaus
20