SPSS – Eine kurze Einführung

Departement für
Kommunikationswissenschaft und Medienforschung DCM
SPSS – Eine kurze Einführung
Forschungsseminar Inhaltsanalyse (D. Beck), Mai 2015
1. Datentabelle und Variableneinstellungen ............................................................................. 3
2. Import von Dateien ............................................................................................................... 6
3. Datenmanipulation ............................................................................................................... 8
3.1 Umcodieren in neue Variablen ....................................................................................... 8
3.2 Selektieren von Teilmengen der Datenbasis ................................................................ 10
4. Datenauswertung ............................................................................................................... 12
4.1 Einfache Häufigkeitsauszählungen .............................................................................. 12
4.2 Kreuztabellen ............................................................................................................... 13
4.3 Kreuztabellen bei Variablen mit Mehrfachnennungen .................................................. 15
4.4 Mittelwert-Vergleich mit T-Test für unabhängige Stichproben...................................... 18
4.5 Weitere häufige Auswertungen .................................................................................... 19
4.6 Übungsbeispiele ........................................................................................................... 21
5. Weiterführende Informationen ............................................................................................ 21
6. Anhang: Codeplan „Sportberichterstattung“ ....................................................................... 22
FACULTÉ DES SCIENCES
ECONOMIQUES ET SOCIALES
DÉPARTEMENT DES SCIENCES DE LA
COMMUNICATION ET DES MÉDIAS
WIRTSCHAFTS- UND
SOZIALWISSENSCHAFTLICHE FAKULTÄT
DEPARTEMENT FÜR KOMMUNIKATIONSWISSENSCHAFT UND MEDIENFORSCHUNG
1/30
2/30
1. Datentabelle und Variableneinstellungen
(Grafiken meist aus Version SPSS 17, in Kap. 4.4 aus SPSS 20)
Datenansicht: Fenster für die Eingabe der Daten: Jede Untersuchungseinheit entspricht einer
Zeile, jede Variable einer Spalte. Pro Zelle kann immer nur ein Wert vergeben werden.
Variablenansicht: Fenster zur Erfassung des Codeplans. Hier werden die Angaben zu jeder
Variable und zu jeder Ausprägung erfasst:



Name: Name der Variable, der oben an der jeweiligen Spalte im „Data View“ erscheint; in
älteren SPSS-Versionen maximal 8 Zeichen lang
Typ: Variablentyp; dabei kann es sich um eine Zahl (numerische Variable), eine Zeichenkette,
ein Datum oder ähnliches handeln. Wegen der besseren Auswertungsmöglichkeiten wird auch
bei nominalen und ordinalen Variablen meist der Typ „numerisch“ verwendet, die Ausprägungen
lauten dann 1, 2, 3 usw.
Spaltenformat: Breite der Zelle, also Anzahl Stellen, die für die jeweiligen Werte gebraucht
werden; sind alle vorgesehenen Variablenwerte einstellig (z. B. Variable „Zeitung“ mit den
3/30
Werten „Blick = 1“, „Tages-Anzeiger = 2“ und „NZZ = 3“) ist Spaltenformat = 1. Wenn
Variablenwerte von 10 bis 99 vorkommen, also zweistellige Zahlen, ist Spaltenformat = 2.

Dezimalstellen: Anzahl Stellen nach dem Komma; dieser Wert wird auf 0 gesetzt, wenn nur
ganzzahlige Variablenwerte vorgesehen sind.

Variablenlabel: ausführlicher Name der Variable, wie er später in den Tabellen der Auswertung
angegeben wird. Dieser Name sollte möglichst genau angegeben werden.

Wertelabels: In diesem Feld können die Variablenwerte den jeweiligen Ausprägungen
zugeordnet werden. Bei der oben erwähnten Variable „Zeitung“ sieht dies folgendermassen aus:
Nach jeder Zuweisung einer Ausprägung zu
einem Zahlenwert muss „Hinzufügen“
angeklickt
werden.
Bereits
erfasste
Zuweisungen können im unteren Fenster
angewählt
und
mit
„Ändern“
oder
„Entfernen“ editiert werden. Sobald alle
vorhandenen Ausprägungen im unteren
Fenster erfasst sind, kann man die
Zuweisung mit Klick auf „OK“ bestätigen.

Fehlende Werte: Definition von fehlenden Variablenwerten; normalerweise lässt man in SPSS
ein Datenfeld einfach leer, wenn man dazu keine Daten hat (system-missing values). In
manchen Fällen kann es allerdings Sinn machen, fehlende Variablenwerte nach dem Grund
ihres Fehlens zu differenzieren (z.B.
bei einer Befragung verschiedene Gründe einer
Antwortverweigerung). Hier könnte man zu diesem Zweck zusätzliche fehlende Werte (usermissing values) definieren, die bei der Auswertung nicht berücksichtigt werden sollen.
In diesem Beispiel werden die Werte 98 und 99 als usermissing values bestimmt. Im Feld „Wertelabels“ könnte
dann 98 zum Beispiel als „Antwort verweigert“ und 99 als
„Auskunftsperson nicht erreicht" definiert werden. Bei der
Auswertung wird der Anteil dieser Ausprägungen
angegeben, zur eigentlichen 100%-Basis zählen sie aber
nicht mit.

Spalten: Definition der Spaltenbreite im Fenster „Datenansicht“; meistens kann man hier die
Voreinstellung 8 belassen.

Ausrichtung: Textausrichtung im Fenster „Datenansicht“; diese Einstellung kann man bei
Zahlenwerten gut bei der Grundeinstellung „rechtsbündig“ belassen.

Messniveau: Angabe des Skalenniveaus der Variable (nominal, ordinal, metrisch)
Die Variable „Zeitung“ wird im Fenster „Variablenansicht“ wie folgt erfasst:
4/30
Übung: Erfasse ein einfaches Kategorienschema in SPSS
Variable 1: Laufnummer
Variable 2: Zeitung
1. Blick
2. Tages-Anzeiger
3. NZZ
Variable 3: Datum
(Format JJJJMMTT)
Variable 4: Umfang der Ausgabe in Seiten
Variable 5: Artikelgrösse
1. Bis ¼-Seite
2. mehr als ¼ bis ½-Seite
3. mehr als ½ bis ¾-Seite
4. mehr als ¾ bis 1 Seite
5. mehr als 1 Seite
Variable 6: Ressort
1. Ausland
2. Inland
3. Lokal
4. Wirtschaft
5. Kultur
6. Sport
7. Sonstiges
5/30
2. Import von Dateien
In SPSS können Dateien aus anderen Programmen oder Dateiformaten importiert werden. Diese
Funktion stellt sicher, dass auch Daten, die mit anderen Programmen als SPSS erfasst wurden,
später mit diesem Statistikprogramm ausgewertet werden können.
Als Beispiel betrachten wir den Import einer Datentabelle aus Excel:
Die Excel-Datei „Daten2004TSI.xls“ umfasst die Rohdaten aus einer Inhaltsanalyse von
Nachrichtensendungen. Diese Daten können wie folgt in SPSS importiert werden:
1. Anwählen: Datei > Öffnen > Daten…
6/30
2. Gewünschtes Verzeichnis anwählen, beim Menüpunkt „Dateityp“ das entsprechende Dateiformat
(hier: Excel) anwählen und die gewünschte Datei öffnen. Daraufhin öffnet sich ein Kontrollfenster, in
dem man angeben kann, welcher Bereich der Excel-Tabelle in SPSS übernommen werden soll und
ob die erste Zeile der Excel-Tabelle als Variablennamen gelesen werden soll. Bei der Datei
„Daten2004TSI.xls“ können die vorgeschlagenen Einstellungen übernommen werden, man kann
also auf „OK“ klicken.
3. Nun müssen in der Variablenansicht noch die Felder Variablenlabel und Wertelabels ergänzt
werden:
7/30
3. Datenmanipulation
Sind alle Daten eingegeben bzw. importiert und die Variablen vollständig definiert, kann die
Datenauswertung eigentlich beginnen. Damit die Auswertungsfunktionen optimal ausgeschöpft
werden können, verfügt SPSS aber über mehrere Funktionen, mit denen die Daten für die
Auswertung angepasst werden können. Wir betrachten daher vor der eigentlichen Auswertung die
Funktionen zum Recodieren und zur Datenselektion. Als Beispiel verwenden wir dazu den
Datensatz „Sportberichterstattung.sav“ (Codeplan siehe Anhang).
3.1 Umcodieren in neue Variablen
Manchmal ist es sinnvoll, bestimmte Variablen für die Auswertung zu vereinfachen. So gibt es im
verwendeten Datensatz eine Variable „Autor“ mit sieben verschiedenen Ausprägungen. Wenn nun
aber nur der Anteil der reinen Eigenleistungen interessiert, lässt sich auf der Basis der vorhandenen
Daten eine neue Variable „Eigen- und Fremdleistungen“ erstellen:
Alte Codierung:
Eigenleistung, Byline = 1
Eigenleistung, Kürzel = 2
Pressemitteilung = 3
Agentur = 4
Gastautor oder Ähnliches = 5
Mischform (mit Fremdleistung) = 6
keine Angabe, nicht ersichtlich = 7
Neue Codierung:
reine Eigenleistung = 1
Fremdleistung = 2
keine Angabe, nicht ersichtlich = 3
Mit SPSS kann man entweder die bestehenden Variablenwerte verändern oder eine neue Variable
mit den neuen, recodierten Werten schaffen. In der Regel sollte die zweite Variante gewählt werden,
da sonst die Originalwerte verloren sind (ohnehin sollte der Datensatz vor dem Recodieren immer
abgespeichert werden!).
Beim Recodieren in eine neue Variable geht man wie folgt vor:
1. Anwählen: Transformieren > Umkodieren in andere Variablen…
8/30
1
3
2
2. Im Auswahlfeld links die Ausgangsvariable suchen, dann auf die Pfeiltaste (1) drücken. Im
Zielfeld oben rechts (2) den Namen der neuen Variable in Kurzform (Name) und in voller Länge
(Beschriftung) definieren, „Ändern“ anwählen. Dann auf den Knopf „Alte und neue Werte“ (3)
drücken.
3. Im neuen Fenster kann man definieren, welche neuen Werte den alten Variablenwerten
zugewiesen werden. Jede Zuweisung wird mit „Hinzufügen“ bestätigt, am Schluss klickt man auf
„Weiter“.
4. Auf „OK“ klicken, die neue Variable wird nun am rechten Rand der Datentabelle in einer neuen
Spalte erstellt. Über „Variable View“ kann man die Variableneinstellungen festlegen.
Übung: Erstelle eine Variable, in der die Sportarten (Anhang, V40) gemäss dem Rating von
Swissolympic gruppiert sind!
9/30
3.2 Selektieren von Teilmengen der Datenbasis
Manchmal ist es empfehlenswert, für eine bestimmte Auswertung nur einen Teil der vorhandenen
Datenbasis auszuwerten. Im Datensatz „sport.sav“ besteht zum Beispiel ein Teil der Stichprobe aus
Berichten von Olympischen Spielen, ein anderer Teil aus Artikeln, die mit Hilfe von „künstlichen
Wochen“ ausserhalb von sportlichen Grossanlässen gesammelt wurden. Um Verzerrungen etwa bei
der Frage, wie häufig bestimmte Sportarten vorkommen, zu vermeiden, sollen für die folgende
Auswertung die Olympischen Spiele nicht berücksichtigt und nur die Artikel der „Alltags-Stichprobe“
ausgewertet werden:
1. Anwählen: Daten > Fälle auswählen…
2. Anwählen: „Falls Bedingung zutrifft“
10/30
2
1
3. Im Auswahlfeld links (1) die gewünschte Variable anwählen, dann im Zielfeld (2) die
Auswahlbedingungen für diese Variable festlegen. Zur genauen Auswahl der gewünschten
Datensätze sind die Operatoren „ & “, „ | “ und „ ~= “ hilfreich:

& („und“): Beide aufgeführten Bedingungen müssen erfüllt sein
Beispiel: Alle Artikel der Alltagsstichprobe in der Zeitung Blick:
typ = 2 & zeitung = 1

| („oder“): Eine der aufgeführten Bedingungen muss erfüllt sein
Beispiel: Alle Artikel aus den Zeitungen Blick und NZZ:
zeitung = 1 | zeitung = 3

~= („nicht“): Bestimmte Fälle sollen nicht berücksichtigt werden
Beispiel: Alle Artikel, ausser jenen aus dem Sport-Magazin:
zeitung ~= 5
Selbstverständlich kann man nicht nur Fälle mit einer bestimmten Variablenausprägung selektieren,
sondern auch Fälle, in denen der Wert der Ausprägung grösser/kleiner als ein bestimmter Wert ist.
Beispiel: Alle Artikel, die drei oder mehr Spalten breit sind
spalten >= 3 oder spalten > 2
Nach der Festlegung der Selektion kann das Fenster mit „Weiter“ geschlossen werden,
anschliessend im nun aktiven Fenster „OK“ klicken.
Die Fälle, deren Nummerierung in der Spalte ganz links nun durchgestrichen ist, werden bei der
Auswertung nicht berücksichtigt. Diese Filterung kann jederzeit wieder aufgehoben werden über
Daten > Fälle auswählen > Alle Fälle.
11/30
4. Datenauswertung
Mit den bisher erarbeiteten Grundkenntnissen ist es nun möglich, einfache Datenauswertungen
vorzunehmen.
4.1 Einfache Häufigkeitsauszählungen
Will man anhand des Beispieldatensatzes herausfinden, welche Sportart in der Berichterstattung am
häufigsten vorkommt, geht man folgendermassen vor:
Anwählen: Analysieren > Deskriptive Statistiken > Häufigkeiten…
Unter „Format“ kann man unter anderem wählen, in welcher Reihenfolge die Daten dargestellt
werden sollen – geordnet nach den Werten (Ausprägungen) oder nach den Häufigkeiten. Wenn wir
„Absteigende Häufigkeiten“ anwählen, werden in der Ergebnistabelle die am häufigsten
vorkommenden Sportarten zuoberst aufgeführt. Über „Weiter“ gelangt man zurück zum
Ausgangsfenster.
Über den Menüpunkt „Statistiken“ lassen sich zusätzliche statistische Masse berechnen
(Mittelwert, Median, Modus, Standardabweichung, Maximal- oder Minimalwert usw.). Wenn man
keine Häufigkeitstabelle erstellen will, kann man solche Daten auch über Analysieren >
Deskriptive Statistiken > Deskriptive Statistik… erheben.
Über den Menüpunkt „Diagramme“ lassen sich Grafiken erstellen. Die Gestaltungsfunktionen von
SPSS-Grafiken sind allerdings ziemlich beschränkt, es empfiehlt sich daher, die SPSSErgebnistabellen nach Excel zu kopieren und die gewünschten Diagramme mit diesem Programm
zu erstellen.
Erstellen wir also eine einfache Häufigkeitstabelle, indem wir ohne Änderungen der Einstellungen
unter „Statistiken“ und „Diagramme“ im Ausgangsfenster auf „OK“ drücken. Die Ergebnisse
werden im Ausgabefenster angezeigt. Diese Datei kann später unter dem gewünschten Namen
abgespeichert werden:
12/30
In der ersten Tabelle wird aufgrund der gewählten Einstellungen nur die Anzahl der gültigen und der
fehlenden Werte angegeben (da nur die Alltags-Stichprobe selektiert ist, beträgt die Anzahl der
ausgewerteten Artikel 5520). Da für jeden Artikel eine Sportart zugewiesen werden konnte, gibt es
keine Artikel mit fehlenden Werten.
Die zweite Tabelle ist die eigentliche Ergebnistabelle. Angegeben werden die absolute Häufigkeit
(Anzahl Fälle), die relative Häufigkeit in % aller Untersuchungseinheiten respektive in % aller
Einheiten, für die Werte vorhanden sind (gültige Prozente) und die kumulierten Prozentzahlen.
4.2 Kreuztabellen
Kreuztabellen spielen bei der Überprüfung von Hypothesen eine wichtige Rolle, denn sie werden
verwendet, um Abhängigkeiten zwischen zwei Variablen zu beschreiben. Die abhängige Variable
wird dabei immer in den Zeilen dargestellt, die unabhängige Variable immer in den Spalten.
Beispiel: Wir wollen herausfinden, wie sich der Anteil von Frauen als Hauptakteurinnen in der
Sportberichterstattung im Lauf der Zeit verändert hat.


„Geschlecht“ ist damit die abhängige Variable.
„Serie“ (Erfassung des Erhebungszeitraums) ist damit die unabhängige Variable.
Bitte darauf achten, dass alle Artikel des Datensatzes selektiert sind!
Anwählen: Analysieren > Deskriptive Statistiken > Kreuztabellen…
13/30
1
2
Aus dem linken Auswahlfeld werden die gewünschten Variablen ausgesucht und mit den Pfeiltasten
(1, 2) in das gewünschte Zielfeld verschoben. „Geschlecht“ wird als abhängige Variable im Feld
„Zeile(n)“ platziert, „Serie“ als unabhängige Variable im Feld „Spalten“.
Über den Menupunkt „Statistiken“ kann angewählt werden, welche statistischen
Zusammenhangsmasse ausgerechnet werden sollen. Im Beispielfall wird mit einem Chi-QuadratTest ermittelt, ob die Abweichungen zwischen den verschiedenen Erhebungsjahren zufällig sind
oder nicht.
Über den Menupunkt „Zellen“ können weitere Einstellungen vorgenommen werden. Hier sollte unter
„Prozentwerte“ das Feld „Spaltenweise“ angekreuzt werden. Damit werden in der Ergebnistabelle
neben der Anzahl Fälle in absoluten Zahlen auch ihr Anteil in Spaltenprozenten angegeben, im
Beispiel also der Anteil von Artikeln mit weiblichen Hauptakteurinnen pro Untersuchungsjahr. Die
Angabe der Spaltenprozente ist notwendig, damit die Ergebnisse überhaupt interpretiert werden
können.
Über den Menupunkt „Format“ kann man die Reihenfolge der Ausprägungen der abhängigen
Variable verändern. Im konkreten Fall kann die Voreinstellung so belassen werden.
Über „Weiter“ gelangt man jeweils zurück zum Ausgangsfenster, mit „OK“ startet man die
Berechnung der Kreuztabelle:
14/30
Aus der Kreuztabelle wird ersichtlich, dass der Anteil von Artikeln mit Frauen als Hauptakteurinnen
von 1950 bis 2000 von knapp 2% auf über 10% gestiegen ist.
Der Chi-Quadrat-Test zeigt weiter, dass die Abweichungen zwischen den verschiedenen
Untersuchungsjahren mit einer Irrtumswahrscheinlichkeit von weniger als 0,1% signifikant ist. Der in
der Kreuztabelle festgestellte steigende Frauenanteil liegt also nicht im Bereich zufälliger
Schwankungen (normalerweise spricht man bei einer Irrtumswahrscheinlichkeit von weniger als 5%
von statistisch signifikanten Abweichungen).
Tipp: Wenn SPSS
„< 0,001“ ausweisen!
als
Signifikanzwert
„0,000“
ausgibt,
diesen
Wert
immer
als
4.3 Kreuztabellen bei Variablen mit Mehrfachnennungen
Variablen mit Mehrfachnennungen kommen in Inhaltsanalysen recht häufig vor, beispielsweise
wenn in einem Artikel mehrere Themen oder Akteure kategorisiert werden und dafür mehrere
15/30
Variablen mit den gleichen Ausprägungen geschaffen wurden („Thema 1“, „Thema 2“ usw.). In
SPSS gibt es mehrere Möglichkeiten, solche Variablen gemeinsam auszuwerten. Für
Häufigkeitsauszählungen und Kreuztabellen kann man die folgende Funktion verwenden:
Anwählen: Analysieren > Mehrfachantworten > Variablen-Sets definieren
Zuerst muss ein „Mehrfachantworten-Set“ definiert werden. Im gezeigten Beispiel wird ein solches
Set für die Erfassung des Themas aus den beiden Themenvariablen „Hauptthema“ und
„Nebenthema“ geschaffen. Da die Themenvariable nicht dichotom ist, also mehr als zwei
Ausprägungen hat, werden die Variablenwerte als Kategorien kodiert. Ganz wichtig ist dabei, dass
bei allen Variablen, die Teil des „multiple response set“ sind, die genau gleichen Ausprägungen
definiert sind.
Anwählen: Analysieren > Mehrfachantworten > Kreuztabellen
Für die Auswertung wird das geschaffene Variablenset als abhängige Variable festgelegt. Bei der
unabhängigen Variablen kann ein Bereich definiert werden. Im Beispiel soll die Themenentwicklung
im Zeitverlauf untersucht werden. Damit alle Erhebungszeitpunkte mitberücksichtigt werden können,
müssen bei der Variable „Serie“ als unabhängiger Variablen die Werte 1 bis 4 enthalten sein. Wie
16/30
üblich bei Kreuztabellen kommt die abhängige Variable in die Zeilen, die unabhängige in die
Spalten.
Bei den Optionen kann angegeben werden, welche Prozentwerte in der Tabelle angezeigt werden
sollen. Wie bei normalen Kreuztabellen werden hier die Spaltenprozente ausgewählt. Anzugeben ist
weiter, ob sich der Prozentwert auf die Anzahl Fälle oder die Anzahl Antworten bzw. Nennungen
beziehen soll. Im konkreten Fall entspricht 100%, wenn die Prozentwerte auf die Anzahl Fälle
bezogen werden, der Anzahl der untersuchten Artikel. Die Summe der Prozentwerte wird daher
höher ausfallen als 100%, der Wert ist aber besser vergleichbar mit anderen Auswertungen als
wenn die Prozentwerte auf die Anzahl Themennennungen bezogen werden.
Die Ergebnisse erscheinen bei Klick auf „Weiter“, dann auf „OK“:
17/30
4.4 Mittelwert-Vergleich mit T-Test für unabhängige Stichproben
Bei Mittelwerten von metrischen Variablen kann mit Hilfe eines T-Tests bestimmt werden, ob die
Abweichungen zwischen zwei Gruppen statistisch signifikant sind oder nicht. Als Beispiel
vergleichen wir den Aufmerksamkeitswert-Index (Gesamtpunktzahl, die sich aus Spaltenbreite,
Illustrationen und dem Vorhandensein eines Anrisses zusammensetzt) von Blick und NZZ.
Anmerkung: Für einen T-Test brauchen wir metrische Variablen, bei denen man einen Mittelwert
erheben kann. Besser als das künstliche Mass „Aufmerksamkeitswert-Index“ würde sich hier
beispielsweise bei der Auswertung einer Befragung Variablen wie „Alter“, „Berufserfahrung“ oder
„Einkommen“ eignen. Das Prinzip des Tests lässt sich aber auch mit diesem Index demonstrieren.
Da der Blick in der ersten Untersuchungsserie nicht vorkommt, dürfen die NZZ-Artikel aus dieser
Serie im Interesse der besseren Vergleichbarkeit nicht mitausgewertet werden. Sie müssen also
zunächst über Daten > Fälle auswählen > Falls > „serie > 1“ herausgefiltert werden.
Anwählen: Analysieren > Mittelwerte vergleichen > T-Test bei unabhängigen Stichproben…
Die Variable, deren Mittelwerte wir vergleichen möchten, wird ins Feld “Test variable(n)”
verschoben, die Variable, die zur Unterscheidung der beiden Gruppen dient, kommt ins Feld
„Gruppenvariable“. Da „Zeitung“ keine dichotome Variable ist, müssen wir nun die beiden
Ausprägungen für Blick und NZZ unter „Gruppen def.“ angeben:
In diesem Fenster geben wir gemäss Codeplan für den Blick den
Wert 1 und für die NZZ den Wert 3 ein. Dann mit „Weiter“ zurück
zum Ausgangsfenster.
(Bei ordinalen und metrischen Variablen könnte man unter
„Trennwert“ einen bestimmten Wert definieren und alle Fälle mit
einem kleineren Wert mit den Fällen vergleichen, bei denen der
Wert oberhalb des Trennwertes liegt.)
Unter „Optionen“ kann man nun das Vertrauensintervall einstellen, die Voreinstellung ist 95%
(üblicher Wert in den Sozialwissenschaften).
Das Ausgabefenster, das man nach dem Klick auf „OK“ erhält, sieht wie folgt aus:
18/30
In der ersten Tabelle werden für beide Teilgruppen die Anzahl der Fälle, die Mittelwerte, die
Standardabweichung und der Standardfehler des Mittelwerts (bei einem Vertrauensintervall von
95%) angegeben. Es zeigt sich, dass der mittlere Aufmerksamkeitswert beim Blick fast doppelt so
hoch ist wie bei der NZZ.
Der eigentliche T-Test befindet sich in der zweiten Tabelle. Die Spalten mit der Überschrift „LeveneTest der Varianzgleichheit“ geben an, ob die Varianzen in beiden zu vergleichenden Gruppen gleich
sind. Der klassische T-Test basiert auf dieser Annahme. Wenn der Signifikanzwert (2. Spalte)
kleiner ist als p = 0,1, muss folglich die untere Zeile gelesen werden, die eine Korrektur für die
ungleichen Varianzen enthält. Ist der Signifikanzwert grösser als p = 0,1, gelten die Varianzen als
gleich, und es muss die erste Zeile gelesen werden.
Beim vorliegenden Beispiel ist also die zweite Zeile massgeblich. Der T-Test bestätigt, dass die
Abweichung mit einer Irrtumswahrscheinlichkeit von weniger als 0,1% (5. Spalte) statistisch
signifikant ist.
4.5 Weitere häufige Auswertungen

Eine Varianzanalyse zum Vergleich der Mittelwerte von mehr als zwei Gruppen kann man über
den folgenden Menupunkt vornehmen:
Analysieren > Mittelwerte vergleichen > Einfaktorielle ANOVA…

Korrelationen (gibt es eine gemeinsame Tendenz zweier Variablen bei der Abweichung vom
Mittelwert?) zur Berechnung der Korrelationskoeffizienten Spearman’s rho (bei ordinal skalierten
Variablen) oder Pearson’s r (bei metrisch skalierten Variablen) erstellt man über den folgenden
Menupunkt:
Analysieren > Korrelationen > Bivariat…
oder
Analysieren > Deskriptive Statistiken > Kreuztabellen > Statistiken:
Korrelationen
19/30
Sportler allg.
Spitzensportler
Amateursportler
Trainer
Sportärzte
Schiedsrichter
Sportverbände
Sponsoren
Medien
Zuschauer
Bevölkerung allg.
Experten
Politiker
einzelne Nationen
nicht ersichtlich
1948/49
olymp.
Spiele
(n=416)
0.0%
87.5%
1.7%
0.7%
0.2%
0.2%
5.0%
0.5%
1.7%
1.9%
0.0%
0.0%
0.2%
0.2%
0.0%
künstl.
Woche
(n=812)
1.4%
72.1%
7.4%
0.9%
0.0%
0.7%
14.3%
0.2%
1.0%
0.7%
0.0%
0.5%
0.7%
0.0%
0.0%
1968/69
olymp.
Spiele
(n=875)
0.2%
78.7%
1.7%
1.7%
1.3%
0.3%
9.5%
0.1%
2.2%
1.9%
0.0%
0.6%
0.8%
0.9%
0.0%
künstl.
Woche
(n=1700)
0.5%
74.0%
3.0%
3.8%
0.1%
0.6%
11.6%
0.8%
1.5%
1.3%
0.1%
0.9%
1.6%
0.2%
0.1%
1988/89
olymp.
Spiele
(n=914)
0.0%
80.9%
0.1%
3.8%
0.5%
1.1%
5.1%
0.2%
3.2%
2.4%
0.1%
0.2%
1.2%
1.1%
0.0%
künstl.
Woche
(n=1913)
0.3%
79.6%
1.1%
5.9%
0.4%
0.8%
7.3%
0.8%
1.6%
0.9%
0.0%
0.3%
0.7%
0.1%
0.1%
2000/01
olymp.
Spiele
(n=840)
0.1%
77.3%
0.2%
4.3%
0.2%
0.2%
7.9%
0.8%
2.5%
3.9%
0.1%
0.5%
1.2%
0.7%
0.0%
künstl.
Woche
(n=1105)
0.4%
78.7%
0.6%
8.2%
0.4%
0.3%
7.1%
0.7%
1.2%
0.8%
0.0%
0.7%
0.8%
0.0%
0.0%
Hauptakteure in der Sportberichterstattung von Blick, TA, NZZ, Sport und Sport-Magazin

Komplexere Tabellen wie die hier abgebildete kann man mit SPSS mit Hilfe der folgenden
Funktion erstellen:
Analysieren > Tabellen > Benutzerdefinierte Tabellen…
Die gewünschten Variablen können dann über- bzw. nebeneinander in Zeilen oder Spalten
platziert werden. Dabei muss immer angegeben werden, welche Daten der jeweiligen Variablen
angezeigt werden sollen (Häufigkeit, Spaltenprozente, bei metrisch skalierten Variablen der
Mittelwert usw.). Die Ergebnistabelle kann danach direkt in Word hineinkopiert werden, besser
bearbeitet man sie aber zuerst in Excel nach.

Faktorenanalysen dienen der Reduktion von Dimensionen – zum Beispiel bei der Bildung von
Frames anhand von Variablen zu Themen, Ursachenzuschreibungen, Lösungsansätzen und
Bewertungen. Das Verfahren kann nur bei metrisch skalierten Variablen (bei Inhaltsanalysen oft
Dummy-Variablen) angewendet werden.
Analysieren > Dimensionsreduzierung > Faktorenanalyse…
Danach können die Ausgangsvariablen bestimmt und der Wert der Auswahlvariable definiert
werden, den alle berücksichtigten Fälle erfüllen müssen. Unter „Deskriptive Statistik“ kann eine
Korrelationsmatrix (mit dem Punkt „Koeffizienten“) erstellt und mit KMO und Bartlett-Test sowie
Anti-Image-Matrizen ermittelt werden, welche Variablen sich überhaupt für die Analyse eignen.
Unter „Extraktion“ kann die genaue Methode der Faktorenanalyse bestimmt und ein Scree-Test
zur Bestimmung der relevanten extrahierten Faktoren vorgenommen werden. Da unrotierte
Faktorladungen meist schwierig zu interpretieren sind, kann unter „Rotation“ die gewünschte
Rotationsmethode (am häufigsten wird Varimax verwendet) bestimmt werden. Genauere Infos
zu diesem und anderen komplexeren Verfahren (z.B. Clusteranalysen) gibt es auf bzw. in den in
Kap. 5 aufgelisteten Websites und Links.

Für Reliabilitätstests reicht das einfache Verfahren mit der Holsti-Formel für studentische
Arbeiten in der Regel aus. Als Reliabilitätskoeffizient, der auch zufällige Übereinstimmungen
mitberücksichtigt, kann Cohen’s Kappa ermittelt werden. Dazu werden die Werte, die zwei
Codierer bei den gleichen Fällen einer Variablen zugeordnet haben, als zwei separate Variablen
erfasst. In einer Kreuztabelle werden dann die beiden Codierervariablen als abhängige und
unabhängige Variable definiert, unter „Statistik“ wird „Kappa“ ausgewählt.
20/30
Als Reliabilitätsmass für metrische Variablen wird auch Cronbach’s Alpha oft verwendet. In der
Regel wird dieses Mass meist bei Befragungen zur Kontrolle eingesetzt, ob mit verschiedenen
Items mit Ratingskalen tatsächlich das gleiche Konstrukt gemessen wird:
Analysieren > Skalierung > Reliabilitätsanalyse…
4.6 Übungsbeispiele
Welche Sportarten kommen an den olympischen Spielen am häufigsten vor?
Welche Sportarten haben im Lauf der Zeit an Bedeutung gewonnen, welche an Bedeutung
verloren?
In welcher Zeitung kommen am meisten Beiträge mit Humor vor? Benutze dazu die Variable
„index2“. Wie sieht die Situation aus, wenn wir nur die jüngste Teilstichprobe (Variable
„serie“) anschauen?
5. Weiterführende Informationen
Im Rahmen dieses Kurses konnten nur die einfachsten und häufigsten Auswertungsverfahren
gezeigt werden. SPSS weist aber noch viel mehr statistische Funktionen auf, zudem existiert mit der
SPSS-Syntaxprogrammierung eine zusätzliche Benutzeroberfläche innerhalb des Programms, die in
diesem Schnellkurs nicht berücksichtigt werden konnte. Informationen hierzu liefern verschiedene
Kurs-Websites von Universitäten, die auch vertiefende Informationen zu den gezeigten Verfahren
anbieten:

SPSS-Kurs an der Universität Bern: http://www.molar.unibe.ch/help/statistics/

Empirische Methoden an der Hochschule Luzern: http://www.empiricalmethods.hslu.ch/empirical-methods/h-entscheidbaum.htm

Einführung
in
SPSS
für
Windows
am
Leibniz-Rechenzentrum
http://www.lrz.de/services/schulung/unterlagen/spss/

IBM Knowledge Center mit Erklärung statistischer Funktionen in SPSS: http://www01.ibm.com/support/knowledgecenter/SSLVMB_22.0.0/com.ibm.spss.statistics.help/spss/base/i
dh_fact_opt.htm?lang=de

deutschsprachiges SPSS-Tutorial auf Youtube:
http://www.youtube.com/user/TheSpsstutorial?feature=watch
in
München:
Es gibt auch Bücher zum Umgang mit SPSS, zum Beispiel:

Backhaus, Klaus / Erichson, Bernd / Plinke, Wulff / Weiber, Rolf (2011): Multivariate
Analysemethoden: Eine anwendungsorientierte Einführung. 13., überarbeitete Auflage, Berlin.

Bühl Achim (2011): SPSS 20. Einführung in die moderne Datenanalyse. 13., aktualisierte
Auflage. München.
21/30
6. Anhang: Codeplan „Sportberichterstattung“
Allgemeine Anweisungen






Untersuchungseinheiten sind die einzelnen Artikel im Ressort „Sport“ der jeweiligen
Zeitung sowie die Artikel auf der Titelseite der gleichen Ausgabe.
Die einzelnen Artikel jeder Ausgabe werden fortlaufend nummeriert, mit jeder Ausgabe
wieder neu beginnend bei 1.
Berücksichtigt werden nur Artikel mit redaktionellem Text (ganze Sätze). Stichwortartige
Programmhinweise, Ranglisten von Ereignissen ohne redaktionellen Bericht,
Medaillenspiegel oder ähnliches werden nicht erfasst.
Kasten mit ergänzenden Informationen zu einem Hauptartikel werden nicht als
eigenständige Artikel mitgezählt, wenn sie einen eindeutigen Bezug zum Ereignis im
Hauptartikel haben und wenn die Lektüre des Haupttexts zum Verständnis des
Kontexts der Informationen im Kasten notwendig ist.
In älteren Zeitungsausgaben kommt es in der Berichterstattung über olympische Spiele
vor, dass mehrere Berichte über verschiedene Wettkämpfe jeweils nur durch
Zwischentitel voneinander abgetrennt werden. In diesem Fall gilt jeder Bericht als
eigenständiger Artikel.
Bei grafisch abgesetzten Kästen mit aus jeweils nur einem oder zwei Sätzen
bestehenden Kurzmeldungen wird der ganze Kasten als ein einzelner Artikel gewertet.
Identifikatoren
V10: Laufnummer
V11: Serie:
um 1950:
um 1970:
um 1990:
um 2000:
1
2
3
4
V12: Typ:
Olympische Spiele:
Stichprobe ohne Grossanlass
V13: Zeitung
Blick:
Tages-Anzeiger:
NZZ:
Sport:
Sport-Magazin
1
2
1
2
3
4
5
V14: Datum
22/30
Formale Merkmale
V20: Artikelgrösse
Kurzmeldung
bis ¼-Seite
bis ½-Seite
bis ¾-Seite
bis 1 Seite
mehr als 1 Seite
1
2
3
4
5
6
V21: Darstellungsformen
Meldung (bis 30 Zeilen)
1
Bericht (über 30 Zeilen)
2
Reportage (Reporter schildert Erlebnisse vor Ort, Augenzeugenberichte)
3
Feature
4
Interview
5
Porträt
6
Kommentar
7
Glosse
8
Leserbrief
9
„nichtjournalistische“ Formen
10
(Resultatmeldungen, Programmhinweise, Medaillenspiegel usw.; bei der Zuweisung
dieser Kategorie wird nicht weitercodiert und der Artikel für die Auswertung nicht
verwendet)
V22: Anzahl Spalten: ________
V23: Anriss (d.h. der Artikel befindet sich entweder selbst auf der Titelseite oder es
gibt einen Verweis von der Titelseite bzw. der ersten Aufschlagseite auf den
codierten Artikel)
nicht vorhanden:
0
vorhanden:
1
V24: Bild vorhanden (Foto, Karikatur)
nicht vorhanden:
ein Bild vorhanden:
mehrere Bilder vorhanden
0
1
2
V25: Bild hat besondere Form (kein Rechteck)
keine besondere Form:
0
besondere Form:
1
V26: grafische Textelemente (Tabellen, Kästchen mit Zusatzinformationen, Grafiken)
nicht vorhanden:
0
vorhanden:
1
V27: Aufmerksamkeitsindex
Summe der Werte von V22-V27
23/30
V28: Autor
Eigenleistung, Byline
Eigenleistung, Kürzel
Pressemitteilung
Agentur
Gastautor oder ähnliches
Mischform
keine Angabe, nicht ersichtlich
1
2
3
4
5
6
7
Inhaltliche Merkmale
V40: Sportart
geordnet nach der Einstufung der Sportverbände durch den SOV im Frühjahr 2001, die
sich nach der Bedeutung der Sportart für die Schweiz richtet; Bei den Disziplinen, für die
verschiedene Verbände zuständig sind, die aber unter einem Oberbegriff
zusammengefasst werden (Radsport, Pferdesport, Motorsport, Schiessen, Ski nordisch),
wurde die beste Einstufung berücksichtigt
Gruppe 1:
Eishockey
Leichtathletik
Pferdesport
Radsport
Rudern
1
2
3
4
5
Schiessen
Schwimmen
Ski alpin
Tennis
6
7
8
9
Gruppe 2:
Bob
Curling
Fechten
Fussball
Handball
Judo
Kanu
10
11
12
13
14
15
16
Kunstturnen
Landhockey, Unihockey
Orientierungslauf
Ringen
Segeln
Ski nordisch
Triathlon
17
18
19
20
21
22
23
Gruppe 3:
Badminton
Eiskunstlauf
Eisschnellauf
Flugsportarten
Fünfkampf
Klettern
Motorsport
Rodeln
Rollhockey
24
25
26
27
28
29
30
31
32
Squash
Synchronschwimmen
Tanzen
Tauziehen
Tischtennis
Trampolin
Volleyball
Wasserball
Wasserspringen
33
34
35
36
37
38
39
40
41
Gruppe 4:
Basketball
Casting
Duathlon
Eisstockschiessen
Faustball
Gewichtheben
Golf
42
43
44
45
46
47
48
Grasski
Minigolf
Rhythm. Sportgymnastik
Skeleton
Ski-Bob, Snow Bike
Taekwando
49
50
51
52
53
54
24/30
Keine Einstufung:
American Football
55
Rollschuh-Kunstlaufen
Base- und Softball
56
Boccia
Boxen
57
Wasserski
Rugby
58
Bridge, Billard
Schach
59
Hornussen
Unterwassersport
60
Bodybuilding
Wehrsportarten
61
Snowboard
Schwingen
62
Behindertensport
mehrere Wintersportarten, Wintersport allgemein
mehrere Sommersportarten, Sommersport allgemein
Verschiedene Sportarten, Sport allgemein, jahreszeitunabhängig
63
64
65
66
67
68
69
70
97
98
99
V41: Berichterstattung während der olympischen Spiele
keine Olympia-Stichprobe
0
Beitrag bezieht sich auf olympische Spiele 1
Beitrag bezieht sich auf andere Ereignisse 2
V42: Hauptthema des Artikels
Die Werte 10, 20, 30, 40, 50, 60, 70 und 80 werden codiert, wenn die Zuordnung zu einer
Themendimension eindeutig erscheint, aber das Thema nicht eindeutig einem der unter
der entsprechenden Dimension gelisteten spezifischen Themen zugeordnet werden kann.
Ausnahme: Falls Wettkampfverlauf und Ergebnis in einem Artikel etwa gleich gewichtet
sind, wird im Zweifelsfall die Kategorie „Wettkampfverlauf“ codiert.
Es darf pro Artikel nur ein Hauptthema bzw. eine Dimension zugeordnet werden!
Dimension Leistung:
Leistung allgemein
Prognosen
Wettkampfverlauf
10
11
12
Ergebnis
Analyse
13
14
Dimension Organisation:
Organisation allgemein
Vereins-, Verbandspolitik
Spielregeln
20
21
22
Wettkampfvorbereitungen
Karrierenentscheide
Infrastruktur
23
24
25
Dimension Ethik:
Ethik allgemein
Doping
Korruption
Gewalt auf dem Spielfeld
30
31
32
33
Gewalt neben Spielfeld
sonst. unfaires Verhalten
Risiken des Sports
34
35
36
Übertragungsrechte
Finanzen von Sportorganisationen
Sport als Medienereignis
44
Dimension Kommerzialisierung:
Kommerzialisierung allg.
40
Preisgelder
41
Transfermarkt
42
Werbung, Sponsoring
43
45
46
25/30
Dimension Politik:
Politik allgemein
Sportanlässe als Objekt…
und Rahmen polit. Aktionen
Sportförderung
50
51
52
53
weitere Entscheide von
Politikern zum Sport
54
Politische Verhältnisse am
Austragungsort
55
Dimension Gesundheit:
Gesundheit allgemein
Verletzungen, Unfälle
60
61
Kondition/Zustand (auch
Material)
Trainingsmethoden
Dimension Privatleben:
Privatleben allgemein
70
Sportler als Privatpersonen
(Intimes, Gefühle, Partner,
Familie)
71
Dimension Rahmenhandlung:
Rahmenhandlung allg.
80
Nebenschauplätze bei
sportlichen Grossanlässen 81
62
63
Sportler als Prominenz bei
Partys, Empfängen usw.
72
Aktionen ausserhalb des
Sports
73
Zuschauer, Fans
82
V43: Weiteres wichtiges Thema des Artikels
Dieses Thema muss aus einer anderen Themendimension stammen, sonst bei V42 mit
„… allgemein“ codieren
keine 2. Themendimension
0
sonst: wie V42
Akteure
V50: Haupthandlungsträger
Nur ein Haupthandlungsträger ist zu bestimmen!
Sportler allgemein (ohne Qualitätsangabe)
Hochleistungssportler (Einzelsportler/Mannschaft)
Amateursportler/Breitensportler
Trainer
Sportärzte (und Vertreter von Ärzten)
Schiedsrichter, Kampfrichter
Vertreter der Sportverbände, Organisationskomitees, Offizielle
Wirtschafts- und Unternehmensvertreter, Sponsoren
Medienvertreter
Zuschauer, Leser, Fans
Schweizer Bevölkerung allgemein
Wissenschaftler, Experten
Politiker, politische Parteien, (sport-)politische Institutionen
einzelne Nationen
nicht ersichtlich
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
26/30
V51: Personalisierung
Zur Zuordnung muss man sich überlegen, welche Person(en) oder welche Gruppe der
Artikel primär behandelt.
einzelne Person
1
mehrere einzelne Personen
2
Verein, Mannschaft
3
Verband, Organisation
4
Wettkampfteilnehmer als Gesamtheit (Starterfeld, Liga) 5
nicht organisierte Gruppe (z. B. Publikum)
6
anderes
7
V52: Geschlecht des Haupthandlungsträgers
weiblich
männlich
nicht ersichtlich, mehrere Akteure
unterschiedlichen Geschlechts (Familie, Organisation)
V53: Herkunft des Hauptakteurs
Inland
Ausland
1
2
3
1
2
V54: Prominenz der sportlichen Akteure
Internationale Elite (Weltmeistertitel, unter Weltbesten, ...)
Schweizer Elite (international erfolgreiche Schweizer)
erfolgreiche Schweizer im eigenen Land (nationale Meister, Top 10,
Nationalligen)
Basis
keine Sportler/innen
1
2
3
4
0
Raum und Zeit
V55: Zeitliche Dimension:
Bezug auf ein eben abgeschlossenes Ereignis
Vorschau, Ausblick
Rückblick auf weiter zurückliegende Ereignisse
Sportgeschichte
Überblicksdarstellung, Hintergrund
1
2
3
4
5
V56: Räumliche Dimension:
lokal (im Kanton Zürich)
in der Schweiz, v. a. Schweizer beteiligt
in der Schweiz, mit internationaler Beteiligung
im Ausland, mit Schweizer Beteiligung
im Ausland, ohne Schweizer Beteiligung
1
2
3
4
5
27/30
Dramatische Elemente
V60: Kommt ein allgemeiner Grundkonflikt vor? Welche Konfliktart?
Wenn V61=0, hier ebenfalls mit 0 codieren
keine allgemeine Konfliktart
0
Mensch gegen Mensch
1
Mensch gegen sich selbst
2
Mensch gegen Naturgewalten
3
Mensch gegen unbekannte Kraft
4
Mensch gegen Normen der Gesellschaft
5
V61: Kann die Handlung unter einer der folgenden dramatischen Situationen
subsumiert werden?
(Definition gemäss separater Auflistung)
Keine dramatische Situation
0
Das Flehen
1
Befreiung/Erlösung
2
Delikt aus Rache
3
Racheakt zwischen Verwandten
4
Verfolgung
5
Katastrophe, Unglück
6
Der Grausamkeit/einem Unglück zum Opfer fallen
7
Revolte, Aufruhr, Aufstand
8
Waghalsige Pläne/Vorhaben/Unternehmen
9
Entführung
10
Rätsel
11
Erhalten/Erwerben
12
Feindschaft zwischen Verwandten/Freunden
13
Konkurrenz/Rivalität zwischen Verwandten/Freunden
14
Mörderischer Ehebruch
15
Wahnsinn
16
Verhängnisvolle Unverschämtheit/Frechheit
17
Ungewolltes Liebesdelikt
18
Erschlagen eines nicht erkannten Verwandten
19
Selbstaufopferung für einen Blutsverwandten
20
Selbstaufopferung für eine Leidenschaft
21
Selbstaufopferung für ein Ideal
22
Notwendigkeit, eine geliebte Person zu opfern
23
Rivalität zwischen Überlegenem und Unterlegenem
24
Ehebruch
25
Liebesdelikt
26
Entdeckung der Unehre/Schande einer geliebten Person 27
Hindernisse, die einer Liebe entgegenstehen
28
Geliebter Feind
29
Ehrgeiz
30
Konflikt mit einem Gott/religiöse Konflikte
31
Irrtümliche/falsche Eifersucht
32
28/30
Fehlurteil
Reue
Wiederfinden/Wiedergewinnung geliebter Personen
Verlust geliebter Personen
33
34
35
36
V62: Tritt eine weitere Konstellation auf, die einer dramatischen Situation
entspricht?
gleiche Ausprägungen wie V61
Ästhetisierung
V70: Wird Attraktivität/Eleganz von sportlichen Aktivitäten explizit betont?
nein
0
ja
1
V71: Wird Attraktivität des Körpers eines Athleten/einer Athletin explizit betont?
nein
0
ja
1
V72: Wenn ja bei V71: Geschlecht des beschriebenen Akteurs?
Attraktivität nicht betont
0
weiblich
1
männlich
2
mehrere Personen untersch.
Geschlechts/nicht ersichtlich
3
V73: Wenn ja bei V71: wird der entsprechende Akteur abgebildet?
Attraktivität nicht betont
0
keine Abbildung
1
Abbildung vorhanden
2
Humor
V80: Textform
Glosse
Feature
keine dieser Formen
1 (wenn V21=8, dann ist V80=1)
1 (wenn V21=4, dann ist V80=1)
0 (wenn V21≠4 und V21≠8, dann ist V80=0)
29/30
V81: Humoristische Elemente im Text:
kein Humor
sich lustig machen über andere (Schadenfreude bei
Misserfolg des Gegners, Eigenschaften von Aussenseitern,
überspitzte Darstellung nationaler oder anderer Merkmale)
Inkongruenz (ungewohnte Kombination von Elementen)
humorvolle Bemerkungen als Beigabe zu einer
„schlechten“ Nachricht (Niederlage des eigenen Teams)
sonstige Formen (z.B. Wortspiele, wenn nicht unter 1-3 codiert)
0
1
2
3
4
V82: Ist mindestens eine Karikatur vorhanden?
nicht vorhanden
0
vorhanden
1
V83 Index Humor
keine Humor-Elemente vorhanden
humoristische Elemente vorhanden
0 (wenn bei V50 bis V52 überall Wert 0)
1
30/30