Departement für Kommunikationswissenschaft und Medienforschung DCM SPSS – Eine kurze Einführung Forschungsseminar Inhaltsanalyse (D. Beck), Mai 2015 1. Datentabelle und Variableneinstellungen ............................................................................. 3 2. Import von Dateien ............................................................................................................... 6 3. Datenmanipulation ............................................................................................................... 8 3.1 Umcodieren in neue Variablen ....................................................................................... 8 3.2 Selektieren von Teilmengen der Datenbasis ................................................................ 10 4. Datenauswertung ............................................................................................................... 12 4.1 Einfache Häufigkeitsauszählungen .............................................................................. 12 4.2 Kreuztabellen ............................................................................................................... 13 4.3 Kreuztabellen bei Variablen mit Mehrfachnennungen .................................................. 15 4.4 Mittelwert-Vergleich mit T-Test für unabhängige Stichproben...................................... 18 4.5 Weitere häufige Auswertungen .................................................................................... 19 4.6 Übungsbeispiele ........................................................................................................... 21 5. Weiterführende Informationen ............................................................................................ 21 6. Anhang: Codeplan „Sportberichterstattung“ ....................................................................... 22 FACULTÉ DES SCIENCES ECONOMIQUES ET SOCIALES DÉPARTEMENT DES SCIENCES DE LA COMMUNICATION ET DES MÉDIAS WIRTSCHAFTS- UND SOZIALWISSENSCHAFTLICHE FAKULTÄT DEPARTEMENT FÜR KOMMUNIKATIONSWISSENSCHAFT UND MEDIENFORSCHUNG 1/30 2/30 1. Datentabelle und Variableneinstellungen (Grafiken meist aus Version SPSS 17, in Kap. 4.4 aus SPSS 20) Datenansicht: Fenster für die Eingabe der Daten: Jede Untersuchungseinheit entspricht einer Zeile, jede Variable einer Spalte. Pro Zelle kann immer nur ein Wert vergeben werden. Variablenansicht: Fenster zur Erfassung des Codeplans. Hier werden die Angaben zu jeder Variable und zu jeder Ausprägung erfasst: Name: Name der Variable, der oben an der jeweiligen Spalte im „Data View“ erscheint; in älteren SPSS-Versionen maximal 8 Zeichen lang Typ: Variablentyp; dabei kann es sich um eine Zahl (numerische Variable), eine Zeichenkette, ein Datum oder ähnliches handeln. Wegen der besseren Auswertungsmöglichkeiten wird auch bei nominalen und ordinalen Variablen meist der Typ „numerisch“ verwendet, die Ausprägungen lauten dann 1, 2, 3 usw. Spaltenformat: Breite der Zelle, also Anzahl Stellen, die für die jeweiligen Werte gebraucht werden; sind alle vorgesehenen Variablenwerte einstellig (z. B. Variable „Zeitung“ mit den 3/30 Werten „Blick = 1“, „Tages-Anzeiger = 2“ und „NZZ = 3“) ist Spaltenformat = 1. Wenn Variablenwerte von 10 bis 99 vorkommen, also zweistellige Zahlen, ist Spaltenformat = 2. Dezimalstellen: Anzahl Stellen nach dem Komma; dieser Wert wird auf 0 gesetzt, wenn nur ganzzahlige Variablenwerte vorgesehen sind. Variablenlabel: ausführlicher Name der Variable, wie er später in den Tabellen der Auswertung angegeben wird. Dieser Name sollte möglichst genau angegeben werden. Wertelabels: In diesem Feld können die Variablenwerte den jeweiligen Ausprägungen zugeordnet werden. Bei der oben erwähnten Variable „Zeitung“ sieht dies folgendermassen aus: Nach jeder Zuweisung einer Ausprägung zu einem Zahlenwert muss „Hinzufügen“ angeklickt werden. Bereits erfasste Zuweisungen können im unteren Fenster angewählt und mit „Ändern“ oder „Entfernen“ editiert werden. Sobald alle vorhandenen Ausprägungen im unteren Fenster erfasst sind, kann man die Zuweisung mit Klick auf „OK“ bestätigen. Fehlende Werte: Definition von fehlenden Variablenwerten; normalerweise lässt man in SPSS ein Datenfeld einfach leer, wenn man dazu keine Daten hat (system-missing values). In manchen Fällen kann es allerdings Sinn machen, fehlende Variablenwerte nach dem Grund ihres Fehlens zu differenzieren (z.B. bei einer Befragung verschiedene Gründe einer Antwortverweigerung). Hier könnte man zu diesem Zweck zusätzliche fehlende Werte (usermissing values) definieren, die bei der Auswertung nicht berücksichtigt werden sollen. In diesem Beispiel werden die Werte 98 und 99 als usermissing values bestimmt. Im Feld „Wertelabels“ könnte dann 98 zum Beispiel als „Antwort verweigert“ und 99 als „Auskunftsperson nicht erreicht" definiert werden. Bei der Auswertung wird der Anteil dieser Ausprägungen angegeben, zur eigentlichen 100%-Basis zählen sie aber nicht mit. Spalten: Definition der Spaltenbreite im Fenster „Datenansicht“; meistens kann man hier die Voreinstellung 8 belassen. Ausrichtung: Textausrichtung im Fenster „Datenansicht“; diese Einstellung kann man bei Zahlenwerten gut bei der Grundeinstellung „rechtsbündig“ belassen. Messniveau: Angabe des Skalenniveaus der Variable (nominal, ordinal, metrisch) Die Variable „Zeitung“ wird im Fenster „Variablenansicht“ wie folgt erfasst: 4/30 Übung: Erfasse ein einfaches Kategorienschema in SPSS Variable 1: Laufnummer Variable 2: Zeitung 1. Blick 2. Tages-Anzeiger 3. NZZ Variable 3: Datum (Format JJJJMMTT) Variable 4: Umfang der Ausgabe in Seiten Variable 5: Artikelgrösse 1. Bis ¼-Seite 2. mehr als ¼ bis ½-Seite 3. mehr als ½ bis ¾-Seite 4. mehr als ¾ bis 1 Seite 5. mehr als 1 Seite Variable 6: Ressort 1. Ausland 2. Inland 3. Lokal 4. Wirtschaft 5. Kultur 6. Sport 7. Sonstiges 5/30 2. Import von Dateien In SPSS können Dateien aus anderen Programmen oder Dateiformaten importiert werden. Diese Funktion stellt sicher, dass auch Daten, die mit anderen Programmen als SPSS erfasst wurden, später mit diesem Statistikprogramm ausgewertet werden können. Als Beispiel betrachten wir den Import einer Datentabelle aus Excel: Die Excel-Datei „Daten2004TSI.xls“ umfasst die Rohdaten aus einer Inhaltsanalyse von Nachrichtensendungen. Diese Daten können wie folgt in SPSS importiert werden: 1. Anwählen: Datei > Öffnen > Daten… 6/30 2. Gewünschtes Verzeichnis anwählen, beim Menüpunkt „Dateityp“ das entsprechende Dateiformat (hier: Excel) anwählen und die gewünschte Datei öffnen. Daraufhin öffnet sich ein Kontrollfenster, in dem man angeben kann, welcher Bereich der Excel-Tabelle in SPSS übernommen werden soll und ob die erste Zeile der Excel-Tabelle als Variablennamen gelesen werden soll. Bei der Datei „Daten2004TSI.xls“ können die vorgeschlagenen Einstellungen übernommen werden, man kann also auf „OK“ klicken. 3. Nun müssen in der Variablenansicht noch die Felder Variablenlabel und Wertelabels ergänzt werden: 7/30 3. Datenmanipulation Sind alle Daten eingegeben bzw. importiert und die Variablen vollständig definiert, kann die Datenauswertung eigentlich beginnen. Damit die Auswertungsfunktionen optimal ausgeschöpft werden können, verfügt SPSS aber über mehrere Funktionen, mit denen die Daten für die Auswertung angepasst werden können. Wir betrachten daher vor der eigentlichen Auswertung die Funktionen zum Recodieren und zur Datenselektion. Als Beispiel verwenden wir dazu den Datensatz „Sportberichterstattung.sav“ (Codeplan siehe Anhang). 3.1 Umcodieren in neue Variablen Manchmal ist es sinnvoll, bestimmte Variablen für die Auswertung zu vereinfachen. So gibt es im verwendeten Datensatz eine Variable „Autor“ mit sieben verschiedenen Ausprägungen. Wenn nun aber nur der Anteil der reinen Eigenleistungen interessiert, lässt sich auf der Basis der vorhandenen Daten eine neue Variable „Eigen- und Fremdleistungen“ erstellen: Alte Codierung: Eigenleistung, Byline = 1 Eigenleistung, Kürzel = 2 Pressemitteilung = 3 Agentur = 4 Gastautor oder Ähnliches = 5 Mischform (mit Fremdleistung) = 6 keine Angabe, nicht ersichtlich = 7 Neue Codierung: reine Eigenleistung = 1 Fremdleistung = 2 keine Angabe, nicht ersichtlich = 3 Mit SPSS kann man entweder die bestehenden Variablenwerte verändern oder eine neue Variable mit den neuen, recodierten Werten schaffen. In der Regel sollte die zweite Variante gewählt werden, da sonst die Originalwerte verloren sind (ohnehin sollte der Datensatz vor dem Recodieren immer abgespeichert werden!). Beim Recodieren in eine neue Variable geht man wie folgt vor: 1. Anwählen: Transformieren > Umkodieren in andere Variablen… 8/30 1 3 2 2. Im Auswahlfeld links die Ausgangsvariable suchen, dann auf die Pfeiltaste (1) drücken. Im Zielfeld oben rechts (2) den Namen der neuen Variable in Kurzform (Name) und in voller Länge (Beschriftung) definieren, „Ändern“ anwählen. Dann auf den Knopf „Alte und neue Werte“ (3) drücken. 3. Im neuen Fenster kann man definieren, welche neuen Werte den alten Variablenwerten zugewiesen werden. Jede Zuweisung wird mit „Hinzufügen“ bestätigt, am Schluss klickt man auf „Weiter“. 4. Auf „OK“ klicken, die neue Variable wird nun am rechten Rand der Datentabelle in einer neuen Spalte erstellt. Über „Variable View“ kann man die Variableneinstellungen festlegen. Übung: Erstelle eine Variable, in der die Sportarten (Anhang, V40) gemäss dem Rating von Swissolympic gruppiert sind! 9/30 3.2 Selektieren von Teilmengen der Datenbasis Manchmal ist es empfehlenswert, für eine bestimmte Auswertung nur einen Teil der vorhandenen Datenbasis auszuwerten. Im Datensatz „sport.sav“ besteht zum Beispiel ein Teil der Stichprobe aus Berichten von Olympischen Spielen, ein anderer Teil aus Artikeln, die mit Hilfe von „künstlichen Wochen“ ausserhalb von sportlichen Grossanlässen gesammelt wurden. Um Verzerrungen etwa bei der Frage, wie häufig bestimmte Sportarten vorkommen, zu vermeiden, sollen für die folgende Auswertung die Olympischen Spiele nicht berücksichtigt und nur die Artikel der „Alltags-Stichprobe“ ausgewertet werden: 1. Anwählen: Daten > Fälle auswählen… 2. Anwählen: „Falls Bedingung zutrifft“ 10/30 2 1 3. Im Auswahlfeld links (1) die gewünschte Variable anwählen, dann im Zielfeld (2) die Auswahlbedingungen für diese Variable festlegen. Zur genauen Auswahl der gewünschten Datensätze sind die Operatoren „ & “, „ | “ und „ ~= “ hilfreich: & („und“): Beide aufgeführten Bedingungen müssen erfüllt sein Beispiel: Alle Artikel der Alltagsstichprobe in der Zeitung Blick: typ = 2 & zeitung = 1 | („oder“): Eine der aufgeführten Bedingungen muss erfüllt sein Beispiel: Alle Artikel aus den Zeitungen Blick und NZZ: zeitung = 1 | zeitung = 3 ~= („nicht“): Bestimmte Fälle sollen nicht berücksichtigt werden Beispiel: Alle Artikel, ausser jenen aus dem Sport-Magazin: zeitung ~= 5 Selbstverständlich kann man nicht nur Fälle mit einer bestimmten Variablenausprägung selektieren, sondern auch Fälle, in denen der Wert der Ausprägung grösser/kleiner als ein bestimmter Wert ist. Beispiel: Alle Artikel, die drei oder mehr Spalten breit sind spalten >= 3 oder spalten > 2 Nach der Festlegung der Selektion kann das Fenster mit „Weiter“ geschlossen werden, anschliessend im nun aktiven Fenster „OK“ klicken. Die Fälle, deren Nummerierung in der Spalte ganz links nun durchgestrichen ist, werden bei der Auswertung nicht berücksichtigt. Diese Filterung kann jederzeit wieder aufgehoben werden über Daten > Fälle auswählen > Alle Fälle. 11/30 4. Datenauswertung Mit den bisher erarbeiteten Grundkenntnissen ist es nun möglich, einfache Datenauswertungen vorzunehmen. 4.1 Einfache Häufigkeitsauszählungen Will man anhand des Beispieldatensatzes herausfinden, welche Sportart in der Berichterstattung am häufigsten vorkommt, geht man folgendermassen vor: Anwählen: Analysieren > Deskriptive Statistiken > Häufigkeiten… Unter „Format“ kann man unter anderem wählen, in welcher Reihenfolge die Daten dargestellt werden sollen – geordnet nach den Werten (Ausprägungen) oder nach den Häufigkeiten. Wenn wir „Absteigende Häufigkeiten“ anwählen, werden in der Ergebnistabelle die am häufigsten vorkommenden Sportarten zuoberst aufgeführt. Über „Weiter“ gelangt man zurück zum Ausgangsfenster. Über den Menüpunkt „Statistiken“ lassen sich zusätzliche statistische Masse berechnen (Mittelwert, Median, Modus, Standardabweichung, Maximal- oder Minimalwert usw.). Wenn man keine Häufigkeitstabelle erstellen will, kann man solche Daten auch über Analysieren > Deskriptive Statistiken > Deskriptive Statistik… erheben. Über den Menüpunkt „Diagramme“ lassen sich Grafiken erstellen. Die Gestaltungsfunktionen von SPSS-Grafiken sind allerdings ziemlich beschränkt, es empfiehlt sich daher, die SPSSErgebnistabellen nach Excel zu kopieren und die gewünschten Diagramme mit diesem Programm zu erstellen. Erstellen wir also eine einfache Häufigkeitstabelle, indem wir ohne Änderungen der Einstellungen unter „Statistiken“ und „Diagramme“ im Ausgangsfenster auf „OK“ drücken. Die Ergebnisse werden im Ausgabefenster angezeigt. Diese Datei kann später unter dem gewünschten Namen abgespeichert werden: 12/30 In der ersten Tabelle wird aufgrund der gewählten Einstellungen nur die Anzahl der gültigen und der fehlenden Werte angegeben (da nur die Alltags-Stichprobe selektiert ist, beträgt die Anzahl der ausgewerteten Artikel 5520). Da für jeden Artikel eine Sportart zugewiesen werden konnte, gibt es keine Artikel mit fehlenden Werten. Die zweite Tabelle ist die eigentliche Ergebnistabelle. Angegeben werden die absolute Häufigkeit (Anzahl Fälle), die relative Häufigkeit in % aller Untersuchungseinheiten respektive in % aller Einheiten, für die Werte vorhanden sind (gültige Prozente) und die kumulierten Prozentzahlen. 4.2 Kreuztabellen Kreuztabellen spielen bei der Überprüfung von Hypothesen eine wichtige Rolle, denn sie werden verwendet, um Abhängigkeiten zwischen zwei Variablen zu beschreiben. Die abhängige Variable wird dabei immer in den Zeilen dargestellt, die unabhängige Variable immer in den Spalten. Beispiel: Wir wollen herausfinden, wie sich der Anteil von Frauen als Hauptakteurinnen in der Sportberichterstattung im Lauf der Zeit verändert hat. „Geschlecht“ ist damit die abhängige Variable. „Serie“ (Erfassung des Erhebungszeitraums) ist damit die unabhängige Variable. Bitte darauf achten, dass alle Artikel des Datensatzes selektiert sind! Anwählen: Analysieren > Deskriptive Statistiken > Kreuztabellen… 13/30 1 2 Aus dem linken Auswahlfeld werden die gewünschten Variablen ausgesucht und mit den Pfeiltasten (1, 2) in das gewünschte Zielfeld verschoben. „Geschlecht“ wird als abhängige Variable im Feld „Zeile(n)“ platziert, „Serie“ als unabhängige Variable im Feld „Spalten“. Über den Menupunkt „Statistiken“ kann angewählt werden, welche statistischen Zusammenhangsmasse ausgerechnet werden sollen. Im Beispielfall wird mit einem Chi-QuadratTest ermittelt, ob die Abweichungen zwischen den verschiedenen Erhebungsjahren zufällig sind oder nicht. Über den Menupunkt „Zellen“ können weitere Einstellungen vorgenommen werden. Hier sollte unter „Prozentwerte“ das Feld „Spaltenweise“ angekreuzt werden. Damit werden in der Ergebnistabelle neben der Anzahl Fälle in absoluten Zahlen auch ihr Anteil in Spaltenprozenten angegeben, im Beispiel also der Anteil von Artikeln mit weiblichen Hauptakteurinnen pro Untersuchungsjahr. Die Angabe der Spaltenprozente ist notwendig, damit die Ergebnisse überhaupt interpretiert werden können. Über den Menupunkt „Format“ kann man die Reihenfolge der Ausprägungen der abhängigen Variable verändern. Im konkreten Fall kann die Voreinstellung so belassen werden. Über „Weiter“ gelangt man jeweils zurück zum Ausgangsfenster, mit „OK“ startet man die Berechnung der Kreuztabelle: 14/30 Aus der Kreuztabelle wird ersichtlich, dass der Anteil von Artikeln mit Frauen als Hauptakteurinnen von 1950 bis 2000 von knapp 2% auf über 10% gestiegen ist. Der Chi-Quadrat-Test zeigt weiter, dass die Abweichungen zwischen den verschiedenen Untersuchungsjahren mit einer Irrtumswahrscheinlichkeit von weniger als 0,1% signifikant ist. Der in der Kreuztabelle festgestellte steigende Frauenanteil liegt also nicht im Bereich zufälliger Schwankungen (normalerweise spricht man bei einer Irrtumswahrscheinlichkeit von weniger als 5% von statistisch signifikanten Abweichungen). Tipp: Wenn SPSS „< 0,001“ ausweisen! als Signifikanzwert „0,000“ ausgibt, diesen Wert immer als 4.3 Kreuztabellen bei Variablen mit Mehrfachnennungen Variablen mit Mehrfachnennungen kommen in Inhaltsanalysen recht häufig vor, beispielsweise wenn in einem Artikel mehrere Themen oder Akteure kategorisiert werden und dafür mehrere 15/30 Variablen mit den gleichen Ausprägungen geschaffen wurden („Thema 1“, „Thema 2“ usw.). In SPSS gibt es mehrere Möglichkeiten, solche Variablen gemeinsam auszuwerten. Für Häufigkeitsauszählungen und Kreuztabellen kann man die folgende Funktion verwenden: Anwählen: Analysieren > Mehrfachantworten > Variablen-Sets definieren Zuerst muss ein „Mehrfachantworten-Set“ definiert werden. Im gezeigten Beispiel wird ein solches Set für die Erfassung des Themas aus den beiden Themenvariablen „Hauptthema“ und „Nebenthema“ geschaffen. Da die Themenvariable nicht dichotom ist, also mehr als zwei Ausprägungen hat, werden die Variablenwerte als Kategorien kodiert. Ganz wichtig ist dabei, dass bei allen Variablen, die Teil des „multiple response set“ sind, die genau gleichen Ausprägungen definiert sind. Anwählen: Analysieren > Mehrfachantworten > Kreuztabellen Für die Auswertung wird das geschaffene Variablenset als abhängige Variable festgelegt. Bei der unabhängigen Variablen kann ein Bereich definiert werden. Im Beispiel soll die Themenentwicklung im Zeitverlauf untersucht werden. Damit alle Erhebungszeitpunkte mitberücksichtigt werden können, müssen bei der Variable „Serie“ als unabhängiger Variablen die Werte 1 bis 4 enthalten sein. Wie 16/30 üblich bei Kreuztabellen kommt die abhängige Variable in die Zeilen, die unabhängige in die Spalten. Bei den Optionen kann angegeben werden, welche Prozentwerte in der Tabelle angezeigt werden sollen. Wie bei normalen Kreuztabellen werden hier die Spaltenprozente ausgewählt. Anzugeben ist weiter, ob sich der Prozentwert auf die Anzahl Fälle oder die Anzahl Antworten bzw. Nennungen beziehen soll. Im konkreten Fall entspricht 100%, wenn die Prozentwerte auf die Anzahl Fälle bezogen werden, der Anzahl der untersuchten Artikel. Die Summe der Prozentwerte wird daher höher ausfallen als 100%, der Wert ist aber besser vergleichbar mit anderen Auswertungen als wenn die Prozentwerte auf die Anzahl Themennennungen bezogen werden. Die Ergebnisse erscheinen bei Klick auf „Weiter“, dann auf „OK“: 17/30 4.4 Mittelwert-Vergleich mit T-Test für unabhängige Stichproben Bei Mittelwerten von metrischen Variablen kann mit Hilfe eines T-Tests bestimmt werden, ob die Abweichungen zwischen zwei Gruppen statistisch signifikant sind oder nicht. Als Beispiel vergleichen wir den Aufmerksamkeitswert-Index (Gesamtpunktzahl, die sich aus Spaltenbreite, Illustrationen und dem Vorhandensein eines Anrisses zusammensetzt) von Blick und NZZ. Anmerkung: Für einen T-Test brauchen wir metrische Variablen, bei denen man einen Mittelwert erheben kann. Besser als das künstliche Mass „Aufmerksamkeitswert-Index“ würde sich hier beispielsweise bei der Auswertung einer Befragung Variablen wie „Alter“, „Berufserfahrung“ oder „Einkommen“ eignen. Das Prinzip des Tests lässt sich aber auch mit diesem Index demonstrieren. Da der Blick in der ersten Untersuchungsserie nicht vorkommt, dürfen die NZZ-Artikel aus dieser Serie im Interesse der besseren Vergleichbarkeit nicht mitausgewertet werden. Sie müssen also zunächst über Daten > Fälle auswählen > Falls > „serie > 1“ herausgefiltert werden. Anwählen: Analysieren > Mittelwerte vergleichen > T-Test bei unabhängigen Stichproben… Die Variable, deren Mittelwerte wir vergleichen möchten, wird ins Feld “Test variable(n)” verschoben, die Variable, die zur Unterscheidung der beiden Gruppen dient, kommt ins Feld „Gruppenvariable“. Da „Zeitung“ keine dichotome Variable ist, müssen wir nun die beiden Ausprägungen für Blick und NZZ unter „Gruppen def.“ angeben: In diesem Fenster geben wir gemäss Codeplan für den Blick den Wert 1 und für die NZZ den Wert 3 ein. Dann mit „Weiter“ zurück zum Ausgangsfenster. (Bei ordinalen und metrischen Variablen könnte man unter „Trennwert“ einen bestimmten Wert definieren und alle Fälle mit einem kleineren Wert mit den Fällen vergleichen, bei denen der Wert oberhalb des Trennwertes liegt.) Unter „Optionen“ kann man nun das Vertrauensintervall einstellen, die Voreinstellung ist 95% (üblicher Wert in den Sozialwissenschaften). Das Ausgabefenster, das man nach dem Klick auf „OK“ erhält, sieht wie folgt aus: 18/30 In der ersten Tabelle werden für beide Teilgruppen die Anzahl der Fälle, die Mittelwerte, die Standardabweichung und der Standardfehler des Mittelwerts (bei einem Vertrauensintervall von 95%) angegeben. Es zeigt sich, dass der mittlere Aufmerksamkeitswert beim Blick fast doppelt so hoch ist wie bei der NZZ. Der eigentliche T-Test befindet sich in der zweiten Tabelle. Die Spalten mit der Überschrift „LeveneTest der Varianzgleichheit“ geben an, ob die Varianzen in beiden zu vergleichenden Gruppen gleich sind. Der klassische T-Test basiert auf dieser Annahme. Wenn der Signifikanzwert (2. Spalte) kleiner ist als p = 0,1, muss folglich die untere Zeile gelesen werden, die eine Korrektur für die ungleichen Varianzen enthält. Ist der Signifikanzwert grösser als p = 0,1, gelten die Varianzen als gleich, und es muss die erste Zeile gelesen werden. Beim vorliegenden Beispiel ist also die zweite Zeile massgeblich. Der T-Test bestätigt, dass die Abweichung mit einer Irrtumswahrscheinlichkeit von weniger als 0,1% (5. Spalte) statistisch signifikant ist. 4.5 Weitere häufige Auswertungen Eine Varianzanalyse zum Vergleich der Mittelwerte von mehr als zwei Gruppen kann man über den folgenden Menupunkt vornehmen: Analysieren > Mittelwerte vergleichen > Einfaktorielle ANOVA… Korrelationen (gibt es eine gemeinsame Tendenz zweier Variablen bei der Abweichung vom Mittelwert?) zur Berechnung der Korrelationskoeffizienten Spearman’s rho (bei ordinal skalierten Variablen) oder Pearson’s r (bei metrisch skalierten Variablen) erstellt man über den folgenden Menupunkt: Analysieren > Korrelationen > Bivariat… oder Analysieren > Deskriptive Statistiken > Kreuztabellen > Statistiken: Korrelationen 19/30 Sportler allg. Spitzensportler Amateursportler Trainer Sportärzte Schiedsrichter Sportverbände Sponsoren Medien Zuschauer Bevölkerung allg. Experten Politiker einzelne Nationen nicht ersichtlich 1948/49 olymp. Spiele (n=416) 0.0% 87.5% 1.7% 0.7% 0.2% 0.2% 5.0% 0.5% 1.7% 1.9% 0.0% 0.0% 0.2% 0.2% 0.0% künstl. Woche (n=812) 1.4% 72.1% 7.4% 0.9% 0.0% 0.7% 14.3% 0.2% 1.0% 0.7% 0.0% 0.5% 0.7% 0.0% 0.0% 1968/69 olymp. Spiele (n=875) 0.2% 78.7% 1.7% 1.7% 1.3% 0.3% 9.5% 0.1% 2.2% 1.9% 0.0% 0.6% 0.8% 0.9% 0.0% künstl. Woche (n=1700) 0.5% 74.0% 3.0% 3.8% 0.1% 0.6% 11.6% 0.8% 1.5% 1.3% 0.1% 0.9% 1.6% 0.2% 0.1% 1988/89 olymp. Spiele (n=914) 0.0% 80.9% 0.1% 3.8% 0.5% 1.1% 5.1% 0.2% 3.2% 2.4% 0.1% 0.2% 1.2% 1.1% 0.0% künstl. Woche (n=1913) 0.3% 79.6% 1.1% 5.9% 0.4% 0.8% 7.3% 0.8% 1.6% 0.9% 0.0% 0.3% 0.7% 0.1% 0.1% 2000/01 olymp. Spiele (n=840) 0.1% 77.3% 0.2% 4.3% 0.2% 0.2% 7.9% 0.8% 2.5% 3.9% 0.1% 0.5% 1.2% 0.7% 0.0% künstl. Woche (n=1105) 0.4% 78.7% 0.6% 8.2% 0.4% 0.3% 7.1% 0.7% 1.2% 0.8% 0.0% 0.7% 0.8% 0.0% 0.0% Hauptakteure in der Sportberichterstattung von Blick, TA, NZZ, Sport und Sport-Magazin Komplexere Tabellen wie die hier abgebildete kann man mit SPSS mit Hilfe der folgenden Funktion erstellen: Analysieren > Tabellen > Benutzerdefinierte Tabellen… Die gewünschten Variablen können dann über- bzw. nebeneinander in Zeilen oder Spalten platziert werden. Dabei muss immer angegeben werden, welche Daten der jeweiligen Variablen angezeigt werden sollen (Häufigkeit, Spaltenprozente, bei metrisch skalierten Variablen der Mittelwert usw.). Die Ergebnistabelle kann danach direkt in Word hineinkopiert werden, besser bearbeitet man sie aber zuerst in Excel nach. Faktorenanalysen dienen der Reduktion von Dimensionen – zum Beispiel bei der Bildung von Frames anhand von Variablen zu Themen, Ursachenzuschreibungen, Lösungsansätzen und Bewertungen. Das Verfahren kann nur bei metrisch skalierten Variablen (bei Inhaltsanalysen oft Dummy-Variablen) angewendet werden. Analysieren > Dimensionsreduzierung > Faktorenanalyse… Danach können die Ausgangsvariablen bestimmt und der Wert der Auswahlvariable definiert werden, den alle berücksichtigten Fälle erfüllen müssen. Unter „Deskriptive Statistik“ kann eine Korrelationsmatrix (mit dem Punkt „Koeffizienten“) erstellt und mit KMO und Bartlett-Test sowie Anti-Image-Matrizen ermittelt werden, welche Variablen sich überhaupt für die Analyse eignen. Unter „Extraktion“ kann die genaue Methode der Faktorenanalyse bestimmt und ein Scree-Test zur Bestimmung der relevanten extrahierten Faktoren vorgenommen werden. Da unrotierte Faktorladungen meist schwierig zu interpretieren sind, kann unter „Rotation“ die gewünschte Rotationsmethode (am häufigsten wird Varimax verwendet) bestimmt werden. Genauere Infos zu diesem und anderen komplexeren Verfahren (z.B. Clusteranalysen) gibt es auf bzw. in den in Kap. 5 aufgelisteten Websites und Links. Für Reliabilitätstests reicht das einfache Verfahren mit der Holsti-Formel für studentische Arbeiten in der Regel aus. Als Reliabilitätskoeffizient, der auch zufällige Übereinstimmungen mitberücksichtigt, kann Cohen’s Kappa ermittelt werden. Dazu werden die Werte, die zwei Codierer bei den gleichen Fällen einer Variablen zugeordnet haben, als zwei separate Variablen erfasst. In einer Kreuztabelle werden dann die beiden Codierervariablen als abhängige und unabhängige Variable definiert, unter „Statistik“ wird „Kappa“ ausgewählt. 20/30 Als Reliabilitätsmass für metrische Variablen wird auch Cronbach’s Alpha oft verwendet. In der Regel wird dieses Mass meist bei Befragungen zur Kontrolle eingesetzt, ob mit verschiedenen Items mit Ratingskalen tatsächlich das gleiche Konstrukt gemessen wird: Analysieren > Skalierung > Reliabilitätsanalyse… 4.6 Übungsbeispiele Welche Sportarten kommen an den olympischen Spielen am häufigsten vor? Welche Sportarten haben im Lauf der Zeit an Bedeutung gewonnen, welche an Bedeutung verloren? In welcher Zeitung kommen am meisten Beiträge mit Humor vor? Benutze dazu die Variable „index2“. Wie sieht die Situation aus, wenn wir nur die jüngste Teilstichprobe (Variable „serie“) anschauen? 5. Weiterführende Informationen Im Rahmen dieses Kurses konnten nur die einfachsten und häufigsten Auswertungsverfahren gezeigt werden. SPSS weist aber noch viel mehr statistische Funktionen auf, zudem existiert mit der SPSS-Syntaxprogrammierung eine zusätzliche Benutzeroberfläche innerhalb des Programms, die in diesem Schnellkurs nicht berücksichtigt werden konnte. Informationen hierzu liefern verschiedene Kurs-Websites von Universitäten, die auch vertiefende Informationen zu den gezeigten Verfahren anbieten: SPSS-Kurs an der Universität Bern: http://www.molar.unibe.ch/help/statistics/ Empirische Methoden an der Hochschule Luzern: http://www.empiricalmethods.hslu.ch/empirical-methods/h-entscheidbaum.htm Einführung in SPSS für Windows am Leibniz-Rechenzentrum http://www.lrz.de/services/schulung/unterlagen/spss/ IBM Knowledge Center mit Erklärung statistischer Funktionen in SPSS: http://www01.ibm.com/support/knowledgecenter/SSLVMB_22.0.0/com.ibm.spss.statistics.help/spss/base/i dh_fact_opt.htm?lang=de deutschsprachiges SPSS-Tutorial auf Youtube: http://www.youtube.com/user/TheSpsstutorial?feature=watch in München: Es gibt auch Bücher zum Umgang mit SPSS, zum Beispiel: Backhaus, Klaus / Erichson, Bernd / Plinke, Wulff / Weiber, Rolf (2011): Multivariate Analysemethoden: Eine anwendungsorientierte Einführung. 13., überarbeitete Auflage, Berlin. Bühl Achim (2011): SPSS 20. Einführung in die moderne Datenanalyse. 13., aktualisierte Auflage. München. 21/30 6. Anhang: Codeplan „Sportberichterstattung“ Allgemeine Anweisungen Untersuchungseinheiten sind die einzelnen Artikel im Ressort „Sport“ der jeweiligen Zeitung sowie die Artikel auf der Titelseite der gleichen Ausgabe. Die einzelnen Artikel jeder Ausgabe werden fortlaufend nummeriert, mit jeder Ausgabe wieder neu beginnend bei 1. Berücksichtigt werden nur Artikel mit redaktionellem Text (ganze Sätze). Stichwortartige Programmhinweise, Ranglisten von Ereignissen ohne redaktionellen Bericht, Medaillenspiegel oder ähnliches werden nicht erfasst. Kasten mit ergänzenden Informationen zu einem Hauptartikel werden nicht als eigenständige Artikel mitgezählt, wenn sie einen eindeutigen Bezug zum Ereignis im Hauptartikel haben und wenn die Lektüre des Haupttexts zum Verständnis des Kontexts der Informationen im Kasten notwendig ist. In älteren Zeitungsausgaben kommt es in der Berichterstattung über olympische Spiele vor, dass mehrere Berichte über verschiedene Wettkämpfe jeweils nur durch Zwischentitel voneinander abgetrennt werden. In diesem Fall gilt jeder Bericht als eigenständiger Artikel. Bei grafisch abgesetzten Kästen mit aus jeweils nur einem oder zwei Sätzen bestehenden Kurzmeldungen wird der ganze Kasten als ein einzelner Artikel gewertet. Identifikatoren V10: Laufnummer V11: Serie: um 1950: um 1970: um 1990: um 2000: 1 2 3 4 V12: Typ: Olympische Spiele: Stichprobe ohne Grossanlass V13: Zeitung Blick: Tages-Anzeiger: NZZ: Sport: Sport-Magazin 1 2 1 2 3 4 5 V14: Datum 22/30 Formale Merkmale V20: Artikelgrösse Kurzmeldung bis ¼-Seite bis ½-Seite bis ¾-Seite bis 1 Seite mehr als 1 Seite 1 2 3 4 5 6 V21: Darstellungsformen Meldung (bis 30 Zeilen) 1 Bericht (über 30 Zeilen) 2 Reportage (Reporter schildert Erlebnisse vor Ort, Augenzeugenberichte) 3 Feature 4 Interview 5 Porträt 6 Kommentar 7 Glosse 8 Leserbrief 9 „nichtjournalistische“ Formen 10 (Resultatmeldungen, Programmhinweise, Medaillenspiegel usw.; bei der Zuweisung dieser Kategorie wird nicht weitercodiert und der Artikel für die Auswertung nicht verwendet) V22: Anzahl Spalten: ________ V23: Anriss (d.h. der Artikel befindet sich entweder selbst auf der Titelseite oder es gibt einen Verweis von der Titelseite bzw. der ersten Aufschlagseite auf den codierten Artikel) nicht vorhanden: 0 vorhanden: 1 V24: Bild vorhanden (Foto, Karikatur) nicht vorhanden: ein Bild vorhanden: mehrere Bilder vorhanden 0 1 2 V25: Bild hat besondere Form (kein Rechteck) keine besondere Form: 0 besondere Form: 1 V26: grafische Textelemente (Tabellen, Kästchen mit Zusatzinformationen, Grafiken) nicht vorhanden: 0 vorhanden: 1 V27: Aufmerksamkeitsindex Summe der Werte von V22-V27 23/30 V28: Autor Eigenleistung, Byline Eigenleistung, Kürzel Pressemitteilung Agentur Gastautor oder ähnliches Mischform keine Angabe, nicht ersichtlich 1 2 3 4 5 6 7 Inhaltliche Merkmale V40: Sportart geordnet nach der Einstufung der Sportverbände durch den SOV im Frühjahr 2001, die sich nach der Bedeutung der Sportart für die Schweiz richtet; Bei den Disziplinen, für die verschiedene Verbände zuständig sind, die aber unter einem Oberbegriff zusammengefasst werden (Radsport, Pferdesport, Motorsport, Schiessen, Ski nordisch), wurde die beste Einstufung berücksichtigt Gruppe 1: Eishockey Leichtathletik Pferdesport Radsport Rudern 1 2 3 4 5 Schiessen Schwimmen Ski alpin Tennis 6 7 8 9 Gruppe 2: Bob Curling Fechten Fussball Handball Judo Kanu 10 11 12 13 14 15 16 Kunstturnen Landhockey, Unihockey Orientierungslauf Ringen Segeln Ski nordisch Triathlon 17 18 19 20 21 22 23 Gruppe 3: Badminton Eiskunstlauf Eisschnellauf Flugsportarten Fünfkampf Klettern Motorsport Rodeln Rollhockey 24 25 26 27 28 29 30 31 32 Squash Synchronschwimmen Tanzen Tauziehen Tischtennis Trampolin Volleyball Wasserball Wasserspringen 33 34 35 36 37 38 39 40 41 Gruppe 4: Basketball Casting Duathlon Eisstockschiessen Faustball Gewichtheben Golf 42 43 44 45 46 47 48 Grasski Minigolf Rhythm. Sportgymnastik Skeleton Ski-Bob, Snow Bike Taekwando 49 50 51 52 53 54 24/30 Keine Einstufung: American Football 55 Rollschuh-Kunstlaufen Base- und Softball 56 Boccia Boxen 57 Wasserski Rugby 58 Bridge, Billard Schach 59 Hornussen Unterwassersport 60 Bodybuilding Wehrsportarten 61 Snowboard Schwingen 62 Behindertensport mehrere Wintersportarten, Wintersport allgemein mehrere Sommersportarten, Sommersport allgemein Verschiedene Sportarten, Sport allgemein, jahreszeitunabhängig 63 64 65 66 67 68 69 70 97 98 99 V41: Berichterstattung während der olympischen Spiele keine Olympia-Stichprobe 0 Beitrag bezieht sich auf olympische Spiele 1 Beitrag bezieht sich auf andere Ereignisse 2 V42: Hauptthema des Artikels Die Werte 10, 20, 30, 40, 50, 60, 70 und 80 werden codiert, wenn die Zuordnung zu einer Themendimension eindeutig erscheint, aber das Thema nicht eindeutig einem der unter der entsprechenden Dimension gelisteten spezifischen Themen zugeordnet werden kann. Ausnahme: Falls Wettkampfverlauf und Ergebnis in einem Artikel etwa gleich gewichtet sind, wird im Zweifelsfall die Kategorie „Wettkampfverlauf“ codiert. Es darf pro Artikel nur ein Hauptthema bzw. eine Dimension zugeordnet werden! Dimension Leistung: Leistung allgemein Prognosen Wettkampfverlauf 10 11 12 Ergebnis Analyse 13 14 Dimension Organisation: Organisation allgemein Vereins-, Verbandspolitik Spielregeln 20 21 22 Wettkampfvorbereitungen Karrierenentscheide Infrastruktur 23 24 25 Dimension Ethik: Ethik allgemein Doping Korruption Gewalt auf dem Spielfeld 30 31 32 33 Gewalt neben Spielfeld sonst. unfaires Verhalten Risiken des Sports 34 35 36 Übertragungsrechte Finanzen von Sportorganisationen Sport als Medienereignis 44 Dimension Kommerzialisierung: Kommerzialisierung allg. 40 Preisgelder 41 Transfermarkt 42 Werbung, Sponsoring 43 45 46 25/30 Dimension Politik: Politik allgemein Sportanlässe als Objekt… und Rahmen polit. Aktionen Sportförderung 50 51 52 53 weitere Entscheide von Politikern zum Sport 54 Politische Verhältnisse am Austragungsort 55 Dimension Gesundheit: Gesundheit allgemein Verletzungen, Unfälle 60 61 Kondition/Zustand (auch Material) Trainingsmethoden Dimension Privatleben: Privatleben allgemein 70 Sportler als Privatpersonen (Intimes, Gefühle, Partner, Familie) 71 Dimension Rahmenhandlung: Rahmenhandlung allg. 80 Nebenschauplätze bei sportlichen Grossanlässen 81 62 63 Sportler als Prominenz bei Partys, Empfängen usw. 72 Aktionen ausserhalb des Sports 73 Zuschauer, Fans 82 V43: Weiteres wichtiges Thema des Artikels Dieses Thema muss aus einer anderen Themendimension stammen, sonst bei V42 mit „… allgemein“ codieren keine 2. Themendimension 0 sonst: wie V42 Akteure V50: Haupthandlungsträger Nur ein Haupthandlungsträger ist zu bestimmen! Sportler allgemein (ohne Qualitätsangabe) Hochleistungssportler (Einzelsportler/Mannschaft) Amateursportler/Breitensportler Trainer Sportärzte (und Vertreter von Ärzten) Schiedsrichter, Kampfrichter Vertreter der Sportverbände, Organisationskomitees, Offizielle Wirtschafts- und Unternehmensvertreter, Sponsoren Medienvertreter Zuschauer, Leser, Fans Schweizer Bevölkerung allgemein Wissenschaftler, Experten Politiker, politische Parteien, (sport-)politische Institutionen einzelne Nationen nicht ersichtlich 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 26/30 V51: Personalisierung Zur Zuordnung muss man sich überlegen, welche Person(en) oder welche Gruppe der Artikel primär behandelt. einzelne Person 1 mehrere einzelne Personen 2 Verein, Mannschaft 3 Verband, Organisation 4 Wettkampfteilnehmer als Gesamtheit (Starterfeld, Liga) 5 nicht organisierte Gruppe (z. B. Publikum) 6 anderes 7 V52: Geschlecht des Haupthandlungsträgers weiblich männlich nicht ersichtlich, mehrere Akteure unterschiedlichen Geschlechts (Familie, Organisation) V53: Herkunft des Hauptakteurs Inland Ausland 1 2 3 1 2 V54: Prominenz der sportlichen Akteure Internationale Elite (Weltmeistertitel, unter Weltbesten, ...) Schweizer Elite (international erfolgreiche Schweizer) erfolgreiche Schweizer im eigenen Land (nationale Meister, Top 10, Nationalligen) Basis keine Sportler/innen 1 2 3 4 0 Raum und Zeit V55: Zeitliche Dimension: Bezug auf ein eben abgeschlossenes Ereignis Vorschau, Ausblick Rückblick auf weiter zurückliegende Ereignisse Sportgeschichte Überblicksdarstellung, Hintergrund 1 2 3 4 5 V56: Räumliche Dimension: lokal (im Kanton Zürich) in der Schweiz, v. a. Schweizer beteiligt in der Schweiz, mit internationaler Beteiligung im Ausland, mit Schweizer Beteiligung im Ausland, ohne Schweizer Beteiligung 1 2 3 4 5 27/30 Dramatische Elemente V60: Kommt ein allgemeiner Grundkonflikt vor? Welche Konfliktart? Wenn V61=0, hier ebenfalls mit 0 codieren keine allgemeine Konfliktart 0 Mensch gegen Mensch 1 Mensch gegen sich selbst 2 Mensch gegen Naturgewalten 3 Mensch gegen unbekannte Kraft 4 Mensch gegen Normen der Gesellschaft 5 V61: Kann die Handlung unter einer der folgenden dramatischen Situationen subsumiert werden? (Definition gemäss separater Auflistung) Keine dramatische Situation 0 Das Flehen 1 Befreiung/Erlösung 2 Delikt aus Rache 3 Racheakt zwischen Verwandten 4 Verfolgung 5 Katastrophe, Unglück 6 Der Grausamkeit/einem Unglück zum Opfer fallen 7 Revolte, Aufruhr, Aufstand 8 Waghalsige Pläne/Vorhaben/Unternehmen 9 Entführung 10 Rätsel 11 Erhalten/Erwerben 12 Feindschaft zwischen Verwandten/Freunden 13 Konkurrenz/Rivalität zwischen Verwandten/Freunden 14 Mörderischer Ehebruch 15 Wahnsinn 16 Verhängnisvolle Unverschämtheit/Frechheit 17 Ungewolltes Liebesdelikt 18 Erschlagen eines nicht erkannten Verwandten 19 Selbstaufopferung für einen Blutsverwandten 20 Selbstaufopferung für eine Leidenschaft 21 Selbstaufopferung für ein Ideal 22 Notwendigkeit, eine geliebte Person zu opfern 23 Rivalität zwischen Überlegenem und Unterlegenem 24 Ehebruch 25 Liebesdelikt 26 Entdeckung der Unehre/Schande einer geliebten Person 27 Hindernisse, die einer Liebe entgegenstehen 28 Geliebter Feind 29 Ehrgeiz 30 Konflikt mit einem Gott/religiöse Konflikte 31 Irrtümliche/falsche Eifersucht 32 28/30 Fehlurteil Reue Wiederfinden/Wiedergewinnung geliebter Personen Verlust geliebter Personen 33 34 35 36 V62: Tritt eine weitere Konstellation auf, die einer dramatischen Situation entspricht? gleiche Ausprägungen wie V61 Ästhetisierung V70: Wird Attraktivität/Eleganz von sportlichen Aktivitäten explizit betont? nein 0 ja 1 V71: Wird Attraktivität des Körpers eines Athleten/einer Athletin explizit betont? nein 0 ja 1 V72: Wenn ja bei V71: Geschlecht des beschriebenen Akteurs? Attraktivität nicht betont 0 weiblich 1 männlich 2 mehrere Personen untersch. Geschlechts/nicht ersichtlich 3 V73: Wenn ja bei V71: wird der entsprechende Akteur abgebildet? Attraktivität nicht betont 0 keine Abbildung 1 Abbildung vorhanden 2 Humor V80: Textform Glosse Feature keine dieser Formen 1 (wenn V21=8, dann ist V80=1) 1 (wenn V21=4, dann ist V80=1) 0 (wenn V21≠4 und V21≠8, dann ist V80=0) 29/30 V81: Humoristische Elemente im Text: kein Humor sich lustig machen über andere (Schadenfreude bei Misserfolg des Gegners, Eigenschaften von Aussenseitern, überspitzte Darstellung nationaler oder anderer Merkmale) Inkongruenz (ungewohnte Kombination von Elementen) humorvolle Bemerkungen als Beigabe zu einer „schlechten“ Nachricht (Niederlage des eigenen Teams) sonstige Formen (z.B. Wortspiele, wenn nicht unter 1-3 codiert) 0 1 2 3 4 V82: Ist mindestens eine Karikatur vorhanden? nicht vorhanden 0 vorhanden 1 V83 Index Humor keine Humor-Elemente vorhanden humoristische Elemente vorhanden 0 (wenn bei V50 bis V52 überall Wert 0) 1 30/30
© Copyright 2024 ExpyDoc