Blatt 1 - homeweb2.unifr.ch

UNIVERSITÄT FREIBURG
Naturwissenschaftliche Fakultät
Department Mathematik
Frühlingssemester 2016
Propädeutische Statistik – Übungsblatt 1
Abzugeben bis Mittwoch 9. März 2016, 8:30 Uhr
(Postfach Prop. Statistik“ Physik 2. Stock)
”
Aufgabe 1. Comprendre l’histogramme
Sur le site internet du cours, vous trouverez un fichier “HALFLIFE.xlsx“. Le fichier contient 4 colonnes de
données : Le numéro du patient, le type de médicament attribué (A ou G), la période de semi-vie et la dose
injectée.
Le but de cet exercice est de comprendre comment construire un histogramme. Pour cela vous allez réaliser
l’histogramme des données HALF étape par étape.
a) Excel / Libreoffice : Réaliser un nouveau tableau. Dans la première colonne seront les centres de classes
et dans la deuxième, faites compter automatiquement au logiciel le nombre d’individus dans cette classe.
L’histogramme devra comprendre 6 classes de même largeur.
b) Excel / Libreoffice : A l’aide de l’outil de diagrammes simple, représentez l’histogramme.
c) A la main :
1) Imaginons que vous souhaitiez maintenant représenter votre histogramme non pas avec 6 classes, mais
12... énumérez les difficultés que vous rencontrerez (que devriez vous changer,...)
2) Après avoir réalisé l’exercice 2, une étape vous semble-t-elle superflue ici (du point de vue de la
représentation des données, pas de la compréhension) ?
Aufgabe 2. Représentation de données - Histogramme et scatterplot
Nutzt wieder die Daten aus Übung 1, “HALFLIFE.xlsx“. Benutzt SPSS mithilfe des Tutorials auf der Webseite.
a) SPSS : Zeichnet zwei Histogrammen für “HALF“.
1) Eins einfach ohne Parameteränderung.
2) Eins mit genau 12 Klassen.
b) Scatterplot :
1) SPSS : Zeichnet ein Scatterplot von HALF (X-axis) versus DOSE (Y-axis). Unterscheidet die Patienten
aus den Gruppen A und B mithilfe von Färbungen.
2) SPSS : Zeichnet ein Histogramm von DOSE mit Unterscheidung der beiden Gruppen.
3) Schriftlich : Auf dem Plot gibt es eine Zusammenfassung mit Varianz und Mittelwert. Was stellen
diese beide Werte dar? Erläutert eure Antwort?
Aufgabe 3. Utiliser le scatterplot - Loup ou chien ?
On a retrouvé un crâne fossile qui pourrait être celui d’un chien ou celui d’un loup. Différentes mesures ont
été prises sur de nombreux crânes comme indiqué sur la figure. Vous trouverez dans le fichier “WOLF.xlsx“
toutes les données. Les premières lignes donnent les mesures pour des crânes de chiens puis viennent celles
concernant les crânes de loups. La dernière ligne concerne le crâne inconnu.
En utilisant uniquement les techniques vues précédemment, essayez de déterminer si le crâne inconnu était
un chien ou un loup. Vous devrez être convaincants !
Aufgabe 4. Utiliser le scatterplot - Was ist wichtig ?
Öffne die Datei “MAYA.xlsx“. Dies ist eine Studie über die Lokalisierung früher existierender Mayadörfer. Die
Hypothese ist, dass die Mayas ihre Städten so bauten, dass die Distanz zu wichtigen Ressourcen minimiert
wurde. Dazu haben Archäologen eine Gebiet in Belize mit einem Kontrollnetz überzogen und untersucht:
ein Netz aus 151 Quadraten mit jeweiliger Seitenlänge von 2.5 km. Für jedes Quadrat wurden 13 Variablen
gemessen:
• Sites : Anzahl der gefundenen Städte im Quadrat.
• V1 : Prozentsatz des Bodens mit Kalkstein.
• V2 : Prozentsatz des Bodens mit sehr kalkhaltigem Grundwasser.
• V3 : Prozentsatz des Bodens mit Korallevorkommen.
• V4 : Prozentsatz des Bodens, an dem Anschwemmungen auftreten.
• V5 : Anteil an Laubwald.
• V6 : Anteil an Sumpfgebiet.
• V7 : Anteil an Palmwälder.
• V8 : Mischung von V5-V7.
• V9 : Anzahl der Bodentypen.
• V10 : Distanz zu schiffbaren Gewässern.
• V11 : Prozentsatz des Quadrates, der schiffbare Gewässer enthält.
• V12 : Distanz bis nach Santa Rita Stat (politisches und ökonomisches Zentrum).
Die Frage ist: Welche Variablen waren die wichtigsten für die Mayas?
1. SPSS : Zeichnet einen Scatterplot mit nur einer X-Achse für die Variable V1 und gruppiert die Daten
nach der Anzahl der Städte.
(Hint : Benutzt “Groups / Point ID“und dann wähle “Row panel variable“. Die Variable “Sites“soll
dazu Nominal sein.)
2. SPSS : Macht dasselbe für jede Variable V2-V12.
3. Welche Variablen sind die wichtigsten und in welchem Sinn? Was sind die statistischen Argumente
dafür?
Zur Abgabe: Gebt nur die Graphen ab, die notwendig sind um eure Argumente zu erklären.