Instrument Zufallsstichprobe

Instrument
Zufallsstichprobe
Ziel
Vorgehensweise
Ziel einer Zufallsstichprobe ist es, mit einer kleinen
repräsentativen Menge das Gesamtbild aller Daten
oder Proben gleicher Merkmale darzustellen. Dies
erfolgt in der Regel, um eine faktenbasierte Entscheidungsfindung zu ermöglichen.
Die Erläuterungen in diesem Instrument gliedern
sich in zwei Teile: Zuerst ein „unwissenschaftlicher“
eher pragmatischer Ansatz. Darauf folgt eine kurze
statistische Einlassung zur Genauigkeit von Stichprobenergebnissen.
Nutzbar bei den Modulen
I. Pragmatischer Ansatz (für eine erste orientierende Untersuchung):
Anwendungsbeispiel: Ein Unternehmen hat seine
Material- und Personalaufwände zwar auftragsbezogen erfasst, diese sind jedoch nicht den einzelnen Leistungs- bzw. Projektphasen zugeordnet.
Wenn Sie nun messen wollen, wie sich beispielsweise der Personalaufwand auf die einzelnen Projektphasen verteilt, gibt es zwei Möglichkeiten:
II. Entwicklung & Vermarktung
2. Ideen bewerten und auswählen
5. Geschäftsprozesse aufnehmen und gestalten
III. Produktivitätssteigerung
2. Geschäftsprozesse aufnehmen und gestalten
4. Lösungen und Maßnahmen
Aufwand
Der Aufwand ist abhängig von Art und Umfang der
Informationen, die gewonnen werden sollen.
Wichtig: Der Aufwand der Erhebung einer Zufallsstichprobe ist, entgegen der weitläufigen Meinung,
nicht von der Masse der zur Verfügung stehenden
Daten abhängig, sondern von der Streuung der Ergebnisse. Je homogener die Daten also verteilt sind, desto
kleiner darf die Stichprobe sein.
Vergleich
Vorteile
> repräsentatives Ergebnis
> kostengünstig, da nur ein Teil aller Informationen
ausgewertet wird
Nachteile
> Unsachgemäße Stichprobenauswahl führt zu falschen Ergebnissen.
> Große Stichprobenumfänge erhöhen den Aufwand.
Instrument: Zufallsstichprobe
1. Die nächsten neuen Aufträge detailliert erfassen
(Auftragstagebuch führen)
2. Abgeschlossene Aufträge auswerten (Stichprobe
ziehen)
Sofern viele Aufträge gleichzeitig abgewickelt und
diese in einer angemessen kurzen Zeit abgeschlossen werden, ist Variante 1 voraussichtlich einfacher
zu realisieren. Falls aber die Auftragsdauer mehrere
Monate umfasst, kann es zielführend sein, bereits
abgeschlossene Aufträge auszuwerten. Das sind
dann z. B. „alle Aufträge der letzten 3 Monate“ oder
eine Stichprobe z. B. aus den Aufträgen der letzten
3 Jahre.
Hier kommt Statistik ins Spiel: „alle Aufträge der
letzten 3 Monate“ ist eine „Vollerhebung“, denn es
sind ja alle Aufträge betrachtet worden. Dies liefert
ein Ergebnis, das für den betrachteten Zeitraum
unverrückbar wahr ist. Für „die Aufträge der letzten
3 Jahre“ ist eine Vollerhebung ggf. sehr aufwändig.
Mit einer Stichprobe soll daher kostengünstig ein
annähernd wahres – also „repräsentatives“ – Ergebnis erzeugt werden.
PROMIDIS 11/2015
1/3
Dazu wird hier die Vorgehensweise zur Durchführung
einer einfachen Zufallsstichprobe erläutert.
Wichtig: Einer der häufigsten Fehler von Stichprobenbetrachtungen ist es, die Daten zu nehmen, „die gerade da sind“. In einem solchen Fall kann man ziemlich
sicher davon ausgehen, dass es einen besonderen, in
der Regel systematischen Grund gibt, warum gerade
diese Daten vorliegen. Der Fachmann spricht dann
von einer systematischen Verzerrung. Jede Form der
manuellen Auswahl ist in gewisser Weise „beliebig“
und eben nicht zufällig. Damit kann von vornherein
keine im statistischen Sinne repräsentative Stichprobe
erreicht werden.
Aber: Was soll ausgewertet werden?
Stichprobenumfang
I
2012
2013
Auftragstyp A
n=30
Auftragstyp B
II
2014
Auftragstyp A
n=30
Auftragstyp B
n=30
Auswertung
möglich?
Eine Gesamtaussage möglich mit n = 30
Eine Aussage je
Auftragstyp
möglich n = 60
> Was ist die Grundgesamtheit?
> Wie erfolgt die Zufallsziehung?
> Wie groß soll die Stichprobe sein?
Bei der Grundgesamtheit „Alle Aufträge der letzten
drei Jahre“ lässt n = 30 eine Aussage zu, wie es in
den letzten 3 Jahren ausgesehen hat. Sofern aber
nach Auftragstyp A und B unterschieden werden
soll, kann eine Zufallsziehung mit n = 60 erfolgen,
damit eine Auswertung je Auftragstyp - wahrscheinlich - möglich wird, oder es werden zwei Zufallsziehungen mit n = 30 und jeweils eigener Liste aller
Aufträge der letzten 3 Jahre (getrennt nach Typ A
und Typ B) durchgeführt.
Was ist die Grundgesamtheit (N)?
Im Beispiel ist N = „Alle Aufträge der letzten 3 Jahre“.
Für die einfache Zufallsstichprobe ist es erforderlich,
dass jedes Element der Grundgesamtheit mit der gleichen Wahrscheinlichkeit in die Stichprobe aufgenommen werden kann und dass die Stichprobenentnahme
der einzelnen Elemente voneinander unabhängig erfolgt. Das heißt für o. g. Beispiel: Benötigt wird eine
Liste, in der die Aufträge der letzten 3 Jahre vollständig
und ohne Dopplungen aufgeführt sind.
II. Bestimmung der Genauigkeit einer Stichprobe
Anders als bei einer Wahl selbst, bei der jeder Wähler seine Stimme abgibt, wird bei einer Wahlbefragung nur eine repräsentative Anzahl an Wählern
befragt. Das Ergebnis einer Befragung von drei
Personen stellvertretend für das Wahlergebnis von
80 Millionen Wählern kann nicht die gesamten Meinungen der Wähler widerspiegeln. Aber wie groß
sollte die Stichprobe sein?
Wie erfolgt die Zufallsziehung?
Die Zufallsziehung kann physisch nach dem LottoPrinzip erfolgen (für jeden Auftrag wird ein Los erstellt,
die Lose werden durchmischt und die Stichprobe wird
daraus gezogen) oder elektronisch mithilfe von Zufallszahlen. Umsetzung für das Beispiel: Alle Aufträge
aus der Liste werden durchnummeriert, die für die
Stichprobe erforderliche Anzahl von Zufallszahlen wird
erzeugt (zum Beispiel in Excel-Tabellen). Alle Aufträge
deren Nummer mit einer Zufallszahl übereinstimmen,
werden ausgewählt.
Die Anzahl der nötigen Stichproben (n) kann
mathematisch berechnet werden. Möchte man mit
der Stichprobe eine mit 95%iger Sicherheit (α=0,05)
wahre Aussage über die Grundgesamtheit erhalten,
so lässt sich der optimale Stichprobenumfang bei
einer einfachen Zufallsauswahl wie folgt berechnen:
Für die einfache Zufallsstichprobe sind folgende Überlegungen erforderlich:
Wie groß soll die Stichprobe (n) sein?
Es gibt eine Faustregel, die besagt: Liegt eine Normalverteilung der Daten vor, so kann man mit einem
Stichprobenumfang von n = 30 Stichproben eine Auswertung durchführen.
Instrument: Zufallsstichprobe
n≥
f∙ s2
x
e2
α
mit f = z1 − ² = 1,96²
2
Die Genauigkeit einer Stichprobe lässt sich durch
die Parameter Stichprobenfehler und Konfidenzniveau näher beschreiben. Auf Basis einer Stichprobenerhebung kann der wahre Wert einer
Grundgesamtheit (N) nicht exakt gemessen werden, sondern er wird aus den Stichprobenergebnissen näherungsweise geschätzt.
PROMIDIS 11/2015
2/3
Der Stichprobenfehler beschreibt die durchschnittliche Abweichung der Stichprobenergebnisse gegenüber dem wahren Wert. Mit Hilfe des maximalen
Stichprobenfehlers lässt sich ein Intervall (Konfidenzintervall) beschreiben, in dem der wahre Wert
zu finden ist.
Die Schätzungsgenauigkeit beschreibt nun, mit
welcher Sicherheit der aus den Stichprobenergebnissen hochgerechnete Wert, in diesem Konfidenzintervall liegt.
Stichprobenfehler und Konfidenzintervall sind abhängig von der Streuung der zu bewertenden Merkmale.
Diese ist allerdings in der Regel vor einer Messung
unbekannt. Um zu einer verlässlichen Abschätzung
zu kommen, welcher Stichprobenumfang zu hinreichend genauen Bewertungsergebnissen führt, wird –
falls möglich – auf Messergebnisse früherer Untersuchungen zurückgegriffen. Dazu muss die Streuung
der Stichprobe als Varianz bekannt sein.
Falls eine Abschätzung der Streuung im Vorfeld nicht
möglich ist, so kann die Stichprobe basierend auf der
Grundgesamtheit berechnet werden. Dies führt allerdings in der Regel zu sehr großen Stichprobenumfängen.
Alternativ kann bei einer einfachen Zufallsstichprobe
im Nachhinein die Genauigkeit der Ergebnisse, also
das Konfidenzintervall, berechnet werden, so dass
für die Entscheidungsfindung diese Information mit
zur Verfügung steht.
Der Stichprobenumfang wird abhängig von der
Grundgesamtheit folgendermaßen berechnet:
n≥
N
1 + e2 N
Dabei ist e fest vorzugeben.
Formeln zur Berechnung wesentlicher Parameter
sind:
Arithmetischer Mittelwert 𝑥̅
𝑛
𝑥̅ =
1
∑ 𝑥𝑖
𝑛
𝑖=1
Varianz 𝑠𝑥
2
𝑛
𝑠𝑥 2 =
1
∑(𝑥𝑖 − 𝑥̅ )2
𝑛
𝑖=1
Standardabweichung 𝑠𝑥
𝑠𝑥 = √𝑠𝑥 2
Stichprobenfehler 𝑆𝐹(𝑥̅ )
𝑆𝐹(𝑥̅ ) =
𝑠𝑥
√𝑛
Maximaler Stichprobenfehler 𝑒
𝑒 = 2 ∗ 𝑆𝐹(𝑥̅ )
Konfidenzintervall 𝐾𝐼
𝐾𝐼 = 𝑥̅ ± 𝑒
Konfidenzniveau
Die Irrtumswahrscheinlichkeit
wird auf den in der Wirtschaftsund Sozialstatistik üblichen
Wert von α= 0,05 gesetzt, das
entspricht einer Schätzungsgenauigkeit von 95 %.
𝛼 = 0,05
Weiterführende Informationen
> http://user.demogr.mpg.de/doblhammer/zufall.pdf
> https://www.uni-due.de/imperia/md/content/
soziologie/5_auswahlverfahren.pdf
> Universität Dresden „Einfache Zufallsstichprobe“;
online unter http://elearning.tudresden.de/versuchsplanung/e35/e3904/e3958/
zuletzt nachgesehen am 02.10.2015.
> https://www.empiwifo.uni-freiburg.de/lehreteaching-1/winter-term-08-09/materialienwirtschaftsstatistik/II_Stichprobe
Impressum
Autorin: Susanne Crezelius; DGQ e. V.
Redaktion: Alexander Sonntag, Beate Schlink;
RKW Kompetenzzentrum
November 2015
Diese Publikation wurde im Rahmen des Projektes
„Produktivitätsmanagement für industrielle
Dienstleistungen stärken“ (PROMIDIS) erstellt.
Instrument: Zufallsstichprobe
PROMIDIS 11/2015
3/3