Balancierte unvollständige Blockanlagen, wie man sie nicht

Balancierte unvollständige Blockanlagen, wie man sie nicht
definieren sollte
Dieter Rasch
Vorbemerkung: Dieses Manuskript kann als Grundlage für einen Vortrag zum “Statistischen Tag“ der
Alpen Adria Universität am 9.12.05, eines Seminarvortrages an der Psychologischen Fakultät in Wien im
Dez. 2005, als Basis einer englischsprachigen Publikation in Psychology Science und zu weitern
Diskussionen mit Wim van der Linden dienen.
1. Einführung und Motivation
In dem Buch “Linear Models for Optimal Test Design” (Springer 2005) von Wim, J. van
der Linden wird auf S. 153 eine Definition von balancierten unvollständigen Blockanlagen
(BUB, engl. BIB) gegeben, die der seit über 80 Jahren in der Versuchsplanung, der
Mathematischen Statistik und in der Diskreten Mathematik (Kombinatorik) gebräuchlichen
widerspricht. Der Autor fühlt sich dabei selbst nicht wohl, denn er schreibt: „In the
educational assessment literature, a balanced incomplete-block design (BIB design) consists
of preassembled blocks of items assigned to booklets according to certain principles.
(Unfortunately, the use of this term is not entirely in agreement with the experimentaldesign literature)”. Zurückzuführen ist diese bedauerliche Entwicklung offensichtlich auf
National Assessment of Educational Progress (NAEP). Im folgenden soll ausgeführt
werden, dass es sich bei derartigen Anlagen um TBUB, wie der Blockplan auf S. 154,
handeln kann (TBUB = teilweise balancierte unvollständige Blockanlage, engl. PBIB), dass
offensichtlich die Stellung von Blocks und Behandlungen ausgetauscht wird und insgesamt
die Vorgehensweise nur zu Konfusionen in der Biometrie führen kann, zu der man auch die
Psychometrie rechnen sollte. Gleichzeitig sollten die Psychologen, die sich mit Tests und
anderen quantitativen Methoden beschäftigen, erkennen, dass sie sich der Theorie der
Blockanlagen nicht völlig verschließen sollten. Beim Erarbeiten des Buches „Statistik für
das Psychologiestudium“ von Rasch und Kubinger (Spektrum-Elsevier, 2005) hatte der
Autor dieses Artikels große Mühe, den Abschnitt 5.2.2 Versuchsanlagen auf den Seiten 5663 bei dem 2. Autor des Buches, wenn auch stark gekürzt, durchzusetzen.
In der Versuchsplanungsliteratur wird (in Anlehnung an R.A. Fisher) davon ausgegangen,
dass v (von variety=Sorte) Behandlungen b Blocks derartig zugeordnet werden, dass
weitestgehende „Balanciertheit“ eingehalten wird. In Rothamsted Experimental Station,
Fishers Arbeitsplatz, wo Sortenversuche auf Feldern durchgeführt werden, waren die
Blocks möglichst (bezüglich Bodenbeschaffenheit) homogene Teile des Feldes. Damit
sollten Sortenvergleiche innerhalb der Blocks genauer werden. Diese Blocks wurden daher
in Teilstücke (engl. plots) unterteilt und je Teilstück wurde dann eine der Sorten angebaut.
Aus erntetechnischen Gründen durften die Teilstücke nicht zu klein und um homogene
Blocks zu garantieren letztere nicht zu groß sein. Das führte dazu, dass die Anzahl der
Teilstücke je Block geringer als die Anzahl der Sorten war und damit nicht alle Sorten im
selben Block angebaut werden konnten. Das führte eben zum Konzept von unvollständigen
Blockanlagen, nur einen Teil der Sorten konnte man im gleichen Block anbauen. Um nun
statistische Schätzungen oder Tests zum Vergleich des Ertrages y (von yield = Ertrag)
zwischen 2 beliebigen Sorten mit gleicher Genauigkeit (Varianz) für alle Sortenpaare
durchführen zu können, forderte man, dass alle Sortenpaare gleich oft (λ mal) gemeinsam
in einem der Blocks vorkommen. Außerdem sollte jede Sorte auf gleich vielen (r
Teilstücken, vom englischen replication = Wiederholung) angebaut werden und alle Blocks
gleich viele (k) Teilstücke enthalten.
Damit ist die Gesamtanzahl N der Teilstücke durch N = b ⋅ k aber auch durch N = v ⋅ r
gegeben und daraus folgt die erste notwendige Bedingung für die Existenz einer BUB
v⋅r = b⋅k
(1)
 v  v ⋅ (v − 1)
Aus der Tatsache, dass jedes der   =
verschiedenen Sortenpaare λ mal
2
 2
gemeinsam in einem der Blocks auftritt und in jedem der b Blocks mit je k Teilstücken
 k  k ⋅ (k − 1)
 k  b ⋅ k ⋅ (k − 1)
  =
Teilstückpaare auftreten, insgesamt im Versuch also b ⋅ .  =
2
2
 2
 2
Sortenpaare untergebracht werden können, folgt zunächst
λ⋅
v ⋅ (v − 1) b ⋅ k ⋅ (k − 1)
v ⋅ (v − 1) v ⋅ r ⋅ (k − 1)
=
=
bzw. wegen (1) auch λ ⋅
.
2
2
2
2
Das ergibt nun aber die zweite notwendige Bedingung für die Existenz einer BUB
λ ⋅ (v − 1) = r ⋅ (k − 1) .
(2)
In Rasch und Kubinger (2005) wird durch ein Gegenbeispiel gezeigt, dass diese
Bedingungen nicht hinreichend sein müssen. Zumindest muss noch die Fishersche
Ungleichung
b≥v
erfüllt sein.
(3)
Betrachten wir nun das Beispiel auf S. 154, Table 6.2, von van der Linden. Dort soll eine
BUB widergegeben sein mit b = 13 Blocks und v = 26 Behandlungen (booklets). Eine
solche BUB existiert aber nicht, da (3) nicht erfüllt ist. Außerdem handelt es sich bei den
Blocks um „Aufgabengruppen“ (engl. items), die man eher als behandlungen denn als
Blocks ansehen könnte. Tut man das, entsteht tatsächlich eine BUB mit v = 13
Behandlungen, b = 26 Blocks, in jedem Block gibt es k = 3 Elemente und jede Behandlung
wird r = 6 mal angewendet. Damit gilt (1) und mit λ = 1 auch (2), (3) ist natürlich auch
erfüllt. Die Bedingungen sind hinreichend, denn die Existenz der so verstandenen BUB ist
ja in Table 6.2 zu erkennen.
Die auf S. 154 angegebene BUB ist keine solche im Sinne der Versuchsplanung sondern
eine TBUB mit 2 Assoziationsklassen (T = teilweise). Will man aber mit 13 Blocks
arbeiten und beschränkt sich auf v = 25 booklets (jetzt die Behandlungen), so liefert
CADEMO/DESIGN die kleinstmögliche folgende BUB mit b = 100 Blocks.
Mit den v = 26 Behandlungen des Beispiels von van der Linden mit k = 3 Elementen je
Block folgt aus (1)
26 ⋅ r = b ⋅ 3 , also
b=
26 ⋅ r
3
(a).
Andererseits folgt aus (2) λ ⋅ ⋅25 = r ⋅ 2 oder
λ=
2⋅r
25
(b)
Das kleinste b, für das beide Gleichungen erfüllt sind, ist b = 650 mit r =75 und λ = 6. Dies
ist sicher unzumutbar. Daher könnte man die Anzahl der Behandlungen zu reduzieren
versuchen und eventuell auch die Blockgrößen variieren. Beschränken wir uns auf
Behandlungsanzahlen zwischen 20 und 25 und Blockgrößen zwischen 3 und 7, so erhalten
wir folgende Möglichkeiten:
Tabelle 1 Die kleinsten BUB (Anzahl b der Blocks) mit vorgegebenen Werten von v und k.
Anzahl von Behandlungen
Blockgröße k 20 21 22 23 24 25
3
380 70 154 253 184 100
4
95 105 77 253 138 50
5
76 21 462 253 552 30
6
190 42 77 253 92 100
7
380 30 44 253 552 100
Der Tabelle 1 kann man entnehmen, dass eine Vergrößerung der Blockgröße nicht
notwendig zur Verringerung der Anzahl der Blocks führen muss. Die Werte von r und λ,
die zu den (v,k,b) - Wertetripeln der Tabelle 1 gehören, kann man sich aus (1) und (2)
berechnen.