Balancierte unvollständige Blockanlagen, wie man sie nicht definieren sollte Dieter Rasch Vorbemerkung: Dieses Manuskript kann als Grundlage für einen Vortrag zum “Statistischen Tag“ der Alpen Adria Universität am 9.12.05, eines Seminarvortrages an der Psychologischen Fakultät in Wien im Dez. 2005, als Basis einer englischsprachigen Publikation in Psychology Science und zu weitern Diskussionen mit Wim van der Linden dienen. 1. Einführung und Motivation In dem Buch “Linear Models for Optimal Test Design” (Springer 2005) von Wim, J. van der Linden wird auf S. 153 eine Definition von balancierten unvollständigen Blockanlagen (BUB, engl. BIB) gegeben, die der seit über 80 Jahren in der Versuchsplanung, der Mathematischen Statistik und in der Diskreten Mathematik (Kombinatorik) gebräuchlichen widerspricht. Der Autor fühlt sich dabei selbst nicht wohl, denn er schreibt: „In the educational assessment literature, a balanced incomplete-block design (BIB design) consists of preassembled blocks of items assigned to booklets according to certain principles. (Unfortunately, the use of this term is not entirely in agreement with the experimentaldesign literature)”. Zurückzuführen ist diese bedauerliche Entwicklung offensichtlich auf National Assessment of Educational Progress (NAEP). Im folgenden soll ausgeführt werden, dass es sich bei derartigen Anlagen um TBUB, wie der Blockplan auf S. 154, handeln kann (TBUB = teilweise balancierte unvollständige Blockanlage, engl. PBIB), dass offensichtlich die Stellung von Blocks und Behandlungen ausgetauscht wird und insgesamt die Vorgehensweise nur zu Konfusionen in der Biometrie führen kann, zu der man auch die Psychometrie rechnen sollte. Gleichzeitig sollten die Psychologen, die sich mit Tests und anderen quantitativen Methoden beschäftigen, erkennen, dass sie sich der Theorie der Blockanlagen nicht völlig verschließen sollten. Beim Erarbeiten des Buches „Statistik für das Psychologiestudium“ von Rasch und Kubinger (Spektrum-Elsevier, 2005) hatte der Autor dieses Artikels große Mühe, den Abschnitt 5.2.2 Versuchsanlagen auf den Seiten 5663 bei dem 2. Autor des Buches, wenn auch stark gekürzt, durchzusetzen. In der Versuchsplanungsliteratur wird (in Anlehnung an R.A. Fisher) davon ausgegangen, dass v (von variety=Sorte) Behandlungen b Blocks derartig zugeordnet werden, dass weitestgehende „Balanciertheit“ eingehalten wird. In Rothamsted Experimental Station, Fishers Arbeitsplatz, wo Sortenversuche auf Feldern durchgeführt werden, waren die Blocks möglichst (bezüglich Bodenbeschaffenheit) homogene Teile des Feldes. Damit sollten Sortenvergleiche innerhalb der Blocks genauer werden. Diese Blocks wurden daher in Teilstücke (engl. plots) unterteilt und je Teilstück wurde dann eine der Sorten angebaut. Aus erntetechnischen Gründen durften die Teilstücke nicht zu klein und um homogene Blocks zu garantieren letztere nicht zu groß sein. Das führte dazu, dass die Anzahl der Teilstücke je Block geringer als die Anzahl der Sorten war und damit nicht alle Sorten im selben Block angebaut werden konnten. Das führte eben zum Konzept von unvollständigen Blockanlagen, nur einen Teil der Sorten konnte man im gleichen Block anbauen. Um nun statistische Schätzungen oder Tests zum Vergleich des Ertrages y (von yield = Ertrag) zwischen 2 beliebigen Sorten mit gleicher Genauigkeit (Varianz) für alle Sortenpaare durchführen zu können, forderte man, dass alle Sortenpaare gleich oft (λ mal) gemeinsam in einem der Blocks vorkommen. Außerdem sollte jede Sorte auf gleich vielen (r Teilstücken, vom englischen replication = Wiederholung) angebaut werden und alle Blocks gleich viele (k) Teilstücke enthalten. Damit ist die Gesamtanzahl N der Teilstücke durch N = b ⋅ k aber auch durch N = v ⋅ r gegeben und daraus folgt die erste notwendige Bedingung für die Existenz einer BUB v⋅r = b⋅k (1) v v ⋅ (v − 1) Aus der Tatsache, dass jedes der = verschiedenen Sortenpaare λ mal 2 2 gemeinsam in einem der Blocks auftritt und in jedem der b Blocks mit je k Teilstücken k k ⋅ (k − 1) k b ⋅ k ⋅ (k − 1) = Teilstückpaare auftreten, insgesamt im Versuch also b ⋅ . = 2 2 2 2 Sortenpaare untergebracht werden können, folgt zunächst λ⋅ v ⋅ (v − 1) b ⋅ k ⋅ (k − 1) v ⋅ (v − 1) v ⋅ r ⋅ (k − 1) = = bzw. wegen (1) auch λ ⋅ . 2 2 2 2 Das ergibt nun aber die zweite notwendige Bedingung für die Existenz einer BUB λ ⋅ (v − 1) = r ⋅ (k − 1) . (2) In Rasch und Kubinger (2005) wird durch ein Gegenbeispiel gezeigt, dass diese Bedingungen nicht hinreichend sein müssen. Zumindest muss noch die Fishersche Ungleichung b≥v erfüllt sein. (3) Betrachten wir nun das Beispiel auf S. 154, Table 6.2, von van der Linden. Dort soll eine BUB widergegeben sein mit b = 13 Blocks und v = 26 Behandlungen (booklets). Eine solche BUB existiert aber nicht, da (3) nicht erfüllt ist. Außerdem handelt es sich bei den Blocks um „Aufgabengruppen“ (engl. items), die man eher als behandlungen denn als Blocks ansehen könnte. Tut man das, entsteht tatsächlich eine BUB mit v = 13 Behandlungen, b = 26 Blocks, in jedem Block gibt es k = 3 Elemente und jede Behandlung wird r = 6 mal angewendet. Damit gilt (1) und mit λ = 1 auch (2), (3) ist natürlich auch erfüllt. Die Bedingungen sind hinreichend, denn die Existenz der so verstandenen BUB ist ja in Table 6.2 zu erkennen. Die auf S. 154 angegebene BUB ist keine solche im Sinne der Versuchsplanung sondern eine TBUB mit 2 Assoziationsklassen (T = teilweise). Will man aber mit 13 Blocks arbeiten und beschränkt sich auf v = 25 booklets (jetzt die Behandlungen), so liefert CADEMO/DESIGN die kleinstmögliche folgende BUB mit b = 100 Blocks. Mit den v = 26 Behandlungen des Beispiels von van der Linden mit k = 3 Elementen je Block folgt aus (1) 26 ⋅ r = b ⋅ 3 , also b= 26 ⋅ r 3 (a). Andererseits folgt aus (2) λ ⋅ ⋅25 = r ⋅ 2 oder λ= 2⋅r 25 (b) Das kleinste b, für das beide Gleichungen erfüllt sind, ist b = 650 mit r =75 und λ = 6. Dies ist sicher unzumutbar. Daher könnte man die Anzahl der Behandlungen zu reduzieren versuchen und eventuell auch die Blockgrößen variieren. Beschränken wir uns auf Behandlungsanzahlen zwischen 20 und 25 und Blockgrößen zwischen 3 und 7, so erhalten wir folgende Möglichkeiten: Tabelle 1 Die kleinsten BUB (Anzahl b der Blocks) mit vorgegebenen Werten von v und k. Anzahl von Behandlungen Blockgröße k 20 21 22 23 24 25 3 380 70 154 253 184 100 4 95 105 77 253 138 50 5 76 21 462 253 552 30 6 190 42 77 253 92 100 7 380 30 44 253 552 100 Der Tabelle 1 kann man entnehmen, dass eine Vergrößerung der Blockgröße nicht notwendig zur Verringerung der Anzahl der Blocks führen muss. Die Werte von r und λ, die zu den (v,k,b) - Wertetripeln der Tabelle 1 gehören, kann man sich aus (1) und (2) berechnen.
© Copyright 2024 ExpyDoc