Ziel und Anspruch der Schule als Organisation

Schulische Leistungsmessung
Über den beschreibenden und sinnstiftenden Charakter der Ziffernnote
Autor: Fabian Oestersötebier
eMail: [email protected]
Blog: https://wortsalatsite.wordpress.com/
Inhaltsverzeichnis
1. Einleitung…………………………………………………………………………….3
2. Messbarkeit von Schülerleistungen………...………….……………………………..4
2.1 Gütekriterien……………………………………………………………………...4
2.2 Bezugsnormen…………………………………………………………………....5
2.3 Personwahrnehmung……………………………………………………………..6
2.4 Schichtspezifische Bewertungstendenzen…………………………………….…..7
3. Wie Zensuren Sinn stiften……………………………………………………………8
3.1 Erwartungen……………………………………………………………………...8
3.2 Zensuren als Eignungsprädikat……………………………………………….….10
3.3 Der sinnstiftende Charakter der Schulnote………………..…….…………….…13
4. Schluss…………………………………………………………………………...…...15
5. Literaturverzeichnis………………………………………………………………..…17
2
1. Einleitung
Ein jeder schulpflichtige Mensch sieht sich im Laufe seines Lebens mit ihnen konfrontiert,
erfährt ihre weisende Kraft, muss sich ihren Konsequenzen stellen und sein Handeln an ihnen
orientieren. Es sind Zahlen mit eigentümlicher Macht, die uns Wege in die Zukunft bereiten
und verbauen können. Die Rede ist von Schulnoten, wie sie tagtäglich an deutschen Schulen
vergeben werden.
In einer modernen Gesellschaft, in der die soziale Herkunft nicht länger den zukünftigen
Status eines Menschen determinieren soll, wird es, dem Leistungsprinzip folgend, zur
Herausforderung
der
Institution
Schule,
zwischen
„Leistungsfähigen“
und
„Leistungsschwachen“ zu unterscheiden und ihnen Positionen in der Sozialstruktur
zuzuweisen. Noten sind dabei das zentrale Element schulischer Selektionsvorhaben. Die sich
diesem Gegenstand widmende, vornehmlich erziehungswissenschaftliche Literatur, zeichnet
sich vor allem durch eine ablehnende Haltung gegenüber der Schülerbewertung mittels
Ziffernzensuren aus. Die Kritik richtet sich dabei zumeist auf den Informationsverlust und die
Gefahr von Verfälschungen, die dieser Form der Leistungsbeschreibung zueigen seien.
Im Rahmen meiner Arbeit möchte ich zunächst kritisch hinterfragen, inwieweit die Schulnote
Leistung zu repräsentieren vermag und welche spezifischen Probleme aus ihrem Gebrauch
erwachsen. In einem zweiten, eher explorativen Teil werde ich versuchen, die Schulnote aus
alternativen Blickwinkeln zu betrachten und den wirklichkeitsstiftenden Charakter dieser
zahlenförmigen Darstellungsform zu erörtern.
3
2. Messbarkeit von Schülerleistungen
2.1 Gütekriterien
In der einschlägigen Fachliteratur besteht, aufbauend auf dem Bestreben nach einer gerechten
Verteilung
von
Lebenschancen,
allgemeiner
Konsens
darüber,
dass
die
Leistungsbeschreibung durch den Lehrer den Gütekriterien einer Messung genügen sollte. Im
Einzelnen sind dies Objektiviät, Validität und Reliabilität.
Die Reliabilität (Zuverlässigkeit) verdeutlicht sich anhand der Reproduzierbarkeit eines
Messergebnisses zu einem späteren Zeitpunkt. In unserem Kontext bedeutet dies, dass ein
Lehrer mittels seines „Messinstruments“, der Notenskala, bei einer bestimmten Leistung
immer zu genau demselben Messerergebnis, derselben Zensur, gelangen muss.
Als valide (gültig) gilt ein Messergebnis dann, wenn ihm eine Messung, die sich
ausschließlich auf das zu messende Merkmal bezieht, zugrunde liegt. So dürfen etwa bei einer
Mathematik-Prüfung nur jene Kompetenzen gemessen werden, die auch abgefragt werden.
Leistungsfremde Aspekte, wie etwa der Kleidungsstil oder - in diesem Falle Sprachfertigkeiten des Prüflings, dürfen keinen Einfluss auf das Messerergebnis nehmen.
Eine Schulnote würde im Kern dann den Kriterien der Objektivität genügen, wenn die
Leistung, die ihr zugrunde liegt, unabhängig von der Person des Schülers / des Lehrers stets
mit derselben Zensur bedacht wird (vgl. Krope 1976: 12). Hierbei ist wiederum zwischen
drei, aufeinander aufbauenden Teilaspekten von Objektivität zu differenzieren. Das Ausmaß,
in dem der Messvorgang reglementiert und standardisiert ist, bezeichnet die sogenannte
„Durchführungsobjektivität“ (vgl. Ziegenspeck 1999: 134). Diese wäre in der Praxis in
höchstmöglichem Maße erreicht, wenn sichergestellt ist, dass alle Schüler ihr Wissen unter
gleichen
Prüfungsbedingungen
abrufen
können.
Insbesondere
Aufgabenstellung,
Bearbeitungszeit und gewährte Hilfeleistungen müssten ganz und gar vereinheitlicht sein. Die
„Auswertungsobjektivität“ bezieht sich auf das „Ausmaß, in dem die beschreibende Erfassung
der Prüfungsleistung bei der Korrektur reglementiert und vereinheitlicht ist“ (Ziegenspeck
1999: 134). Lehrer müssten, um eine maximale Auswertungsobjektivität zu erreichen, immer
nach denselben Prinzipien zwischen „richtig“ und „falsch“ unterscheiden, Teillösungen stets
einheitlich registrieren. Sofern, durch Orientierung an den genannten Kriterien, die objektive
Fehlerhaftigkeit/Richtigkeit der Leistung registriert wurde, gilt es weiterhin einheitlichen
Richtlinien bei der Notenzuordnung und damit der Beurteilung ihrer Qualität, Folge zu leisten
(„Interpretationsobjektivität“). Nur wenn verschiedene Lehrkräfte, bei einer bestimmten
4
Häufigkeit von Fehlern und Lösungen, nun auch zu einer einheitlichen Note kommen, kann
man von einer gänzlich objektiven „Leistungsmessung“ sprechen.
2.2 Bezugsnormen
In Deutschland wird für die Feststellung von Schülerleistungen eine Notenskala von 1-6
herangezogen. Dabei existieren für die einzelnen Notenstufen folgende Erläuterungen der
Kultusministerkonferenz:

1 (sehr gut)
„Die Note ‚sehr gut’ soll erteilt werden, wenn die Leistung den Anforderungen in
besonderem Maße entspricht.

2 (gut)
„Die Note ‚gut’ soll erteilt werden, wenn die Leistung den Anforderungen voll
entspricht.“

3 (befriedigend)
„Die Note ‚befriedigend’ soll erteilt werden, wenn die Leistung im allgemeinen den
Anforderungen entspricht.“

4 (ausreichend)
„Die Note ‚ausreichend’ soll erteilt werden, wenn die Leistung zwar Mängel aufweist,
aber im ganzen den Anforderungen noch entspricht.“

5 (mangelhaft)
„Die Note ‚mangelhaft’ soll erteilt werden, wenn die Leistung den Anforderungen
nicht entspricht, jedoch erkennen läßt, daß die notwendigen Grundkenntnisse
vorhanden sind und die Mängel in absehbarer Zeit behoben werden könnten.“

6 (ungenügend)
„Die Note ‚ungenügend’ soll erteilt werden, wenn die Leistung den Anforderungen
nicht entspricht und selbst die Grundkenntnisse so lückenhaft sind, daß die Mängel in
absehbarer Zeit nicht behoben werden könnten.“
(Ingenkamp 1989: 16)
Unweigerlich stellt sich nun die Frage, worauf der Begriff „Anforderung“ eigentlich verweist,
zumal man genauere Erläuterungen durch die Kultusminister vermisst. Woran misst der
Lehrer die Schülerleistung?
5
Wenn wir uns den Gegebenheiten in der Praxis zuwenden, müssen wir konstatieren, dass
diesbezüglich faktisch keine einheitlichen Richtlinien existieren. Vielmehr liegt es im
Ermessen des Lehrers, nach welcher Bezugsnorm er sich richtet. So kann man mit einer
Schulnote etwa verdeutlichen, inwiefern die Leistungen des Schülers den Anforderungen des
Curriculums entsprechen („objektive Relation“), wie die Leistung des Schülers im Verhältnis
zu seinen Mitschülern zu beurteilen sind („intersubjektive Relation“), oder, unter
Berücksichtigung vorangegangener Leistungen, inwieweit sich die Leistung des betreffenden
Schülers verbessert oder verschlechtert hat („intrasubjektive Relation“) (vgl. Ziegenspeck
1999: 54). In welchem Maße, bzw. ob überhaupt diese Bezugsgrößen zum Vergleich
herangezogen wurden, lässt sich anhand des Resultats, der Zensur, freilich nicht mehr oder
nur schwer überprüfen. Weiterhin müssen wir uns damit auseinandersetzen, ob die
„Messgröße“, die eigentliche Leistung, durch den Lehrer überhaupt in aller Exaktheit und
damit valide, erfasst werden kann.
Es ist davon auszugehen, dass sich der Lehrer bei der Benotung, in einem gewissen Maße
immer an dem mittleren Leistungsniveau seiner Klasse orientiert (vgl. Ingenkamp 1989:
185ff.). Bei einseitiger Berücksichtigung dieser sozialen Bezugsnorm, wird sich die
Verteilung der Noten in der Regel einer Normalverteilung annähern. Der Vergleich zwischen
Noten von Schülern unterschiedlicher Klassen bzw. Lehrer hätte infolgedessen aber auch
keinerlei Aussagekraft mehr über das jeweils tatsächliche Leistungsniveau, wenn wir dies als
das Maß, in dem der Schüler die Inhalte des Lehrplans verinnerlicht und im Unterricht
kommuniziert hat, verstehen.
Aber auch die Lehrerpersönlichkeit nimmt, aufgrund des Mangels an klaren, einheitlichen
Richtlinien bei der Notenzuordnung, eine gewichtige Rolle ein. So neigen einige Lehrer zu
unangemessen strengen bzw. milden Urteilen („Milde- oder Strengefehler“), während Andere
dem „Fehler der zentralen Tendenz“ unterliegen und Extremurteile auch bei herausragend
guten bzw. schlechten Leistungen vermeiden. Es gibt andererseits aber auch Lehrer, die
gerade die Tendenz zu extremen Noten aufweisen (Wagener 2003: 24).
6
2.3 Personwahrnehmung
Die Personwahrnehmung des Lehrers unterliegt, gemäß sozialpsychologischen Erkenntnissen,
spezifisch menschlichen Unzulänglichkeiten (vgl. Wagener 2003: 22). Anders als bei einem
technischen Aufzeichnungsmedium, bettet der Mensch Wahrgenommenes in aller Regel
unmittelbar in einen Sinnzusammenhang ein, wobei die Wahrnehmung selbst bereits eine
gewisse Selektivität aufweist, welche von unterschiedlichen Faktoren abhängen kann. 1 Bei
dem
sogenannten
„Halo-Effekt“
bzw.
„Hof-Effekt“
überlagert
ein
globaler
Allgemeineindruck, der auf hervorstechenden Eigenschaften der zu beurteilenden Person fußt,
die Wahrnehmung der eigentlich zu berücksichtigenden Merkmale (vgl. Ziegenspeck 1999:
175, Wagener 2003: 22). Dies kann bei der Notengebung etwa dahingehend Einfluss nehmen,
dass ein Schüler mit augenfällig unsauberer Schrift, bei einem Diktat, trotz gleicher
Fehlerzahl, schlechter bewertet wird, als ein Schüler, dessen Schrift für den Lehrer besser
lesbar ist. Andererseits können auch Merkmale wie z.B. Sorgfalt und Ordnung die
Leistungsbenotung des Lehrers positiv beeinträchtigen. Die sogenannte „Projektion“, als ein
der Psychoanalyse entstammender Begriff, kann ebenso zu Wahrnehmungsverfälschungen
führen. Zu dem Projektionsfehler kommt es dann, wenn Lehrer eigene Wünsche,
Persönlichkeitseigenschaften, Motive, oder Zielsetzungen auf die Person des Schülers
übertragen, bzw. „projezieren“ und schließlich an ihr wahrzunehmen glauben (vgl.
Ziegenspeck 1999. 179). Umgekehrt besteht eine Tendenz, dass Eigenschaften, die im
Kontrast zu den eigenen stehen, in stärkerem Maße wahrgenommen werden.
2.4 Schichtspezifische Bewertungstendenzen
Dieses Phänomen bezeichnet der sogenannte „Kontrastfehler“ (vgl. Ziegenspeck 1999. 179,
Wagener 2003: 23). Hierbei ist festzuhalten, dass der Beruf des Lehrers eine akademische
Laufbahn vorraussetzt, Lehrer üblicherweise aus der „Mittelschicht“ rekrutiert werden. Dieser
gesellschaftliche Status drückt sich etwa in Wertorientierungen, aber auch, um einen
wesentlichen Punkt zu nennen, in einem schichtspezifischen Sprachgebrauch aus. So
unterschied der Soziolinguist Basil Bernstein zwischen dem „restringierten Sprachcode“ der
Arbeiter-/Unterschicht und dem „elaborierten Sprachcode“ höherer Schichten. Ohne mich der
These Bernsteins, dass die Unterschichtsprache gegenüber dem oberschichttypischen
Sprachgebrauch „defizitär“ sei, anschließen zu wollen, weisen Darlegungen dieser Art darauf
1
Ein Problem, dessen man sich in wissenschaftlichen Beobachtungen durch die Berücksichtigung strenger
methodischer Leitprinzipien zu erwehren versucht.
7
hin, dass insbesondere Kinder unterer Schichtzugehörigkeit in negativer Weise von dem
erwähnten „Messfehler“ betroffen sein dürften. Autoren wie Hartmut Ditton (vgl. Ditton
2004: 258) und Elmar Lange (vgl. Lange 1986: 97) gehen entsprechend davon aus, dass ein
elaborierter Spachgebrauch schulischen Erfolg begünstigt, und dieser manifestiert sich
letztlich in Zensuren. Zudem scheinen Lehrererwartungen insbesondere das vielfach
angeprangerte Problem der schichtspezifischen Selektion zu verschärfen.2 Rudolf Weiss legte
in einer Untersuchung dar, dass Vorinformationen über die soziale Herkunft eines Schülers,
die Notengebung durch den Lehrer beeinträchtigen (vgl. Ditton 2004: 258). Wurde Lehrern in
subtiler Art und Weise mitgeteilt, dass der Schüler einem eher bildungsfernen Milieu
entstamme, so wirkte sich allein dies negativ auf die Benotung der angeblich von jenem
Schüler geschriebenen Klassenarbeit aus. Ohne dieses Lehrerverhalten als absichtsvoll
darstellen zu wollen, kann man hieraus folgern, dass bereits die schulische Benotungspraxis
einen gewissen Beitrag zur Stabilisierung des vorherrschenden Sozialgefüges auf der
Makroebene leistet und soziale Mobilität tendenziell beschränkt. In diesem Zusammenhang
sollte
ebenso
Erwähnung
finden,
dass
soziale
Selektivität
auch
bei
den
Übertrittsempfehlungen deutscher Grundschullehrer nachgewiesen werden konnte. Wie eine
Untersuchung von Otmar Preuß ergab, fallen bei gleichen Zensuren, die Eignungsurteile für
Kinder aus Arbeiterfamilien schlechter aus, als bei Kindern höherer sozialer Schichten (vgl
Ditton 2004: 264). Diesen Darlegungen zum Trotz lautet die gemeinschaftliche Forderung der
Kultusminister, dass „jedem Kind - ohne Rücksicht auf Stand und Vermögen der Eltern – der
Bildungsweg offen stehen [muss], der seiner Bildungsfähigkeit entspricht.“ (KMK –
Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik
Deutschland 2003: 4). Aus den Untersuchungen von Weiss und Preuß ist zu folgern, dass sich
dieser Appell insbesondere an die Person des Lehrers richten muss.
3. Wie Zensuren Sinn stiften…
3.1 Erwartungen
Die
geschilderten
Untersuchungen
bezüglich
des
Einflusses
von
Sprache
und
Vorinformationen über Schichtzugörigkeit lassen einen, scheinbar eng mit der Notengebung
verbundenen Aspekt, offensichtlich werden. Es handelt sich dabei um Erwartungen. Hierbei
2
Aktualität erfuhr das Thema insbesondere durch die Ergebnisse der Pisa-Studie, wobei zu berücksichtigen ist,
dass das Augenmerk dabei meist auf sog. „kulturellen Effekten“ liegt. Gegenstand der sich häufig auf Bourdieu
berufenden Kritik ist hier etwa die unzureichende Befähigung deutscher Schulen, ein in Familien unterer
Schichtzugehörigkeit bestehendes Defizit an „kulturellem Kapital“, welches sich in geringerer
Leistungsfähigkeit der Schüler niederschlägt, zu kompensieren.
8
möchte ich im Wesentlichen zwischen drei Dimensionen der Beeinflussung durch
Erwartungen unterscheiden:

Auf der Anwendung leistungsfremder Kriterien beruhende Erwartungen, die im
Zusammenhang mit der Lehrerpersönlichkeit und/oder spezifisch menschlichen
Unzulänglichkeiten stehen und die Notengebung beeinträchtigen

Erwartungen, die sich aus den früheren Zensuren eines Schülers konstruieren und das
Ausmaß möglicher Abweichungen von einmal erteilten Zensuren bei zukünftigen
Bewertungen einschränken

Erwartungen, die auf frühere Leistungen, Zensuren und/oder Verhaltensweisen des
Schülers, sowie auf spezifische Orientierungen des Lehrers zurückzuführen sind und
das Verhalten des Lehrers gegenüber dem Schüler dahingehend bestimmen, dass das
zukünftige Leistungsvermögen des Schülers beeinflusst und gleichzeitig der Horizont
möglicher Benotungen durch den Lehrer, verengt wird.
Der erste Punkt veranschaulicht sich etwa an dem erwähnten Phänomen der von
schichtspezifischen Gesichtspunkten geleiteten Benotung. Es lässt darauf schließen, dass in
Abhängigkeit von dem sozialen Status der Herkunftsfamilie, Erwartungen an die
Leistungsfähigkeit des Schülers konstruiert werden, die die Sensibilität des Lehrers für
tatsächlich erbrachte Leistungen herabsetzen.
Bei Punkt zwei sind wir auf einer Ebene angelangt, bei der die Zensur selbst konstituierenden
Charakter annimmt. Ein Lehrer wird sich bei späteren Benotungen, auch aus ökonomischen
Gründen, stets auf früher erteilte Zensuren zurückbesinnen. Ein realer Leistungszuwachs bzw.
Leistungsabfall des Schülers wird so jedoch durch die Erwartungen des Lehrers an sein
Leistungsniveau, bei der Notengebung relativiert. Die Neigung, an einem einmal gefällten
Urteil
auch
zu
späteren
Zeitpunkten
festzuhalten,
bezeichnet
die
sogenannte
„Perseverationstendenz“. Diese schlägt sich insbesondere bei unmittelbar aufeinander
folgenden Beurteilungen der Leistungen eines Schülers nieder und äußert sich konkret darin,
dass spätere Zensuren nicht oder nur kaum von einer einmal erteilten Zensur abweichen (vgl.
Ziegenspeck 1999: 177). Ähnliches offenbart sich bei dem sogenannten „Reihungseffekt“, der
sich häufig in der Benotung von Klassenarbeiten bzw. Klausuren niederschlägt (vgl. Wagener
2003: 24). Hier wirken sich die Zensuren der zuerst benoteten Arbeiten, auf die Beurteilung
der darauffolgenden
aus. Ein
Unterschied
besteht
hier jedoch darin,
dass
im
Beurteilungsprozess eine fremde Leistung, den Maßstab für die Bewertung anderer Arbeiten
9
bildet, also entsprechende Erwartungen an das Leistungsniveau weckt. Wenn ein Lehrer bei
der Begutachtung von Aufsätzen etwa gleich zu Beginn eine sprachlich herausragende,
wohlstrukturierte Arbeit vor sich hat, wird er sich beim Lesen des zweiten, weniger guten
Aufsatzes unweigerlich daran erinnern und womöglich zu einem unangemessen strengen
Urteil kommen. Das eigentliche Problem liegt in diesem Fall demnach eher in einer
übermäßigen Orientierung an der sozialen Bezugsnorm.
Der dritte Punkt drückt den nicht zu unterschätzenden Einfluss der Leistungsrückmeldungen
auf das Selbstbild des Schülers aus. Ein Lehrer wird nach ersten Urteilen oder auch
Vorinformationen
über
die
bisherigen
Zensuren
eines
Schülers,
eine
gewisse
Erwartungshaltung bezüglich zukünftiger Leistungen entwickeln. Nun besteht die Neigung,
diese Erwartungen auf mitunter subtile Art und Weise, dem betreffenden Schüler zu
kommunizieren. Dies kann sich etwa darin äußern, dass die Schülerleistungen im
Unterrichtsgeschehen verstärkt positiv bzw. negativ kommentiert werden. Der Schüler wird
wiederum sein Anspruchsniveau an die Erwartungen des Lehrers angleichen, was sich
mittelfristig auf sein „reales“ Leistungsvermögen auswirkt. Dann zeigt der sogenannte
„Pygmalion-Effekt“ seine Wirkung (Wagener 2003: 22).
3.2 Zensuren als Eignungsprädikat
Zensuren können, wie wir geklärt, haben zum Prädiktor künftiger Beurteilungen, aber auch
Bezugspunkt gewichtigerer Entscheidungen werden. Sie ebnen erst den Weg für eine Vielzahl
an Auslesepraktiken. Dies verdeutlicht sich in besonderem Maße an den Übertrittsschwellen
des Schulsystems. So gelten in erster Linie Zensuren als kommunikativer Bezugspunkt, wenn
gegen Ende der Grundschulzeit, Aussagen über die Eignung eines Schülers für eine
bestimmte Schulform getroffen werden. Der Lehrer wird sein Urteil in der Regel als
leistungsgerecht empfinden und vertreten, während Außenstehende die Güte der
Leistungsmessung, in Ermangelung an Nachweisen, nicht ernsthaft in Frage stellen können.
Schulnoten gewinnen in diesem Sinne einen gewissen Faktizitätscharakter. Dies wird dadurch
bekräftigt, dass in mittlerweile der Hälfte aller Bundesländer das Lehrerurteil bindend ist.
Dieser Stellenwert der Zensuren wird in Bayern gar in entsprechenden Verordnungen
verfestigt. So bestimmt sich die weitere Schullaufbahn landesweit über das Erreichen
bestimmter Notendurchschnitte (Schulberatung Bayern: 3). Diese werden durch das
arithmetische Mittel der Zensuren des Deutsch-, Mathematik- und „Heimat- und
Sachunterrichts“ gebildet. Um die uneingeschränkte Berechtigung für den Zugang zum
10
Gymnasium zu erhalten, ist dabei ein Notendurchschnitt von 2,33 erforderlich, für die
Realschule ein Schnitt von 2,66. Bei negativen Abweichungen von diesen Werten, besteht bis
zu einem Notendurchschnitt von 2,66 für das Gymnasium, bzw. 3,00 für die Realschule, die
Möglichkeit, bei erfolgreichem Absolvieren eines dreitägigen „Probeunterrichts“ in den
Fächern Deutsch und Mathematik doch noch die jeweilige Eignung zu erhalten. Der
sogenannte „Probeunterricht“, der eher die Charakteristika einer Aufnahmeprüfung aufweist,
veranlasst wiederum zur Produktion neuer Zahlen und gilt dann als erfolgreich abgeschlossen,
wenn der Schüler in dem einen Fach mindestens die Note „3“ und in dem anderen mindestens
eine „4“ erhält.
Zensuren, die ihrerseits schon aufgrund der geschilderten Messprobleme, nur in einem eher
losen Zusammenhang zu den einzelnen Fachkompetenzen stehen, werden in dem
beschriebenen Sachverhalt zum Ansatzpunkt weiterer Berechnungen, deren Ergebnisse
zukunftsweisende Bedeutung haben. Diese beruht auf den Konsequenzen, die unmittelbar aus
ihnen folgen. Es ist nicht länger die angreifbare Schulempfehlung durch den Lehrer, sondern
eine einzige, auf kühler Berechnung basierende Zahl, der man nicht länger Befangenheit
unterstellen kann, die diesen Platz einnimmt. Zweifellos befreit diese Rechenpraktik den
Lehrer von schwierigen Entscheidungen und entlastet ihn damit in seiner Verantwortung,
gleichwohl geht jedoch die Frage unter, ob man durch Bildung solcher „Notendurchschnitte“
wirklich umfassende Auskünfte über das allgemeine Leistungspotential eines Schülers
gewinnen und damit eine leistungsgerechte Selektion erreichen kann.
Zum einen muss betont werden, dass bei der Berechnung lediglich die Zensuren von drei
bestimmten Fächern Berücksichtigung finden, was daraufhindeutet, dass der Selektion ein
gewisser Konsens über hochzuhaltende Werte zugrunde liegt. Wenn ein Schüler etwa über
eine künstlerische Begabung verfügt und gute Zensuren in dem entsprechenden Bereich
aufweist, wirkt sich dies in keiner Weise positiv auf den Wert aus, der seine weitere
Schullaufbahn bestimmt. Auch positive und negative Entwicklungen von Leistungen werden
durch einen Notendurchschnitt nicht erfasst.
Zudem muss man sich die Frage stellen, ob die Bildung des arithmetischen Mittels bei
Schulnoten mathematisch überhaupt zulässig ist. In den bisherigen Ausführungen wurde
bereits dargelegt, dass Schulnoten keineswegs als objektive Messergebnisse anzusehen sind,
was dann gegeben wäre, wenn eine bestimmte Leistung immer gleich benotet werden würde.
Auch die Abstände zwischen den Zensurengraden können von Lehrer zu Lehrer, je nach
Beurteilungstendenz, variieren (vgl. Ziegenspeck 1999: 120). Man kommt somit zu dem
Schluss, dass Schulnoten höchstens eine Rangordnung vermitteln können, die Notenskala sich
11
somit auf einem Ordinal-Skalenniveau befindet, womit die Bildung eines solchen
Durchschnittswerts eigentlich nicht zulässig ist (vgl. Ziegenspeck 1999: 121). Die sog.
„Durchschnittsnote“ ist so gesehen ein Wert, der produziert wird und sich nicht etwa aus den
Daten ableitet. Dennoch setzt man sich in der Praxis hierüber häufig hinweg, so etwa auch
zum Zwecke der Verteilung von Studienplätzen unter der Berücksichtigung verfügbarer
Kapazitäten, wie es bei der „Zentralstelle für die Vergabe von Studienplätzen“ (ZVS)
geschieht.
In dem Begriff der „Eignung“ spiegelt sich eine Doppeldeutigkeit, die Zensuren zukommt,
wider.
Zum
einen
sollen
sie
Schülern,
Eltern,
Lehrern
und
außerschulischen
Interessensgruppen, etwa Unternehmen, in ihrer Rückmeldefunktion Aufschluss über das
erreichte Leistungsniveau und Lernfortschritte geben, zum anderen wird ihnen eine gewisse
prognostische Funktion beigemessen.
So leitet der Schüler aus den Zensuren z.B. Einschätzungen bezüglich seiner Lernstrategien
und Fächerwahl ab. Der Lehrer wird in Folge seiner Notenvergabe zwischen leistungsstarken
und leistungsschwachen Schülern differenzieren und sich etwa um entsprechende Förderung
bemühen. Gleichzeitig dient ihm die scheinbar objektive „Leistungsfeststellung“ zur
Abschätzung des Unterrichterfolgs. Eltern bieten sie durch ihre Zahlenform, eindeutige (wenn
auch fragwürdige) Möglichkeiten des Vergleichs zwischen aktuellen und früheren Leistungen
ihres Zöglings. Sie leisten ihnen Orientierungshilfen für ihre Erziehung. Die Wirtschaft zieht,
auf Grundlage von Zensuren und Zeugnissen, Rückschlüsse auf die Qualifikation eines
Bewerbers für einen bestimmten Posten. Dies birgt natürlich zugleich eine Erwartungshaltung
gegenüber dem Maß, in dem ein Schüler/Student mit bestimmten Zensuren, die ihm zukünftig
aufgetragenen Aufgaben in einem Betrieb erledigen kann. Doch wir können uns zur
Veranschaulichung auch weiter unserem Beispiel zuwenden:
So hält die (Durchschnitts-)Note an der Übertrittschwelle nach dem vierten Schuljahr auch als
ein Indikator für den zu erwartenden Erfolg in einer Schulform her. Die bayerischen Schulen
orientieren sich bei dieser Eignungsprognose an einer sachlichen bzw. kriteriumsorientierten
Bezugsnorm. So suggeriert die Festlegung von „Durchschnittsnoten“, die zum Besuch einer
bestimmten
weiterführenden
Schule
berechtigen,
die
Existenz
verbindlicher
Kompetenzstandards und setzt voraus, dass ein Notenwert Auskünfte über den Grad der
Entsprechung der Schülerleistung erlaubt.
Ein gewisser Pragmatismus liegt dagegen der Verwendung der Abiturdurchschnittsnote bei
der Vergabe von Studienplätzen zugrunde. Die Bildungsexpansion hatte zur Folge, dass
immer mehr Jugendliche, die Schule mit dem Abitur verließen und damit den formalen
12
Erfordernissen zur Aufnahme eines Hochschulstudiums gerecht wurden. Dies hat den
Nebeneffekt, dass es in bestimmten Fächern, an vielen Hochschulen zu Kapazitätsengpässen
kommt, was schließlich eine Selektion unter den Studienbewerbern notwendig macht. Auf
Grundlage der Anzahl der Bewerber für ein Studienfach und den vorhandenen
Aufnahmekapazitäten, ermittelt man, jedes Semester neu, eine Zulassungsgrenze. Diese gibt
eine bestimmte Anzahl an Wartesemestern, sowie einen Abiturnotendurchschnitt vor, der für
die Immatrikulation mindestens benötigt wird. Sofern beispielsweise hundert Studienplätze
frei sind, erhalten die hundert Abiturienten mit dem besten Notendurchschnitt Zugang zum
Studium, wenn man die Zahl der Wartesemester aus Gründen der Veranschaulichung jetzt
einmal außen vor lässt. Wie zu erkennen ist, definiert sich in diesem Fall, anders als bei dem
Schulübertritt in Bayern, das Zulassungskriterium über die Notendurchschnitte der Bewerber
selbst. Man kann daher sagen, dass die Auswahl nach einer sozialen Bezugsnorm geschieht.
3.3 Der sinnstiftende Charakter der Schulnote
Wenn es denn wirklich darum ginge, die Leistungsfähigsten herauszufiltern, würde eine
Auslese nach diesem Prinzip nur Sinn machen, wenn der Vergleich unter den Bewerbern auch
schon in der Schule bestanden hätte und die soziale Bezugsnorm alleiniger Maßstab aller
Benotungen gewesen wäre oder aber die schulischen Beurteilungen, unter der Bedingung
vollkommen vereinheitlichter Leistungsanforderungen, ausschließlich an einer sachlichen
bzw. kriteriumsorientierten Bezugsnorm orientiert gewesen wären. Zudem müsste die
Schulleistungsmessung den Gütekriterien entsprechen, was sich, wie wir nun wissen, nicht
bestätigt.
Im bayerischen Übertrittsverfahren geht man insofern weiter, als das man den Anspruch
erhebt, mittels Bildung eines Notendurchschnitts, die „Eignung“ eines Schülers für eine
bestimmte Schulform festzustellen. Noten können jedoch, sofern sie nicht auf vollkommen
objektiver, reliabler und valider Messung basieren, sowie ausschließlich unter Anlegung einer
sachlichen Bezugsnorm zustande gekommen sind, nicht das Leistungsniveau, geschweige
denn das Leistungspotential eines Schülers, repräsentieren. Sie orientieren sich ausschließlich
an den abgerufenen Leistungen in Unterricht, Klassenarbeiten und Klausuren in einer
begrenzten Auswahl an Schulfächern, die Personen aus der Mittelschicht, mehr oder weniger
nach den unpräzisen Vorgaben der jeweiligen Kultusministerien und Bezirksregierungen
lehren. Sie lassen sich daher nur unter Tolerierung spezifischer, in ihrem Ausmaß nicht
abschätzbarer
Verzerrungen,
sowie
eines
13
oftmals
nicht
wahrgenommenen
Informationsverlusts bilden. Der Anspruch der „Eignungsfeststellung“ durch Ziffernzensuren
kann demnach in Wirklichkeit nicht eingelöst werden. Um die Leistungsdifferenzierung durch
Schulnoten zu rechtfertigen, muss in der schulischen Kommunikation jedoch vor allem der
Repräsentationscharakter der Schulnoten Betonung finden.
Ziffernzensuren erweisen sich für die Organisation Schule, bezüglich ihrer Selektionsaufgabe,
als funktional. Im Gegensatz zu den, von vielen Kritikern geforderten, sprachlichen
Beurteilungsformen, ermöglichen sie erst die Anwendung mathematischer Verfahren, wie
etwa die Bildung eines Durchschnitts, was hierbei eine erhebliche Effizienzsteigerung
bedeutet. Sie schaffen erst die eindeutigen Vergleichsmöglichkeiten, die Institutionen wie die
ZVS zur Verteilung von Studienbewerbern auf verfügbare Kapazitäten benötigen und stellen
Wirklichkeitsgrundlagen, etwa für Entscheidungen über die weitere Schullaufbahn eines
Kindes dar. Nicht nur Institutionen, sondern auch den Schülern offenbaren sich die
unmittelbaren Vergleichsmöglichkeiten, die die Ziffernzensur bietet. Durch Vergleich seiner
eigenen
Noten
kann
der
Schüler
Rückschlüsse
auf
die
Beurteilung
seiner
Leistungsentwicklung ziehen, während ihm der Vergleich seiner Zensuren mit den Noten
seiner Mitschüler, Auskunft über sein relatives Leistungsniveau im Klassenverbund liefert.
Die an Zahlen orientierte Kommunikation über Leistung irritiert desweiteren auch das
Bewusstseinssystem des Schülers. Man kann es als Sozialisationseffekt der Schule ansehen,
dass der Schüler erlernt, aus einer zahlenförmigen Darstellung, Rückschlüsse auf die
Beurteilung seiner Leistungen zu ziehen. Er stellt Handlungsmotive und Arbeitsverhalten auf
die periodische Vergabe von Zensuren ein. So wird ein Schüler bei Kenntnis des Termins der
Zeugniskonferenz, möglicherweise besonderes Engagement in den Wochen zuvor an den Tag
legen, um gezielt Einfluss auf seine Zensur zu nehmen, beispielsweise um statt einer „5“, eine
„4“ zu erhalten und damit versetzt zu werden. Man könnte sich in diesem Zusammenhang
auch dazu veranlasst sehen, von dem Einwirken des sogenannten „heimlichen Lehrplanes“ zu
sprechen. Abgesehen von ihrer erzieherischen Funktion, der positiven und negativen
Sanktionierung der Lernbereitschaft, kann die Notenvergabe demnach auch bewirken, dass
Schüler bestimmte Strategien entwickeln, damit die Note für sie, ohne großen Lernaufwand,
günstig ausfällt. Sie erlernen derartige Zahlenkonstrukte insofern zu durchblicken, als dass sie
ihrer „Indikatoren“ gewahr werden und sich gezielt auf die Manipulation dieser konzentrieren
können.
Die tiefe Verankerung der Schulnotenskala im Bewusstsein der Allgemeinheit verdeutlicht
sich außerhalb des schulischen Kontexts auch daran, dass es für gewöhnlich keinerlei
Erläuterungen bedarf, wenn man sie als Beurteilungsmaßstab heranzieht. So findet sie
14
beispielsweise auch häufig in standardisierten Fragebögen der Markt- und Sozialforschung
Verwendung.
Auch in der Forschung über die schulische Reproduktion sozialer Ungleichheit, orientiert man
sich an Noten, die Schülern unterschiedlicher sozialer Herkunft zugeteilt werden, und kommt,
wie wir dargelegt haben, zu dem Ergebnis, dass die Person des Lehrers entscheidenden Anteil
an der Selektion nach leistungsfremden Kriterien hat. Würden Beurteilungen, wie es von
vielen Autoren gefordert wird, in rein textlicher Form abgefasst werden, wären Vergleiche
wie sie in derartigen Arbeiten vollzogen werden, nicht ohne weiteres möglich. Es wäre jedoch
entsprechend davon auszugehen, dass das Problem der Chancenungleichheit weiterhin
Bestand hat.
4. Schluss
In der vorhandenen Literatur zur schulischen Beurteilungspraxis sind Schulnoten
überwiegend Gegenstand von Kritik, die sich in erster Linie auf ihr mangelhaftes
Repräsentationsvermögen bezieht. Der derzeitige Forschungsstand belegt, dass die schulische
„Leistungsmessung“ den Gütekriterien der Objektivität, Validität und Reliabilität nicht
genügt. Die Notenvergabe scheint mehr oder weniger durch menschliche Unzulänglichkeiten
in der Leistungserfassung geprägt, was die Vergleichbarkeit der Zensuren stark herabsetzt.
Dennoch wird der Schulnote gegenwärtig ein gewisser Faktizitätscharakter beigemessen, der
sich darin äußert, dass gar immer mehr gewichtige Konsequenzen/Entscheidungen aus ihnen
abgeleitet werden. Zeugnisse und Zensuren haben dabei prägenden Einfluss auf die
Lebenschancen des Einzelnen.
Dass sich diese als Selektionsinstrument auf breiter Basis durchgesetzt haben, mag nicht
zuletzt ihrer Praktikabilität geschuldet sein. Alternative Beurteilungsformen, wie sie viele
Kritiker fordern, vermögen nicht in gleicher Form Komplexität zu reduzieren, d.h.
Vergleichsmöglichkeiten zu schaffen und die notwendigen Selektionsentscheidungen zu
vereinfachen. So ist es nicht verwunderlich, dass die Anstengungen momentan eher auf eine
Verbesserung
des
vorherrschenden
Prinzips,
im
Sinne
einer
leistungsgerechteren
Notenvergabe, abzielen. Das Bestreben nach mehr Bildungsgerechtigkeit äußert sich aktuell
etwa in der flächendeckenden Einführung des sogennanten „Zentralabiturs“, zu dessen
Kernelementen die Vereinheitlichung der Prüfungsinhalte, sowie der Bewertungspraxis
zählen.
15
Doch gerade bei der so bedeutsamen „Abiturdurchschnittsnote“ ist nach wie vor unklar, was
man überhaupt mit ihr misst. Einerseits ist aus genannten Gründen allein schon die Bildung
eines Notendurchschnitts eine fragwürdige Angelegenheit. Andererseits finden hierbei auch
nur Zensuren eines bestimmten Zeitraumes, die zudem noch unterschiedliche Gewichtung
erfahren, Berücksichtigung. Es erscheint insofern angemessen von einem „Konstrukt“ zu
sprechen, dass erst durch die Berechnungen selbst erzeugt wird.
Wer sich einmal mit der Berechnung eines solchen „Durchschnitts“ befasst hat, wird schnell
merken, dass es sich dabei um ein höchst kompliziertes und undurchsichtiges Unterfangen
handelt. Einem informierten Schüler, der aus diesen Rechenformeln, Handlungskonsequenzen
ableitet, kann man getrost bereits gewisse kalkulative Lesefähigkeiten attestieren. Er wird
seine Anstrengungen auf Kurse und Prüfungen konzentrieren, die bei der Berechnung seiner
Durchschnittsnote in besonderem Maße relevant sind; um noch einmal zu illustrieren,
welchen Einfluss Schulnoten auf die Handlungsdispositionen ihrer Adressaten haben können.
Einer leistungsgerechten Benotung ist, zugespitzt formuliert, insbesondere der Lehrer, in
seiner Menschlichkeit hinderlich. Hier ist insbesondere die „mündliche Note“ hervorzuheben,
bei der die Gefahr des Einwirkens menschlicher Unzulänglichkeiten am größten ist.
Konsequenterweise müsste man den Prozess des Auswertens und Interpretierens einer
Unterrichtsleistung von der Person des Lehrers lösen, um zu einer sachbezogenen,
„repräsentativen“ Beurteilung gelangen zu können. Dies wäre etwa dann gegeben, wenn man
die Aufgabe des Beobachtens, die beim Lehrer allzu oft mit der Interpretation einherzugehen
scheint, an ein technisches Aufzeichnungsmedium abtritt, welches zugleich in mechanischkalter Präzision die Anzahl korrekter und inkorrekter Aussagen misst und eine
Notenzuordnung mittels einheitlicher Algorithmen trifft. Es wäre jedoch zu erwarten, dass das
Schweigen der Kritiker auch hier nicht lange andauern würde.
16
Literatur

Ditton, Hartmut 2004: Der Beitrag von Schule und Lehrern zur Reproduktion von
Bildungsungleichheit. In: Becker, Rolf / Lauterbach, Wolfgang (Hrsg.), Bildung als
Privileg? Erklärungen und Befunde zu den Ursachen der Bildungsungleichheit.
Wiesbaden, VS Verlag.

Ingenkamp,
Karlheinz
1989:
Die
Fragwürdigkeit
der
Zensurengebung.
Weinheim/Basel, Beltz Verlag.

KMK – Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der
Bundesrepublik Deutschland, 2003: Übergang von der Grundschule in die Schulen des
Sekundarbereichs I. Informationsunterlage. Bonn.

Krope, Peter 1976: Zensur, Ausbildung und Gesellschaft. Bochum, Berg-Verlag.

Lange, Elmar 1986: Soziologie des Erziehungswesens. Stuttgart, B. G. Teubner.

Schulberatung
Bayern
2009:
Das
„neue“
Übertrittsverfahren
in
Bayern.
http://www.schulberatung.bayern.de/imperia/md/content/schulberatung/pdf/uebertritts
verfahren_2009.pdf (28.10.2009)

Wagener, Matthea 2003: Ziffernzensuren oder verbale Beurteilung. Weinheim/Basel.
Beltz Verlag

Ziegenspeck, Jörg W. 1999: Handbuch Zensur und Zeugnis in der Schule. Bad
Heilbrunn, Julius Klinkhardt.
17