Normreferenzierter Test
Normreferenziert bezieht sich auf standardisierte Tests, die darauf ausgelegt sind, Testteilnehmer in Relation zueinander zu vergleichen und einzustufen. Normreferenzierte Tests geben an, ob die Testteilnehmer besser oder schlechter als ein hypothetischer Durchschnittsschüler abgeschnitten haben, was durch den Vergleich mit den Leistungsergebnissen einer statistisch ausgewählten Gruppe von Testteilnehmern, typischerweise des gleichen Alters oder der gleichen Klassenstufe, die bereits an der Prüfung teilgenommen haben, ermittelt wird.
Die Berechnung der normreferenzierten Ergebnisse wird als „Normierungsprozess“ bezeichnet, und die Vergleichsgruppe ist als „Normierungsgruppe“ bekannt. Normierungsgruppen umfassen typischerweise nur eine kleine Teilmenge früherer Testteilnehmer, nicht alle oder sogar die meisten früheren Testteilnehmer. Testentwickler verwenden eine Vielzahl statistischer Methoden, um Normierungsgruppen auszuwählen, Rohwerte zu interpretieren und Leistungsniveaus zu bestimmen.
Normierungsbezogene Ergebnisse werden in der Regel als Prozentsatz oder Prozentrang angegeben. Beispielsweise hat ein Schüler, der im siebzigsten Perzentil liegt, genauso gut oder besser abgeschnitten als siebzig Prozent der anderen Testteilnehmer desselben Alters oder derselben Klassenstufe, und dreißig Prozent der Schüler haben besser abgeschnitten (wie durch die Ergebnisse der Normierungsgruppe bestimmt).
Normbezogene Tests verwenden oft ein Multiple-Choice-Format, obwohl einige auch offene Fragen mit kurzen Antworten enthalten. Sie basieren in der Regel auf einer Form von nationalen Standards, nicht auf lokal festgelegten Standards oder Lehrplänen. IQ-Tests gehören zu den bekanntesten normreferenzierten Tests, ebenso wie Entwicklungsscreening-Tests, die verwendet werden, um Lernschwächen bei Kleinkindern zu erkennen oder die Berechtigung für sonderpädagogische Förderung zu bestimmen. Einige wichtige normreferenzierte Tests sind der California Achievement Test, der Iowa Test of Basic Skills, der Stanford Achievement Test und TerraNova.
Nachfolgend einige repräsentative Beispiele, wie normreferenzierte Tests und Ergebnisse verwendet werden können:
- Um die Bereitschaft eines kleinen Kindes für die Vorschule oder den Kindergarten zu bestimmen. Diese Tests können so konzipiert sein, dass sie die mündlich-sprachlichen Fähigkeiten, die visuell-motorischen Fähigkeiten und die kognitive und soziale Entwicklung messen.
- Um grundlegende Lese-, Schreib- und Rechenfähigkeiten zu beurteilen. Die Testergebnisse können für eine Vielzahl von Zwecken verwendet werden, wie z. B. zur Messung des akademischen Fortschritts, zur Festlegung von Kurszuweisungen, zur Bestimmung der Bereitschaft für einen Klassenaufstieg oder zur Ermittlung des Bedarfs an zusätzlicher akademischer Unterstützung.
- Zur Identifizierung spezifischer Lernbehinderungen, wie z. B. Autismus, Legasthenie oder nonverbale Lernbehinderung, oder zur Bestimmung der Eignung für sonderpädagogische Leistungen.
- Zur Entscheidung über die Eignung für ein Studienprogramm oder die Zulassung zu einem College (in diesen Fällen werden die normbezogenen Ergebnisse im Allgemeinen zusammen mit anderen Informationen über einen Schüler ausgewertet). Die Ergebnisse der SAT- oder ACT-Prüfungen sind ein gängiges Beispiel.
Normreferenzierte Tests im Vergleich zu kriterienreferenzierten Tests
Normreferenzierte Tests sind so konzipiert, dass sie die Testteilnehmer auf einer „Glockenkurve“ einordnen, d.h. eine Verteilung der Ergebnisse, die, wenn sie grafisch dargestellt wird, dem Umriss einer Glocke ähnelt, ein kleiner Prozentsatz der Schüler erbringt gute Leistungen, die meisten erbringen durchschnittliche Leistungen und ein kleiner Prozentsatz erbringt schlechte Leistungen. Um jedes Mal eine Glockenkurve zu erzeugen, werden die Testfragen sorgfältig entworfen, um die Leistungsunterschiede zwischen den Testteilnehmern zu betonen und nicht, um festzustellen, ob die Schüler bestimmte Lernstandards erreicht, bestimmten Stoff gelernt oder bestimmte Fähigkeiten und Kenntnisse erworben haben. Tests, die die Leistung anhand eines festen Satzes von Standards oder Kriterien messen, werden als kriterienbezogene Tests bezeichnet.
Kriterienbezogene Testergebnisse basieren oft auf der Anzahl der richtigen Antworten, die von den Schülern gegeben werden, und die Punktzahl kann als Prozentsatz der gesamten möglichen Anzahl von richtigen Antworten ausgedrückt werden. Bei einer normreferenzierten Prüfung hingegen würde die Punktzahl widerspiegeln, wie viele mehr oder weniger richtige Antworten ein Student im Vergleich zu anderen Studenten gegeben hat. Hypothetisch gesehen, wenn alle Studenten, die an einem normreferenzierten Test teilgenommen haben, schlechte Leistungen erbracht haben, würden die am wenigsten schlechten Ergebnisse die Studenten im höchsten Perzentil einordnen. Ähnlich verhält es sich, wenn alle Schüler außerordentlich gut abschneiden, dann würde die am wenigsten starke Leistung die Schüler im niedrigsten Perzentil einordnen.
Es ist zu beachten, dass normreferenzierte Tests nicht die Lernleistung oder den Lernfortschritt einer ganzen Gruppe von Schülern messen können, sondern nur die relative Leistung von Individuen innerhalb einer Gruppe.
Reform
Normreferenzierte Tests wurden in der Vergangenheit verwendet, um zwischen Schülern zu unterscheiden, oft zum Zweck der Kurseinteilung, der Eignung für ein Programm oder der Aufnahme in eine Schule. Da normreferenzierte Tests jedoch so konzipiert sind, dass sie die Leistungen der Schüler auf einer relativen Skala – d.h, Da normbezogene Tests jedoch so konzipiert sind, dass sie die Leistungen der Schüler auf einer relativen Skala – d.h. in Relation zu den Leistungen anderer Schüler – einstufen, sind sie von vielen Schulen und Staaten zugunsten von kriterienbezogenen Tests aufgegeben worden, die die Leistungen der Schüler in Relation zu einer Reihe von festgelegten Kriterien oder Standards messen.
Es ist anzumerken, dass normbezogene Tests typischerweise nicht die Form von standardisierten Tests sind, die weithin verwendet werden, um staatliche oder bundesstaatliche Richtlinien – wie z.B. den No Child Left Behind Act – zu erfüllen, die darauf abzielen, Schulleistungen zu messen, „Leistungslücken“ zu schließen oder Schulen für die Verbesserung der Lernergebnisse der Schüler verantwortlich zu machen. In den meisten Fällen werden für diese Zwecke kriterienbezogene Tests verwendet, da das Ziel darin besteht, festzustellen, ob die Schulen den Schülern erfolgreich das beibringen, was von ihnen erwartet wird.
In ähnlicher Weise sind auch die Tests, die entwickelt werden, um die Leistungen der Schüler im Hinblick auf die Common Core State Standards zu messen, kriterienbezogene Prüfungen. Einige Testentwickler werben jedoch für ihre normreferenzierten Prüfungen – wie z.B. TerraNova Common Core – als eine Möglichkeit für Lehrer, den Lernfortschritt zu „benchmarken“ und festzustellen, ob die Schüler auf dem richtigen Weg sind, um in den auf den Common Core basierenden Prüfungen gut abzuschneiden.
Debatte
Während normreferenzierte Tests nicht im Mittelpunkt der laufenden nationalen Debatten über „high-stakes testing“ stehen, sind sie dennoch Gegenstand vieler Debatten. Die wesentliche Meinungsverschiedenheit besteht zwischen denjenigen, die normbezogene Tests als objektive, gültige und faire Maßstäbe für Schülerleistungen ansehen, und denjenigen, die glauben, dass das Verlassen auf relative Leistungsergebnisse ungenau, wenig hilfreich und unfair ist, insbesondere wenn es darum geht, wichtige Bildungsentscheidungen für Schüler zu treffen. Während sich ein Teil der Debatte darauf konzentriert, ob es ethisch angemessen oder sogar pädagogisch sinnvoll ist, das Lernen eines einzelnen Schülers in Relation zu anderen Schülern zu bewerten (anstatt die individuelle Leistung in Relation zu festen und bekannten Kriterien zu bewerten), konzentriert sich ein Großteil der Debatte auch darauf, ob es in den Vereinigten Staaten ein allgemeines Übervertrauen auf standardisierte Testergebnisse gibt und ob ein einzelner Test, egal wie er gestaltet ist, verwendet werden sollte – unter Ausschluss anderer Maßnahmen – um die Leistung von Schulen oder Schülern zu bewerten.
Es sollte beachtet werden, dass die wahrgenommene Leistung in einem standardisierten Test potenziell manipuliert werden kann, unabhängig davon, ob ein Test norm- oder kriterienbezogen ist. Wenn z.B. eine große Anzahl von Schülern bei einem Test schlecht abschneidet, können die Leistungskriterien – d.h. die Messlatte für „Bestehen“ oder „Beherrschen“ – gesenkt werden, um die wahrgenommene Leistung zu „verbessern“, auch wenn die Schüler nicht mehr lernen oder bessere Leistungen erbringen als frühere Testteilnehmer. Wenn zum Beispiel ein standardisierter Test, der in der elften Klasse durchgeführt wird, Leistungsstandards verwendet, die als gleichwertig mit den Lernerwartungen der achten Klasse angesehen werden, wird es den Anschein haben, dass die Schüler gute Leistungen erbringen, obwohl der Test in Wirklichkeit die Lernleistung nicht auf einem ihrem Alter oder ihrer Klasse entsprechenden Niveau gemessen hat. Aus diesem Grund ist es wichtig, die Kriterien zu untersuchen, die zur Bestimmung der „Leistung“ in einem bestimmten Test verwendet werden – insbesondere dann, wenn ein Test als „High Stakes“ gilt, da die Motivation, die wahrgenommene Testleistung zu manipulieren, größer ist, wenn die Ergebnisse mit Sanktionen, Mittelkürzungen, öffentlicher Blamage oder anderen negativen Konsequenzen verbunden sind.
Die folgenden Argumente sind typisch für die Befürworter normbezogener Tests:
- Normbezogene Tests sind relativ kostengünstig zu entwickeln, einfach zu verwalten und leicht auszuwerten.
- Die Qualität normbezogener Tests ist in der Regel hoch, da sie von Testexperten entwickelt, erprobt und überarbeitet werden, bevor sie bei Schülern eingesetzt werden.
- Normreferenzierte Tests können helfen, Schüler zu differenzieren und diejenigen zu identifizieren, die besondere pädagogische Bedürfnisse oder Defizite haben, die spezielle Unterstützung oder Lernumgebungen erfordern.
- Die Tests sind eine objektive Bewertungsmethode, die Voreingenommenheit oder Bevorzugung bei pädagogischen Entscheidungen verringern kann. Wenn es zum Beispiel nur begrenzte Plätze in einem Begabtenförderungsprogramm gibt, ist eine transparente Art der Entscheidungsfindung, allen Schülern den gleichen Test zu geben und den Schülern mit den höchsten Punktzahlen den Zugang zu ermöglichen.
Die folgenden Argumente sind repräsentativ für die Art von Argumenten, die typischerweise von Kritikern normbezogener Tests vorgebracht werden:
- Obwohl Testexperten und Testentwickler davor warnen, dass wichtige Bildungsentscheidungen nicht auf der Grundlage eines einzigen Testergebnisses getroffen werden sollten, werden normbezogene Ergebnisse in Schulen oft missbraucht, wenn es darum geht, kritische Bildungsentscheidungen zu treffen, wie z.B. die Beförderung oder den Verbleib in einer Klasse, was potenziell schädliche Konsequenzen für einige Schüler und Schülergruppen haben kann.
- Normreferenzierte Tests ermutigen Lehrer dazu, Schüler im Sinne einer Glockenkurve zu betrachten, was dazu führen kann, dass sie die akademischen Erwartungen für bestimmte Gruppen von Schülern, insbesondere für Schüler mit besonderen Bedürfnissen, Englischlernende oder Minderheitengruppen, senken. Und wenn die akademischen Erwartungen Jahr für Jahr immer weiter gesenkt werden, kann es sein, dass die Schüler dieser Gruppen nie zu ihren Mitschülern aufschließen und so eine sich selbst erfüllende Prophezeiung entsteht. Eine verwandte Diskussion finden Sie unter Hohe Erwartungen.
- Multiple-Choice-Tests – das vorherrschende normreferenzierte Format – sind besser geeignet, um erinnerte Fakten zu messen als komplexere Formen des Denkens. Folglich fördern normbezogene Tests das Auswendiglernen und Auswendiglernen in den Schulen gegenüber anspruchsvolleren kognitiven Fähigkeiten wie Schreiben, kritisches Lesen, analytisches Denken, Problemlösung oder Kreativität.
- Übermäßiges Vertrauen auf normbezogene Testergebnisse kann zu unbeabsichtigter Diskriminierung von Minderheitengruppen und einkommensschwachen Schülern führen, die beide dazu neigen, mit größeren Bildungshürden konfrontiert zu werden als nicht-minderheitliche Schüler aus einkommensstärkeren Haushalten. Viele Pädagogen haben zum Beispiel argumentiert, dass die übermäßige Verwendung von normbezogenen Tests zu einer signifikanten Überrepräsentation von Minderheitenschülern in sonderpädagogischen Programmen geführt hat. Andererseits führt die Verwendung normbezogener Ergebnisse zur Bestimmung der Platzierung in Begabtenförderungsprogrammen oder anderen „angereicherten“ Lernmöglichkeiten zu einer Unterrepräsentation von Minderheiten und einkommensschwächeren Schülern in diesen Programmen. Ebenso können Schüler aus einkommensstärkeren Haushalten einen unfairen Vorteil im College-Zulassungsverfahren haben, weil sie sich teure Testvorbereitungsdienste leisten können.
- Ein übermäßiges Vertrauen auf normbezogene Testergebnisse unterbewertet wichtige Leistungen, Fähigkeiten und Fertigkeiten zugunsten der engeren Gruppe von Fähigkeiten, die durch die Tests gemessen werden.
Das Glossar der Bildungsreform von Great Schools Partnership ist lizenziert unter einer Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.