Norm-Referenced Test
Norm-referenced si riferisce a test standardizzati che sono progettati per confrontare e classificare gli studenti in relazione gli uni agli altri. I test con riferimento alla norma riportano se gli studenti hanno fatto meglio o peggio di un ipotetico studente medio, che è determinato confrontando i punteggi con i risultati delle prestazioni di un gruppo statisticamente selezionato di studenti, in genere della stessa età o livello, che hanno già sostenuto l’esame.
Il calcolo dei punteggi con riferimento alla norma è chiamato “processo di normalizzazione”, e il gruppo di confronto è noto come “gruppo di normalizzazione”. I gruppi di normalizzazione tipicamente comprendono solo un piccolo sottoinsieme dei precedenti partecipanti al test, non tutti o addirittura la maggior parte dei precedenti partecipanti. Gli sviluppatori del test usano una varietà di metodi statistici per selezionare i gruppi di normalizzazione, interpretare i punteggi grezzi e determinare i livelli di prestazione.
I punteggi riferiti alla norma sono generalmente riportati come percentuale o percentile. Per esempio, uno studente che ottiene un punteggio nel settantesimo percentile ha fatto altrettanto bene o meglio del settanta per cento degli altri partecipanti al test della stessa età o livello, e il trenta per cento degli studenti ha fatto meglio (come determinato dai punteggi del gruppo di normalizzazione).
I test normalizzati spesso usano un formato a scelta multipla, anche se alcuni includono domande aperte e a risposta breve. Di solito sono basati su qualche forma di standard nazionale, non su standard o curricula determinati a livello locale. I test del QI sono tra i più noti test normoreferenziati, così come i test di screening dello sviluppo, che sono usati per identificare le difficoltà di apprendimento nei bambini piccoli o per determinare l’idoneità ai servizi di educazione speciale. Alcuni dei principali test normalizzati includono il California Achievement Test, l’Iowa Test of Basic Skills, lo Stanford Achievement Test e il TerraNova.
Questi sono alcuni esempi rappresentativi di come i test normalizzati e i punteggi possono essere usati:
- per determinare la prontezza di un bambino per la scuola materna o per l’asilo. Questi test possono essere progettati per misurare l’abilità linguistica orale, le abilità visivo-motorie e lo sviluppo cognitivo e sociale.
- Per valutare le abilità di base di lettura, scrittura e matematica. I risultati dei test possono essere usati per un’ampia varietà di scopi, come la misurazione del progresso accademico, l’assegnazione dei corsi, la determinazione della prontezza per la promozione di grado, o l’identificazione del bisogno di ulteriore supporto accademico.
- Per identificare specifiche difficoltà di apprendimento, come l’autismo, la dislessia, o la disabilità di apprendimento non verbale, o per determinare l’idoneità ai servizi di educazione speciale.
- Per prendere decisioni sull’idoneità al programma o sull’ammissione al college (in questi casi, i punteggi riferiti alla norma sono generalmente valutati insieme ad altre informazioni su uno studente). I punteggi degli esami SAT o ACT sono un esempio comune.
Test Normale-Riferimento vs Criterio-Riferimento
I test Normale-Riferimento sono specificamente progettati per classificare gli studenti su una “curva a campana”, o una distribuzione di punteggi che assomiglia, quando graficizzata, al profilo di una campana – cioè, una piccola percentuale di studenti che ottiene buoni risultati, la maggior parte nella media, e una piccola percentuale che ottiene scarsi risultati. Per produrre ogni volta una curva a campana, le domande del test sono accuratamente progettate per accentuare le differenze di rendimento tra i partecipanti al test, non per determinare se gli studenti hanno raggiunto determinati standard di apprendimento, imparato un certo materiale o acquisito abilità e conoscenze specifiche. I test che misurano le prestazioni rispetto a un insieme fisso di standard o criteri sono chiamati test con riferimento ai criteri.
I risultati dei test con riferimento ai criteri sono spesso basati sul numero di risposte corrette fornite dagli studenti, e i punteggi possono essere espressi come percentuale del numero totale possibile di risposte corrette. In un esame riferito alle norme, tuttavia, il punteggio rifletterebbe quante risposte corrette in più o in meno uno studente ha dato rispetto agli altri studenti. Ipoteticamente, se tutti gli studenti che hanno fatto un test normalizzato hanno ottenuto risultati scadenti, i risultati meno scadenti classificherebbero gli studenti nel percentile più alto. Allo stesso modo, se tutti gli studenti hanno ottenuto risultati straordinari, la performance meno forte classificherebbe gli studenti nel percentile più basso.
Si deve notare che i test riferiti alle norme non possono misurare i risultati di apprendimento o il progresso di un intero gruppo di studenti, ma solo il rendimento relativo degli individui all’interno di un gruppo. Per questo motivo, i test con riferimento ai criteri sono utilizzati per misurare le prestazioni dell’intero gruppo.
Riforma
I test con riferimento alle norme sono stati storicamente utilizzati per fare distinzioni tra gli studenti, spesso ai fini dell’inserimento nei corsi, dell’idoneità ai programmi o dell’ammissione alla scuola. Tuttavia, poiché i test con riferimento alle norme sono progettati per classificare le prestazioni degli studenti su una scala relativa, cioè in relazione al rendimento di altri studenti – i test normalizzati sono stati abbandonati da molte scuole e Stati in favore dei test basati sui criteri, che misurano il rendimento degli studenti in relazione a un insieme comune di criteri o standard fissi.
Si dovrebbe notare che i test normalizzati non sono in genere la forma di test standardizzati ampiamente utilizzati per conformarsi alle politiche statali o federali – come il No Child Left Behind Act – che sono destinati a misurare il rendimento scolastico, chiudere i “divari di rendimento”, o ritenere le scuole responsabili del miglioramento dei risultati di apprendimento degli studenti. Nella maggior parte dei casi, i test con riferimento ai criteri sono utilizzati per questi scopi perché l’obiettivo è quello di determinare se le scuole stanno insegnando con successo agli studenti ciò che ci si aspetta che imparino.
Similmente, le valutazioni sviluppate per misurare i risultati degli studenti dei Common Core State Standards sono anche esami con riferimento ai criteri. Tuttavia, alcuni sviluppatori di test promuovono i loro esami con riferimento alle norme – per esempio, il TerraNova Common Core – come un modo per gli insegnanti di “valutare” i progressi nell’apprendimento e determinare se gli studenti sono sulla buona strada per ottenere buoni risultati nelle valutazioni basate sul Common Core.
Dibattito
Mentre i test con riferimento alle norme non sono al centro dei dibattiti nazionali in corso sui “test ad alta valutazione”, essi sono comunque oggetto di un grande dibattito. Il disaccordo essenziale è tra coloro che vedono i test con riferimenti normativi come misure oggettive, valide ed eque del rendimento degli studenti, e coloro che credono che fare affidamento sui risultati del rendimento relativo sia impreciso, inutile e ingiusto, specialmente quando si prendono importanti decisioni educative per gli studenti. Mentre parte del dibattito si concentra sull’opportunità o meno di valutare l’apprendimento individuale degli studenti in relazione ad altri studenti (piuttosto che valutare le prestazioni individuali in relazione a criteri fissi e noti), gran parte del dibattito si concentra anche sul fatto che negli Stati Uniti c’è un eccessivo affidamento sui punteggi dei test standardizzati, e se un singolo test, indipendentemente dal suo design, dovrebbe essere utilizzato – escludendo altre misure – per valutare le prestazioni della scuola o degli studenti.
Dovrebbe essere notato che la performance percepita in un test standardizzato può essere potenzialmente manipolata, indipendentemente dal fatto che un test sia riferito alle norme o ai criteri. Per esempio, se un gran numero di studenti sta ottenendo scarsi risultati in un test, i criteri di rendimento – cioè, l’asticella di ciò che è considerato “passante” o “competente” – potrebbe essere abbassata per “migliorare” il rendimento percepito, anche se gli studenti non stanno imparando di più o non stanno ottenendo risultati migliori rispetto a chi ha fatto il test in passato. Per esempio, se un test standardizzato somministrato in undicesima classe usa standard di competenza che sono considerati equivalenti alle aspettative di apprendimento della terza media, sembrerà che gli studenti stiano ottenendo buoni risultati, quando in realtà il test non ha misurato i risultati di apprendimento ad un livello appropriato alla loro età o classe. Per questo motivo, è importante indagare i criteri utilizzati per determinare la “competenza” in qualsiasi test – e in particolare quando un test è considerato “high stakes”, poiché c’è una maggiore motivazione a manipolare le prestazioni percepite quando i risultati sono legati a sanzioni, riduzioni di fondi, imbarazzo pubblico, o altre conseguenze negative.
Quelli che seguono sono rappresentativi dei tipi di argomenti tipicamente fatti dai sostenitori dei test normalizzati:
- I test normalizzati sono relativamente poco costosi da sviluppare, semplici da somministrare e facili da valutare. Finché i risultati sono usati insieme ad altre misure di performance, possono fornire preziose informazioni sull’apprendimento degli studenti.
- La qualità dei test normalizzati è solitamente alta perché sono sviluppati da esperti di test, pilotati e rivisti prima di essere usati con gli studenti, e sono affidabili e stabili per ciò che sono progettati per misurare.
- I test normalizzati possono aiutare a differenziare gli studenti e identificare quelli che possono avere bisogni educativi specifici o deficit che richiedono assistenza specializzata o ambienti di apprendimento.
- I test sono un metodo di valutazione oggettivo che può diminuire pregiudizi o favoritismi quando si prendono decisioni educative. Se ci sono posti limitati in un programma di talento, per esempio, un modo trasparente per prendere la decisione è quello di dare ad ogni studente lo stesso test e permettere agli studenti con il punteggio più alto di entrare.
Quelli che seguono sono rappresentativi dei tipi di argomenti tipicamente fatti dai critici dei test normalizzati:
- Anche se gli esperti di test e gli sviluppatori di test avvertono che le principali decisioni educative non dovrebbero essere prese sulla base del punteggio di un singolo test, i punteggi normalizzati sono spesso usati impropriamente nelle scuole quando si prendono decisioni educative critiche, come la promozione o il mantenimento dei voti, che può avere conseguenze potenzialmente dannose per alcuni studenti e gruppi di studenti.
- I test normalizzati incoraggiano gli insegnanti a vedere gli studenti in termini di una curva a campana, il che può portarli ad abbassare le aspettative accademiche per alcuni gruppi di studenti, in particolare gli studenti con bisogni speciali, gli studenti di lingua inglese o i gruppi minoritari. E quando le aspettative accademiche sono costantemente abbassate anno dopo anno, gli studenti in questi gruppi possono non raggiungere mai i loro compagni, creando una profezia che si autoavvera. Per una discussione correlata, vedi alte aspettative.
- I test a scelta multipla – il formato dominante con riferimento alle norme – sono più adatti a misurare fatti ricordati che forme più complesse di pensiero. Di conseguenza, i test normalizzati promuovono l’apprendimento meccanico e la memorizzazione nelle scuole rispetto ad abilità cognitive più sofisticate, come la scrittura, la lettura critica, il pensiero analitico, la risoluzione dei problemi o la creatività.
- L’eccessivo affidamento sui risultati dei test normalizzati può portare a una discriminazione involontaria contro i gruppi di minoranza e le popolazioni di studenti a basso reddito, che tendono entrambi ad affrontare più ostacoli educativi rispetto agli studenti non minoritari provenienti da famiglie con reddito più elevato. Per esempio, molti educatori hanno sostenuto che l’uso eccessivo di test normalizzati ha portato a una significativa sovrarappresentazione degli studenti delle minoranze nei programmi di educazione speciale. D’altra parte, l’uso di punteggi normalizzati per determinare l’inserimento in programmi per dotati e talentuosi, o altre opportunità di apprendimento “arricchite”, porta alla sottorappresentazione delle minoranze e degli studenti a basso reddito in questi programmi. Allo stesso modo, gli studenti provenienti da famiglie ad alto reddito possono avere un vantaggio sleale nel processo di ammissione al college perché possono permettersi costosi servizi di preparazione ai test.
- Un eccessivo affidamento sui punteggi dei test normalizzati sottovaluta importanti risultati, competenze e abilità in favore di un insieme più ristretto di competenze misurate dai test.
The Glossary of Education Reform by Great Schools Partnership is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.