Prueba con referencia a la norma
La referencia a la norma se refiere a las pruebas estandarizadas que están diseñadas para comparar y clasificar a los examinados en relación con los demás. Las pruebas con referencia a la norma informan si los examinados se desempeñaron mejor o peor que un estudiante promedio hipotético, lo cual se determina comparando los puntajes con los resultados de desempeño de un grupo seleccionado estadísticamente de examinados, generalmente de la misma edad o nivel de grado, que ya han realizado el examen.
El cálculo de los puntajes con referencia a la norma se denomina «proceso de normalización», y el grupo de comparación se conoce como «grupo de normalización». Los grupos de normalización suelen estar formados por un pequeño subconjunto de examinados anteriores, no por todos ni por la mayoría de los examinados anteriores. Los desarrolladores de pruebas utilizan una variedad de métodos estadísticos para seleccionar los grupos de normalización, interpretar las puntuaciones brutas y determinar los niveles de rendimiento.
Las puntuaciones referidas a la norma generalmente se informan como un porcentaje o una clasificación percentil. Por ejemplo, un alumno que obtiene una puntuación en el percentil setenta tiene un rendimiento igual o mejor que el setenta por ciento de los demás examinados de la misma edad o grado, y el treinta por ciento de los alumnos tiene un rendimiento mejor (según las puntuaciones del grupo de normalización).
Las pruebas referenciadas por la norma suelen utilizar un formato de opción múltiple, aunque algunas incluyen preguntas abiertas de respuesta corta. Suelen basarse en algún tipo de norma nacional, no en normas o planes de estudio determinados localmente. Los tests de CI son los más conocidos, al igual que los tests de evaluación del desarrollo, que se utilizan para identificar problemas de aprendizaje en los niños pequeños o para determinar la posibilidad de recibir servicios de educación especial. Algunas de las principales pruebas referenciadas a normas son la Prueba de Rendimiento de California, la Prueba de Habilidades Básicas de Iowa, la Prueba de Rendimiento de Stanford y TerraNova.
Los siguientes son algunos ejemplos representativos de cómo se pueden utilizar las pruebas referenciadas a normas y las puntuaciones:
- Para determinar la preparación de un niño pequeño para el preescolar o el jardín de infancia. Estas pruebas pueden estar diseñadas para medir la capacidad del lenguaje oral, las habilidades visuales y motoras y el desarrollo cognitivo y social.
- Para evaluar las habilidades básicas de lectura, escritura y matemáticas. Los resultados de las pruebas pueden utilizarse para una amplia variedad de propósitos, como medir el progreso académico, realizar asignaciones de cursos, determinar la preparación para la promoción de grado o identificar la necesidad de apoyo académico adicional.
- Para identificar discapacidades de aprendizaje específicas, como el autismo, la dislexia o la discapacidad de aprendizaje no verbal, o para determinar la elegibilidad para los servicios de educación especial.
- Para tomar decisiones de elegibilidad de programas o de admisión a la universidad (en estos casos, las puntuaciones referidas a normas generalmente se evalúan junto con otra información sobre un estudiante). Las puntuaciones de los exámenes SAT o ACT son un ejemplo común.
- Las pruebas referidas a normas son relativamente baratas de desarrollar, sencillas de administrar y fáciles de calificar. Siempre que los resultados se utilicen junto con otras medidas de rendimiento, pueden proporcionar información valiosa sobre el aprendizaje de los estudiantes.
- La calidad de las pruebas referenciadas por normas suele ser alta porque son desarrolladas por expertos en pruebas, pilotadas y revisadas antes de ser utilizadas con los estudiantes, y son fiables y estables para lo que están diseñadas para medir.
- Las pruebas referenciadas a la norma pueden ayudar a diferenciar a los alumnos e identificar a aquellos que puedan tener necesidades educativas específicas o déficits que requieran asistencia especializada o entornos de aprendizaje.
- Las pruebas son un método de evaluación objetivo que puede disminuir el sesgo o el favoritismo a la hora de tomar decisiones educativas. Si hay plazas limitadas en un programa de superdotados y talentosos, por ejemplo, una forma transparente de tomar la decisión es someter a todos los alumnos a la misma prueba y permitir que los alumnos con mayor puntuación accedan.
- Aunque los expertos en pruebas y los desarrolladores de las mismas advierten de que las decisiones educativas importantes no deberían tomarse en función de la puntuación de una sola prueba, las puntuaciones referidas a normas se utilizan a menudo de forma incorrecta en las escuelas a la hora de tomar decisiones educativas críticas, como la promoción o la permanencia en el grado, lo que puede tener consecuencias potencialmente perjudiciales para algunos estudiantes y grupos de estudiantes.
- Las pruebas referenciadas a la norma animan a los profesores a ver a los estudiantes en términos de una curva de campana, lo que puede llevarles a rebajar las expectativas académicas para ciertos grupos de estudiantes, particularmente los que tienen necesidades especiales, los que aprenden inglés o los grupos minoritarios. Y cuando las expectativas académicas se reducen sistemáticamente año tras año, es posible que los alumnos de estos grupos nunca alcancen a sus compañeros, creando una profecía autocumplida. Para una discusión relacionada, ver altas expectativas.
- Las pruebas de elección múltiple -el formato dominante referido a normas- son más adecuadas para medir hechos recordados que formas más complejas de pensamiento. En consecuencia, las pruebas referenciadas por normas promueven el aprendizaje de memoria y la memorización en las escuelas en lugar de habilidades cognitivas más sofisticadas, como la escritura, la lectura crítica, el pensamiento analítico, la resolución de problemas o la creatividad.
- La excesiva dependencia de los resultados de las pruebas referenciadas por normas puede conducir a una discriminación inadvertida contra los grupos minoritarios y las poblaciones de estudiantes de bajos ingresos, que tienden a enfrentarse a más obstáculos educativos que los estudiantes no minoritarios de hogares con mayores ingresos. Por ejemplo, muchos educadores han argumentado que el uso excesivo de pruebas referenciadas a la norma ha dado lugar a una sobrerrepresentación significativa de los estudiantes de las minorías en los programas de educación especial. Por otra parte, el uso de las puntuaciones referidas a las normas para determinar la colocación en programas para superdotados y talentosos, u otras oportunidades de aprendizaje «enriquecidas», conduce a la subrepresentación de los estudiantes de minorías y de bajos ingresos en estos programas. Del mismo modo, los estudiantes procedentes de hogares con mayores ingresos pueden tener una ventaja injusta en el proceso de admisión a la universidad porque pueden permitirse costosos servicios de preparación para los exámenes.
- La excesiva dependencia de las puntuaciones de los exámenes referenciados a la norma infravalora importantes logros, destrezas y habilidades en favor del conjunto más limitado de habilidades que miden los exámenes.
Pruebas referenciadas por norma vs. Pruebas referenciadas por criterio
Las pruebas referenciadas por norma están específicamente diseñadas para clasificar a los examinados en una «curva de campana», o una distribución de las puntuaciones que se asemeja, cuando se grafica, al contorno de una campana, es decir, un pequeño porcentaje de estudiantes con un buen rendimiento, la mayoría con un rendimiento medio y un pequeño porcentaje con un rendimiento bajo. Para producir una curva de campana cada vez, las preguntas de los exámenes se diseñan cuidadosamente para acentuar las diferencias de rendimiento entre los examinados, no para determinar si los estudiantes han alcanzado estándares de aprendizaje específicos, han aprendido cierto material o han adquirido habilidades y conocimientos concretos. Las pruebas que miden el rendimiento en relación con un conjunto fijo de estándares o criterios se denominan pruebas referidas a criterios.
Los resultados de las pruebas referidas a criterios suelen basarse en el número de respuestas correctas proporcionadas por los estudiantes, y las puntuaciones pueden expresarse como un porcentaje del número total posible de respuestas correctas. En un examen referido a la norma, sin embargo, la puntuación reflejaría cuántas respuestas correctas más o menos dio un estudiante en comparación con otros estudiantes. Hipotéticamente, si todos los alumnos que realizaron un examen referenciado a la norma tuvieran un mal rendimiento, los resultados menos malos situarían a los alumnos en el percentil más alto. Del mismo modo, si todos los estudiantes tuvieran un rendimiento extraordinario, el rendimiento menos fuerte clasificaría a los estudiantes en el percentil más bajo.
Hay que tener en cuenta que las pruebas referidas a la norma no pueden medir el rendimiento del aprendizaje o el progreso de todo un grupo de estudiantes, sino sólo el rendimiento relativo de los individuos dentro de un grupo. Por esta razón, las pruebas referidas a criterios se utilizan para medir el rendimiento de todo el grupo.
Reforma
Las pruebas referidas a normas se han utilizado históricamente para hacer distinciones entre los estudiantes, a menudo con fines de colocación en cursos, elegibilidad de programas o admisión a la escuela. Sin embargo, debido a que las pruebas referidas a normas están diseñadas para clasificar el rendimiento de los estudiantes en una escala relativa, es decir, en relación con el rendimiento de otros estudiantes, en relación con el rendimiento de otros estudiantes- las pruebas referidas a normas han sido abandonadas por muchas escuelas y estados en favor de las pruebas referidas a criterios, que miden el rendimiento de los estudiantes en relación con un conjunto común de criterios o estándares fijos.
Hay que tener en cuenta que las pruebas referidas a normas no son típicamente la forma de prueba estandarizada que se utiliza ampliamente para cumplir con las políticas estatales o federales -como la Ley Que Ningún Niño Se Quede Atrás- que están destinadas a medir el rendimiento escolar, cerrar las «brechas de rendimiento», o hacer que las escuelas sean responsables de mejorar los resultados de aprendizaje de los estudiantes. En la mayoría de los casos, las pruebas referidas a criterios se utilizan para estos fines porque el objetivo es determinar si las escuelas están enseñando con éxito a los estudiantes lo que se espera que aprendan.
De manera similar, las evaluaciones que se están desarrollando para medir el logro de los estudiantes de los Estándares Estatales Básicos Comunes también son exámenes referidos a criterios. Sin embargo, algunos desarrolladores de pruebas promueven sus exámenes referenciados por normas -por ejemplo, el TerraNova Common Core- como una forma de que los profesores puedan «comparar» el progreso del aprendizaje y determinar si los estudiantes están en camino de tener un buen desempeño en las evaluaciones basadas en los Common Core.
Debate
Si bien las pruebas referenciadas por normas no son el centro de los actuales debates nacionales sobre las «pruebas de alto riesgo», sí son objeto de mucho debate. El desacuerdo esencial se produce entre quienes consideran que las pruebas referidas a normas son medidas objetivas, válidas y justas del rendimiento de los estudiantes, y quienes creen que basarse en los resultados relativos del rendimiento es inexacto, poco útil e injusto, especialmente a la hora de tomar decisiones educativas importantes para los estudiantes. Aunque parte del debate se centra en si es éticamente apropiado, o incluso útil desde el punto de vista educativo, evaluar el aprendizaje individual de los estudiantes en relación con otros estudiantes (en lugar de evaluar el rendimiento individual en relación con criterios fijos y conocidos), gran parte del debate también se centra en si existe una excesiva dependencia general de las puntuaciones de las pruebas estandarizadas en Estados Unidos, y si se debe utilizar una única prueba, independientemente de su diseño, en exclusión de otras medidas, para evaluar el rendimiento de la escuela o de los estudiantes.
Hay que tener en cuenta que el rendimiento percibido en una prueba estandarizada puede ser potencialmente manipulado, independientemente de si una prueba está referida a normas o a criterios. Por ejemplo, si un gran número de estudiantes obtienen malos resultados en un examen, los criterios de rendimiento -es decir, el listón de lo que se considera «aprobado» o «competente»- podrían reducirse para «mejorar» el rendimiento percibido, aunque los estudiantes no estén aprendiendo más o rindiendo mejor que los anteriores examinados. Por ejemplo, si una prueba estandarizada administrada en undécimo grado utiliza estándares de competencia que se consideran equivalentes a las expectativas de aprendizaje de octavo grado, parecerá que los estudiantes tienen un buen desempeño, cuando en realidad la prueba no ha medido el logro de aprendizaje a un nivel apropiado para su edad o grado. Por esta razón, es importante investigar los criterios utilizados para determinar el «dominio» en cualquier prueba, y en particular cuando una prueba se considera de «alto riesgo», ya que hay una mayor motivación para manipular el rendimiento percibido en las pruebas cuando los resultados están vinculados a sanciones, reducciones de financiación, vergüenza pública u otras consecuencias negativas.
Los siguientes son representativos del tipo de argumentos que suelen esgrimir los defensores de las pruebas referidas a normas:
Los siguientes son representativos de los tipos de argumentos que suelen esgrimir los críticos de las pruebas referidas a normas:
El Glosario de la Reforma Educativa de Great Schools Partnership se encuentra bajo una licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.