Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Sistemas de calificación y regímenes de promoción, Monografías, Ensayos de Didáctica General

Este documento analiza los sistemas de calificación y los regímenes de promoción en la educación formal, destacando su importancia como componentes esenciales de los sistemas de evaluación. Se discuten los diferentes tipos de escalas de calificación, los criterios para su elección y la problemática de los regímenes de promoción. Se señala la necesidad de considerar las diferencias entre grupos y cursos al definir las políticas de calificación, y la importancia de complementar las evaluaciones numéricas con anotaciones sobre los errores, la adecuación de la velocidad y la dirección e intensidad de los esfuerzos de los estudiantes.

Tipo: Monografías, Ensayos

2022/2023

Subido el 26/07/2023

patricia-elizabeth-espinoza
patricia-elizabeth-espinoza 🇦🇷

2 documentos

1 / 25

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
SISTEMAS DE CALIFICACIÓN Y REGÍMENES DE PROMOCIÓN*
Alicia R. W. de Camilloni
* Este artículo ha sido posible gracias al subsidio otorgado a la investigación dirigida por la autora por la Secretaría
de Ciencia y Técnica de la UBA (FI2IS).
LA CALIFICACIÓN Y LA PROMOCIÓN DE LOS ESTUDIANTES
Los sistemas de calificación empleados en la evaluación de los aprendizajes y los
regímenes de promoción de los alumnos constituyen un componente esencial de los
sistemas de evaluación que se emplean en la educación formal. Aunque ambos son
producto de un conjunto de decisiones prácticas adoptadas en virtud de la adhesión a una
u otra entre las diversas corrientes teóricas de la didáctica, siempre ejercen, de hecho, un
fuerte efecto normativo sobre las acciones de enseñanza y de aprendizaje ya que, más
que aparecer como una consecuencia de los fundamentos teóricos que se suscriben en la
materia, tienen un efecto tan poderoso que suelen operar de manera muy efectiva, en
reversa, como determinantes de todas las prácticas pedagógicas. De este modo, si los
sistemas de calificación y promoción permanecen estáticos en sus modalidades
fundamentales y no acompañan las transformaciones de las prácticas de la enseñanza,
sólo sirven de obstáculo a esas transformaciones, obligando a los docentes a una
permanente adaptación a los moldes pedagógicos que los procesos de renovación o de
reforma pretenden reemplazar. Si, por el contrario, se resuelve producir modificaciones en
los sistemas de calificación y promoción, éstos tienden a desarrollar una indudable
influencia sobre las estrategias de enseñanza de los docentes y, particularmente, sobre las
estrategias de aprendizaje de los alumnos, con un efecto denominado de "validez
retroactiva". Sobre estos procesos mucho se ha estudiado en el campo del análisis dell
denominado" currículo oculto". Aunque esta influencia puede ser abusiva, porque es
necesario trabajar de manera integral sobre la enseñanza y la evaluación ya que ésta es
subsidiaria de la primera, debemos reconocer que el papel de los sistemas de calificación y
de los regímenes de promoción es central en la educación escolar, más allá de la
pretendida desvalorización que de ellos se suele hacer en algunas teorías de la
enseñanza, en tanto se les atribuye el constituirse en una manifestación no siempre
adecuada o necesaria del ejercicio del control o de la autoridad interna o externa a la
institución escolar sobre los aprendizajes de los alumnos y, en consecuencia, en una
imposición que recorta la libertad personal de estos últimos.
La importancia que tienen, pues, los sistemas de calificación y los regímenes de
promoción, sea evaluándolos en un sentido pretendidamente positivo o sea éste negativo,
obliga a efectuar un estudio muy cuidadoso de las características que ofrecen las diversas
modalidades que presenta cada uno de los modelos, de manera de seleccionar aquellos
que resulten más apropiados para los propósitos de la programación didáctica, de la
planificación de la institución y del sistema escolar.
Sistemas de Calificación
Es preciso considerar, en primer lugar, dos cuestiones básicas. El primer aspecto
relativo a la constitución de un sistema de calificación es el relacionado con la construcción
y la fijación de una escala de calificación, y el segundo aspecto está referido a la decisión
fundamental relativa a la adopción de sólo una o más de una de estas escalas en el
sistema de calificación que se diseña. Veamos la primera cuestión.
En el proceso de construcción de una escala es necesario tener en cuenta las
características que las escalas de calificación adquieren en términos de las condiciones y
posibilidades que brinda cada una de las grandes modalidades de las escalas de medición
en general.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19

Vista previa parcial del texto

¡Descarga Sistemas de calificación y regímenes de promoción y más Monografías, Ensayos en PDF de Didáctica General solo en Docsity!

SISTEMAS DE CALIFICACIÓN Y REGÍMENES DE PROMOCIÓN*

Alicia R. W. de Camilloni

  • Este artículo ha sido posible gracias al subsidio otorgado a la investigación dirigida por la autora por la Secretaría de Ciencia y Técnica de la UBA (FI2IS).

LA CALIFICACIÓN Y LA PROMOCIÓN DE LOS ESTUDIANTES

Los sistemas de calificación empleados en la evaluación de los aprendizajes y los regímenes de promoción de los alumnos constituyen un componente esencial de los sistemas de evaluación que se emplean en la educación formal. Aunque ambos son producto de un conjunto de decisiones prácticas adoptadas en virtud de la adhesión a una u otra entre las diversas corrientes teóricas de la didáctica, siempre ejercen, de hecho, un fuerte efecto normativo sobre las acciones de enseñanza y de aprendizaje ya que, más que aparecer como una consecuencia de los fundamentos teóricos que se suscriben en la materia, tienen un efecto tan poderoso que suelen operar de manera muy efectiva, en reversa, como determinantes de todas las prácticas pedagógicas. De este modo, si los sistemas de calificación y promoción permanecen estáticos en sus modalidades fundamentales y no acompañan las transformaciones de las prácticas de la enseñanza, sólo sirven de obstáculo a esas transformaciones, obligando a los docentes a una permanente adaptación a los moldes pedagógicos que los procesos de renovación o de reforma pretenden reemplazar. Si, por el contrario, se resuelve producir modificaciones en los sistemas de calificación y promoción, éstos tienden a desarrollar una indudable influencia sobre las estrategias de enseñanza de los docentes y, particularmente, sobre las estrategias de aprendizaje de los alumnos, con un efecto denominado de "validez retroactiva". Sobre estos procesos mucho se ha estudiado en el campo del análisis dell denominado" currículo oculto". Aunque esta influencia puede ser abusiva, porque es necesario trabajar de manera integral sobre la enseñanza y la evaluación ya que ésta es subsidiaria de la primera, debemos reconocer que el papel de los sistemas de calificación y de los regímenes de promoción es central en la educación escolar, más allá de la pretendida desvalorización que de ellos se suele hacer en algunas teorías de la enseñanza, en tanto se les atribuye el constituirse en una manifestación no siempre adecuada o necesaria del ejercicio del control o de la autoridad interna o externa a la institución escolar sobre los aprendizajes de los alumnos y, en consecuencia, en una imposición que recorta la libertad personal de estos últimos.

La importancia que tienen, pues, los sistemas de calificación y los regímenes de promoción, sea evaluándolos en un sentido pretendidamente positivo o sea éste negativo, obliga a efectuar un estudio muy cuidadoso de las características que ofrecen las diversas modalidades que presenta cada uno de los modelos, de manera de seleccionar aquellos que resulten más apropiados para los propósitos de la programación didáctica, de la planificación de la institución y del sistema escolar.

Sistemas de Calificación

Es preciso considerar, en primer lugar, dos cuestiones básicas. El primer aspecto relativo a la constitución de un sistema de calificación es el relacionado con la construcción y la fijación de una escala de calificación, y el segundo aspecto está referido a la decisión fundamental relativa a la adopción de sólo una o más de una de estas escalas en el sistema de calificación que se diseña. Veamos la primera cuestión.

En el proceso de construcción de una escala es necesario tener en cuenta las características que las escalas de calificación adquieren en términos de las condiciones y posibilidades que brinda cada una de las grandes modalidades de las escalas de medición en general.

Escalas de medición

Las escalas de medición pueden ser clasificadas en cuatro grupos a partir de las características que presentan respecto de la relación de ordenamiento progresivo u horizontal de las categorías que las constituyen, de la distancia igual o desigual que existe entre los diferentes grados de la escala y de la existencia o no de un punto de partida (cero absoluto) que permita operar de manera particular con tramos parciales de la escala.

De este modo, las escalas de medición se agrupan en los siguientes tipos: a) Escalas nominales. En ellas las categorías que componen la escala no se encuentran en un orden de seriación que implique que un grado es mayor o mejor que el o los otros grados. No hay grados superiores e inferiores. Todos se encuentran en el mismo nivel. Se emplean para medir la frecuencia con la que los ejemplares evaluados se incluyen en cada una de las clases que la escala presenta. La construcción de una escala nominal requiere que se cumplan las siguientes condiciones: la escala debe incluir todas las categorías necesarias para diferenciar los ejemplares que se evalúan, dependiendo su carácter y número de la necesidad de obtener la información que se requiere con un fin determinado, aquel que dio lugar a la construcción de la escala. Para ello, las categorías se determinan en función del número indispensable de clases que permitan dar cuenta del universo que se estudia. El número debe ser el mínimo posible, sin que se pierda información útil. La escala, además, debe ser completa, es decir que debe hacer posible la inclusión en alguna categoría de la escala de todos los ejemplares analizados. Por otra parte, todas las categorías deben ser excluyentes entre sí, lo que implica que ningún ejemplar podría ser incluido simultáneamente en más de una categoría. La definición de las categorías, para ello, debe ser tan clara que no genere ninguna interpretación ambigua que pueda prestarse a error de clasificación. Una escala nominal se construye ad hoc, en los términos necesarios para el estudio que se desea realizar. Si se trata, por ejemplo, de clasificar a las personas según su nacionalidad, el número de categorías para incluir en la escala dependerá de la utilización que se quiera dar a las informaciones que se recojan. En un caso puede ser suficiente contar con dos grados (Argentino; Extranjero) o con tres (Argentino nativo; Argentino naturalizado; Extranjero) o con cuatro (Argentino nativo; Argentino naturalizado; Natural de país limítrofe; Extranjero natural de país no limítrofe), etcétera.

b) Escalas ordinales. Son aquellas que presentan una serie de categorías Ordenadas de acuerdo con un criterio definido por un sentido u orientación determinada que no permite introducir alteraciones en la secuencia. Los grados de la escala se ordenan, por ejemplo, de mayor a menor o de mejor a peor. Deben cumplir con los mismos requisitos que las escalas nominales, a los que se suma, como se ha dicho, la definición del criterio de ordenamiento de la serie. Se caracterizan, además, porque las distancias entre los pares de categorías o grados consecutivos no deben ser necesariamente iguales. Así, el intervalo entre "Muy bueno" y "Bueno" no tiene que ser igual al intervalo entre "Bueno" y "Regular". Las escalas ordinales son específicas y se usan para medir aspectos determinados. Las escalas ordinales no son y, en consecuencia, no deberían ser utilizadas como escalas universales. Sin embargo con cierta frecuencia adquieren una alto grado de formalismo y se usan indistintamente para evaluar cuestiones muy heterogéneas, perdiendo de este modo la riqueza posible de su valor descriptivo que deriva ya sea de su construcción ad hoc, ya de la especificidad de la definición de cada uno de los grados de la escala.

c) Escalas de intervalos. Son aquellas en las que se debe responder a los mismos requisitos que hemos enumerado para las escalas ordinales, con la particularidad que se agrega de que los intervalos entre pares de grados consecutivos deben ser iguales. Este último rasgo permite operar con las mediciones en las que se han utilizado las unidades medidas por estas escalas efectuando operaciones aritméticas que no pueden realizarse con las escalas ordinales. Entre ellas, por ejemplo, es posible obtener la media aritmética

docentes. De este modo, parece conveniente construir escalas con un número de categorías pequeño con el fin de mejorar la definición de cada grado y con el objetivo de contribuir all perfeccionamiento de la confiabilidad de las calificaciones.

Pero una escala de dos grados ("1" y "2" o "suficiente" e "insuficiente", por ejemplo) puede resultar poco descriptiva de los progresos de los estudiantes, porque cada grado debe cubrir un campo muy amplio y variado de rasgos. Si bien se aumenta la confiabilidad en las escalas de pocos grados, Robert E. Thorndike y Elizabeth P. Hagen (1991) señalan:

“Desde luego, esta ventaja se logra a expensas de la mayor parte de la información que el sistema de calificación puede suministrar acerca del individuo. En un sistema de aprobado-reprobado, sólo sabemos que el estudiante ha sido juzgado como aprobado en un curso, excepto por la pequeña fracción que se juzgó como fracasada. [u.] A medida que se incrementa el número de discriminaciones más allá del sistema de dos o tres categorías, las distinciones empiezan a ser importantes para todos los estudiantes” (pág. 577).

Así pues, si la capacidad descriptiva de la escala es pobre se perderán muchas de las funciones de la evaluación. Aumentando en pocos grados más la escala, con uno o dos puntos como mínimo por el lado de la no aprobación, y con dos o tres puntos por el costado de la aprobación, la escala permite una mejor definición de las categorías empleadas por el evaluador. Según los casos, sin embargo, puede ser útil discriminar con mayor fineza el nivel de logro en las realizaciones actuales de los alumnos. Las escalas de cuatro o cinco grados suelen servir de base para la elección de escalas. En ellas se emplean uno o dos grados para diferenciar la calidad en la desaprobación y dos, tres o cuatro para distinguir niveles de calidad en la aprobación. Por ejemplo:

  1. 1 (desaprobación); 2, 3 Y 4 (aprobación).
  2. 1 Y 2 (desaprobación); 3, 4 Y 5 (aprobación). Se puede afirmar que más allá del número que el análisis de los casos particulares demuestre ser necesario y suficiente, al aumentar el número de grados de la escala es más lo que se pierde en confiabilidad que lo que se gana en información.

Las escalas numéricas, según la calidad de la definición de cada uno de los grados que las componen, aplicando la categorización que antes se presentó con respecto a los tipos de escalas de medición, pueden ser ordinales, intervalares o de razones.

Las escalas conceptuales o descriptivas tienen algunos aspectos semejantes a las escalas numéricas pero presentan otros rasgos que los diferencian claramente de ellas. Ambos tipos presentan un escalonamiento de la calidad de lo que es evaluado desde un grado mínimo hasta un grado máximo. Se distinguen, empero, porque la escala numérica, al ser formalmente siempre la misma, sin importar el carácter sustantivo de lo que se evalúa, es mucho menos descriptiva que la escala conceptual; se presta a distintas interpretaciones e induce a que rasgos heterogéneos sean tratados como equivalentes o equiparables. Una vez asignada una calificación, la frialdad de los números no permite discernir el tipo de rasgo, producto o comportamiento evaluado.

Las escalas conceptuales, por el contrario, se ajustan a las necesidades de cada instancia evaluativa. Varían su forma según las características de aquello que se desea evaluar.

Veamos algunos ejemplos: Para apreciar la frecuencia con la que se produce un cierto fenómeno, la escala puede ser la siguiente:

  • Siempre
  • Generalmente
  • A veces
  • Nunca Para apreciar la intensidad:
  • Muy fuerte
  • Fuerte
  • Moderadamente fuerte
  • Regular
  • Débil
  • Muy débil Para apreciar la cantidad y la calidad de los conocimientos:
  • Sobresaliente • Distinguido • Bueno • Aprobado • Insuficiente • Reprobado
  • Excelente • Muy Bueno • Bueno • Regular • Insuficiente • Reprobado Cada una de estas categorías constituye un grado de la escala y debe ser claramente definida. Con frecuencia se hace corresponder a cada grado conceptual un símbolo numérico. Si esto ocurre, la escala conceptual se convierte en una escala numérica y presenta los mismos problemas de que adolece este último tipo de escalas. La delicadeza de las evaluaciones se pierde en favor de una formalidad presuntamente favorable a la exactitud, cómoda, por cierto, pero generadora del vaciamiento de la dimensión cualitativa de la evaluación.

En el mismo caso se encuentran las escalas alfabéticas como la que sigue: A; B; C; D; E o F..., etcétera. En ellas también suele establecerse una correspondencia con una escala numérica, pero esto no las convierte en escalas intervalares o de razones porque las escalas conceptuales son, por su misma naturaleza y básicamente, escalas ordinales.

La escala gráfica consiste en representar, sobre referencias lineales, categorías descriptivas determinadas.

Tiene la característica de presentar la intensidad de un rasgo como un continuo desde un grado mínimo hasta un grado máximo. La intensidad deseable del rasgo puede encontrarse señalada y definida en cualquiera de los puntos de la línea de evaluación, en ambos extremos y en un número determinado de puntos intermedios. Cada uno de los grados de la escala, cuyo número se recomienda que no supere los siete para no disminuir la confiabilidad de la evaluación, debe estar especificado en términos de lo que el docente está en condiciones de observar, conceptualizar e inferir realmente. En ninguno de los dos extremos se colocarán categorías que no puedan ser alcanzadas efectivamente o que se estima casi imposible que se presenten en los alumnos que integran la clase. Pero, en compensación, se habrá de tener en cuenta también que el apoyo gráfico lineal de la escala corresponde a una recta y no a un segmento. Será posible, por lo tanto, utilizar todos los puntos de la recta, aun los intermedios, entre los puntos definidos y los que se encuentran más allá de los últimos puntos definidos en los extremos.

Veamos algunos ejemplos de escalas gráficas.

En cuanto a la definición de cada grado, debe ser clara y comprensible para todos los implicados en los procesos de evaluación y en el uso de la información que ella provee. Todos -docentes, alumnos, directivos, padres y público en general- deben poder interpretar las calificaciones de la misma manera. Cuando se emplea una escala numérica debe explicarse previamente qué significado se atribuye a cada uno de los símbolos numéricos que integran la escala. De otro modo, la evaluación estaría impedida de cumplir con sus funciones orientativas.

Se sugiere también la necesidad de completar la calificación numérica con descripciones que sirvan de guía a alumnos y docentes para el diagnóstico de logros y dificultades y para la orientación del tratamiento apropiado para solucionar estas últimas. Una calificación numérica que no especificara en qué consisten los logros y los yerros no tendría utilidad para el alumno más que como pauta simbólica de su éxito o fracaso. No es de extrañar que con este tipo de calificaciones, la evaluación suela quedar al margen de los procesos de enseñanza y de aprendizaje y pierda, en consecuencia, sus funciones educativas. La calificación debe enriquecerse mediante la localización de los errores y el señalamiento aprobatorio de los resultados apropiados en el trabajo evaluado.

Otro difícil problema queda por resolver. Toda calificación lleva implícito un conflicto básico en las funciones de la evaluación. Hay dos maneras de calificar que responden a diferentes criterios, según se contrasten las realizaciones del estudiante con sus propias posibilidades o con un patrón ajeno a él, sea el rendimiento de sus compañeros (una norma) o una pauta establecida por el docente como objetivo a alcanzar (un estándar). Es evidente que cada una de estas formas dará lugar a calificaciones diversas para un mismo trabajo y un mismo alumno. También el éxito y el fracaso pueden tener dos tipos de interpretación. Tienen una realidad subjetiva cuando se refieren al acuerdo o desacuerdo existente entre el nivel de desempeño del alumno con su nivel de aspiración (lo que para un alumno es un éxito para otro puede ser un fracaso) y pueden tener una realidad objetiva cuando se compara ese nivel de desempeño con el patrón de rendimiento esperado y que ha sido adoptado a priori por el docente en su programación didáctica. Este conflicto de funciones se refleja, con frecuencia, en una pregunta común entre los docentes: ¿debemos calificar al alumno por su esfuerzo o debemos hacerlo en función de sus realizaciones efectivas? Ante esta pregunta se pueden ofrecer diversas respuestas porque, en efecto, el rendimiento del alumno puede ser apreciado, ya no de dos, sino de tres maneras diferentes, según se lo compare con los logros realmente alcanzados por otros alumnos, con una pauta fijada a priori por el docente o con el rendimiento que podría esperarse de él en condiciones conocidas.

Sin incursionar todavía en la problemática de los regímenes de promoción y restringiéndonos a la cuestión de las escalas de calificación, podemos establecer, siguiendo el primer criterio mencionado arriba, una relación entre el rendimiento de un alumno en una asignatura determinada y el rendimiento medio de un grupo representativo de alumnos de edad similar en el mismo nivel, ciclo y año de enseñanza de la asignatura. Con este fin se han acuñado las nociones de edad educativa y de cociente educativo. De la misma forma en que se deriva el concepto de 11 edad mental" de un test de inteligencia, se deriva la edad educacional de un test de rendimiento. Utilizando un instrumento diseñado para evaluar conocimientos en un dominio determinado o para evaluar el desarrollo de una habilidad, se mide el rendimiento de una población de alumnos de características definidas. Cuando se trabaja con sujetos de distintas edades y niveles de aprendizaje en una disciplina, se obtiene, de este modo, una escala de normas de edad referida al instrumento utilizado. La edad educativa representa la edad en años y meses de las personas que obtuvieron un determinado puntaje en la administración del instrumento empleado, medido en términos de su relación con el puntaje promedio (en este caso, la mediana es la medida de tendencia central elegida) de la norma de edad de la población de referencia. La mediana es el puntaje por debajo del cual se encuentra la mitad de los

puntajes, de todo ese grupo de edad. Con las medianas obtenidas se construye la escala de rendimiento por edad.

Tomemos, por ejemplo, la escala siguiente: Puntaje Edad Año de escolaridad 20 14 años 8. 21 14 años, 2 meses 8. 22 14 años, 3 meses 8. 23 14 años, 4 meses 9. 24 14 años, 5 meses 9. Si un alumno obtuviera 22 puntos, su edad educativa sería de 14 años, 3 meses, la que correspondería a 8.9 años de escolaridad.

Si relacionamos la E.E. (edad educativa) con la edad cronológica (E.C) del alumno obtendremos su cociente educativo (CE.).

El C.E. nos indicará cuánto tiempo ha necesitado el alumno para alcanzar un rendimiento determinado en comparación con el promedio (mediana) del tiempo requerido por los alumnos de su edad.

Así, de la misma forma en que el C.I. se deriva de la noción de edad mental, el CE. se deriva del concepto de E.E. En ambos casos se trata, y debe siempre puntualizarse, de un C.E. "medido", al igual que de una E.M. y un CI. "medidos", sólo válidos con referencia a los instrumentos de medición utilizados.

Veamos algunos ejemplos. Un estudiante que tuviera 14 años de E.E. y una E.C. de 15 años, tendría un CE. de 93.3. Otro estudiante de la misma clase que obtuviera el mismo puntaje en la evaluación pero que tuviera 13 años de edad cronológica, tendría un CE. de 107.

Se ha de tener en cuenta, empero, que para la determinación de la escala de normas de edad se toman como base las medianas de los puntajes respecto de cada grupo de edad y que, por lo tanto, en cada uno hay puntajes superiores y puntajes inferiores a las medianas. Al determinar los CE. de los alumnos de una clase se ha de esperar, pues, que haya tantos estudiantes que estén por encima del valor 100 como por debajo de él. Hay que señalar, también, que el "C.E. medido" no se correlaciona directa y necesariamente con el "C.I. medido" pues son muchos los determinantes que actúan sobre el C.E. además del CI.

desenvolvimiento de sus posibilidades. Pero debemos tener siempre en cuenta, también, que se debe actuar sobre todas las potencialidades de los dos para no acentuar sus aparentes diferencias iniciales y lograr el máximo desarrollo, de hecho imprevisible, en ambos alumnos.

Los conceptos de C.E. y de C.R. se encuentran con mucha frecuencia en la literatura de habla inglesa sobre el tema y son, o eran, de aplicación muy frecuente en los países anglosajones. Su empleo ha sido escaso o nulo en América latina, en donde es también poco frecuente el empleo de pruebas estandarizadas de rendimiento. En los conceptos que hemos presentado pueden advertirse, por una parte, la influencia de las corrientes conductistas de la medición en la evaluación, que se manifiestan en el esfuerzo por generar fórmulas que permitan construir indicadores "exactos" y confiables para expresar los resultados de la medición. Pero, por otra parte, es interesante observar que, más allá del intento de cuantificar los rendimientos y las habilidades o aptitudes, estos conceptos permiten estudiar la relación existente entre aspectos que en la evaluación de los aprendizajes con enfoques no conductistas también deben ser tomados en consideración. Son, pues, útiles, aun cuando no se pretenda utilizar las fórmulas para producir calificaciones numéricas y sólo se usen para contrastar criterios diferentes de evaluación. Su valor conceptual es significativo incluso en paradigmas no cuantitativistas de la evaluación en educación.

En estos términos, como hemos visto, la construcción de un sistema de calificación implica la elección entre alguno de los siguientes criterios: la calificación por las dotes que el alumno manifiesta poseer para la realización de tareas en dominios determinados, la calificación por sus logros efectivos en comparación con una pauta predefinida por el docente, o la calificación otorgada por comparación con los logros de los compañeros de su grupo de clase o de una población seleccionada. Cada uno marca una dirección distinta para la evaluación.

Al calificar al alumno con referencia a sus dotes y a su esfuerzo, se utiliza una noción correspondiente al campo del C.R. Un alumno voluntarioso, que logra superar sus propias dificultades, se vería mejor calificado que, por ejemplo, otro estudiante inteligente pero indolente. Las calificaciones de ambos estudiantes ya no serían semejantes en el caso de realizaciones iguales, sino que ocurriría -como con el C.R., si hubiera medio de calculado cuantitativamente- que el alumno esforzado obtendría mejor calificación.

Para calificar al alumno por su rendimiento efectivo en relación con una pauta predefinida, es menester expresar esta última en términos mensurables o apreciables para el docente. Se trata, entonces, de establecer previamente una descripción ajustada del rendimiento deseado. A este fin respondían los llamados "objetivos operacionales" que tenían como función principal facilitar una medición numérica ajustada. Esos objetivos pueden ser reemplazados, sin embargo, desde un marco teórico diferente, por la descripción cualitativa de los logros esperados. No se estaría lejos, en este caso, de la aplicación de la noción de C.E. porque, aun si no se desea trabajar con una cuantificación exacta, es obvio que el criterio que se aplica en una evaluación cualitativa puede coincidir con el de este concepto.

Cuando se adopta el criterio de calificar al alumno a partir de la comparación de sus aprendizajes con los logros efectivamente demostrados por su grupo de clase u otro criterio tomado como referencia, los problemas que surgen son muy específicos y serán analizados en el examen que haremos posteriormente de los regímenes de promoción.

Aunque muchas veces ajenos al espíritu rigurosamente cuantitativista que sustenta el uso de calificaciones asignadas mediante sistemas asociados al uso de escalas de calificación numéricas de intervalos o razones, los docentes siempre comparan y eligen criterios. Es menester que se extremen los cuidados para que las calificaciones tengan origen y fundamentación clara, en particular, para los alumnos.

Considerando que, entre los criterios que hemos expuesto más arriba, el equivalente al C.E. y el semejante al C.R. evalúan en función de aspectos diferentes, ambos interesantes por su significatividad, se puede sostener que sería conveniente utilizados en conjunto, con el propósito de mejorar las apreciaciones parciales y de no perder información útil para el docente y el alumno. El sistema que se crea de este modo debiera conservar la identidad de cada uno y preservados de la confusión en la interpretación. Una sola calificación numérica, apoyada en uno solo de esos criterios o como fruto de una combinación de ambos, sería siempre insuficiente para el cumplimiento de las funciones de la evaluación. Se recomienda adoptar, entonces, un sistema de doble calificación. En él se complementan dos calificaciones: una, referida a los progresos realizados por el escolar en relación con una norma establecida previamente, y la otra, referida a sus progresos contrastados con sus aptitudes consideradas individualmente. Este sistema permite combinar las ventajas de ambos criterios y permite manejar simultáneamente los dos sentidos, objetivo y subjetivo. Para realizaciones semejantes, por ejemplo, las dobles calificaciones podrían resultar las siguientes:

Alumno A: 4 (muy bueno) Alumno B: 4(regular) Alumno C: 4 (excelente) Aquí se han empleado dos escalas para el rendimiento efectivo en términos de una pauta predefinida: escala numérica de 1 a 5. Para el rendimiento en términos de capacidad y esfuerzo, escala conceptual con grados con definición clara: malo, regular, bueno, muy bueno, excelente.

La primera calificación procura ser objetiva. La segunda, más subjetiva, se puede emplear en la construcción de una calificación nueva atendiendo al sentido de la progresión que se manifiesta en estas segundas calificaciones. Servirá en cada caso de advertencia o de estímulo y reconocimiento del docente ante la actuación del alumno, incidiendo sobre posteriores aprendizajes y, por tanto, como proveedora de información y estímulo de la motivación. Las segundas calificaciones pueden convertirse en calificación numérica. Pero ésta no resulta del cálculo del promedio sino de la tendencia que ha manifestado el alumno respecto de su esfuerzo en el trabajo de aprendizaje.

La necesidad de completar las evaluaciones numéricas con anotaciones referentes a los errores y sus posibles causas, a la adecuación de la velocidad impresa a la realización del trabajo, que puede ser excesivamente lenta o apresurada, y la referencia a la dirección e intensidad de los esfuerzos del alumno, nos muestra la insuficiencia de un sistema de calificaciones que pretenda manejarse sólo con una simple escala numérica.

La enseñanza opera como una fuerza en un sistema de fuerzas. Es por sí misma, ella también, un conjunto dinámico que actúa sobre y con sujetos dinámicos. Las magnitudes escalares, desprovistas de orientación y en las que sólo interesan los valores numéricos, no pueden describir el tipo de cambio producido por la educación. Por esto, pensamos, el aprendizaje escolar debiera ser conceptualizado a los fines de su medición como magnitud vectorial en el marco de la evaluación, representándose los progresos por segmentos o semirrectas con dirección, y no sólo por sus valores numéricos asignados en instancias puntuales aisladas entre sí.

Decisión sobre el número de escalas de calificación

Del análisis efectuado sobre los distintos tipos de escala de medición y de calificación surge con claridad que cada una de las modalidades califica objetos (caracteres y rasgos, procesos y productos) diversos y lo hace de distinta manera. De ahí que toda calificación sea relativa no sólo al instrumento que se ha utilizado para medir, como lo afirmamos más arriba, sino también a la escala de calificación empleada.

"combinación" para describir todos esos procesos, "agregación" cuando se reúnen evaluaciones de “diferentes cosas" y "reconciliación" cuando las calificaciones se refieren a la “misma cosa" (pág. 19).

Para la fijación de un régimen de promoción son varios los criterios que se han de combinar o complementar, luego de analizar los rasgos fundamentales de las modalidades empleadas con mayor frecuencia en los sistemas escolares.

Analizaremos, en primer lugar, seis de ellos, que se destacan por su uso más frecuente en los sistemas escolares: el sistema de promoción por calificación promedio, el sistema de "logros mínimos exigidos", el sistema de promoción por examen final, el así llamado "sistema de promoción sin examen", los sistemas de puntajes derivados y la evaluación de portafolio.

Régimen de promoción por calificación promedio

Emplea una de las medidas estadísticas de tendencia central como base para la determinación de la promoción. La medida más utilizada con este fin es la media aritmética. Ésta se obtiene sumando primero todas las calificaciones obtenidas por el alumno y dividiendo después la suma por el número de calificaciones sumadas:

Media aritmética = Suma de x ; n en donde x son las calificaciones numéricas obtenidas por el alumno y n el número de calificaciones independientes sumadas.

Las calificaciones de bajo puntaje son equilibradas por calificaciones de puntaje más alto. En el régimen de promoción se determina el promedio mínimo que debe alcanzar el alumno para obtener esa promoción.

Este régimen de promoción tiene algunas características que deben tenerse en cuenta cuando se elige un sistema de promoción o cuando se aplica como resultado de la selección efectuada por la institución o el sistema escolar.

Para que las calificaciones promedio sean confiables debe cumplirse la condición de que la escala empleada sea una escala de intervalos o una escala de razones. Si los intervalos entre pares de grados consecutivos no son iguales no tiene sentido la pretensión de realizar operaciones aritméticas que pretenden dar cuenta exacta de resultados de aprendizaje traducidos en números que expresan tanto logros como diferencias entre alumnos con una precisión no justificada. Si en una escala, por ejemplo, la distancia entre dos grados consecutivos (punto 5 y punto 6 de la escala) no es igual a la distancia que existe entre otros dos (punto 6 Y punto 7), el promedio de las calificaciones 5 y 7 no puede ser 6 puntos ya que la distancia entre 5 y 6 no puede ser compensada por la distancia 6 a 7 puntos.

Ahora bien, en la práctica, en las escalas con calificación promedio mínima exigida para la aprobación es común que la distancia entre esa calificación y la inmediata inferior sea mayor que la que existe entre el promedio mínimo exigido y la calificación inmediata superior a él. El docente suele exigir mayor rendimiento relativo para pasar de la calificación inmediata inferior al promedio mínimo que se exige para promover al alumno, por ejemplo, que el que el mismo docente requiere para asignar la calificación inmediata superior a éste. Por lo tanto, la escala utilizada en la práctica, a pesar de su apariencia, no es una escala de intervalos o de razones, porque se constituye en ella una zona límite, de extensión variable y definición ambigua, en tomo a la calificación promedio y en la que, con frecuencia, puede no haber diferencia efectiva entre los alumnos promovidos y los no promovidos.

Compárense las calificaciones siguientes que corresponden a diferentes alumnos en un régimen que exige una calificación promedio mínima de 6 puntos para la aprobación:

A: 4; 6; 6; 7 calificación promedio: 5, B: 7; 6; 7; 4 calificación promedio: 6 C: 5; 7; 6; 6 calificación promedio: 6 D: 7; 6; 5; 7 calificación promedio: 6, Las calificaciones promedio, en este caso, muestran cómo se construye esa zona límite. Para salvar el concepto de zona, en reemplazo del punto límite para la promoción (que haría que el alumno A no fuera promovido y sí los tres restantes), es común que se aproximen la calificaciones que se encuentran entre n,50 y n,99 al entero más cercano. Pero este esfuerzo de corrección de la escala no es suficiente para evitar y justificar la inexactitud real de la calificación. También habría que demostrar que existe real diversidad entre el n,49 y el n,50. Por otra parte el sistema tampoco permite que se manifiesten con claridad en los promedios las diferencias de rendimiento entre los cuatro alumnos en las diferentes instancias de evaluación.

Como vemos, la calificación promedio no es suficientemente descriptiva del nive de aprendizaje de los alumnos. Esto es producto de la conjunción de diversos factores. Entre ellos podemos mencionar: 1) la variación de las distancias entre grados consecutivos en las escalas de calificación que se utilizan habitualmente en la escuela, y 2) la combinación de este sistema de promoción con escalas que poseen un número relativamente grande de grados.

Si se emplea, por ejemplo, una escala de 11 grados (O a 10) con el sistema de promoción por promedio calculando hasta los centésimos, la escala resultante tendrá 1001 grados. Si la escala de base tuviera 5 grados, la escala para los promedios tendría 401 grados.

Como ya vimos, esta excesiva discriminación cuantitativa entre valores asignados a conjuntos de aprendizajes no es válidamente descriptiva de éstos ni de las diferencias existentes entre los aprendizajes de distintos alumnos. Sería difícil demostrar que la diferencia entre 5,74 y 5,75 puntos tiene alguna correspondencia significativa cuando se interpretan logros y fracasos en esos aprendizajes. Del mismo modo no puede considerarse relevante una diferencia de 25 puntos en una escala de 1001 grados.

El sistema de promoción por promedio presenta otras serias desventajas:

  1. Un alumno que ha hecho un trabajo excelente y uno muy malo obtendrá la misma calificación promedio que otro que ha hecho dos trabajos pobres. Las calificaciones de uno y otro, por ser idénticas, aunque se refieren a dos situaciones sustancialmente distintas, no son útiles porque no pueden servir de base ni para una tarea de diagnóstico ni de pronóstico.
  2. Por este sistema de promoción adquieren el mismo valor, respecto de la calificación promedio, trabajos de naturaleza heterogénea: orales, escritos, prácticos, teóricos, breves, extensos, menos importantes, muy importantes, etcétera.
  3. Marca un tope de rendimiento para los alumnos. La calificación promedio mínima exigida para la promoción se convierte en el objetivo perseguido y en el símbolo del nivel de aspiración de una gran cantidad de alumnos, incluso de muchos estudiantes que podrían alcanzar mejores logros.
  4. Crea en el docente una tendencia a cuantificar todos los comportamientos de los alumnos en clase, estereotipando las categorías de observación.

La media ponderada se calcula del siguiente modo:

Si se calculara una media aritmética no ponderada, la calificación promedio sería de 7 puntos. Como se ve en este caso, el mayor peso de las instancias "muy importantes" mejora la calificación final.

Se trata en los casos que hemos presentado hasta aquí, de calificaciones puntuales, obtenidas en instancias separadas una de la otra, pero se puede adoptar otro punto de vista respecto de la evaluación final de un curso. De Ketele (1984) atribuye a la evaluación, entre otras, la función de certificar que la persona evaluada posee los conocimientos suficientes para pasar al próximo año, al curso siguiente o a la vida profesional, según proceda. Pero, en esos casos, señala la importancia de que se tomen en cuenta dos aspectos:

  1. "este tipo de evaluación se refiere a los objetivos terminales, es decir, a los macroobjetivos que integran un número relativamente importante de objetivos intermedios o microobjetivos, así pues, la evaluación terminal no se refiere a estos últimos. Nos atreveríamos a decir -afirma De Ketele- que en cierta manera pueden olvidarse como tales, es su integración lo que nos interesa"; y 2) "la certificación es una decisión dicotómica: el alumno tiene o no la competencia mínima; interesa, pues, definir bien los criterios" (pág. 30). Así, de modo consistente, en el modelo de la Pedagogía de la Integración que propone De Ketele (1993), la evaluación certificativa final toma como objeto para evaluar el objetivo terminal de integración, en tanto los objetivos intermedios son evaluados por evaluaciones formativas o diagnósticas (pág. 70). En atención a estas observaciones, por ende, conviene emplear otro régimen de promoción, diferente de la calificación promedio. Pero, conviene señalar, que si éste último fuera el régimen establecido en la institución o en el sistema escolar, una adaptación que lo mejoraría consistiría en la introducción del concepto de una calificación promedio ponderada (media ponderada) en la que la ponderación se estableciera diferenciando el peso de las calificaciones que corresponden a los que De Ketele denomina microobjetivos, con un coeficiente de valor 1, por ejemplo, y macroobjetivos con un coeficiente de valor 2 o 3.

Régimen de promoción por logros mínimos exigidos

Este régimen se establece sobre la base de la exigencia de un cierto rendimiento mínimo preestablecido en todas las competencias determinadas como significativas para la promoción. A diferencia del régimen de promoción por promedios, la decisión de promoción no resulta del cálculo de una sumatoria ni de una síntesis que globaliza rendimientos heterogéneos sino del análisis del cumplimiento de cada tarea considerada por sí, en tanto indicadora del logro de la o las competencias correspondientes, las cuales

no pueden ser sustituidas por otras competencias distintas. El propósito es garantizar que el estudiante haya alcanzado todos los saberes que se consideran necesarios. Los niveles mínimos de calidad de la tarea para su aprobación son fijados previamente, por lo general, por el docente o por la escuela. Este régimen tiene algunas ventajas sobre el de promoción por promedios ya que asegura un mejor trabajo del alumno a lo largo de todo el curso y hace inútiles las especulaciones con la calificación que son típicas de ese régimen. Pero presenta, también, algunos riesgos que es imprescindible tener en cuenta para evitar su efecto perjudicial. Entre ellos, tiende, al igual que la promoción por promedio, a fijar un tope muy bajo de rendimiento, al nivel del que se ha fijado como rendimiento mínimo aceptable. Si en una escala 0-10, el mínimo de aprobación se estableciera en 5 puntos, éste se convertiría en el objetivo de aprendizaje de muchos alumnos. Los grados superiores de la escala podrían ser percibidos como superávit no necesarios por algunos estudiantes.

Existe siempre, por otra parte, el riesgo de que un alumno que hubiera fracasado en una de las tareas iniciales del curso, en el entendimiento de que la promoción para él sería imposible o, al menos, muy difícil de alcanzar, perdiera interés y abandonara ese curso sin hacer el esfuerzo necesario para remontar los resultados negativos del comienzo.

Estos problemas, en un régimen que tiene ventajas, pueden ser obviados hasta cierto punto por un buen manejo del docente. Se debería mostrar la importancia de los aprendizajes profundos frente a los superficiales que el régimen podría estar estimulando y ofrecer oportunidades reales de recuperación en relación con tareas en las que el alumno hubiera mostrado tener dificultades, eliminando el carácter definitivo de las desaprobaciones iniciales.

La determinación de los estándares mínimos de aprendizaje para la aprobación es una labor de gran importancia y complejidad. En primer lugar, los estándares deben estar definidos con la mayor claridad posible. Además, no deben ser demasiado bajos porque anularían la eficacia del sistema. Pero tampoco excesivamente altos porque se convertirían en exigencias imposibles de alcanzar. En ambos casos, de excesiva facilidad o excesiva dificultad, los niveles de aspiración de los alumnos sufrirían un descenso, generando un nivel correlativo menor de calidad del aprendizaje. Por lo demás, y desde un punto de vista práctico, la implementación del régimen por logros mínimos no presenta mayores dificultades siempre que se compensen los peligros mencionados con estímulo adecuado para que cada alumno alcance su mejor rendimiento de acuerdo con sus posibilidades y se evite la fragmentación de los aprendizajes en objetivos parciales.

Régimen de promoción por examen final

En este régimen se requiere que, para obtener su promoción, el estudiante apruebe una instancia de evaluación escrita, oral o de actuación, o una combinación de dos o de todas ellas. El examen debe estar diseñado de manera tal que permita apreciar en síntesis el aprendizaje logrado por el alumno a lo largo de todo el curso.

No puede tratarse de una simple prueba de actuación o ejecución de una tarea, sino que debe tener un alto grado de validez de contenido y de validez predictiva. Debe representar, en consecuencia, una muestra significativa del universo de contenido de la asignatura, a la vez que debe predecir eficazmente el desempeño posterior del alumno, sea dentro o fuera del ambiente escolar.

Puede utilizarse de diferentes maneras:

  • Como criterio único para decidir la promoción de los alumnos, en cuyo caso el trabajo a lo largo del curso tiene como un objetivo principal preparar al estudiante para la aprobación de la instancia de evaluación final. Las calificaciones parciales, si existen, sirven de orientación al aprendizaje y a la enseñanza y, a veces, para seleccionar a los alumnos a los que se permite rendir el examen final con probabilidad de éxito.

aplicación de un régimen de evaluaciones parciales cuyas calificaciones se procesan según el régimen de promoción por calificación promedio o de logros mínimos exigidos. En muchos casos se incluye una instancia de evaluación final integradora que ocupa el lugar de una evaluación parcial más, como las otras anteriores y, a la vez, de examen final por el papel que desempeña en el proceso de aprendizaje del alumno en la fase de preparación para enfrentar esta instancia que hace las veces de un examen final complementario.

Una modalidad peculiar que puede adoptar es la que corresponde a un programa de evaluación continua basado sobre el análisis, interpretación y apreciación de los registros sistemáticos de las observaciones efectuadas por el docente respecto de las conductas, los procesos y las producciones realizadas por los alumnos en situaciones no puntuales de evaluación. Estas últimas son situaciones de trabajo no diferenciadas de la tarea de aprendizaje. Orientación y guía del aprendizaje y evaluación del aprendizaje son tareas que el docente realiza de manera simultánea. La evaluación es continua y no se diferencian las instancias o momentos destinados a la evaluación de aquellos en los que el docente "enseña". Se trata de un trabajo de carácter clínico, muy individualizado, que se puede llevar a cabo cuando se trabaja con grupos pequeños y en el que la autoevaluación del alumno juega un papel de gran importancia, ya que no sólo es un instrumento útil de evaluación sino una meta de la enseñanza por su valor intrínseco en la formación del alumno.

Régimen de promoción por puntajes derivados

Los puntajes derivados son normas resultantes del procesamiento estadístico de los puntajes brutos obtenidos efectivamente por los alumnos del grupo que se toma como referencia. Los grupos son, usualmente, el grupo de clase a la que pertenece el alumno, su cohorte, su grupo de edad o el grado o año de escolaridad que corresponde. El procesamiento de los puntajes obtenidos por los estudiantes cuando les son administradas las pruebas se realiza mediante la aplicación de reglas fijas. Las normas no representan niveles deseables de rendimiento definidos apriorísticamente, sino construcciones de los evaluadores que indican los niveles que se ha demostrado que los alumnos pueden alcanzar de manera efectiva. Se procura corregir, de este modo, el nivel de logro establecido en los objetivos de aprendizaje propuestos a priori por el docente, la institución o el sistema escolar para adecuarlos a las posibilidades reales de aprendizaje que tuvieron los alumnos y que pudieron demostrar en las pruebas de evaluación como resultado de la enseñanza que recibieron. De este modo, los puntajes derivados se diferencian de los que responden a la aplicación de la llamada "evaluación referida a criterios" que emplea, en cambio, escalas que tienen un valor absoluto y que corresponden a los niveles de logro determinados en objetivos previamente establecidos definidos en términos de aprendizajes deseables. Ambos enfoques, si bien diferentes uno del otro, responden por igual a la búsqueda de la construcción de procedimientos algorítmicos para la asignación de calificaciones a los alumnos, de acuerdo con los principios que han sido desarrollados por el programa de investigación científica de la psicología conductista y sus derivaciones didácticas. W. James Popham (1983) señala la importancia y la autoría de esta distinción:

[...] el mérito de haber creado una estrategia de solución le corresponde a Robert Glaser, que en 1963 publicó un ensayo que ya se considera clásico en el cual introdujo las expresiones evaluación basada en pautas de normalidad y evaluación basada en criterios. Glaser empleó el concepto de evaluación basada en normas estadísticas para describir los tradicionales tests de rendimiento en los cuales se pone el acento en la determinación de la posición relativa de un sujeto dentro de un grupo. Por otra parte, aplicó el concepto de evaluación basada en criterios a los tests que identificaban el dominio (o ausencia de dominio) de "conductas específicas" por parte del sujeto examinado (pág. 31).

Igualmente Norman E. Gronlund (1973) define a estas pruebas indicando que el criterio de conducta específica provee un estándar absoluto con respecto del cual se

compara el logro de aprendizaje de un individuo. Mencionando también a Robert Glaser como fuente de esta propuesta, Norman Gronlund indica que en virtud de que es este estándar de criterio más que la posición relativa en un grupo de norma el que es empleado para describir el rendimiento en una prueba, estas interpretaciones son denominadas referidas a criterios (pág. 2). La precisión requerida para la definición de criterios en términos de conductas específicas condujo a postular que los objetivos de aprendizaje debían ser formulados de manera operacional, postura que tuvo cierta dominancia durante algún tiempo en la práctica de la programación didáctica. Sin embargo, y a pesar de esta clara diferenciación que se establece entre los dos tipos de evaluación, Perrenoud (1990) los asocia, entendiendo que ambos están presentes en la evaluación formal:

Las prácticas observables participan de una combinación intuitiva de la evaluación de referencia normativa y de la evaluación de referencia criterial, ambas muy artesanales, cada una de las cuales neutraliza en parte los posibles excesos de la otra (pág. 132).

En el enfoque de la evaluación referida a normas en la que se emplean los puntajes derivados, los tipos de normas de uso más frecuente son los rangos percentiles, las normas de edad y de grado y las normas de puntaje estándar.

  1. Rangos percentiles: el percentil representa el porcentaje de todos los puntajes brutos que se hallan por debajo de un puntaje bruto dado. La escala de rangos percentiles se confecciona ordenando en forma decreciente los puntajes brutos obtenidos por los alumnos al ser administrada la prueba de evaluación. Se construye una tabla de distribución de frecuencias, anotando junto a cada intervalo de puntaje el número de alumnos que ha obtenido dicho puntaje. Este número se denomina frecuencia (f). Junto a la columna f se ubica la columna de las frecuencias acumuladas que se determina sumando de abajo hacia arriba las frecuencias de los intervalos de puntaje.

El cálculo de los percentiles requiere la aplicación de una fórmula que permite tener en cuenta cuál es el puesto de cada alumno en el conjunto total de la clase. Si se encuentra entre los percentiles 90 a 99, un estudiante demuestra tener un puntaje superior al del 90 a 99 % de los compañeros que se han tomado como referencia para la construcción de la escala de percentiles. Si se encuentra en el percentil 50, esto significa que la mitad de sus compañeros tienen un puntaje inferior al de ese alumno, lo cual equivale a la mediana. Si se ubica en el percentil 20, su puntaje supera sólo al del 20 % de sus compañeros. La escala de percentiles está construida, pues, sobre la base de la comparación entre los aprendizajes efectivamente logrados por los estudiantes, y se emplea válidamente para establecer comparaciones, pero no permite medir aprendizajes en términos de niveles deseables de logro.

  1. Normas de edad: para determinar estas normas se administran pruebas a grupos de alumnos, representativos de varios niveles sucesivos de edad. Se computan luego las medidas de tendencia central (media aritmética, mediana y modo) correspondientes a cada uno de los niveles de edad. De esta manera se establece cuál es el puntaje bruto típico para cada grupo de edad en las pruebas que se han utilizado. Se debe tener presente, precisamente, que esos puntajes sólo se refieren a las pruebas utilizadas y que la extrapolación de los resultados a otras pruebas debe efectuarse con mucha precaución para garantizar que se trata de pruebas razonablemente equivalentes entre sí.
  2. Normas de grado: tienen características similares en cuanto a su proceso de construcción a las que se mencionaron en el apartado anterior. La diferencia estriba en que aquí se adopta como referencia para la comparación el grupo de grado, año o nivel de escolaridad.

Las normas de grado están basadas sobre los puntajes brutos obtenidos al administrar una prueba a grupos representativos de alumnos de grados sucesivos. Se calcula luego la mediana (percentil 50) de los puntajes brutos obtenidos por los alumnos de cada grado o nivel de escolarización. Se construyen así tablas de puntajes que permiten