La evaluación formativa - Mariana Morales Lobo - E-Book

La evaluación formativa E-Book

Mariana Morales Lobo

0,0

Beschreibung

Evaluar se convierte, a menudo, en una carrera de obstáculos que el alumno supera y el docente certifica, pero que no responde a la finalidad de mejorar el aprendizaje ni en cantidad ni en calidad. Los autores de este libro proponen realizar una evaluación formativa que permita realmente el crecimiento del alumnado. Por eso nos invitan a reflexionar sobre algunas prácticas de evaluación que quizá hayamos repetido sin plantearnos a fondo si funcionan o no. ¿Por qué hacemos lo que hacemos? ¿Qué sustento teórico tiene? ¿Recogemos evidencias cuyo análisis da lugar a una acción inmediata posterior capaz de mejorar el proceso de aprendizaje? La evaluación formativa no es algo trimestral, mensual o semanal. Debe suceder a la vez que el aprendizaje, es decir, dentro de nuestras aulas. Y, además, es posible lograr que los estudiantes participen en ella de manera muy activa. Se trata de una labor gratificante para el docente, que comprueba cómo sus alumnos aprenden más.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 251

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



A quienes desean hacer mañana

Prólogo

Constantemente se pueden oír opiniones, aparentemente antagónicas, del tipo:

• Los estudiantes están más preocupados por las notas que por aprender.

• La mayoría de los estudiantes no se esforzarán para aprender si se eliminan los exámenes y las notas.

¿Qué hay detrás de estas afirmaciones? ¿Qué reflexiones nos generan?

Por un lado, la constatación de un hecho: a medida que pasan los años escolares, buena parte de los jóvenes se van centrando más y más en la nota como objetivo, y no les preocupa ni les interesa lo que aprenden. Paralelamente, otros deciden que, como sus calificaciones no son buenas, es mejor dejar de preocuparse por ellas y, como dicen, “pasar” de los exámenes y de hacer los trabajos que se les proponen.

Y, por otro lado, nos muestran la creencia de las personas para las que la nota fue un estímulo para esforzarse por “estudiar”, de que recibir calificaciones continuamente es algo bueno y útil, aunque luego, en la vida, hayan constatado que la mayoría de los contenidos que aprobaron ni los recuerdan, ni los utilizan. Valoran especialmente el haber aprendido a esforzarse para aprobar (reconociendo, sin embargo, que en muchos casos este esfuerzo se tradujo en aplicar estrategias de copia y de memorización a corto plazo).

Los docentes hemos pasado por esta experiencia escolar y, en consecuencia, tendemos a promover las formas de evaluar que experimentamos cuando éramos estudiantes, básicamente, centradas en la calificación. No nos podemos imaginar otras maneras de incentivar el aprendizaje, aunque seamos conscientes de que buena parte del alumnado ya no recordará, en el curso siguiente, casi nada de lo que consiguió aprobar.

El interés de este libro proviene, precisamente, de que ayuda a repensar la visión de la evaluación dominante y a conocer nuevas prácticas orientadas a que la que apliquemos resulte realmente útil para aprender a todos los estudiantes, conocimientos de todo tipo que sean significativos y socialmente relevantes, es decir, lo que actualmente explicitamos como saberes competenciales.

Este es el gran reto que tienen los sistemas educativos, y que también tenemos los docentes y las escuelas e institutos. Recientemente, para alcanzar este objetivo, las propuestas y prácticas se han centrado, sobre todo, en la génesis y aplicación de nuevas metodologías de enseñanza, de nuevas formas de organizar el aula y de distribuir los espacios en las escuelas, y del uso de los recursos que ofrece la tecnología, pero aun así los resultados a nivel estadístico no han mejorado. Solo desde hace relativamente pocos años, diferentes estudios han empezado a poner de relieve que, aun siendo importantes estos cambios, si, además, no cambia la evaluación, no cambia nada en profundidad. En esta línea han sido relevantes los trabajos generados en Francia alrededor de la llamada evaluación formatrice o en Reino Unido sobre formative assessment. Y aún más recientemente, se empieza a trabajar con la hipótesis de que “menos notas es más”.

¿Qué nos aporta este libro para responder a este reto? Destaco cuatro aspectos que son claves en este cambio en la mirada de la evaluación y en las prácticas asociadas.

En primer lugar, una idea que creo que es muy sugerente: los docentes tenemos que profundizar en lo que realmente motiva a los estudiantes para esforzarse por aprender y pasar de la cultura del cumplimiento a la cultura de la confianza. Esta idea impregna toda la argumentación del porqué es tan importante centrarnos en una evaluación formativa, que se caracteriza por promover el crecimiento, es decir, ir avanzando de forma que cada aprendiz, desde sus características personales, encuentre cómo hacerlo con ayuda de las personas de su entorno, docentes, compañeros, familiares…, y descubra el placer que comporta aprender.

En este camino, normalmente complejo y con momentos de desánimo, los acompañantes son determinantes, y no hay duda de que los docentes somos piezas clave en su liderazgo, especialmente para crear una organización que lo favorezca. Por tanto, nuestra función no es la de corregir y calificar continuamente a cada alumno, sino la de promover que sean autónomos corrigiéndose, a partir de liderar la organización del aula de forma que se cree un clima de confianza, en el que todos pueden aprender, y se posibilite la cooperación en un marco en el que la diversidad sea percibida como algo positivo e, incluso, necesario para que todos puedan progresar.

Para ello, destaco otra idea en la que se profundiza en el libro: centrarnos en dar más feedback y menos notas. De hecho, la actividad menos gratificante que llevamos a cabo los docentes es la que llamamos corregir, y no nos gusta porque nos ocupa muchas horas y no percibimos que sea útil más allá de decidir una nota. Esta inutilidad-utilidad también la perciben los aprendices, y no es extraño que se centren, al realizar una tarea, en cómo obtener una buena nota y no en aprender. Por eso, su pregunta es: “¿Cuánto vale este trabajo para la nota?”. Y nunca se plantean qué están aprendiendo al realizarla. Incluso planifican su tiempo y esfuerzo en función de este valor, hecho que incentivamos cuando confundimos los “criterios de evaluación” —relacionados con la identificación de cómo reconocer donde se está y hacia dónde se debería ir mejorando—, con los criterios —valor en porcentaje de cada una de las tareas— que aplicamos para calcular la calificación final.

Las ideas y los ejemplos de prácticas que nos aporta el libro son claves para ir cambiando nuestra forma de corregir y orientarla a promover un feedback que posibilite la concreción, la progresión, la personalización y, como ya hemos dicho, transmitir confianza. Muchas son las ideas que se recogen y todas interesantes, pero que nos requieren a los docentes un aprendizaje especialmente a dos niveles: el de cambiar creencias y rutinas, a partir de ponerlas en cuestión al fundamentar la mirada en nuevas ideas, hipótesis de trabajo y resultados de investigaciones, y el de conocer y poner en práctica nuevas estrategias e instrumentos que facilitan que el feedback pueda ser efectivo. No es un cambio simple, necesita dedicarle tiempo y un trabajo en el marco de un equipo de docentes que comparte el objetivo y es capaz de conseguir vencer el desánimo, que es normal que se genere cuando se empieza a cambiar rutinas muy interiorizadas, en este caso, sobre la evaluación. De ahí la necesidad de crear una “cultura de centro” sobre la evaluación que promueva esta nueva mirada. No es un cambio de un docente en su clase, es un cambio institucional que requiere poner en práctica un espíritu aventurero.

Una tercera idea, que valoro como muy estimulante en el cambio de la práctica de la evaluación, es la de la modelización por parte del docente. ¿Cómo puede aprender el alumnado a autoevaluarse, a darse un feedback útil, si no tiene buenos ejemplos, experiencias, vivencias? A los docentes nos perciben como personas “perfectas” que nunca tuvieron que afrontar las dificultades con las que se encuentran los que son noveles en un determinado aprendizaje y, en cambio, cuando compartimos cómo nosotros las superamos en nuestra infancia y juventud, las estrategias que aplicábamos, en qué pensábamos, y cómo gestionábamos las emociones negativas que se generaban, es decir, cuando modelizamos, la conexión con nuestros estudiantes es mucho más efectiva.

Razones que lo justifican, y se argumentan y ejemplifican en el libro, son la concreción que conlleva la modelización, el lenguaje “evaluativo” que utilizamos y la orientación hacia la generalización de las nuevas formas de hacer y de pensar. Por ejemplo, si hablamos de cómo superamos un tipo de dificultad, no diremos que nos pusimos a “trabajar más” o estuvimos “más atentos”, o que en vez de escribir tal frase lo hicimos de otra forma, sino que hablaremos de cómo superamos el tipo de error de forma que fuera útil para que nuestros alumnos pensaran en posibles estrategias orientadas a mejorar, tanto en relación con el ejemplo concreto de dificultad, como en muchos más. Y, además, nuestra forma de hablar del error será en positivo, como algo bueno, porque a partir de él se aprende.

Pero no solo el docente es quien “modeliza”, sino también los compañeros y, de ahí, la necesidad de estimular la coevaluación. Para superar las distintas dificultades no hay una sola estrategia, un único camino. Los docentes podemos compartir no solo nuestro camino, sino también el de compañeros que tuvimos y, también, en el marco del aula, los estudiantes pueden compartir las estrategias que aplican, analizarlas y reconocer los puntos fuertes de cada una. Por eso es tan importante promover la coevaluación con finalidades formativas.

Finalmente, destacaría un cuarto eje en las reflexiones e ideas prácticas que el libro aporta: la necesidad de repensar cómo compartir con las familias, por un lado, el cómo y el porqué del cambio en la visión y finalidad de la evaluación y, por otro, los aprendizajes de sus hijos e hijas. Los cambios que una escuela promueve, para que sean efectivos, necesitan ser compartidos por toda la comunidad educativa y, por tanto, por las familias. Si estas solo preguntan a sus hijos por la “nota” que han obtenido y no por lo que han aprendido y, aun menos, por las nuevas preguntas e ideas que se han planteado, será imposible que el cambio en el aula se traduzca en mejores aprendizajes.

Por eso es tan importante crear nuevas formas de comunicación que no se centren solo en la información unidireccional que el docente da a las familias, sino también en promover que compartan su mirada acerca de qué y cómo está aprendiendo su hijo y en cómo los propios alumnos participan de este proceso de comunicación. En esta línea de cambio de las maneras de compartir el progreso en los aprendizajes es necesario disponer de evidencias y no solo calificaciones u opiniones poco fundamentadas. Por eso es importante el uso de instrumentos, como el portfolio u otros, que informan mucho más de los avances —al poder comparar el antes y el después—, que no un simple examen puntual.

De la lectura del libro se podría concluir que poner en práctica una evaluación formativa realmente útil para aprender y gratificante, tanto para alumnos como para los docentes, necesita mucho tiempo y que dedicarlo perjudica a los estudiantes con más capacidades. Sin embargo, los estudios realizados demuestran que estos alumnos también mejoran sus resultados, aunque es cierto que el impacto es mucho mayor en los que en otras prácticas evaluativas obtenían malos resultados. De hecho, como habitualmente las correcciones no promueven que todos los estudiantes superen las dificultades, se pierde mucho tiempo repitiendo los mismos procedimientos e instrucciones. Y como ya se ha fracasado, repetir, recuperar o reforzar son acciones muy poco relevantes. Como dice John Hattie, para los estudiantes una calificación “es el final del camino”, porque ya no se cree en las posibilidades de mejora.

Cuando se aplica una verdadera evaluación formativa se ha de afrontar, tanto los docentes como los alumnos y sus familias, una contradicción: ante el hecho de que los resultados mejoran significativamente y hay mucho menos fracaso escolar, se tiende a atribuirlo a que se ha sido menos exigente y que se ha marginado el aprendizaje de conocimientos importantes. Los docentes tendemos a creer que lo normal es que la media de los resultados de un grupo-clase esté en el “5”, y nos es difícil imaginar que pueda ser deseable que esté en el “7,5”. De ahí la importancia de definir y compartir bien los objetivos y posibles hipótesis de progreso a lo largo de la escolaridad, y que la evaluación recoja evidencias de cómo se va avanzando en su nivel de logro. Ser competente resolviendo problemas, escribiendo textos, diseñando y realizando investigaciones, relacionando el pasado histórico con el presente, aplicando ideas y técnicas de forma creativa, etc., son objetivos de una enseñanza básica que necesitan de una buena planificación para que todos los estudiantes los puedan alcanzar de manera progresiva y a diferentes niveles de abstracción y complejidad.

La finalidad de la escuela es que todos los estudiantes sean competentes y la diversidad se manifiesta en que hay diferentes niveles de competencia, pero sin renunciar a que todos lo sean. Para conseguirlo, el cambio en la finalidad y la práctica de la evaluación, tal como se promueve y argumenta a lo largo del libro, es clave.

Neus Sanmartí, docente, química y especialista en didáctica de las ciencias y en evaluación

Bloque I. ¿Para qué evaluar?

Pide que el camino sea largo.

Que muchas sean las mañanas de verano

en que llegues —¡con qué placer y alegría!—

a puertos nunca vistos antes.

KONSTANTIN K

Capítulo uno

¿Qué entendemos por evaluación formativa?

El libro que tienes entre las manos no es un libro de recetas. No te ayudará a pensar menos y trabajar más, sino a todo lo contrario: a pensar más y ser más eficaz. Para ello, proponemos realizar una evaluación que permita el crecimiento de las personas con las que convives en clase.

Este libro trata sobre la evaluación formativa. Cuando decimos la palabra evaluación, los adjetivos que le siguen son esenciales, porque modifican los procesos y las finalidades de la acción de evaluar. Evaluación formativa y evaluación sumativa son dos tipos de evaluación tan diferentes que merecerían tener vocablos propios. Esta cuestión semántica se muestra, por ejemplo, cuando preguntas en un foro de docentes: ¿Qué finalidades tiene la evaluación?

La lista de respuestas sería larga, pero se resume en dos: evaluar para mejorar o aprender; y evaluar para certificar. Son, en efecto, las dos finalidades que constan en los reglamentos educativos y que corresponden a la evaluación formativa y a la sumativa, respectivamente. La mayoría de los docentes (ver imagen 1) centra sus respuestas en la evaluación formativa. Sin embargo, cuando planteas la misma pregunta a un grupo de alumnos, sus respuestas se centran en “poner notas”, “aprobar”, etc. (ver imagen 2), es decir, se orientan hacia la evaluación sumativa. No es solo una cuestión de comunicación, de que no expliquemos acertadamente para qué estamos evaluando. Esta distancia entre las respuestas de los alumnos y las de los docentes revela una notable diferencia entre los discursos teóricos y la práctica más extendida en las aulas en cuanto a la evaluación. He aquí nuestro margen de mejora.

Imagen 1. Respuestas de los docentes.

Imagen 2. Respuestas de los alumnos.

La evaluación sumativa impregna todo el sistema. La evaluación continua que figura en las sucesivas leyes educativas, en realidad, se ha aplicado en forma de continua evaluación sumativa a base de muchas notas. Los trimestres escolares se denominan “evaluaciones”, la segunda evaluación es, en realidad, el segundo trimestre, y se considera una sumativa de ese periodo, con sus recuperaciones específicas.

Cada trimestre o “evaluación” consta, a su vez, de sus pruebas parciales, sus trabajos de trimestre, tareas puntuales, entregas de deberes, participación en clase, etc., que se recogen en auténticos modelos matemáticos que acaba resolviendo un algoritmo con medias ponderadas de instrumentos de evaluación: exámenes, test, rúbricas, anotaciones de puntos positivos o negativos, etc. Estos procesos de calificación se han vuelto más complejos y exhaustivos con la implantación de sistemas de calidad de gestión documental en los centros educativos, y responden precisamente a eso: a una mejora en la gestión documental.

A veces, esta mejora viene acompañada de mayor transparencia, si bien queda oscurecida en la maraña de infinitos datos, porcentajes y variables de diversa calidad que se introducen en los sistemas para calcular las calificaciones. Así, evaluar se convierte, a menudo, en una carrera de obstáculos que el alumno supera y el docente certifica, pero que, como veremos, no responde a una finalidad formativa de mejorar el aprendizaje ni en cantidad ni en calidad, sino que es una sumativa continua.

Desde la perspectiva de los docentes, la carga de trabajo que supone rellenar rúbricas o corregir más y más pruebas tampoco ayuda. ¿Para qué sirven esas correcciones? ¿Ayudan al aprendizaje o sirven para rellenar el hueco en el Excel o en la plataforma?

En ese batiburrillo de cifras que maneja el sistema de recogida de notas ya no sabemos qué peso se le da a cada contenido o competencia, ni si los datos que se introducen en el modelo son de calidad o “de relleno”. Por ejemplo, en una materia para un trimestre (o “evaluación”), podemos valorar dos notas de exámenes, una rúbrica de una exposición oral, un porcentaje pequeño de actitud (valorada a base de positivos y negativos o de la subjetividad del docente), y un sinfín de pequeñas tareas que no hay tiempo de corregir, de forma que solo se valora la entrega.

Habitualmente, el grueso de la calificación es para los exámenes. Pero ¿cómo se reparten los contenidos o competencias en dichos exámenes? ¿Se repiten preguntas en ambos cuando hay 2 pruebas? ¿Se tiene en cuenta si en la segunda prueba se ha respondido bien a preguntas que en la primera estaban incorrectas? No lo sabemos. El sistema recibe muchos datos, pero desconocemos a qué se está dando más importancia, qué aspectos curriculares se están ignorando o minusvalorando, qué datos tienen realmente calidad y relevancia, etc. Es decir, a pesar del esfuerzo de transparencia que se pueda hacer, los sistemas están nutridos de datos de diferente calidad y peso. Como dice Cathy O’Neil (2018): “Es fácil creer que más datos equivale a mejores datos”.

Ese algoritmo que nos devuelve un número entre 1 y 10, generalmente, es incapaz de especificar qué sabe el alumno, qué no sabe, qué tendría que revisar, en qué necesita ayuda, etc. No nos aporta información cualitativa respecto a unos criterios, que es precisamente lo que necesitamos como docentes para trabajar con nuestros alumnos y hacer una evaluación formativa.

Es frecuente que, además, en la evaluación sumativa de final de curso se haga una media ponderada entre los resultados de cada trimestre, incluso cuando la materia va aumentando su dificultad e incrementando conocimientos o destrezas a lo largo del curso. Es decir, si un alumno tiene que aprender a multiplicar por una cifra en el primer trimestre y por dos cifras en el segundo y hasta el segundo no consigue hacerlo todo, su nota final será la media de los dos trimestres, incluyendo lo que obtuvo en el primer trimestre, cuando estaba en proceso.

Una calificación baja del primer trimestre pesará como una losa en su calificación final para satisfacer un extraño sentido de la justicia que no entiende de dificultades particulares, enfermedades, situaciones familiares difíciles, pobreza o diferentes ritmos en un aula diversa, presuponiendo que todos tienen las mismas oportunidades, capacidad, autonomía personal y conocimientos previos.

La evaluación sumativa, además de certificar, en ocasiones tiene la función de clasificar y ordenar a los alumnos en un ranking. El caso más conocido en España es la prueba de acceso a la universidad, que facilita a las facultades la selección de alumnos en sus procesos de admisión. Otros países tienen sistemas de acceso diferentes (cuya descripción excede el ámbito de este libro) y que muestran que, desde luego, nuestra selectividad es uno más entre otros sistemas posibles de selección de alumnos para las universidades. En ocasiones, esta finalidad de establecer rankings escala hasta la clasificación de centros educativos por parte de algunas comunidades autónomas, según los resultados de las pruebas externas que apliquen. Las pruebas PISA, a menudo, también se interpretan como un ranking. En todos estos casos la función reguladora del sistema queda en un segundo plano.

Si bien este libro se centra en la evaluación formativa, en la parte final explicaremos también propuestas y estrategias efectivas para la evaluación sumativa final. Los instrumentos de evaluación no son formativos en sí mismos; depende de cómo se usen. Un ejemplo habitual son las rúbricas: pueden emplearse para calificar o para evaluar formativamente (Panadero et al., 2014). La herramienta no garantiza el propósito formativo de la evaluación. Repartir stickers, bonos o subir de nivel los avatares puede sustituir a los puntos positivos, pero no convierte una evaluación en formativa. La información que aporta el instrumento de evaluación (sea cual sea) debe permitir una acción inmediatamente posterior que cambie, por ejemplo, lo que vamos a trabajar en clase al día siguiente o la acción que va a realizar el alumno. Por ejemplo, un docente puede pasar un test a su clase de ciencias que saca a relucir que el 40 % del grupo no sabe qué pasa si se riega una planta con agua salada. Así, decide volver a dedicar tiempo al día siguiente a este caso práctico. También puede detectar un error de estructura en la redacción de un alumno y, tras señalárselo, este la rehace. En ambos casos hay una acción inmediata como consecuencia del análisis de una evidencia.

John Hattie, en su libro Aprendizaje visible para profesores (2017), define la evaluación formativa como la información que obtenemos los docentes y que permite “cerrar la brecha” entre el aprendizaje actual y el aprendizaje objetivo de un alumno. Esta información promueve la reflexión sobre el progreso realizado y, de esta manera, permite avanzar hacia ese criterio.

En su libro Evaluar y aprender, un único proceso, Neus Sanmartí (2019) afirma: “Por mucho que cambien los métodos, si no se lleva a la práctica una evaluación que tenga un objetivo distinto de «poner notas», no cambiará nada en el fondo. Sin una evaluación que facilite reconocer las dificultades y encontrar caminos para superarlas, no hay aprendizaje”.

Ejemplos sencillos de lo que no es evaluación formativa son las preguntas: “¿Qué tal hasta ahora?” o “¿Comprendido?”. Las respuestas a estas preguntas rara vez nos van a ayudar. Por una parte, muchos van a murmurar tímidamente un “Sí” que puede, en realidad, significar “No, pero paso de decirlo” o “No sé, pero es lo que el profe espera que responda”. Por otra parte, las declaraciones de que “todo va bien” cuentan principalmente que el individuo ha construido una historia coherente en su cabeza, no necesariamente que esa historia sea cierta.

Niños, adolescentes y adultos somos propensos a la sobreconfianza en nuestras propias posibilidades: sin entrenamiento, no podemos juzgar lo que sabemos o no, y sobrestimamos lo bien que lo hacemos (Ehrlinger et al., 2008). Más aún: aquellos que saben menos sobrestiman su conocimiento aún más, porque es más difícil para ellos juzgar cómo sería hacerlo bien. Esto se conoce como el efecto de Dunning-Kruger (2002). Y, además, como acabamos de decir, el contexto de un aula puede “afectar” a su sinceridad, porque no suelen querer parecer poco inteligentes, ralentizar la clase o, simplemente, llamar la atención.

Por tanto, el principio subyacente sería: monitoriza la comprensión de los alumnos durante las clases para responder en consecuencia. Para ello, necesitamos estrategias que nos permitan descubrir rápidamente lo que están pensando, escuchar a toda la clase, y enfocarnos en el contenido y no en su percepción de lo bien o mal que lo comprenden.

Lo más común es que utilicemos lo que podemos denominar "evidencia que trae el viento", es decir, comentarios espontáneos que pueden revelar su comprensión o incomprensión. También podemos preguntar directamente, pero esto solo nos provee evidencias de un alumno cada vez; y, si toma unos treinta segundos conseguir una respuesta clara de uno, emplearemos dos minutos en cuatro alumnos y así sucesivamente. Además, las respuestas irán reflejando cada vez más las respuestas anteriores.

¿Cómo es, entonces, la evaluación formativa? Se distingue, en primer lugar, por su finalidad: pretende lograr unos aprendizajes mayores o mejores. Su objetivo, a diferencia de la evaluación sumativa, no es certificar unos conocimientos o competencias, sino lograr una mayor eficacia en los procesos de aprendizaje mediante su regulación.

Además, la evaluación formativa consta de tres pasos: la recogida de evidencias de aprendizaje, el análisis de estas y la toma de decisiones. Para que sea realmente formativa, es necesario realizar el proceso completo. Una recogida prolija de evidencias de distinta calidad y fiabilidad, un análisis somero y la ausencia de decisiones convierten el proceso de evaluación en mera burocracia.

Veamos, en primer lugar, algunas características de la recogida de evidencias. Las evidencias deben, obviamente, responder a la naturaleza de lo que se está evaluando. Pongamos por caso que el objetivo de aprendizaje sea “observar muestras por el microscopio”. Si la evidencia consiste en una prueba escrita en la que el alumno tiene que dibujar un microscopio y poner los nombres de cada parte, está claro que no responde al objetivo marcado y no sería una evidencia fiable para ese objetivo (sí podría serlo de “dibujar e identificar las partes de un microscopio”). Para tener evidencias sobre “observar muestras por el microscopio” tendríamos que ver al alumno haciéndolo o explicando cómo se lleva a cabo. La pista nos la da el verbo en infinitivo que vemos en el objetivo de aprendizaje, en este caso, “observar”.

A veces, la fiabilidad de una evidencia depende de si se ajusta parcial o totalmente al objetivo. Por ejemplo, cuando en una prueba de Ciencias Naturales se penaliza la puntuación por errores ortográficos, se está distorsionando la calidad de los datos obtenidos sobre contenidos propios del área. Esto puede ser común cuando trabajamos con alumnado que no domina la lengua vehicular o en materias impartidas en modelo bilingüe. Si no tenemos cuidado, estamos evaluando el nivel de expresión escrita en inglés en lugar de lo que saben acerca del digestive system.

Otro problema con el que podemos toparnos en relación con la fiabilidad de las evidencias se deriva de no considerar el contexto en relación con el formato de la evidencia. Por ejemplo, un alumno de 6 años a quien se le plantea por escrito cualquier conocimiento tendrá una primera barrera debido a que aún no domina la lectoescritura, y eso afectará a la fiabilidad de la evidencia. Lo mismo le sucedería a una persona con dislalia (tartamudez) en una prueba oral.

La idea de que las evaluaciones son procedimientos para sacar conclusiones también ayuda a aclarar la validez de una evaluación. Tradicionalmente, la "validez" se ha definido como la medida en que una evaluación se relaciona con lo que pretende evaluar. Es decir, si el resultado de la evaluación permite inferir el objetivo descrito en esta misma evaluación. Sin embargo, hay dos problemas con esta definición:

El primero es que las evaluaciones se utilizan, a menudo, de maneras que nunca fueron previstas o incluso admitidas por los encargados de desarrollarlas. Por ejemplo, la prueba de acceso a la universidad no fue jamás concebida para deducir lo bueno que es un colegio.

La nota media de un estudiante en las pruebas de acceso a la universidad puede proporcionar alguna información sobre el grado de rendimiento de ese estudiante en sus cursos de Bachillerato, pero proporciona muy poca información sobre la calidad de la educación recibida por ese estudiante, ya que los factores más importantes que influyen en las notas no tienen nada que ver con la escuela, sino más bien con las características personales —y los antecedentes sociales— del estudiante (Wiliam, 2012).

El segundo problema de definir la validez como una propiedad de un examen u otra forma de evaluación es que una evaluación puede ser válida en algunas circunstancias, pero no en otras. Si tuviéramos un examen de problemas de aritmética con una alta demanda de comprensión lectora, ¿qué podríamos concluir de la puntuación de un estudiante en el examen? Si algunos de los estudiantes que hacen el test son malos lectores, no sabremos interpretar una puntuación baja. Puede ser que el estudiante no haya sido capaz de hacer la aritmética, pero también puede significar que el estudiante sí haya sido capaz, pero no haya podido comprender las preguntas lo suficientemente bien.

Por eso hay ahora un acuerdo generalizado entre los investigadores sobre la evaluación: la validez no es una propiedad de los instrumentos, sino de las inferencias. Que una evaluación en particular pueda apoyar inferencias válidas dependerá de las circunstancias en las que se administre la evaluación. Y esto nos lleva a un principio muy importante de la evaluación. El foco no está tanto en lo bien o mal que lo hizo en esa prueba, sino en la medida en que podemos inferir lo que ha aprendido en función de lo que ha realizado en la prueba. En este sentido, es interesante considerar que los docentes nunca podemos saber lo que hay en la memoria a largo plazo. Aunque a veces nos gustaría poder mirar dentro de su cabeza, no hay manera de comprobarlo. Lo que sí podemos saber es lo bien que recupera esa información de su memoria, a través de sus acciones (comportamientos, actividades, etc.). Es decir, necesitamos saber lo bien que evoca lo que sabe y lo aplica a una situación real o ficticia. En definitiva: de los resultados de una prueba queremos sacar conclusiones sobre aprendizajes que no necesariamente están en las pruebas, sino que se infieren de ellas.

En relación con la cantidad de evidencias necesarias, deberíamos considerar la naturaleza de lo que se está evaluando. En los contenidos conceptuales hay que tener en cuenta que son fáciles de olvidar cuando se memorizan sin relacionarlos con otros conceptos anteriores o como parte de un sistema con sentido. En estos casos, la evidencia habrá que tomarla una vez se hayan realizado evocaciones suficientes para que sea relevante. Por ejemplo, aprender una lista de verbos irregulares en inglés sin relacionarlos semántica o gramaticalmente con conocimiento previo hará que se olviden fácilmente. Lo mismo sucederá si la propia lista de verbos se aprende por orden alfabético, ya que esto no la dota de sentido. Si queremos una evidencia de lo que se ha aprendido con alguna garantía de que se va a recordar, habría que asegurarse de que cada verbo de esa lista se relaciona de una manera lógica con otros aspectos de la lengua que el alumno ya conoce bien (por ejemplo, algunos tiempos verbales) y de que la lista en sí misma tiene una coherencia interna tanto semántica como gramatical.

En el caso de contenidos de procedimiento, puede ser interesante recoger más evidencias, siempre y cuando se realice el proceso completo que hemos descrito para la evaluación formativa en cada una de los “altos en el camino”: recoger evidencias, analizarlas y tomar decisiones. En cuanto a los aprendizajes competenciales en los que se integran diferentes tipos de contenidos conceptuales, procedimentales y actitudinales en un contexto concreto, será necesario recoger evidencias en momentos relevantes de la resolución del problema concreto del que se trate, siempre seguido del análisis y toma de decisiones en cada ocasión.

Podemos adelantar ya que, en realidad, hay que ser muy prácticos en este punto y decidir qué y cuántas evidencias se recogerán en función de la posibilidad real de realizar el proceso completo de evaluación formativa. En otras palabras, recogeremos evidencias siempre y cuando podamos hacer un análisis y haya tiempo suficiente para que las decisiones tomadas se implementen