LA VALUTAZIONE SCOLASTICA

By robertorenzetti44 on 25 settembre 2020 • ( 0 )

Roberto Renzetti

1996

La valutazione è sempre il momento successivo alla programmazione. Nella programmazione si identificano gli obiettivi generali e specifici. In essa devono essere chiariti i metodi di lavoro e le forme di controllo scolastico.

Gli obiettivi, oltre che informativi (contenuti), sono (o possono essere) di capacità e comportamenti. Comunque, prima di sapere come valutare si deve aver chiaro cosa valutare. Dobbiamo quindi chiarire gli obiettivi didattici definendo ciò che ci aspettiamo dal corso di studio. Dobbiamo essere noi per primi ad essere coscienti di che cosa vogliamo che lo studente sia in grado di fare alla fine del corso. Si tratta di rispondere all’esigenza di razionalizzare e porre su basi scientifiche l’istruzione.

Razionalizzare e cioè:

*specificare in dettaglio gli scopi della formazione, le risorse di cui si dispone ed i processi formativi che si vogliono impiegare;

* scegliere tra i vari processi che si possono usare quelli che empiricamente sono risultati più efficienti;

Porre su basi scientifiche e cioè:

* utilizzare metodi analitici ed il più possibile oggettivi per compiere la suddetta razionalizzazione;

* utilizzare i metodi della docimologia

Sono quindi gli obiettivi l’argomento preliminare di un gruppo scuola ed un sottogruppo classe. Vediamo in un diagramma di flusso come si articolano tra loro tali obiettivi.

Per misurare il conseguimento di un dato obiettivo è spesso necessario specificarlo ulteriormente in obiettivi parziali.

______________________________________________

ESEMPIO

Supponiamo di avere per obiettivo la “padronanza del linguaggio e capacità di comunicazione”.

Tale obiettivo può essere parcellizzato nei seguenti:

uso della lingua scritta in relazioni su attività specifiche;
uso della lingua parlata per programmare nuovi lavori mediante discussioni con altri;
uso del linguaggio matematico (lettura di grafici e tabelle e loro costruzione);
uso del linguaggio figurativo, drammatico, musicale,…
….

_______________________________________________

Fissati gli obiettivi, si devono delimitare i contenuti cercando quelli che sono più funzionali al raggiungimento degli obiettivi (che dovranno spesso essere graduati in obiettivi parziali).

Definiti gli obiettivi in relazione ai contenuti (con l’ulteriore specificazione in obiettivi parziali) occorre:

strutturare la materia (selezione del materiale, gradazione, presentazione, ripetizione,…)
adattamento del programma alla situazione (tipo di studente, motivazioni, richieste, condizioni generali,…)
stimolare gli studenti attraverso la ricerca della motivazione
verifica e controllo (operazione che, per essere corretta ed efficace, ha bisogno di un lavoro serio e continuo nel tempo. Si tenga conto di un dato basilare della psicologia dell’età evolutiva: se uno studente si accorge che tutto questo non ha effetti sulla sua carriera scolastica è generalmente perduto come soggetto dell’apprendere).

I risultati della verifica possono poi essere letti in vario modo:

diagnostico (come correggiamo il nostro intervento se ci accorgiamo che qualcosa non va ?)
didattico (controllo ordinario dell’apprendimento)
orientativo (per dare consapevolezza allo studente delle sue attitudini, capacità, conoscenze).

La lettura dei risultati fa scattare la valutazione. Si capisce quindi che la valutazione finale non può che essere uno dei momenti di valutazione del corso di studi. Essa deve essere fatta in rapporto alla programmazione e NON PUO’ essere improvvisata, in qualche giorno, prima dell’esame stesso (mi rendo conto che quanto qui espresso sembra una eclatante sciocchezza se lo si confronta con come sono andate e vanno le cose in Italia almeno dal 1969).

DI QUALI MEZZI CI SI PUO’ SERVIRE PER VALUTARE ? QUALI DI QUESTI MEZZI SONO PIU’ CORRETTI ?

Abbiamo a disposizione i mezzi asistematici ( o intuitivi), quelli generalmente usati che hanno scale di misurazione non comparabili (sono soggettivi, approssimativi, empirici). Riporto un solo esempio di esperienza personale.

Nel 1971 presso il CEDE partecipai ad un corso di aggiornamento (prof. Titone) in cui 20 insegnanti di italiano correggevano lo stesso tema e lo spettro dei voti andava dal 2 al 9. Successivamente 20 insegnanti di matematica correggevano lo stesso problema e lo spettro dei voti andava da 4 all’ 8. Quanto qui detto non è un dato isolato. Ormai è certo che le cose stanno così. Evidentemente l’asistematicità può giocare veri e propri brutti scherzi nella valutazione.

Abbiamo poi a disposizione i mezzi sistematici (o prove oggettive o prove strutturate). Si tratta di ridurre al minimo le considerazioni soggettive del singolo insegnante. Tali prove si distinguono in:

standardizzate e cioè:

*costruite da équipes di specialisti secondo criteri precostituiti ed applicabili ad ogni tipo di allievo

non standardizzate e cioè:

*create dall’insegnante per misurare l’apprendimento e quindi il risultato del suo lavoro didattico

standardizzabili e cioè:

*le precedenti ripetute in più anni e corrette successivamente anche con classi di controllo.

Realisticamente è il caso di occuparsi delle prove non standardizzate (dando però una qualche indicazione per rendere standardizzabili).

COME SI PROCEDE

Si stabilisce ciò che si vuole accertare (il fine del test)
Si costruisce il test con una serie di quesiti sull’argomento
Si somministra il test
Si elaborano i dati
In base all’elaborazione dei dati ed a vari confronti con gli studenti, si migliora il test stesso [un insegnamento senza feed-back è inutile].

Le tecniche più correnti per queste prove sono:

scelta multipla
vero/falso
corrispondenza ed associazione
risposte brevi
completamento
riordinamento.

VANTAGGI

sono di rapida somministrazione
permettono la partecipazione dello studente alla correzione e valutazione
offrono una maggiore indicazione diagnostica
i risultati degli studenti sono rapportabili

SVANTAGGI

alcuni quesiti permettono di ‘tirare ad indovinare’
la struttura a risposta obbligata non valorizza la creatività
per alcune discipline è complesso da elaborare

PER ELIMINARE GLI SVANTAGGI

in sede di correzione si penalizza, rispetto al non rispondere, la risposta errata
si dovrebbe operare con domande di controllo: stessa questione formulata in modo diverso
la creatività la si esalterà in altri momenti
materie come l’ italiano devono entrare in ambiti strutturati eliminando sempre più la parte soggettiva dell’insegnante [è questo un ambito provocatorio di ricerca didattica].

Si deve tener in ogni caso conto che, in prospettiva, l’unica selezione la si potrà fare su prove oggettive.

MISURAZIONE ED ELABORAZIONE DEI DATI

Vediamo ora come usare i dati che si ricavano da queste prove:

per assegnare un voto (individuando la sufficienza)
per valutare l’apprendimento della classe e quindi valutare il proprio insegnamento
per valutare il test stesso e le singole domande.

Per fare tutto ciò occorre fissare dei criteri per l’attribuzione dei punteggi (da non confondersi con il voto):

Assegnati i punteggi, si passa all’elaborazione dei dati.

ESEMPIO SU UNA CLASSE DI 24 STUDENTI

Si inizia a costruire una tabella con i punteggi che ciascuno studente ha avuto, la tabella delle frequenze (l’esemplificazione che segue è sperimentale).

Si raggruppano i punteggi in intervalli predeterminati e si vede quanti studenti sono dentro un dato intervallo (tabella degli intervalli di frequenza):

PUNTEGGIO	N° STUDENTI
100-90	2
89-80	3
79-70	4
69-60	9
59-50	4
49-40	2
39-30	1

A questo punto si costruisce un istogramma che riporterà la distribuzione dei punteggi degli studenti.

Si definiscono poi:

gruppo modale –> l’intervallo in cui si addensa il maggior numero di studenti (nel nostro caso tra 60 e 70)
mediana –> il punteggio dello studente centrale (nel nostro caso tra il 12° e 13° studente e quindi 65)
media –> la somma dei punteggi diviso il numero degli studenti (nel nostro caso 1616/24=67,3)

Il confronto tra queste tre grandezze ci fornisce indicazioni sulla difficoltà del test. Un test ideale deve vedere coincidere le tre grandezze. Nel nostro caso siamo con media e mediana che cadono nel gruppo modale. Il test così rappresentato è un buon strumento di valutazione e risulta di media difficoltà. E’ quindi possibile dare alla media (il 67) il valore di sufficienza. Gli altri voti vengono dati per estrapolazione con criteri da esplicitare a priori [se si decide di assegnare punteggi da 1 a 10, chi ha 33 punti prende 1, chi ha 100 punti prende 10, gli altri punteggi vengono dati interpolando. Si deve però tenere conto che si possono costruire altre possibili scale di valutazione, ma tutte da definire a priori. Un esempio lo vedremo più oltre].

Vediamo esempi di istogrammi che forniscono indicazioni diverse sulla difficoltà del test e sul valore del punteggio da associare alla sufficienza.

Nel primo caso abbiamo la media che cade al di sopra del gruppo modale e ciò vuol dire che il test è difficile.

Nel secondo caso la media cade al di sotto del gruppo modale e ciò vuol dire che il test è facile.

In entrambi i casi non sarà più la media a rappresentare la sufficienza ma la mediana poiché essa, essendo relativa al punteggio centrale è più coerente con la distribuzione reale.

La media al di fuori del gruppo modale ci informa di qualche anomalia nella classe. O studenti in grave ritardo (media in basso) o studenti con conoscenze molto superiori (media in alto). Naturalmente qui discende anche il feed-back di cui dicevo prima. E’ possibile che il lavoro dell’insegnante non sia adeguato. E’ possibile che il test fosse superiore alle capacità di quel gruppo, ma è anche possibile che fosse troppo facile. Queste considerazioni faranno intervenire l’insegnante con ulteriori spiegazioni e serviranno via via a calibrare il test medesimo.

In ogni caso, negli esempi visti, la media perde valore mentre la mediana rappresenta meglio la classe.

Un test è considerato di difficoltà adeguata se la media oscilla intorno al 60% del punteggio massimo che si può ottenere in un dato test.

Riassumendo gli istogrammi (“arrangiati” a gaussiane) che ci raccontano, rispettivamente di test adeguati, difficili o facili sono quelli rappresentati dalle “curve” seguenti:

ALTRE INFORMAZIONI RICAVABILI DAGLI ISTOGRAMMI

Riporto due situazioni limite che possono presentarsi:

La seconda situazione è la migliore: pochi studenti “scartano” in modo significativo dalla media. Il livello di apprendimento è omogeneo, fatto che non si verifica nella prima situazione.

Per concludere occorre almeno accennare all’ indice di dispersione (non è proprio il caso di introdurre la deviazione standard perché complessa e non particolarmente utile ai piccoli numeri di una classe. Immagino che con tale strumento il CEDE saprà analizzare, a livello nazionale, i risultati delle “terze prove” degli esami finali”, anche se viziati da una diversità non facilmente riconducibile ad un’unica analisi).

CALCOLO DELL’INDICE DI DISPERSIONE

Dati i risultati di un test si inizia con una scrematura che prevede lo scarto dei punteggi estremi (max e min) e si trova la metà dell’intervallo di punteggi che vanno dal terzo al terzultimo studente (se essi sono in numero da 15 a 21) e dal quarto al quartultimo (se essi sono in numero tra 22 e 28). Nel nostro esempio ci sono 24 studenti: il punteggio del 4° è 85, quello del quartultimo è 55. L’indice di dispersione è la semidifferenza di questi due valori:

ID = (85 – 55)/2 = 15

A questo punto si calcola il numero degli studenti che scarta dalla media di + o – 15 punti (nel nostro caso da 67,3 + 15 = 82,3 e 67,3 – 15 = = 52,3).
Si calcola ora il numero degli studenti che scarta dalla media del doppio del valore precedente, cioè + o – 30 (nel nostro caso 67,3 + 30 = 97,3 e 67,3 – 30 = 37,3).
Quanti scartano dalla media del triplo………….
E così via finché il conto è possibile.
Si fa quindi un istogramma che ha la media come asse centrale (cioè: 67,3) ed a destra e a sinistra i punteggi sopra calcolati. Nel nostro caso si ottiene che tra 67,3 e 52,3 vi sono 11 studenti; tra 67,3 e 82,3 vi sono 6 studenti; e così via.

Perché il livello di apprendimento possa essere considerato buono per il gruppo classe occorre che il 68% degli studenti abbia un punteggio che cada tra l’indice di dispersione + 1 e l’indice di dispersione – 1 (nel nostro esempio tra 52,3 e 82,3. E ciò è verificato poiché 17/24 è circa uguale al 71%).

ESEMPI DI ISTOGRAMMI RELATIVI A DUE TEST

Anche per vedere cosa d’altro si può apprendere dall’uso di questi test riporto due esempi di istogrammi costruiti su due test. Qui vi è una novità: vi è anche un istogramma che riguarda alla data domanda quanti ragazzi hanno risposto (il terzo istogramma di ogni esempio).

Dagli esempi mostrati l’insegnante può capire la difficoltà di una determinata domanda (o è mal formulata o l’argomento non è stato trattato adeguatamente). Su questo aspetto si può intervenire in somministrazioni dello stesso test in anni successivi (standardizzabilità). Se alla domanda 3 nessuno risponde c’è qualcosa che non va. Se alla domanda 7 rispondono tutti, quella domanda è inutile.

ALTRI TESTS ED ALTRI CRITERI

Fatte le verifiche disciplinari sui contenuti specifici, occorre passare ai tests che verifichino il conseguimento degli obiettivi generali di capacità e comportamenti. Questi tests non potranno che essere standardizzati. Tutte le discipline, infatti, concorrono alla soluzione di una questione non necessariamente disciplinare.

Dal punto di vista della valutazione da associare ad un determinato punteggio è anche possibile decidere a priori una determinata scala. Dato il test si vede qual è il minimo voto possibile (ad esempio – 20) e quale il massimo voto possibile (ad esempio + 80). Si rapporta tutto questo ad una scala decimale o centesimale e, mediante semplici proporzioni si calcola immediatamente qual è il voto da assegnare ad ogni singolo studente.

Una ultima considerazione riguarda la Terza Prova introdotta negli esami di Stato. Dovendo essere preparata dalla Commissione d’esame in poco tempo ed essendo slegata da qualunque programmazione che coinvolga gli operatori didattici nel loro insieme può solo essere una sommatoria di singoli pezzi di singole discipline. I criteri di razionalizzazione e scientificità tenderanno a svanire. Si sono creati abiti ricercati ma la tendenza è il lasciarli negli armadi.