Achievement, Aptitude, and Ability Tests

Molti psicologi usano etichette come achievement test, aptitude test e ability test in modo impreciso, e i non psicologi le usano come sinonimi. Questa mancanza di precisione è comprensibile perché nella pratica reale, i test che portano queste etichette spesso sembrano essere abbastanza simili e sono usati per scopi simili. Questa voce spiega la distinzione teorica tra test di realizzazione, attitudinali e di abilità; descrive gli usi principali di questi test e fornisce una breve panoramica dei tipi di sottoscale ampiamente utilizzati in questi test e i costrutti che misurano.

Distinzione teorica tra i test

I test di realizzazione sono progettati per valutare la misura in cui una persona ha sviluppato una specifica abilità motoria o imparato un corpo specifico di conoscenza. Tipicamente, un test di realizzazione viene somministrato dopo un periodo di istruzione progettato per insegnare l’abilità motoria o cognitiva da esaminare. Il prototipo di test di risultato è l’esame periodico in classe che viene somministrato per determinare quanto lo studente ha imparato. Altri esempi sono gli esami scritti e di guida per ottenere la patente di guida, lo Scholastic Assessment Test (SAT) e l’American College Test (ACT) per gli studenti delle scuole superiori che vogliono andare al college, e il Graduate Records Examination (GRE) per gli studenti universitari che vogliono andare alla scuola di specializzazione.

Teoricamente, lo scopo del test di risultato è descrittivo – misurare la misura in cui l’esaminando ha imparato un’abilità motoria o un’area di conoscenza. In pratica, tuttavia, i risultati dei test di risultato sono spesso interpretati come un indicatore di prestazioni future. Per esempio, mentre i test di rendimento come il SAT e il GRE valutano le conoscenze che gli esaminati hanno maturato come risultato delle loro esperienze educative, i punteggi di questi test sono usati per predire la probabilità di successo in programmi di studio più avanzati e impegnativi. Questa pratica comune con-fonde la funzione di valutazione delle prestazioni (cioè, descrittiva) dei test di rendimento con gli obiettivi di previsione dei test attitudinali.

Molti test di rendimento e attitudinali sono molto simili in apparenza, ma lo scopo primario dei test attitudinali è la previsione. Sono progettati per ottenere informazioni che possono essere utilizzate per prevedere qualche aspetto del comportamento futuro della persona. I test attitudinali valutano la capacità dell’esaminando di apprendere sia abilità cognitive che motorie. Spesso, i punteggi su un test di comprensione verbale ad ampio raggio sono usati per predire il potenziale dell’esaminando di imparare (e usare) nuove abilità cognitive. Infatti, l’uso più comune dei test attitudinali è quello di prevedere le prestazioni future in un programma educativo o in un ambiente professionale. Tuttavia, alcuni test attitudinali misurano le abilità motorie (ad esempio, la coordinazione occhio-mano o il tempo necessario per correre una corsa di 40 metri). I punteggi dei test attitudinali come questi sono usati per prevedere la capacità dell’esaminando di imparare (e usare) abilità motorie desiderabili.

La distinzione tra test attitudinali e di abilità è sottile, e molti psicologi ed editori di test usano i termini in modo intercambiabile. In generale, comunque, i test di abilità valutano set di abilità cognitive e motorie che sono state acquisite in un lungo periodo di tempo e che non sono attribuibili ad alcun programma specifico di istruzione. Per esempio, i test di intelligenza come il Wechsler

Adult Intelligence Scale-Third Edition (WAIS-III) e lo Stanford-Binet Intelligence Scales, Fifth Edition (SB5) misurano la comprensione verbale, la memoria di lavoro, l’organizzazione percettiva e la velocità di elaborazione. Queste abilità non sono il risultato di alcun programma specifico di istruzione. Invece, si crede che siano una funzione della capacità nativa della persona di imparare dalle esperienze della vita. I test di abilità sono descrittivi in quanto valutano la conoscenza e le abilità delle persone, ma sono anche predittivi perché misurano qualità che si presume influenzino la capacità della persona di imparare nuove abilità e di risolvere nuovi problemi.

In sintesi, gli psicologi distinguono tra test di realizzazione, attitudine e abilità a livello teorico. I test di realizzazione descrivono lo stato attuale delle persone, i test attitudinali predicono il loro comportamento futuro, e i test di abilità valutano il loro potenziale innato. In pratica, tuttavia, i test di rendimento, attitudine e capacità sono spesso simili nella forma e utilizzati per scopi simili.

Variazioni comuni tra i test

Gli psicologi hanno creato una tale varietà di test che anche sviluppare un sistema per classificarli è impegnativo. La maggior parte dei test misura le attitudini cognitive (ad esempio, il Kendrick Cognitive Tests for the Elderly e il Peabody Individual Achievement Test), ma molti test misurano anche le abilità motorie (ad esempio, l’O’Connor Finger Dexterity Test e la USES General Aptitude Test Battery). La maggior parte dei test richiede l’uso di abilità verbali e di lettura (ad esempio, la Batteria di attitudine multidimensionale e il Test di attitudine differenziale), ma alcuni usano mezzi non verbali per misurare le attitudini (ad esempio, i Test di intelligenza non verbale, seconda edizione e il Peabody Picture Vocabulary Test). Inoltre, i test differiscono nel numero di attitudini che misurano, la loro standardizzazione e il modo di somministrazione.

Numero di attitudini

Alcuni test misurano una sola attitudine (per esempio, il Electrical and Electronics Test e il Personnel Assessment Selection System) ma molti misurano attitudini multiple (per esempio, la Armed Services Vocational Aptitude Battery e la Ball Aptitude Battery). Entrambi gli approcci hanno dei vantaggi.

Le batterie multiattitudinali ottengono informazioni su una vasta gamma di abilità cognitive e motorie e permettono di confrontare i punti di forza e di debolezza relativi dell’esaminando. Questi strumenti sono utili quando gli individui o le organizzazioni cercano informazioni per guidare le decisioni professionali ed educative. Anche se esistono numerose batterie di test multi-attitudinali e multi-abilità, tutti generalmente misurano un insieme relativamente standard di costrutti.

Strumenti più specializzati che misurano un singolo costrutto sono utili quando sono desiderabili previsioni più mirate. Ottenere informazioni su costrutti come il potenziale creativo e artistico spesso richiede l’uso di strumenti specializzati progettati per quello scopo specifico. Inoltre, un singolo strumento attitudinale progettato per misurare la lettura, la matematica, le abilità spaziali o meccaniche può misurare quelle abilità in modo più preciso di una batteria multi-attitudinale.

Standardizzazione

I test standardizzati sono quelli che sono stati somministrati a un gruppo di persone (chiamato gruppo norma) per ottenere informazioni sulla probabilità di ogni possibile punteggio nel test. Confrontando il punteggio di un esaminando con i punteggi ottenuti dalle persone che compongono il gruppo norma, gli psicologi possono interpretare il punteggio. I punteggi dei test standardizzati sono tipicamente riportati in termini di un punteggio standard, un punteggio equivalente all’età, o un punteggio equivalente al grado.

E’ criticamente importante che il gruppo di norme usato per interpretare il punteggio di un esaminando fornisca una base significativa per il confronto. Per esempio, sarebbe fuorviante interpretare il punteggio di un test di rendimento di uno studente di scuola superiore usando un gruppo di norme composto da studenti di scuola media. Anche se il problema identificato in questo esempio è ovvio, problemi più sottili hanno solo recentemente iniziato ad essere evitati. Per esempio, confrontare i punteggi ottenuti da una femmina in un test con i punteggi ottenuti da un gruppo di norma composto esclusivamente da maschi produce un’interpretazione discutibile in molti casi. Tuttavia, questa pratica era standard non molti anni fa.

Per questo motivo, molti test hanno più di un gruppo di riferimento. Un test usato con i bambini della scuola elementare, per esempio, potrebbe avere un gruppo norma composto da studenti di prima elementare, un secondo gruppo norma composto da studenti di seconda elementare, e così via fino a un gruppo norma composto da studenti di prima media. Inoltre, gruppi di norma separati per ragazze e ragazzi potrebbero essere disponibili per ogni livello di grado. Altri esempi dei tipi di gruppi di norma che potrebbero essere sviluppati per un test includono donne laureate, falegnami di successo, avvocati afroamericani e maschi arruolati.

Un’accurata interpretazione normativa di un test non è possibile senza un gruppo di norma rilevante, ma lo sviluppo di gruppi di norma è costoso e richiede tempo. Questo crea due problemi. In primo luogo, molti test hanno solo uno o pochi gruppi di norme. Questa pratica costringe gli utenti a basare la loro interpretazione sul gruppo di norme più rilevante piuttosto che su un gruppo di norme direttamente rilevante. A volte non è disponibile un gruppo di norme rilevante che corrisponda al sesso, al background culturale o all’eredità etnica di un esaminando, così l’utente è costretto a fare la migliore interpretazione possibile nelle circostanze. In secondo luogo, la spesa per ottenere i gruppi di norme significa anche che alcuni gruppi di norme pubblicati non sono attuali. Ogni coorte di esaminandi nasce in un mondo che differisce in aspetti importanti dalla coorte precedente. L’accuratezza e l’utilità delle interpretazioni normative dei risultati dei test diminuisce man mano che il gruppo di norme diventa sempre più datato.

Mentre quasi tutti i test attitudinali e di abilità sono standardizzati, il tipico test di rendimento in classe non è standardizzato. Generalmente, i punteggi dei test non standardizzati sono riportati in termini di percentuale di risposte corrette e sono interpretati in termini di uno standard predeterminato (ad esempio, A > 90%, B = 89%-80%; > 70% = Pass e < 69% = Fail). I test che sono interpretati confrontando le prestazioni dell’esaminando con uno standard predeterminato piuttosto che con un gruppo di norme sono chiamati criter-referenziati. Due vantaggi dei test riferiti ai criteri sono che i punteggi ottenuti in tali test sono intrinsecamente significativi e non sono imposti vincoli artificiali sul numero di esaminati che possono eseguire un determinato livello.

Amministrazione del test

La maggior parte dei test di rendimento, attitudine e abilità possono essere somministrati a una singola persona o a un gruppo di individui. Storicamente, l’opzione di somministrare il test a un gruppo è stata essenziale per test come il SAT, l’ACT e il GRE che vengono sostenuti da centinaia di migliaia di persone ogni anno. Tuttavia, in alcuni casi le informazioni che possono essere ottenute dalle osservazioni comportamentali fatte da uno psicologo durante la somministrazione del test a un individuo sono piuttosto importanti. Anche se è più costoso e richiede più tempo, l’opzione di una somministrazione personalizzata del test è importante. Questa opzione è più probabile che sia desiderabile quando si somministra un test a bambini, adolescenti e individui con difficoltà di apprendimento o altri problemi che potrebbero interferire con le loro prestazioni sul test. Alcuni test, in particolare i test di intelligenza progettati per misurare le abilità cognitive, sono progettati esclusivamente per la somministrazione individuale.

Nell’ultimo decennio, è emersa un’ulteriore opzione per la somministrazione del test: la somministrazione del test tramite computer. La somministrazione al computer combina il vantaggio di una somministrazione economica a un gran numero di individui con la possibilità di alcune osservazioni comportamentali durante la somministrazione del test. Per esempio, le latenze di risposta (cioè la quantità di tempo che l’esaminando impiega per rispondere alla domanda) possono essere registrate durante la somministrazione del test al computer. Inoltre, i test basati sulla teoria della risposta agli articoli possono adattare il test al livello di abilità dell’esaminando.

La somministrazione al computer è ora l’opzione principale per alcuni test. Per esempio, il GRE viene somministrato tramite computer agli esaminandi negli Stati Uniti, in Canada e in molte altre aree del mondo, a meno che non vengano presi accordi speciali per una somministrazione su carta. Questa tendenza è destinata ad accelerare, ed è probabile che la maggior parte dei test standardizzati ampiamente utilizzati forniranno un’opzione per la somministrazione tramite computer entro un decennio.

Capacità misurate

Sono state sviluppate centinaia di scale per misurare vari aspetti del rendimento, attitudine e capacità. Numerosi test si concentrano su specifiche aree di contenuto come le abilità spaziali, matematiche, verbali e motorie. Molti test che misurano una singola abilità cognitiva o motoria forniscono una misura alternativa (e in alcuni casi più precisa) delle abilità misurate dalle batterie multi-attitudinali e dai test di intelligenza. Nonostante questa incredibile varietà di opzioni, la maggior parte dei test principali valuta lo stesso insieme selezionato di abilità. Anche se il nome specifico dell’abilità varia da test a test e ci sono sottili differenze tra test con nomi simili, i costrutti misurati dai vari test sono abbastanza simili.

Le seguenti sezioni descrivono alcune delle abilità cognitive e motorie più frequentemente misurate e alcuni dei punteggi compositi ottenuti combinando le informazioni su queste abilità.

Attività cognitive

Attitudine verbale: La capacità di capire il significato delle parole, delle frasi e dei paragrafi e di usarli in modo efficace. Le misure di questa abilità valutano quanto bene un esaminando capisca le idee espresse in parole e quanto chiaramente possa ragionare con le parole. Alcuni test includono scale separate per misurare i componenti della conoscenza verbale. Per esempio, l’ASVAB include test di conoscenza delle parole e comprensione dei paragrafi. Il WAIS-III, il MAB e l’SB5 contengono test di vocabolario. L’SB5 include anche il test Relazioni verbali. Il DAT contiene i seguenti test: Ragionamento verbale e Uso della lingua: Ortografia e grammatica.

Attitudine numerica: La capacità di comprendere le idee espresse in numeri. I test includono una combinazione di elementi che valutano il calcolo numerico (cioè la capacità di aggiungere, sottrarre ed eseguire altri calcoli aritmetici) e il ragionamento numerico (cioè quanto bene un esaminando può pensare e ragionare con i numeri). Le scale che valutano aspetti di questa abilità sono variamente intitolate Aritmetica, Costruzione di equazioni, Abilità numerica e Quantitativa, tra le altre.

Attitudine spaziale: L’abilità di visualizzare o formare immagini mentali di solidi guardando piani su un pezzo di carta piatto. Alcuni item richiedono alle persone di guardare un diagramma e determinare come un oggetto apparirebbe nello spazio tridimensionale se fosse completato. Altri chiedono agli intervistati di guardare un’immagine o un disegno di un oggetto completato e visualizzare nello spazio tridimensionale come apparirebbe quell’oggetto se fosse ruotato in una posizione diversa. Abilità correlate sono misurate in test intitolati Block Design, Matrix Reasoning, Matrices, Paper Folding and Cutting, Pattern Analysis, Space Relations e Spatial.

Ragionamento astratto: L’abilità di capire le idee che sono presentate senza usare parole o numeri. I test di ragionamento astratto presentano problemi in termini di dimensione, forma, posizione o quantità usando immagini, forme, modelli o qualche altra forma non verbale e non numerica. Le scale che misurano l’attitudine spaziale misurano un aspetto di questa abilità. Altre scale che misurano aspetti di questa abilità sono intitolate Percezione della forma, Assemblaggio di oggetti, Completamento di immagini e Disposizione di immagini, tra gli altri.

Comprensione: L’abilità di usare il ragionamento deduttivo (e, in misura minore, il ragionamento induttivo) per ricavare soluzioni per problemi e questioni socialmente rilevanti. Questi test valutano il giudizio pratico e il buon senso degli esaminati e la loro capacità di affrontare il loro ambiente sociale e culturale. Altre scale che misurano aspetti di questa attitudine sono intitolate Assurdità e Somiglianze.

Capacità motorie

In un certo senso le capacità motorie rappresentano la funzione di uscita dell’abilità umana. La comprensione e la risoluzione dei problemi avvengono inosservate all’interno del cervello umano, ma il prodotto di questa attività mentale è espresso o in parole o attraverso qualche attività fisica. Molti test di abilità motorie richiedono alle persone di usare le loro abilità cognitive prima di fare qualche risposta fisica. Per esempio, i test di velocità e accuratezza impiegatizia (ad esempio, la scansione di liste di nomi o indirizzi stradali per vedere se corrispondono o sono in ordine alfabetico) richiedono alle persone di utilizzare sia le abilità cognitive che quelle motorie. Altri esempi includono la progettazione di blocchi (cioè la disposizione di blocchi per fare un disegno designato) e il simbolo di cifre (cioè la traduzione di simboli disposti a caso in numeri usando una chiave che corrisponde ai simboli e ai numeri).

I seguenti tre test forniscono valutazioni più pure delle abilità motorie. I compiti che richiedono alle persone di eseguire sono semplici e non richiedono abilità cognitive per essere compresi. Come tali, forniscono una misura chiara della capacità dell’individuo di eseguire il compito fisico.

Coordinazione motoria: La capacità di coordinare gli occhi e le mani o le dita in movimenti rapidi, precisi e accurati. I test di coordinazione motoria presentano alle persone una pagina di piccole caselle e richiedono loro di fare un segno nel maggior numero possibile di caselle entro un breve tempo designato.

Destrezza delle dita: La capacità di fare movimenti piccoli, rapidi e precisi con le dita, come nella digitazione, e di spostare piccoli oggetti in modo rapido e preciso, come nell’assemblaggio di due o più oggetti. I test di destrezza delle dita richiedono alle persone di assemblare oggetti semplici come mettere una rondella su un rivetto e di smontare oggetti come togliere le rondelle dai rivetti e riportare le rondelle e i rivetti nella loro posizione di deposito.

Destrezza manuale: La capacità di fare movimenti coordinati con le mani in modo rapido e abile. I test di destrezza manuale richiedono alle persone di posizionare oggetti in posizioni designate o di girare oggetti da una posizione a una posizione designata.

Punteggi compositi

I punteggi compositi sono punteggi ottenuti combinando i punteggi ottenuti su due o più test. Spesso, i punteggi dei test sono interpretati sia in termini del loro significato come punteggio a sé stante che come parte di un composito. Il concetto di intelligenza è probabilmente il composito più noto. Molti test d’intelligenza danno tre punteggi compositi: un’intelligenza verbale, un’intelligenza di performance e un punteggio d’intelligenza generale o su scala completa. Un altro modo di concettualizzare l’intelligenza è in termini di processi mentali che formano la base del comportamento cognitivo. Questa prospettiva suggerisce che il comportamento intellettuale coinvolge la comprensione, l’organizzazione, il pensiero e il ricordo. Importanti punteggi compositi ottenuti dai test di abilità cognitiva che riflettono questa visione dell’intelligenza sono la comprensione verbale, l’organizzazione percettiva, la velocità di elaborazione e la memoria di lavoro.

L’intelligenza verbale: Ottenuta combinando i punteggi sulle misure di attitudine verbale, numerica e spaziale. Questo composito fornisce una misura complessiva dell’abilità di ragionamento astratto delle persone e della capacità di comprendere e imparare nuove abilità. Questo composito è fortemente influenzato dalle abilità verbali.

Intelligenza di prestazione: Ottenuta combinando i punteggi su misure che richiedono sia il ragionamento astratto che la manipolazione di oggetti come blocchi, perline, immagini o pezzi di puzzle. Questo composto fornisce una misura della capacità di ragionamento astratto che si basa meno pesantemente sull’uso delle parole e delle abilità verbali. La capacità di comprendere materiale non verbale figura in modo più prominente in questo composito.

Intelligenza: Ottenuta combinando i punteggi dell’intelligenza verbale e dell’intelligenza delle prestazioni. In test come il WAIS-III, il MAB e l’SB5, questo composito incorpora informazioni dai compositi dell’intelligenza verbale e delle prestazioni di cinque o sei test ciascuno. Nelle batterie multi-attitudinali come il DAT e l’USES GATB, questo composito incorpora informazioni da misure di attitudine verbale, attitudine numerica e attitudine spaziale.

Comprensione verbale: Questo composto fornisce una misura complessiva della capacità dell’individuo di comprendere e lavorare con informazioni verbali. Si ottiene combinando i punteggi delle misure che valutano il vocabolario, le informazioni generali e la capacità di lavorare con informazioni ambigue per risolvere problemi quando vengono presentate in forma verbale.

Organizzazione percettiva: Questo composto fornisce informazioni sulla capacità dell’individuo di analizzare le informazioni presentate in forma non verbale e di organizzarle in un modello significativo. Si ottiene combinando i punteggi delle misure che richiedono all’individuo di lavorare con immagini, blocchi o matrici.

Velocità di elaborazione: questo insieme fornisce informazioni sulla velocità con cui la persona può lavorare con simboli astratti. Si ottiene combinando i punteggi dei test che valutano la capacità di lavorare con simboli astratti che non hanno un significato verbale facilmente accessibile.

Memoria di lavoro: Questo composto fornisce informazioni sulla capacità della persona di tenere le informazioni in memoria e lavorare con esse per risolvere i problemi. Si ottiene combinando i punteggi dei test che richiedono all’individuo di ricordare modelli formati da immagini di perline, numeri e lettere.

Contributo duraturo

Lo sviluppo del test psicologico è uno dei contributi più importanti e duraturi della psicologia alla civiltà. Infatti, i noti psicologi Rene V. Dawis e David Lubinski considerano i test psicologici come aventi la stessa funzione per gli psicologi che il microscopio e il telescopio hanno per i microbiologi e gli astronomi. I test forniscono agli psicologi la capacità di vedere fenomeni che altrimenti sarebbero invisibili. Molti dei benefici che la psicologia ha apportato alla società moderna non sarebbero stati possibili senza l’uso di test psicologici. I primi psicologi iniziarono a lavorare sui primi test di rendimento, attitudine e capacità alla fine del 1800. La ricerca e l’innovazione fino alla seconda guerra mondiale si sono concentrate in gran parte sullo sviluppo di metodi per misurare gli interessi professionali e le abilità cognitive e motorie. La moderna scienza della misurazione psicologica è attribuibile a decenni di ricerca sui test, così come la fruttuosa diversità dei test sviluppati dagli psicologi. Anche se gli psicologi hanno coscienziosamente sviluppato test per affrontare l’intera gamma di bisogni sociali, la loro produttività nell’area dei test di risultato, attitudine e abilità è insuperabile.

American Educational Research Association, American Psychological Association, e National Council on Measurement in Education. (1999). Gli standard per i test educativi e psicologici. Washington, DC: American Educational Research Association.
American Psychological Association, Joint Committee on Testing Practices. (2005). Codice di pratiche di test eque nell’educazione. Washington, DC: Autore.
Anastasi, A., & Urbina, S. (1997). Test psicologici (7° ed.). Upper Saddle River, NJ: Prentice Hall.
Hambleton, R. K., Robin, F., & Xing, D. (2000). Modelli di risposta agli elementi per l’analisi dei dati dei test educativi e psicologici. In H. E. A. Tinsley & S. D. Brown (Eds.), Handbook of applied multivariate statistics and mathematical modeling (pp. 553-581). San Diego, CA: Academic Press.
National Council on Measurement in Education. (1995). Codice di responsabilità professionale nella misurazione educativa. Madison, WI: Author.
Spies, R. A., & Plake, B. S. (Eds.). (2005). Il sedicesimo annuario delle misure mentali. Lincoln, NE: Buros Institute of Mental Measurements.
Walsh, W. B., & Betz, N. E. (1995). Test e valutazione (4a ed.). Upper Saddle River, NJ: Prentice Hall.

Guinguette Marais Poitevin

Blog