Tests d’accomplissement, d’aptitude et de capacité

De nombreux psychologues utilisent de manière imprécise des étiquettes telles que test d’accomplissement, test d’aptitude et test de capacité, et les non-psychologues les utilisent comme synonymes. Ce manque de précision est compréhensible car dans la pratique réelle, les tests portant ces étiquettes semblent souvent assez similaires et sont utilisés à des fins similaires. Cette entrée explique la distinction théorique entre les tests d’accomplissement, d’aptitude et de capacité ; décrit les utilisations principales de ces tests ; et fournit un bref aperçu des types de sous-échelles largement utilisées dans ces tests et des construits qu’ils mesurent.

Distinction théorique entre les tests

Les tests d’accomplissement sont conçus pour évaluer dans quelle mesure une personne a développé une habileté motrice spécifique ou appris un ensemble de connaissances spécifiques. Généralement, un test d’accomplissement est administré après une période d’instruction conçue pour enseigner l’habileté motrice ou cognitive à examiner. Le prototype de ce test est l’examen périodique en classe qui est administré pour déterminer le niveau d’apprentissage de l’élève. Parmi les autres exemples, citons les tests écrits et de conduite passés pour obtenir un permis de conduire, le Scholastic Assessment Test (SAT) et l’American College Test (ACT) passés par les lycéens qui envisagent d’aller à l’université, et le Graduate Records Examination (GRE) passé par les collégiens qui veulent faire des études supérieures.

Théoriquement, l’objectif du test de réussite est descriptif : il s’agit de mesurer dans quelle mesure un candidat a maîtrisé une habileté motrice ou un domaine de connaissances. Dans la pratique, cependant, les résultats des tests de réussite sont souvent interprétés comme un indicateur de performance future. Par exemple, alors que les tests de réussite tels que le SAT et le GRE évaluent les connaissances que les candidats ont accumulées au cours de leurs expériences éducatives, les résultats de ces tests sont utilisés pour prédire la probabilité de réussite dans des programmes d’études plus avancés et plus difficiles. Cette pratique courante con-fond la fonction d’évaluation des performances (c’est-à-dire descriptive) des tests de réussite avec les objectifs de prédiction des tests d’aptitude.

De nombreux tests de réussite et d’aptitude sont très similaires en apparence, mais l’objectif principal des tests d’aptitude est la prédiction. Ils sont conçus pour obtenir des informations qui peuvent être utilisées pour prédire un aspect du comportement futur de la personne. Les tests d’aptitude évaluent la capacité de la personne examinée à acquérir des compétences cognitives et motrices. Souvent, les résultats d’un test général de compréhension verbale sont utilisés pour prédire le potentiel du candidat à acquérir (et utiliser) de nouvelles compétences cognitives. En fait, l’utilisation la plus courante des tests d’aptitude est de prédire les performances futures dans un programme éducatif ou un cadre professionnel. Cependant, certains tests d’aptitude mesurent les capacités motrices (par exemple, la coordination œil-main ou le temps nécessaire pour courir un sprint de 40 mètres). Les scores obtenus à des tests d’aptitude de ce type sont utilisés pour prédire la capacité du candidat à apprendre (et à utiliser) des compétences motrices souhaitables.

La distinction entre les tests d’aptitude et les tests de capacité est subtile, et de nombreux psychologues et éditeurs de tests utilisent les termes de manière interchangeable. En général, cependant, les tests d’aptitude évaluent des ensembles d’aptitudes cognitives et motrices qui ont été acquises sur une longue période et qui ne sont pas attribuables à un programme d’instruction spécifique. Par exemple, les tests d’intelligence tels que l’échelle d’intelligence pour adultes de Wechsler

Troisième édition (WAIS-III) et les échelles d’intelligence de Stanford-Binet, cinquième édition (SB5) mesurent la compréhension verbale, la mémoire de travail, l’organisation perceptive et la vitesse de traitement. Ces capacités ne sont pas le résultat d’un programme d’enseignement spécifique. On pense plutôt qu’elles sont une fonction de la capacité native de la personne à apprendre à partir de ses expériences de vie. Les tests d’aptitude sont descriptifs dans la mesure où ils évaluent les connaissances et les compétences des personnes, mais ils sont également prédictifs car ils mesurent des qualités qui sont supposées influencer la capacité de la personne à apprendre de nouvelles compétences et à résoudre de nouveaux problèmes.

En résumé, les psychologues font la distinction entre les tests de réalisation, d’aptitude et d’aptitude à un niveau théorique. Les tests d’accomplissement décrivent l’état actuel des personnes, les tests d’aptitude prédisent leur comportement futur et les tests de capacité évaluent leur potentiel inné. Dans la pratique, cependant, les tests d’accomplissement, d’aptitude et de capacité sont souvent similaires dans leur forme et utilisés à des fins similaires.

Variations communes entre les tests

Les psychologues ont créé une telle variété de tests que même l’élaboration d’un système pour les classer est un défi. La plupart des tests mesurent les aptitudes cognitives (par exemple, les tests cognitifs de Kendrick pour les personnes âgées et le test d’aptitudes individuelles de Peabody), mais de nombreux tests mesurent également les aptitudes motrices (par exemple, le test de dextérité des doigts de O’Connor et la batterie de tests d’aptitudes générales USES ). La plupart des tests requièrent l’utilisation d’aptitudes verbales et de lecture (par exemple, la batterie d’aptitudes multidimensionnelles et le test d’aptitudes différentielles), mais quelques-uns utilisent des moyens non verbaux pour mesurer les aptitudes (par exemple, les tests d’intelligence non verbale, deuxième édition et le test de vocabulaire en images Peabody). En outre, les tests diffèrent par le nombre d’aptitudes qu’ils mesurent, leur standardisation et leur mode d’administration.

Nombre d’aptitudes

Certains tests mesurent une seule aptitude (par exemple, le test d’électricité et d’électronique et le système d’évaluation et de sélection du personnel), mais beaucoup mesurent plusieurs aptitudes (par exemple, l’Armed Services Vocational Aptitude Battery et le Ball Aptitude Battery ). Les deux approches présentent des avantages.

Les batteries à aptitudes multiples obtiennent des informations sur un large éventail d’aptitudes cognitives et motrices et permettent de comparer les forces et les faiblesses relatives du candidat. Ces instruments sont utiles lorsque les individus ou les organisations recherchent des informations pour guider les décisions professionnelles et éducatives. Bien qu’il existe de nombreuses batteries de tests multi-aptitudes et multi-activités, toutes mesurent généralement un ensemble relativement standard de construits.

Des instruments plus spécialisés qui mesurent un seul construit sont utiles lorsque des prédictions plus ciblées sont souhaitables. L’obtention d’informations sur des construits tels que le potentiel créatif et artistique nécessite souvent l’utilisation d’instruments spécialisés conçus à cette fin spécifique. En outre, un seul instrument d’aptitude conçu pour mesurer la lecture, les mathématiques, les aptitudes spatiales ou mécaniques peut mesurer ces aptitudes avec plus de précision qu’une batterie multi-aptitudes.

Standardisation

Les tests standardisés sont ceux qui ont été administrés à un groupe de personnes (appelé groupe normatif) pour obtenir des informations sur la probabilité de chaque score possible au test. En comparant le score d’un candidat aux scores obtenus par les personnes composant le groupe normatif, les psychologues peuvent interpréter le score. Les scores aux tests standardisés sont généralement rapportés en termes de score standard, de score équivalent à l’âge ou de score équivalent au niveau scolaire.

Il est essentiel que le groupe de normes utilisé pour interpréter le score d’un candidat fournisse une base de comparaison significative. Par exemple, il serait trompeur d’interpréter le score d’un élève du secondaire à un test de réussite en utilisant un groupe normatif composé d’élèves du collège. Bien que le problème identifié dans cet exemple soit évident, des problèmes plus subtils n’ont commencé à être évités que récemment. Par exemple, la comparaison des scores obtenus par une femme à un test avec les scores obtenus par un groupe normatif composé exclusivement d’hommes donne lieu à une interprétation discutable dans de nombreux cas. Cependant, cette pratique était courante il n’y a pas trop d’années.

Pour cette raison, de nombreux tests ont plus d’un groupe de normes. Un test utilisé avec des enfants de l’école élémentaire, par exemple, peut avoir un groupe de norme composé d’élèves de première année, un deuxième groupe de norme composé d’élèves de deuxième année, et ainsi de suite jusqu’à un groupe de norme composé d’élèves de sixième année. En outre, des groupes de référence distincts pour les filles et les garçons pourraient être disponibles pour chaque niveau scolaire. D’autres exemples de types de groupes de normes qui pourraient être développés pour un test incluent les femmes diplômées d’université, les charpentiers ayant réussi, les avocats afro-américains et les hommes enrôlés.

Une interprétation normative précise d’un test n’est pas possible sans un groupe de normes pertinent, mais le développement de groupes de normes est coûteux et prend du temps. Cela crée deux problèmes. Premièrement, de nombreux tests n’ont qu’un ou quelques groupes de normes. Cette pratique oblige les utilisateurs à baser leur interprétation sur le groupe normatif le plus pertinent plutôt que sur un groupe normatif directement pertinent. Parfois, un groupe de normes pertinent correspondant au sexe, au contexte culturel ou à l’héritage ethnique d’un candidat n’est pas disponible, ce qui oblige l’utilisateur à faire la meilleure interprétation possible dans les circonstances. Deuxièmement, le coût d’obtention des groupes de normes signifie également que certains groupes de normes publiés ne sont pas à jour. Chaque cohorte de candidats naît dans un monde qui diffère à bien des égards de la cohorte précédente. La précision et l’utilité des interprétations normatives des résultats des tests diminuent à mesure que le groupe normatif devient de plus en plus daté.

Alors que presque tous les tests d’aptitude et de capacité sont standardisés, le test typique de réussite scolaire n’est pas standardisé. En général, les scores des tests non normalisés sont rapportés en termes de pourcentage d’items auxquels on a répondu correctement et sont interprétés en fonction d’une norme prédéterminée (par exemple, A > 90 %, B = 89 %-80 % ; > 70 % = réussite et < 69 % = échec). Les tests qui sont interprétés en comparant la performance du candidat à une norme prédéterminée plutôt qu’à un groupe de normes sont dits critériés. Deux avantages des tests critériés sont que les scores obtenus sur de tels tests sont intrinsèquement significatifs et qu’aucune contrainte artificielle n’est imposée sur le nombre d’examinateurs qui peuvent performer à un niveau donné.

Administration du test

La plupart des tests de réussite, d’aptitude et de capacité peuvent être administrés à une seule personne ou à un groupe d’individus. Historiquement, l’option d’administrer le test à un groupe était essentielle pour des tests tels que le SAT, l’ACT et le GRE qui sont passés par des centaines de milliers de personnes chaque année. Cependant, dans certains cas, les informations qui peuvent être obtenues à partir des observations comportementales faites par un psychologue lors de l’administration du test à un individu sont très importantes. Bien que plus coûteuse et plus longue, l’option d’une administration individualisée du test est importante. Cette option est plus susceptible d’être souhaitable lorsqu’on administre un test à des enfants, des adolescents et des personnes ayant des difficultés d’apprentissage ou d’autres problèmes qui pourraient nuire à leur performance au test. Certains tests, en particulier les tests d’intelligence conçus pour mesurer les capacités cognitives, sont conçus exclusivement pour une administration individuelle.

Au cours de la dernière décennie, une option supplémentaire pour l’administration du test est apparue : l’administration informatique du test. L’administration par ordinateur combine l’avantage d’une administration économique à un grand nombre d’individus avec la possibilité de certaines observations comportementales pendant l’administration du test. Par exemple, les latences de réponse (c’est-à-dire le temps qu’il faut au candidat pour répondre à la question) peuvent être enregistrées pendant l’administration du test par ordinateur. En outre, les tests basés sur la théorie de la réponse à l’item peuvent adapter le test au niveau de capacité du candidat.

L’administration par ordinateur est désormais la principale option pour certains tests. Par exemple, le GRE est administré par ordinateur aux candidats aux États-Unis, au Canada et dans de nombreuses autres régions du monde, sauf si des dispositions particulières sont prises pour une administration sur papier. Cette tendance va probablement s’accélérer, et il est probable que la plupart des tests standardisés largement utilisés offriront une option d’administration par ordinateur d’ici une décennie.

Compétences mesurées

Des centaines d’échelles ont été développées pour mesurer diverses facettes de la réussite, de l’aptitude et de la capacité. De nombreux tests se concentrent sur des domaines de contenu spécifiques tels que les compétences spatiales, mathématiques, verbales et motrices. De nombreux tests qui mesurent une seule aptitude cognitive ou motrice constituent une alternative (et dans certains cas une mesure plus précise) aux aptitudes mesurées par les batteries multi-aptitudes et les tests d’intelligence. Malgré cette étonnante variété d’options, la plupart des principaux tests évaluent le même ensemble de compétences sélectionnées. Bien que le nom spécifique de la compétence varie d’un test à l’autre et que des différences subtiles existent entre des tests portant un nom similaire, les constructions mesurées par les divers tests sont assez similaires.

Les sections suivantes décrivent certaines des aptitudes cognitives et motrices les plus fréquemment mesurées et certains des scores composites obtenus en combinant les informations sur ces aptitudes.

Aptitudes cognitives

Aptitude verbale : La capacité à comprendre le sens des mots, des phrases et des paragraphes et à les utiliser efficacement. Les mesures de cette aptitude évaluent dans quelle mesure un candidat comprend les idées exprimées par des mots et avec quelle clarté il peut raisonner avec des mots. Certains tests comprennent des sous-échelles distinctes pour mesurer les composantes des connaissances verbales. Par exemple, l’ASVAB comprend des tests de connaissance des mots et de compréhension des paragraphes. Le WAIS-III, le MAB et le SB5 contiennent des tests de vocabulaire. Le SB5 comprend également le test Relations verbales. Le DAT contient les tests suivants : Raisonnement verbal et Usage de la langue : Orthographe et grammaire.

Aptitude numérique : La capacité à comprendre des idées exprimées en chiffres. Les tests comprennent une certaine combinaison d’éléments qui évaluent le calcul numérique (c’est-à-dire la capacité d’additionner, de soustraire et d’effectuer d’autres calculs arithmétiques) et le raisonnement numérique (c’est-à-dire la façon dont un candidat peut penser et raisonner avec des chiffres). Les échelles qui évaluent les aspects de cette compétence sont diversement intitulées Arithmétique, Construction d’équations, Aptitude numérique et Quantitative, entre autres.

Aptitude spatiale : La capacité à visualiser ou à former des images mentales de solides à partir de l’observation de plans sur une feuille de papier plane. Certains items demandent aux personnes de regarder un diagramme et de déterminer comment un objet aurait l’air dans l’espace tridimensionnel s’il était complété. D’autres demandent aux répondants de regarder une image ou un dessin d’un objet terminé et de visualiser dans un espace tridimensionnel comment cet objet se présenterait s’il était tourné dans une position différente. Des compétences connexes sont mesurées dans des tests intitulés Block Design, Matrix Reasoning, Matrices, Paper Folding and Cutting, Pattern Analysis, Space Relations et Spatial.

Raisonnement abstrait : La capacité à comprendre des idées qui sont présentées sans utiliser de mots ou de chiffres. Les tests de raisonnement abstrait présentent des problèmes en termes de taille, de forme, de position ou de quantité en utilisant des images, des formes, des motifs ou toute autre forme non verbale et non numérique. Les échelles mesurant l’aptitude spatiale mesurent un aspect de cette aptitude. D’autres échelles mesurant des aspects de cette aptitude sont intitulées Perception des formes, Assemblage d’objets, Achèvement d’images et Arrangement d’images, entre autres.

Compréhension : La capacité d’utiliser le raisonnement déductif (et, dans une moindre mesure, le raisonnement inductif) pour dériver des solutions à des problèmes et questions socialement pertinents. Ces tests permettent d’évaluer le jugement pratique et le bon sens des candidats ainsi que leur capacité à faire face à leur environnement social et culturel. D’autres échelles mesurant des aspects de cette aptitude sont intitulées Absurdités et Similitudes.

Habiletés motrices

Dans un sens, les habiletés motrices représentent la fonction de sortie de l’aptitude humaine. La compréhension et la résolution de problèmes se produisent sans être observées à l’intérieur du cerveau humain, mais le produit de cette activité mentale est exprimé soit en mots, soit par une certaine activité physique. De nombreux tests d’aptitudes motrices exigent des personnes qu’elles utilisent leurs aptitudes cognitives avant d’effectuer une réponse physique. Par exemple, les tests de rapidité et d’exactitude administrative (par exemple, le balayage de listes de noms ou d’adresses pour voir s’ils correspondent ou sont dans l’ordre alphabétique) exigent que les personnes utilisent à la fois leurs capacités cognitives et motrices. Parmi les autres exemples, citons le dessin de blocs (c’est-à-dire l’agencement de blocs pour réaliser un dessin désigné) et le symbole de chiffres (c’est-à-dire la traduction de symboles disposés au hasard en chiffres à l’aide d’une clé qui fait correspondre les symboles et les chiffres).

Les trois tests suivants fournissent des évaluations plus pures des capacités motrices. Les tâches qu’ils demandent aux personnes d’effectuer sont simples et ne nécessitent pas de compétences cognitives pour être comprises. À ce titre, ils fournissent une mesure claire de la capacité de la personne à effectuer la tâche physique.

Coordination motrice : La capacité à coordonner les yeux et les mains ou les doigts dans des mouvements rapides, précis et exacts. Les tests de coordination motrice présentent aux personnes une page de petites cases et leur demandent de faire une marque dans le plus grand nombre de cases possible dans un bref temps désigné.

Dexterité des doigts : La capacité à faire de petits mouvements rapides et précis avec les doigts, comme dans la dactylographie, et à déplacer de petits objets rapidement et avec précision, comme dans l’assemblage de deux ou plusieurs objets. Les tests de la dextérité digitale demandent aux personnes d’assembler des objets simples comme mettre une rondelle sur un rivet et de démonter des objets comme retirer les rondelles des rivets et remettre les rondelles et les rivets à leur emplacement de rangement.

Dexterité manuelle : La capacité d’effectuer des mouvements coordonnés avec les mains, rapidement et avec habileté. Les tests de dextérité manuelle demandent aux personnes de placer des objets dans des positions désignées ou de tourner des objets d’une position à une position désignée.

Scores composites

Les scores composites sont des scores obtenus en combinant les scores obtenus à deux tests ou plus. Souvent, les scores des tests sont interprétés à la fois en fonction de leur signification en tant que score autonome et en tant que partie d’un composite. Le concept d’intelligence est probablement le composite le plus connu. De nombreux tests d’intelligence donnent trois scores composites : une intelligence verbale, une intelligence de performance et un score d’intelligence globale ou complète. Une autre façon de conceptualiser l’intelligence est de l’envisager en termes de processus mentaux qui constituent la base du comportement cognitif. Cette perspective suggère que le comportement intellectuel implique de comprendre, d’organiser, de penser et de se souvenir. Les scores composites importants obtenus à partir de tests d’aptitudes cognitives qui reflètent cette vision de l’intelligence sont la compréhension verbale, l’organisation perceptive, la vitesse de traitement et la mémoire de travail.

Intelligence verbale : Obtenue en combinant les scores des mesures des aptitudes verbales, numériques et spatiales. Ce composite fournit une mesure globale de la capacité de raisonnement abstrait des personnes et de leur capacité à comprendre et à apprendre de nouvelles compétences. Ce composite est fortement influencé par les aptitudes verbales.

L’intelligence de performance : Obtenue en combinant les scores aux mesures qui nécessitent à la fois un raisonnement abstrait et la manipulation d’objets tels que des blocs, des perles, des images ou des pièces de puzzle. Ce composite fournit une mesure de la capacité de raisonnement abstrait qui repose moins sur l’utilisation des mots et des compétences verbales. La capacité à comprendre du matériel non verbal figure de manière plus importante dans ce composite.

Intelligence : Obtenue en combinant les scores de l’intelligence verbale et de l’intelligence de performance. Dans des tests tels que le WAIS-III, le MAB et le SB5, ce composite incorpore des informations provenant de composites verbaux et de performance de cinq ou six tests chacun. Dans les batteries multi-aptitudes telles que le DAT et l’USES GATB, ce composite incorpore des informations provenant de mesures de l’aptitude verbale, de l’aptitude numérique et de l’aptitude spatiale.

Compréhension verbale : Ce composite fournit une mesure globale de la capacité de l’individu à comprendre et à travailler avec des informations verbales. Il est obtenu en combinant les scores des mesures qui évaluent le vocabulaire, les informations générales et la capacité à travailler avec des informations ambiguës pour résoudre des problèmes lorsqu’elles sont présentées sous forme verbale.

Organisation perceptive : Ce composite fournit des informations sur la capacité de l’individu à analyser des informations qui sont présentées sous une forme non verbale et à les organiser en un schéma significatif. Il est obtenu en combinant les scores aux mesures qui demandent à la personne de travailler avec des images, des blocs ou des matrices.

Vitesse de traitement : Ce composite fournit des informations sur la vitesse à laquelle la personne peut travailler avec des symboles abstraits. Il est obtenu en combinant les scores des tests qui évaluent la capacité à travailler avec des symboles abstraits qui n’ont pas de signification verbale facilement accessible.

Mémoire de travail : Ce composite fournit des informations sur la capacité de la personne à garder des informations en mémoire et à travailler avec elles pour résoudre des problèmes. Il est obtenu en combinant les scores obtenus à des tests qui demandent à l’individu de se souvenir de modèles formés par des images de perles, de chiffres et de lettres.

Contribution durable

Le développement du test psychologique est l’une des contributions les plus importantes et durables de la psychologie à la civilisation. En effet, les psychologues réputés Rene V. Dawis et David Lubinski considèrent que les tests psychologiques remplissent la même fonction pour les psychologues que le microscope et le télescope pour les microbiologistes et les astronomes. Les tests donnent aux psychologues la possibilité de voir des phénomènes qui seraient autrement invisibles. Bon nombre des avantages enrichissants que la psychologie a apportés à la société moderne n’auraient pas été possibles sans l’utilisation de tests psychologiques.

Les premiers psychologues ont commencé à travailler sur les premiers tests de réussite, d’aptitude et de capacité à la fin des années 1800. Jusqu’à la Seconde Guerre mondiale, la recherche et l’innovation se sont largement concentrées sur le développement de méthodes de mesure des intérêts professionnels et des aptitudes cognitives et motrices. La science moderne de la mesure psychologique est attribuable à des décennies de recherche sur les tests, tout comme la diversité fructueuse des tests développés par les psychologues. Bien que les psychologues aient consciencieusement développé des tests pour répondre à toute la gamme des besoins sociaux, leur productivité dans le domaine des tests de réussite, d’aptitude et de capacité est inégalée.

  1. American Educational Research Association, American Psychological Association, et National Council on Measurement in Education. (1999). Les normes pour les tests éducatifs et psychologiques. Washington, DC : American Educational Research Association.
  2. American Psychological Association, Joint Committee on Testing Practices. (2005). Code des pratiques de test équitables dans l’éducation. Washington, DC : Auteur.
  3. Anastasi, A., & Urbina, S. (1997). Les tests psychologiques (7e éd.). Upper Saddle River, NJ : Prentice Hall.
  4. Hambleton, R. K., Robin, F., & Xing, D. (2000). Item response models for the analysis of educational and psychological test data. Dans H. E. A. Tinsley & S. D. Brown (Eds.), Handbook of applied multivariate statistics and mathematical modeling (pp. 553-581). San Diego, CA : Academic Press.
  5. National Council on Measurement in Education. (1995). Code des responsabilités professionnelles en matière de mesure de l’éducation. Madison, WI : Author.
  6. Spies, R. A., & Plake, B. S. (Eds.). (2005). Le seizième annuaire des mesures mentales. Lincoln, NE : Institut des mesures mentales de Buros.
  7. Walsh, W. B., & Betz, N. E. (1995). Tests et évaluation (4e éd.). Upper Saddle River, NJ : Prentice Hall.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *