Achievement, Aptitude, and Ability Tests - IResearchNet

多くの心理学者はアチーブメントテスト、アプティチュードテスト、アビリティテストなどのラベルを不正確に使用し、心理学者以外の人も同義語として使用しています。実際には、これらのラベルを付けたテストはよく似ていて、同じような目的で使用されることが多いので、このような正確さを欠くことは理解できます。このエントリでは、達成度テスト、適性テスト、能力テストの理論的な違いを説明し、これらのテストの主な用途を説明し、これらのテストで広く使用されている下位尺度の種類と、それらが測定する構成要素の簡単な概要を提供します。通常、達成度テストは、検査対象となる運動技能や認知技能を習得するための教育期間の後に実施されます。典型的なアチーブメントテストは、生徒がどれだけ学んだかを判定するために行われる定期的な授業の試験である。

理論的には、アチーブメントテストの目的は、ある運動技能や知識をどの程度習得したかを測定する記述的なものです。しかし、実際には、アチーブメントテストの結果は、将来のパフォーマンスの指標として解釈されることが多い。例えば、SATやGREなどの学力テストは、受験者が教育を受けた結果として得た知識を評価するものであるが、これらのテストのスコアは、より高度で困難なプログラムでの成功の可能性を予測するために使用される。

多くの達成度テストと適性テストは見た目が非常に似ていますが、適性テストの主な目的は予測です。

達成度テストと適性テストは見た目が似ているものが多いですが、適性テストの主な目的は「予測」です。適性検査では、認知能力と運動能力の両方を習得する能力が評価されます。多くの場合、広い意味での言語理解力のテストのスコアは、被検者が新しい認知スキルを学ぶ（そして使う）可能性を予測するために使用されます。実際、適性検査の最も一般的な用途は、教育プログラムや職業環境における将来のパフォーマンスを予測することです。しかし、適性検査の中には、運動能力を測定するものもあります（例えば、目と手の協調性や40ヤードダッシュにかかる時間など）。

適性テストと能力テストの違いは微妙で、多くの心理学者やテスト出版社はこの2つの用語を使い分けています。

適性テストと能力テストの違いは微妙で、多くの心理学者やテスト出版社はこの言葉を使い分けています。しかし、一般的に能力テストは、特定の指導プログラムに起因しない、長期間にわたって習得された認知および運動スキルセットを評価します。例えば、ウェクスラー式知能検査（WAIS-III）やスタンフォード・ビネ式知能検査（SB5）では、言語理解力、作業記憶力、知覚構成力、処理速度などが測定されます。これらの能力は、特定のプログラムによる指導の結果ではありません。これらの能力は、特定の教育プログラムの結果ではなく、人生経験から学ぶその人固有の能力の機能であると考えられています。

まとめますと、心理学者は理論的なレベルで達成度テスト、適性テスト、能力テストを区別しています。達成度テストは人の現在の状態を表し、適性テストは人の将来の行動を予測し、能力テストは人が本来持っている可能性を評価します。

テストの共通点

心理学者が作ったテストは非常にバラエティに富んでおり、分類するためのシステムを開発することさえ困難です。ほとんどのテストは認知能力を測定するものですが (例: Kendrick Cognitive Tests for the Elderly (高齢者のためのケンドリック認知テスト) や Peabody Individual Achievement Test (ピーボディ個人達成テスト))、多くのテストは運動能力も測定します (例: O’Connor Finger Dexterity Test や USES General Aptitude Test Battery (オコーナー指先器用テスト))。ほとんどのテストは、言語能力と読解力を必要としますが（例：多次元適性テスト、差動適性テスト）、いくつかのテストは、非言語的な方法で適性を測定します（例：非言語的知能テスト第2版、ピーボディ絵文字テスト）。

適性の数

単一の適性を測定するテストもあれば(例：電気電子テスト、人事考課選択システム)、複数の適性を測定するテストもあります(例：軍人職業適性バッテリー、ボール適性バッテリー)。

複数の適性を測定することで、幅広い認知能力や運動能力に関する情報を得ることができ、受験者の相対的な長所と短所を比較することができます。これらの測定器は、個人や組織が職業や教育の決定に役立つ情報を求めている場合に役立ちます。

単一の構成要素を測定するより専門的なテストは、より焦点を絞った予測が必要な場合に役立ちます。

単一の構成要素を測定するより専門的な検査は、より焦点を絞った予測が必要な場合に役立ちます。

標準化

標準化されたテストとは、テストの各スコアの可能性についての情報を得るために、あるグループ(規範グループと呼ばれる)に実施されたテストです。心理学者は、受験者のスコアを規範群を構成する人々が得たスコアと比較することで、スコアを解釈することができます。

受験者のスコアを解釈するために使用される規範群が、比較のための意味のある基準を提供することは非常に重要です。例えば、高校生のアチーブメントテストのスコアを、中学生で構成された規範群を使って解釈するのは、誤解を招く恐れがあります。この例で明らかになった問題は、最近になってようやく回避されるようになったものです。例えば、あるテストで女性が取った点数を、男性だけで構成された規範集団が取った点数と比較することは、多くの場合、疑わしい解釈になります。

このような理由から、多くのテストには複数の規範群が存在します。

そのため、多くのテストでは、複数の基準群が設定されています。例えば、小学生を対象としたテストでは、小学1年生の基準群、小学2年生の基準群、そして小学6年生の基準群が設定されています。また、学年ごとに女子用、男子用の規範群が用意されている場合もあります。

テストを正確に規範的に解釈するには、適切な規範群が必要ですが、規範群の作成にはコストと時間がかかります。そのため、2つの問題があります。まず、多くのテストには1つまたは数個の規範群しかありません。このような場合、ユーザーは、直接関連する規範群ではなく、最も関連性の高い規範群に基づいて解釈を行うことになります。時には、受験者の性別、文化的背景、民族的遺産などに合致する規範群がないため、ユーザーは状況に応じて最善の解釈をせざるを得ないのです。 2つ目は、規範群の入手に費用がかかるため、公表されている規範群の中には最新のものではないものがあるということです。それぞれの受験者は、前の受験者とは重要な点で異なる世界に生まれてきます。

ほとんどすべての適性および能力テストが標準化されている一方で、典型的なクラスルームアチーブメントテストは非標準化されています。一般的に、非標準化テストのスコアは、正解した項目の割合で報告され、あらかじめ決められた基準で解釈されます（例：A > 90%、B = 89%-80%、>< 69% = 不合格）。受験者のパフォーマンスを規範群ではなく、あらかじめ設定された基準と比較することで解釈されるテストを基準参照テストと呼びます。基準参照テストの2つの利点は、このようなテストで得られたスコアは本質的に意味があること、そして、あるレベルのパフォーマンスを発揮できる受験者の数に人為的な制約が課せられないことです。

テストの実施

ほとんどの達成度、適性、および能力テストは、1人または複数の人に実施することができます。歴史的に見ても、毎年何十万人もの人々が受験する SAT、ACT、GRE などのテストでは、グループにテストを実施するという選択肢は不可欠でした。しかし、場合によっては、心理学者が個人にテストを実施する際に行う行動観察から得られる情報が非常に重要になることがあります。コストと時間はかかりますが、個人に合わせてテストを実施するという選択肢は重要です。このオプションは、子供や青年、学習障害やその他の問題でテストの実施に支障をきたす可能性のある人にテストを実施する際に、より望ましいものとなります。

ここ10年で、テストの実施方法として、コンピュータによる実施という選択肢が増えてきました。

ここ10年ほどで、テスト実施の選択肢の一つとして、コンピュータによるテスト実施が登場しました。例えば，コンピュータによるテストの実施中に，応答遅延（受験者が問題に答えるまでの時間）を記録することができる。さらに、項目応答理論に基づいたテストでは、受験者の能力レベルに合わせてテストを調整することができます。

コンピュータによる実施は、現在、いくつかのテストで主要な選択肢となっています。

現在、いくつかのテストでは、コンピュータによる実施が主流となっています。例えば、GREは、紙による実施の特別な取り決めがない限り、米国、カナダ、その他の多くの地域の受験者にコンピュータで実施されています。

測定されるスキル

達成度、適性、および能力のさまざまな側面を測定するために、何百もの尺度が開発されてきました。また、空間的能力、数学的能力、言語的能力、運動能力など、特定の内容に焦点を当てたテストも数多くあります。また、単一の認知能力や運動能力を測定する多くのテストは、複数のaptitudeバッテリーや知能テストで測定される能力の代替となる（場合によってはより正確な）測定方法を提供しています。このように多様な選択肢があるにもかかわらず、主要なテストのほとんどは、同じスキルのセットを評価します。技能の具体的な名称はテストごとに異なり、類似した名称のテストの間には微妙な違いがありますが、様々なテストで測定される構成要素は非常に似通っています。

以下のセクションでは、最も頻繁に測定されている認知能力と運動能力、およびこれらの能力に関する情報を組み合わせて得られる複合スコアについて説明します。単語、文章、段落の意味を理解し、それらを効果的に使用する能力。この能力を測るテストでは、受験者が言葉で表現されたアイデアをどれだけ理解しているか、また、言葉でどれだけ明確に推論できるかを評価します。いくつかのテストでは、言葉の知識の構成要素を測定するための別の下位尺度が含まれています。例えば、ASVABには、単語知識と段落理解のテストがあります。 WAIS-III、MAB、および SB5 には、語彙テストが含まれています。 SB5 には Verbal Relations というテストがあります。 DATには次のようなテストがあります。

DATには以下のテストが含まれています：言語的推論、言語使用法。

Numerical Aptitude（数値的適性）。数字で表現されたアイデアを理解する能力。テストには、数値計算（足し算、引き算、その他の算術計算を行う能力）と数値推論（数字を使ってどれだけ考え、推論することができるか）を評価する項目がいくつか組み合わされています。

Spatial Aptitude（空間的適性）。平面に描かれた図面を見て、立体のイメージを思い浮かべることができる能力。図を見て、その物体が完成した場合に3次元空間でどのように見えるかを判断させる項目もあります。また、完成した物体の写真や図面を見て、その物体を回転させて別の位置に置いたときの様子を立体的にイメージすることを求めるものもあります。

「ブロックデザイン」「行列推理」「行列」「紙の折り方と切り方」「パターン分析」「空間関係」「空間」と題されたテストでは、関連するスキルが測定されています。

「抽象的推理」。言葉や数字を使わずに提示されたアイデアを理解する能力です。抽象的推論のテストでは、絵、形、パターン、またはその他の非言語的、非数値的な形式を使用して、サイズ、形状、位置、または量の観点から問題を提示します。空間的適性を測定する尺度は、この能力の1つの側面を測定します。この能力の側面を測定する他の尺度には、Form Perception、Object Assembly、Picture Completion、Picture Arrangementなどがあります。

理解力：社会的に関連した問題や課題の解決策を導き出すために、演繹的な推論（より程度の低い帰納的な推論も含む）を用いる能力。これらのテストでは、受験者の実践的な判断力や常識、社会的・文化的環境に対処する能力を評価します。

運動能力

運動能力は、ある意味では人間の能力の出力機能を表しています。理解や問題解決は、人間の脳の中で人知れず行われていますが、その精神活動の産物は、言葉や何らかの身体的活動によって表現されます。多くの運動技能テストでは、身体的な反応をする前に、認知的なスキルを使うことが求められます。例えば、事務的なスピードと正確さのテスト（名前や住所のリストをスキャンして、それらが一致しているか、アルファベット順になっているかを確認する）では、認知能力と運動能力の両方を使用する必要があります。

また、より純粋に運動能力を評価するために、次の3つのテストがあります。次の3つのテストは、より純粋に運動能力を評価するためのものです。これらのテストが人々に要求するタスクは単純で、理解するために認知能力を必要としません。

Motor Coordination: 目と手や指の動きを素早く、正確に調整する能力。運動協調性のテストでは、人々に小さな箱のページを提示し、短い指定時間内にできるだけ多くの箱に印をつけることを求めます。

Finger Dexterity（指先の器用さ）。

指先の器用さ：タイピングのように指を使って小さく、速く、正確な動きをする能力や、2つ以上の物を組み立てるように小さな物を速く、正確に動かす能力。指先の器用さを測るテストでは、リベットにワッシャーを取り付けるなどの簡単な組み立て作業や、リベットからワッシャーを外してワッシャーやリベットを保管場所に戻すなどの分解作業が求められます。

手先の器用さ。手を使った協調的な動きを素早くかつ巧みに行う能力。

複合得点

複合得点とは、2つ以上のテストで得られた得点を組み合わせて得られる得点です。テストのスコアは、単独のスコアとしての意味と、複合体の一部としての意味の両方で解釈されることがよくあります。最もよく知られているのは「知能」の概念であろう。多くの知能テストでは、言語的知能、パフォーマンス的知能、総合的知能の3つの複合スコアが得られます。知能を概念化するもう一つの方法は、認知行動の基礎となる心的プロセスという観点からです。この観点からは、知的行動には理解、整理、思考、記憶が含まれると考えられます。このような考え方を反映した認知能力テストから得られる重要な複合得点は、言語的理解力、知覚的構成力、処理速度、作業記憶です。

言語的知能：言語的、数値的、空間的な適性のテストのスコアを組み合わせて得られる。

言語的知能：言語的、数値的、空間的適性のスコアを組み合わせて得られるもので、抽象的な推論能力や新しい技能を理解し学ぶ能力を総合的に評価します。

パフォーマンス・インテリジェンス（Performance Intelligence）。ブロック、ビーズ、絵、パズルのピースなど、抽象的な推論と物体の操作の両方を必要とするテストのスコアを組み合わせて得られます。

パフォーマンス・インテリジェンス：ブロックやビーズ、絵やパズルなど、抽象的な推論と物の操作を必要とするテストのスコアを組み合わせることで得られる。

知能：言語的なものを理解する能力。

知能：言語的知能と動作的知能のスコアを組み合わせて得られます。 WAIS-III、MAB、SB5のようなテストでは、この複合体は、5つまたは6つのテストからなる言語的およびパフォーマンス複合体の情報を取り入れています。 DATやUSES GATBなどのマルチ・アプティチュード・バッテリーでは、この複合は、言語的適性、数値的適性、および空間的適性の測定からの情報を組み込んでいます。

言語的理解力。

言語理解力：この複合語は、個人の言語情報を理解して作業する能力の総合的な尺度を提供します。

Perceptual Organization (知覚組織): この複合語は、語彙、一般的な情報、および言語形式で提示されたときに問題を解決するために曖昧な情報を扱う能力を評価する尺度のスコアを組み合わせることによって得られます。この複合項目は、非言語形式で提示された情報を分析し、それを意味のあるパターンに整理する個人の能力に関する情報を提供します。

処理速度：この複合語は、個人が抽象的な記号を扱うことができる速度に関する情報を提供します。

作業記憶。

作業記憶：この複合項目は、情報を記憶に留め、それを使って問題を解決する人の能力に関する情報を提供します。

Enduring Contribution

心理テストの開発は、心理学が文明に与えた最も重要かつ永続的な貢献の1つです。実際、著名な心理学者である Rene V. Dawis と David Lubinski は、心理テストは、微生物学者や天文学者にとっての顕微鏡や望遠鏡と同じような役割を心理学者に与えていると考えています。テストは、心理学者に、通常では見えない現象を見る能力を与えてくれるのである。

初期の心理学者は、1800年代後半に最初の達成度、適性、能力のテストの研究を始めました。

初期の心理学者は、1800年代後半に最初の達成度・適性・能力テストの研究を始め、第二次世界大戦までは、主に職業的興味や認知・運動能力を測定する方法の開発に注力しました。現代の心理学的測定の科学は，何十年にもわたるテストの研究と，心理学者によって開発されたテストの多様性に支えられている。

American Educational Research Association, American Psychological Association, and National Council on Measurement in Education. (1999). The standards for educational and psychological testing. Washington, DC:
American Psychological Association, Joint Committee on Testing Practices. (2005). 教育における公正なテスト実施の規範。 Washington, DC: Author.
Anastasi, A., & Urbina, S. (1997). Psychological testing (7th ed.).
Hambleton, R. K., Robin, F., & Xing, D. (2000). 教育・心理テストデータの分析のための項目応答モデル。 In H. E. A. Tinsley & S. D. Brown (Eds.), Handbook of applied multivariate statistics and mathematical modeling (pp. 553-581). San Diego, CA: Academic Press.
National Council on Measurement in Education. (1995). 教育測定における専門家の責任に関するコード。 Madison, WI: Author.
Spies, R. A., & Plake, B. S. (Eds.). (2005). The sixteenth mental measurements yearbook. Lincoln, NE: Buros Institute of Mental Measurements.
Walsh, W. B., & Betz, N. E. (1995). Tests and assessment (4th ed.). Upper Saddle River, NJ: Prentice Hall.

。

Guinguette Marais Poitevin

Blog

Achievement, Aptitude, and Ability Tests (日本語)

テストの共通点

複合得点

Enduring Contribution

コメントを残すコメントをキャンセル

Guinguette Marais Poitevin

Blog

テストの共通点

複合得点

Enduring Contribution

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル