Testes de Realização, Aptidão, e Habilidade

Muitos psicólogos usam rótulos como teste de realização, teste de aptidão, e teste de habilidade de forma imprecisa, e os não psicólogos usam-nos como sinónimos. Esta falta de precisão é compreensível porque na prática real, os testes com estas etiquetas parecem muitas vezes ser bastante semelhantes e são utilizados para fins semelhantes. Esta entrada explica a distinção teórica entre testes de realização, aptidão, e habilidade; descreve os usos primários destes testes; e fornece uma breve visão geral dos tipos de sub-vendas amplamente utilizadas nestes testes e as construções que medem.

Distinção teórica entre Testes

Testes de aptidão são concebidos para avaliar até que ponto uma pessoa desenvolveu uma habilidade motora específica ou aprendeu um corpo específico de conhecimentos. Tipicamente, um teste de realização é administrado após um período de instrução concebido para ensinar a habilidade motora ou cognitiva a ser examinada. O teste de desempenho protótipo é o exame periódico em sala de aula que é administrado para determinar o quanto o aluno aprendeu. Outros exemplos incluem os testes escritos e de condução realizados para obter uma carta de condução, o Scholastic Assessment Test (SAT) e o American College Test (ACT) realizados por estudantes do ensino secundário que estejam a considerar a faculdade, e o Graduate Records Examination (GRE) realizado por estudantes universitários que queiram ir para a faculdade.

Teóricamente, o objectivo do teste de aproveitamento é descritivo – medir até que ponto um examinando dominou uma habilidade motora ou uma área de conhecimento. Na prática, contudo, os resultados do teste de aproveitamento são muitas vezes interpretados como um indicador de desempenho futuro. Por exemplo, enquanto testes de aproveitamento como o SAT e o GRE avaliam os examinados de conhecimentos acumulados como resultado das suas experiências educativas, os resultados desses testes são utilizados para prever a probabilidade de sucesso em programas de estudo mais avançados e desafiantes. Esta prática comum fundamenta a função de avaliação do desempenho (ou seja, descritiva) dos testes de aproveitamento com os objectivos de previsão dos testes de aptidão.

Muitos testes de aproveitamento e aptidão são muito semelhantes na aparência, mas o objectivo principal dos testes de aptidão é a previsão. São concebidos para obter informações que podem ser utilizadas na previsão de algum aspecto do comportamento futuro da pessoa. Os testes de aptidão avaliam a capacidade do examinando para aprender tanto as capacidades cognitivas como motoras. Muitas vezes, os resultados de um teste de compreensão verbal são utilizados para prever o potencial do examinando para aprender (e utilizar) novas aptidões cognitivas. De facto, o uso mais comum dos testes de aptidão é a previsão do desempenho futuro num programa educacional ou num ambiente ocupacional. Contudo, alguns testes de aptidão medem as capacidades motoras (por exemplo, coordenação olho-mão ou o tempo necessário para executar um traço de 40 jardas). Os resultados de testes de aptidão como estes são usados para prever a capacidade do examinando para aprender (e usar) as capacidades motoras desejáveis.

A distinção entre testes de aptidão e testes de aptidão é subtil, e muitos psicólogos e editores de testes usam os termos de forma intercambiável. No entanto, em geral, os testes de aptidão avaliam conjuntos de habilidades cognitivas e motoras que foram adquiridos durante um longo período de tempo e que não são atribuíveis a qualquer programa específico de instrução. Por exemplo, testes de inteligência como a Wechsler

Adult Intelligence Scale-Third Edition (WAIS-III) e a Stanford-Binet Intelligence Scale, Fifth Edition (SB5) medem a compreensão verbal, memória de trabalho, organização perceptiva, e velocidade de processamento. Estas capacidades não são o resultado de qualquer programa específico de instrução. Em vez disso, acredita-se que são uma função da capacidade nativa da pessoa de aprender com as experiências de vida. Os testes de aptidão são descritivos na medida em que avaliam os conhecimentos e capacidades das pessoas, mas são também preditivos porque medem qualidades que se presume influenciarem a capacidade da pessoa para aprender novas capacidades e resolver problemas novos.

Em resumo, os psicólogos distinguem entre os resultados, aptidão e testes de aptidão a um nível teórico. Os testes de realização descrevem o estado actual das pessoas, os testes de aptidão prevêem o seu comportamento futuro, e os testes de aptidão avaliam o seu potencial inato. Na prática, contudo, os testes de realização, aptidão, e habilidade são muitas vezes semelhantes na forma e utilizados para fins semelhantes.

Variações Comuns Entre Testes

Os psicólogos criaram uma tal variedade de testes que mesmo o desenvolvimento de um sistema para os classificar é um desafio. A maioria dos testes mede as aptidões cognitivas (por exemplo, os Testes Cognitivos Kendrick para Idosos e o Teste de Realização Individual Peabody), mas muitos testes também medem as capacidades motoras (por exemplo, o Teste de Dedo O’Connor e o Teste de Aptidão Geral USES). A maioria dos testes requer o uso de capacidades verbais e de leitura (por exemplo, a Bateria de Aptidão Multidimensional e o Teste de Aptidão Diferencial ), mas alguns utilizam meios não verbais para medir aptidões (por exemplo, Testes de Inteligência Não-Verbal, Segunda Edição e o Teste de Vocabulário Peabody Picture). Além disso, os testes diferem no número de aptidões que medem, na sua padronização, e na forma de administração.

Número de Aptidões

alguns testes medem uma única aptidão (por exemplo, o Teste Eléctrico e Electrónico e o Sistema de Selecção de Avaliação de Pessoal) mas muitos medem aptidões múltiplas (por exemplo, a Bateria de Aptidão Profissional dos Serviços Armados e a Bateria de Aptidão de Bolas ). Ambas as abordagens têm vantagens.

As baterias de aptidão múltipla obtêm informações sobre uma vasta gama de competências cognitivas e motoras e permitem comparações dos pontos fortes e fracos relativos do examinando. Estes instrumentos são úteis quando indivíduos ou organizações procuram informação para orientar decisões vocacionais e educacionais. Embora existam numerosas baterias de teste de multiaptidão e de capacidade múltipla, todas medem geralmente um conjunto relativamente padrão de construções.

Mais instrumentos especializados que medem uma única construção são úteis quando são desejáveis previsões mais focalizadas. A obtenção de informação sobre construções como potencial criativo e artístico requer frequentemente a utilização de instrumentos especializados concebidos para esse fim específico. Além disso, um único instrumento de aptidão concebido para medir capacidades de leitura, matemática, espacial, ou mecânica pode medir essas capacidades com maior precisão do que uma bateria multi-aptidão.

Testes normalizados

Testes normalizados são aqueles que foram administrados a um grupo de pessoas (referido como o grupo normalizado) para obter informações sobre a probabilidade de cada pontuação possível no teste. A comparação da pontuação de um examinando com as pontuações obtidas pelas pessoas que compõem o grupo normalizado permite aos psicólogos interpretar a pontuação. As pontuações nos testes padronizados são tipicamente relatadas em termos de uma pontuação padrão, uma pontuação equivalente à idade, ou uma pontuação equivalente à nota.

É extremamente importante que o grupo normativo utilizado para interpretar a pontuação de um examinando forneça uma base significativa para a comparação. Por exemplo, seria enganador interpretar a nota de um estudante do ensino secundário utilizando um grupo normativo composto por estudantes do ensino médio. Embora o problema identificado neste exemplo seja óbvio, problemas mais subtis só recentemente começaram a ser evitados. Por exemplo, a comparação das notas obtidas por uma mulher num teste com as notas obtidas por um grupo normativo composto exclusivamente por machos produz uma interpretação questionável em muitos casos. Contudo, esta prática não era padrão há muitos anos atrás.

Por esta razão, muitos testes têm mais do que um grupo normativo. Um teste utilizado com crianças do ensino básico, por exemplo, pode ter um grupo normativo composto por alunos do primeiro ano, um grupo normativo composto por alunos do segundo ano, e assim por diante até um grupo normativo composto por alunos do sexto ano. Além disso, podem estar disponíveis grupos normalizados separados para raparigas e rapazes para cada nível da classe. Exemplos adicionais dos tipos de grupos normativos que poderiam ser desenvolvidos para um teste incluem graduadas universitárias, carpinteiras bem sucedidas, advogados afro-americanos, e homens alistados.

A interpretação normativa precisa de um teste não é possível sem um grupo normativo relevante, mas o desenvolvimento de grupos normativos é dispendioso e demorado. Isto cria dois problemas. Primeiro, muitos testes têm apenas um ou poucos grupos de normas. Esta prática obriga os utilizadores a basear a sua interpretação no grupo de normas mais relevante e não num grupo de normas directamente relevante. Por vezes não existe um grupo normativo relevante que corresponda ao género, origem cultural ou património étnico de um examinando, pelo que o utilizador é forçado a fazer a melhor interpretação possível, dadas as circunstâncias. Em segundo lugar, a despesa de obter grupos de normas também significa que alguns grupos de normas publicadas não são actuais. Cada coorte de examinados nasce num mundo que difere, em aspectos importantes, da coorte anterior. A exactidão e utilidade das interpretações normativas dos resultados dos exames diminui à medida que o grupo normativo se torna cada vez mais datado.

Embora quase todos os testes de aptidão e habilidade sejam padronizados, o típico teste de desempenho em sala de aula não é padronizado. Geralmente, os resultados dos testes não padronizados são comunicados em termos da percentagem de itens respondidos correctamente e são interpretados em termos de uma norma pré-determinada (por exemplo, A > 90%, B = 89%-80%; > 70% = Passar e < 69% = Falhar). Os testes que são interpretados por comparação do desempenho do examinando com um padrão pré-determinado e não com um grupo normativo são chamados de critérios-referenciados. Duas vantagens dos testes referenciados por critérios são que as pontuações obtidas em tais testes são inerentemente significativas e não são impostas restrições artificiais ao número de examinados que podem desempenhar num determinado nível.

Test Administration

Os testes de maior realização, aptidão e capacidade podem ser administrados a uma única pessoa ou a um grupo de indivíduos. Historicamente, a opção de administrar o teste a um grupo era essencial para testes como o SAT, ACT, e GRE que são realizados por centenas de milhares de pessoas todos os anos. No entanto, em alguns casos, a informação que pode ser obtida a partir de observações comportamentais feitas por um psicólogo enquanto se administra o teste a um indivíduo é bastante importante. Embora mais dispendiosa e demorada, a opção de uma administração individualizada do teste é importante. É mais provável que esta opção seja desejável ao administrar um teste a crianças, adolescentes e indivíduos com dificuldades de aprendizagem ou outros problemas que possam interferir com o seu desempenho no teste. Alguns testes, particularmente testes de inteligência concebidos para medir capacidades cognitivas, são concebidos exclusivamente para administração individual.

Na última década, surgiu uma opção adicional para a administração do teste: administração do teste por computador. A administração por computador combina a vantagem da administração económica a um grande número de indivíduos com a possibilidade de algumas observações comportamentais durante a administração do teste. Por exemplo, as latências de resposta (ou seja, a quantidade de tempo que o examinando leva a responder à pergunta) podem ser registadas durante a administração do teste por computador. Além disso, testes baseados na teoria da resposta ao item podem adaptar o teste ao nível de capacidade do examinando.

p>Administração por computador é agora a opção principal para alguns testes. Por exemplo, o GRE é administrado por computador para examinar nos Estados Unidos, Canadá, e muitas outras áreas do mundo, a menos que sejam tomadas disposições especiais para uma administração baseada em papel. Esta tendência irá provavelmente acelerar, e é provável que a maioria dos testes padronizados amplamente utilizados forneçam uma opção para administração por computador dentro de uma década.

Skills Measured

Centenas de escalas foram desenvolvidas para medir várias facetas de realização, aptidão, e capacidade. Numerosos testes concentram-se em áreas específicas de conteúdo, tais como capacidades espaciais, matemáticas, verbais e motoras. Muitos testes que medem uma única habilidade cognitiva ou motora fornecem uma medida alternativa (e em alguns casos uma medida mais precisa) das habilidades medidas pelas baterias multi-aptidão e testes de inteligência. Apesar desta incrível variedade de opções, a maioria dos principais testes avalia o mesmo conjunto seleccionado de competências. Embora o nome específico da habilidade varie de teste para teste e existam diferenças subtis entre testes com nomes semelhantes, as construções medidas pelos vários testes são bastante semelhantes.

As secções seguintes descrevem algumas das competências cognitivas e motoras mais frequentemente medidas e algumas das pontuações compostas obtidas pela combinação de informações sobre estas competências.

Competências cognitivas

Aptidão verbal: A capacidade de compreender os significados das palavras, frases e parágrafos e de os utilizar eficazmente. As medidas desta habilidade avaliam o quão bem um examinando compreende as ideias expressas em palavras e quão claramente pode raciocinar com palavras. Alguns testes incluem subscales separados para medir componentes do conhecimento verbal. Por exemplo, o ASVAB inclui testes de conhecimento de palavras e compreensão de parágrafos. Os testes WAIS-III, MAB, e SB5 contêm testes de vocabulário. O SB5 também inclui o teste Relações Verbais. O teste DAT contém os seguintes testes: Raciocínio Verbal e Uso da Linguagem: Ortografia e Gramática.

Aptidão Numérica: A capacidade de compreender ideias expressas em números. Os testes incluem alguma combinação de itens que avaliam o cálculo numérico (isto é, a capacidade de adicionar, subtrair, e executar outros cálculos aritméticos) e o raciocínio numérico (isto é, o quão bem um examinando pode pensar e raciocinar com números). As escalas que avaliam aspectos desta capacidade são várias vezes intituladas Aritmética, Construção de Equações, Capacidade Numérica, e Quantitativa, entre outras.

Aptidão Espacial: A capacidade de visualizar ou formar imagens mentais de sólidos a partir do olhar para planos num pedaço de papel plano. Alguns itens exigem que as pessoas olhem para um diagrama e determinem a aparência de um objecto no espaço tridimensional se este fosse completado. Outros pedem aos inquiridos que olhem para uma imagem ou desenho de um objecto completado e visualizem no espaço tridimensional como esse objecto ficaria se fosse rodado para uma posição diferente. As competências relacionadas são medidas em testes intitulados Desenho de Blocos, Raciocínio Matricial, Matrizes, Dobra e Corte de Papel, Análise de Padrões, Relações Espaciais, e Espaciais.

Abstract Reasoning: A capacidade de compreender ideias que são apresentadas sem utilizar palavras ou números. Os testes de raciocínio abstracto apresentam problemas em termos de tamanho, forma, posição, ou quantidade utilizando imagens, formas, padrões, ou alguma outra forma não-verbal, não numérica. As escalas que medem a aptidão espacial medem um aspecto desta capacidade. Outras escalas que medem aspectos desta capacidade são intituladas Percepção de Forma, Montagem de Objecto, Conclusão de Imagem, e Arranjo de Imagem, entre outras.

Compreensão: A capacidade de usar o raciocínio dedutivo (e, em menor grau, o raciocínio indutivo) para derivar soluções para problemas e questões socialmente relevantes. Estes testes avaliam o julgamento prático e o senso comum dos examinadores e a sua capacidade de lidar com o seu ambiente social e cultural. Outras escalas que medem aspectos desta aptidão são intituladas Absurdities and Similarities.

Motor Skills

Em certo sentido, as capacidades motoras representam a função de saída da capacidade humana. A compreensão e a resolução de problemas ocorrem sem serem observadas dentro do cérebro humano, mas o produto dessa actividade mental é expresso ou em palavras ou através de alguma actividade física. Muitos testes de capacidades motoras exigem que as pessoas utilizem as suas capacidades cognitivas antes de darem alguma resposta física. Por exemplo, os testes de velocidade e exactidão de escriturários (ou seja, listas de nomes ou endereços de ruas para ver se correspondem ou estão em ordem alfabética) exigem que as pessoas utilizem tanto as suas capacidades cognitivas como as suas capacidades motoras. Outros exemplos incluem o desenho de blocos (isto é, organizar blocos para fazer um desenho designado) e símbolo de dígitos (isto é, traduzir símbolos dispostos aleatoriamente em números usando uma chave que corresponda aos símbolos e números).

Os três testes seguintes fornecem avaliações mais puras das capacidades motoras. As tarefas que requerem que as pessoas executem são simples e não requerem capacidade cognitiva para compreender. Como tal, fornecem uma medida clara da capacidade do indivíduo para executar a tarefa física.

Coordenação motora: A capacidade de coordenar os olhos e as mãos ou dedos em movimentos rápidos, precisos e precisos. Os testes de coordenação motora apresentam as pessoas com uma página de pequenas caixas e exigem que elas façam uma marca no maior número de caixas possível dentro de um breve período de tempo designado.

Destreza do dedo: A capacidade de fazer movimentos pequenos, rápidos e precisos com os dedos, como na dactilografia, e de mover objectos pequenos de forma rápida e precisa, como na montagem de dois ou mais objectos. Os testes de destreza dos dedos requerem que as pessoas montem objectos simples, tais como colocar uma anilha num rebite e desmontar objectos tais como tirar anilhas de rebites e devolver as anilhas e rebites ao seu local de armazenamento.

Dexteridade manual: A capacidade de fazer movimentos coordenados com as mãos, de forma rápida e hábil. Os testes de destreza manual exigem que as pessoas coloquem objectos em posições designadas ou que transfiram objectos de uma posição para uma posição designada.

Partituras compostas

Partituras compostas são pontuações obtidas pela combinação das pontuações obtidas em dois ou mais testes. Muitas vezes, as pontuações dos testes são interpretadas tanto em termos do seu significado como uma pontuação isolada como como parte de um composto. O conceito de inteligência é provavelmente o composto mais conhecido. Muitos testes de inteligência produzem três pontuações compostas: uma inteligência verbal, uma inteligência de desempenho, e uma pontuação global ou completa de inteligência. Outra forma de conceptualizar a inteligência é em termos dos processos mentais que formam a base do comportamento cognitivo. Esta perspectiva sugere que o comportamento intelectual envolve compreensão, organização, pensamento, e memória. Pontuações compostas importantes obtidas em testes de capacidade cognitiva que reflectem esta visão da inteligência são compreensão verbal, organização perceptiva, velocidade de processamento, e memória de trabalho.

Inteligência verbal: Obtido através da combinação de pontuações em medidas de aptidão verbal, numérica, e espacial. Este composto fornece uma medida global da capacidade de raciocínio abstracto das pessoas e a sua capacidade de compreender e aprender novas aptidões. Este composto é fortemente influenciado por aptidões verbais.

Inteligência de desempenho: Obtido pela combinação de pontuações em medidas que requerem tanto raciocínio abstracto como a manipulação de objectos tais como blocos, contas, imagens, ou peças de puzzle. Este composto fornece uma medida da capacidade de raciocínio abstracto que se baseia menos no uso de palavras e habilidades verbais. A capacidade de compreender figuras materiais não verbais de forma mais proeminente neste composto.

p>Intelligence: Obtido através da combinação de pontuações em inteligência verbal e inteligência de desempenho. Em testes como o WAIS-III, MAB, e SB5, este composto incorpora informação de compostos verbais e de desempenho de cinco ou seis testes cada. Em baterias multi-aptitude como o DAT e USES GATB, este composto incorpora informação de medidas de aptidão verbal, aptidão numérica, e aptidão espacial.

Compreensão verbal: Este composto fornece uma medida global da capacidade do indivíduo para compreender e trabalhar com informação verbal. É obtido através da combinação de pontuações em medidas que avaliam vocabulário, informação geral, e a capacidade de trabalhar com informação ambígua para resolver problemas quando apresentada em forma verbal.

Organização perceptual: Este composto fornece informação sobre a capacidade do indivíduo para analisar informação que é apresentada de forma não verbal e para a organizar num padrão significativo. É obtido através da combinação de pontuações em medidas que requerem que o indivíduo trabalhe com imagens, blocos, ou matrizes.

Velocidade de processamento: Este composto fornece informação sobre a velocidade com que a pessoa pode trabalhar com símbolos abstractos. É obtido através da combinação de pontuações em testes que avaliam a capacidade de trabalhar com símbolos abstractos que não têm qualquer significado verbal facilmente acessível.

Memória de trabalho: Este composto fornece informação sobre a capacidade da pessoa para guardar informação na memória e trabalhar com ela para resolver problemas. É obtido através da combinação de resultados em testes que requerem que o indivíduo se lembre de padrões formados por imagens de contas, números, e letras.

Contribuição duradoura

O desenvolvimento do teste psicológico é uma das mais importantes e duradouras contribuições da psicologia para a civilização. De facto, os psicólogos Rene V. Dawis e David Lubinski consideram os testes psicológicos como servindo a mesma função para os psicólogos que o microscópio e o telescópio servem para microbiologistas e astrónomos. Os testes proporcionam aos psicólogos a capacidade de ver fenómenos que de outra forma seriam invisíveis. Muitos dos benefícios enriquecedores que a psicologia contribuiu para a sociedade moderna não teriam sido possíveis sem o uso de testes psicológicos.

Os primeiros psicólogos começaram a trabalhar nos primeiros testes de realização, aptidão, e capacidade no final dos anos 1800. A investigação e inovação até à Segunda Guerra Mundial centrou-se largamente no desenvolvimento de métodos para medir os interesses profissionais e as aptidões cognitivas e motoras. A ciência moderna da medição psicológica é atribuível a décadas de investigação sobre testes, assim como a diversidade frutuosa de testes desenvolvidos por psicólogos. Embora os psicólogos tenham conscienciosamente desenvolvido testes para abordar toda a gama de necessidades sociais, a sua produtividade na área da realização, aptidão, e testes de aptidão é insuperável.

American Educational Research Association, American Psychological Association, e National Council on Measurement in Education. (1999). Os padrões para os testes educacionais e psicológicos. Washington, DC: American Educational Research Association.
American Psychological Association, Joint Committee on Testing Practices. (2005). Código de práticas de testes justos na educação. Washington, DC: Autor.
Anastasi, A., & Urbina, S. (1997). Testes psicológicos (7ª ed.). Upper Saddle River, NJ: Prentice Hall.
Hambleton, R. K., Robin, F., & Xing, D. (2000). Modelos de resposta ao item para a análise de dados de testes educativos e psicológicos. Em H. E. A. Tinsley & S. D. Brown (Eds.), Handbook of applied multivariate statistics and mathematical modeling (pp. 553-581). San Diego, CA: Academic Press.
Conselho Nacional de Medição em Educação. (1995). Código de responsabilidades profissionais em matéria de medição educativa. Madison, WI: Author.
Spies, R. A., & Plake, B. S. (Eds.). (2005). O décimo sexto anuário de medições mentais. Lincoln, NE: Buros Institute of Mental Measurements.
Walsh, W. B., & Betz, N. E. (1995). Testes e avaliação (4ª ed.). Upper Saddle River, NJ: Prentice Hall.

Guinguette Marais Poitevin

Blog