Les tests psychotechniques sont l'outil le plus puissant et le plus mal utilisé du recrutement français. Sur les missions Lity, on voit régulièrement des comités décider sur la base d'un Raven SPM passé en 12 minutes sans contextualisation, ou d'un test maison sans validation statistique. C'est l'erreur méthodologique la plus coûteuse en évaluation.

Ce guide cadre l'usage des tests d'aptitudes cognitives en recrutement. Les vrais tests psychotechniques (mesure de raisonnement, mémoire, attention), pas les tests de personnalité (sujet à part). Validité prédictive, choix d'outil, biais culturels, conformité RGPD, et la place exacte de ces tests dans un processus structuré.

Tests psychotechniques, tests de logique pure, tests de personnalité : trois familles distinctes

Première confusion à lever. Les tests psychotechniques mesurent les aptitudes cognitives générales : raisonnement abstrait, raisonnement numérique, raisonnement verbal, mémoire de travail, attention soutenue. Les tests de logique pure (suites de chiffres, énigmes) sont un sous-ensemble. Ils ne mesurent qu'une dimension. Les tests de personnalité (Big Five, MBTI, AssessFirst) mesurent des traits comportementaux. Sujet traité dans un article frère sur les tests de personnalité.

Ce que mesure vraiment un test psychotechnique

Le facteur g, ou intelligence générale, isolé en 1904 par Charles Spearman. Trois sous-dimensions reviennent dans 95% des outils du marché : raisonnement fluide (logique abstraite face à un problème nouveau), raisonnement cristallisé (connaissances stockées), vitesse de traitement. Une bonne batterie combine au moins deux sous-dimensions pour éviter le sur-poids d'un seul type de cognition.

L'apport scientifique fondamental : la méta-analyse Schmidt & Hunter

Frank Schmidt et John Hunter ont publié en 1998 la méta-analyse la plus citée en psychologie du travail (85 ans de données, 32 000 études). Conclusion : les tests d'aptitudes cognitives prédisent la performance professionnelle avec un coefficient de validité de 0,51, supérieur à l'entretien non structuré (0,38), au CV (0,18) ou aux références (0,26). Combinés à un entretien structuré, on monte à 0,63. C'est la combinaison la plus prédictive connue à ce jour.

Les 4 outils du marché français : ce qu'ils valent vraiment

Raven SPM et APM : la référence du raisonnement abstrait

Les Progressive Matrices de John Raven mesurent le facteur g sans support linguistique. SPM (Standard) : 60 items, 45 minutes, calibré pour des candidats opérationnels et confirmés. APM (Advanced) : 48 items, 60 minutes, conçu pour des profils cadres et dirigeants. Validité prédictive de 0,40 à 0,55 selon les méta-analyses. Faible dépendance culturelle, mais pas nulle.

BLS4 : le test de raisonnement verbal Pearson

Édité par Pearson Talentlens. 80 items, 18 minutes, mesure la capacité d'inférence logique en français écrit. Très utilisé sur les fonctions support (juridique, RH, finance, communication). Validité de 0,42 sur les fonctions à composante rédactionnelle. Attention aux candidats non francophones natifs : biais culturel élevé, à compenser systématiquement.

NV5 et NV7 : les tests de raisonnement numérique

Édités également par Pearson, dérivés du DAT (Differential Aptitude Test). NV5 : niveau opérationnel et confirmé, 40 items, 30 minutes. NV7 : niveau cadre, 36 items, 30 minutes, items plus complexes (lecture de tableaux, ratios, projections). Validité de 0,45 sur les fonctions data, finance, contrôle de gestion. Bon prédicteur de la capacité d'analyse quantitative.

OPQ32 : à classer à part

Souvent rangé dans les tests psychotechniques par les RH, l'OPQ32 (édité par SHL) est en réalité un test de personnalité au format questionnaire. Pas un test d'aptitude cognitive. À utiliser en complément d'un Raven ou d'un BLS4, jamais en remplacement.

TestMesureDuréeValidité prédictiveCas d'usage
Raven SPMRaisonnement abstrait45 min0,40-0,55Tous niveaux
Raven APMRaisonnement abstrait avancé60 min0,45-0,55Cadres et dirigeants
BLS4 (Pearson)Raisonnement verbal18 min0,42Fonctions support
NV5 (Pearson)Raisonnement numérique30 min0,45Data, finance, gestion
NV7 (Pearson)Raisonnement numérique cadre30 min0,45Cadres analytiques
OPQ32 (SHL)Personnalité40 min0,30Complément, pas substitut

Quand utiliser un test psychotechnique : la règle des 3 conditions

Un test d'aptitudes n'est pertinent que si trois conditions sont remplies. Le poste demande une charge cognitive élevée. La sélection produit un volume de candidats supérieur à 30. L'évaluateur sait interpréter le résultat dans le contexte du poste.

Postes où le test apporte de la valeur

Fonctions analytiques : data analyst, contrôleur de gestion, consultant en stratégie, actuaire. Fonctions techniques exigeantes : développeur senior, ingénieur process, chef de projet complexe. Fonctions à fort volume de candidatures où le tri qualitatif manuel devient impraticable.

Postes où le test est superflu ou contre-productif

Métiers manuels qualifiés : artisanat, BTP, restauration. La validité prédictive chute à 0,20. Métiers relationnels où l'empathie prime : commerciaux terrain, customer success, service client. Le test mesure mal ce qui compte. Postes de direction où l'expérience pèse plus que l'aptitude brute. Un dirigeant de 25 ans de carrière n'a pas à passer un Raven.

Le piège du test obligatoire pour tous

Imposer un test psychotechnique à 100% des candidats sur tous les postes du cabinet est une erreur stratégique. Les profils confirmés et chassés refusent souvent de passer un test. Sur les missions Lity 2026, 38% des candidats seniors approchés en direct déclinent un process incluant un test obligatoire. On réserve le test aux postes où il apporte de la valeur prédictive réelle.

Où placer le test dans le processus : pas trop tôt, pas trop tard

Le placement optimal d'un test psychotechnique dans un funnel de recrutement
100
Candidatures reçuestri CV et lettre de motivation
35
Call qualif RH20 min, alignement attentes
18
Entretien managerévaluation motivation et fit poste
8
Test psychotechniquefinalistes uniquement, post-entretien 1
3
Entretien final + référencesdécision en comité avec score test
1
Signingoffre formelle
Le test arrive après le premier entretien, jamais avant. Raison : le test demande 30 à 60 minutes d'engagement. Le candidat doit déjà avoir validé l'intérêt du poste. Placé trop tôt, le test fait fuir 40% des profils qualifiés. Placé trop tard (juste avant signing), il devient un filtre théâtral sans impact décisionnel. Source : Méthodologie Lity 2026 sur 60 missions cabinet

Le brief candidat avant le test

On explique au candidat pourquoi on lui demande de passer ce test. Pas par tradition, pas pour le piéger. On précise la durée, les conditions (calme, sans coupure, ordinateur personnel), et le délai de restitution. On garantit un retour sur le résultat, qu'il soit retenu ou non. C'est une obligation déontologique, pas une option.

Interpréter un résultat : ce que le score dit et ne dit pas

Le score brut, le rang centile, et l'étalonnage

Un score brut sur 60 items n'a aucune valeur en soi. On compare au rang centile sur la population de référence (cadres français, 25-45 ans, cursus universitaire). Un candidat à 75ᵉ centile fait mieux que 75% de la population de référence. C'est l'information qui compte, pas le nombre absolu de bonnes réponses.

Le seuil de décision : pas une note éliminatoire

Sur les missions Lity, on ne fixe jamais un seuil binaire. On pondère le score test dans la grille d'évaluation globale, comme un critère parmi d'autres. Un candidat à 60ᵉ centile peut très bien signer si son entretien et son track record le justifient. Un candidat à 90ᵉ centile peut être écarté si ses soft skills ne correspondent pas à la culture en place.

Pourquoi le test seul ne décide jamais

La validité prédictive d'un test psychotechnique culmine à 0,55 dans les meilleurs cas. Cela veut dire que 70% de la variance de performance future reste expliquée par d'autres facteurs. Un test seul donne une orientation, pas une décision. C'est exactement pour cela que Schmidt et Hunter recommandent la combinaison test + entretien structuré, qui monte à 0,63 de validité.

Biais culturels et discrimination : les angles morts à corriger

Le biais linguistique sur les profils non francophones natifs

BLS4 et tous les tests à support verbal pénalisent systématiquement les candidats dont le français n'est pas la langue maternelle. Sur un même niveau de raisonnement réel, l'écart de score peut atteindre 15 points centiles. Solution : utiliser des tests non verbaux (Raven SPM ou APM), ou proposer la passation dans la langue maternelle du candidat quand l'éditeur le permet.

Le biais socio-culturel des Progressive Matrices

Le Raven a longtemps été présenté comme culture-free. Les méta-analyses récentes nuancent. Les candidats issus de cursus scientifiques européens performent en moyenne mieux que ceux issus de cursus littéraires ou de parcours non académiques, à intelligence réelle égale. Solution : croiser le score avec d'autres indicateurs (entretien comportemental, mise en situation, références).

La discrimination algorithmique des tests gamifiés

Les nouveaux tests gamifiés (Pymetrics, Arctic Shores) sont vendus comme moins biaisés. Les audits indépendants montrent au contraire des biais sur l'âge (les 45+ obtiennent des scores inférieurs sur des dimensions de vitesse de traitement) et sur l'accessibilité (candidats avec troubles dys ou TDAH désavantagés). Si vous utilisez un test gamifié, demandez à l'éditeur les rapports d'audit d'équité (fairness reports) avant achat.

Conformité RGPD : ce que la loi française impose

Article L.1221-8 du Code du travail

Le candidat doit être expressément informé des méthodes et techniques d'aide au recrutement utilisées à son égard. Les résultats restent confidentiels. Communication du résultat obligatoire si le candidat en fait la demande.

RGPD : durée de conservation et finalité

Les résultats de test sont une donnée sensible au sens du RGPD. Conservation maximale : 2 ans après la dernière communication avec le candidat (recommandation CNIL). Finalité : strictement l'aide à la décision de recrutement sur le poste précis. Pas de réutilisation pour un autre poste sans consentement explicite renouvelé.

Trois fautes RGPD fréquentes sur les tests

1. Stocker les résultats en pièce jointe dans un ATS sans chiffrement. 2. Partager le rapport complet avec le manager opérationnel (seul le RH habilité doit avoir accès au détail). 3. Conserver les scores pour alimenter des modèles prédictifs internes sans base légale. Ces trois pratiques exposent à une sanction CNIL et à un risque de discrimination prouvée.

Alternatives aux tests psychotechniques : quand le test n'est pas l'outil

Les mises en situation et études de cas

Sur un poste de consultant en stratégie, une étude de cas business de 90 minutes apporte plus d'information qu'un Raven APM. Sur un poste de développeur, un live coding ou un take-home test prédit mieux la performance que n'importe quel test d'aptitude. Le principe : tester la compétence réelle dans le contexte réel du poste, pas l'aptitude abstraite.

Les tests d'échantillon de travail (work sample tests)

Validité prédictive de 0,54 selon Schmidt et Hunter, équivalente aux meilleurs tests cognitifs. Avantage : forte acceptabilité par les candidats, biais culturels limités, lien direct avec le poste. Désavantage : coût de conception et d'administration plus élevé.

L'entretien structuré comportemental

Validité de 0,51 selon les méta-analyses. Mêmes questions, même grille d'évaluation, pour tous les candidats. Méthode STAR (Situation, Tâche, Action, Résultat) sur des compétences précises identifiées dans la scorecard du poste.

La méthode Lity sur l'usage des tests psychotechniques

Matrice : quel outil d'évaluation selon le poste
Volume candidatures élevé (>30)
Volume candidatures faible (<30)

Test psychotechnique pertinent

Raven SPM ou APM, NV5 ou NV7 selon profil. Placé après le 1er entretien. Pondération 15-25% dans la grille d'évaluation finale.

Tri par mise en situation

Étude de cas courte (45-60 min) en amont. Test cognitif optionnel sur finalistes. Entretien structuré obligatoire.

Pas de test, entretien comportemental

Le test apporte peu de valeur prédictive. Mises en situation + références suffisent. Préserver l'expérience candidat.

Work sample test recommandé

Take-home test, live coding, cas business. Validité 0,54. Plus pertinent qu'un test cognitif générique sur un profil spécialisé.

Charge cognitive faible (relationnel, manuel)
Charge cognitive élevée (analytique, technique)

Règle d'or

Un test psychotechnique n'est jamais l'outil par défaut. C'est un outil contextuel à choisir en fonction de la charge cognitive du poste et du volume de candidatures à trier.

Source : Méthodologie Lity 2026

Erreurs fréquentes à éviter

1. Utiliser le test comme filtre éliminatoire

Aucun test au monde ne justifie une élimination automatique sur seuil. Le score s'intègre à une grille pondérée, croisée avec entretien, référencement, mise en situation.

2. Faire passer un test sans débrief

Le candidat qui passe 60 minutes de test a droit à un retour. Pas le détail item par item, mais une lecture qualitative : forces observées, axes de progression, score global relatif. C'est une obligation déontologique.

3. Choisir un test sans étalonnage adapté

Un test étalonné sur une population américaine de 1995 ne donne aucun résultat exploitable sur un candidat français en 2026. On exige un étalonnage français récent (moins de 5 ans) et adapté au niveau du poste (cadres, opérationnels, dirigeants).

4. Confondre score et performance future

Un score élevé ne garantit ni l'engagement, ni la culture fit, ni la résilience. Un score moyen n'exclut ni la performance ni le leadership. Le test informe sur une dimension parmi d'autres.

Quand Lity recommande ou déconseille un test sur ses missions

Sur 60 missions cabinet 2026, on recommande un test psychotechnique sur environ 35% des recrutements : profils analytiques, postes à forte charge cognitive, premières embauches sur une fonction critique. Sur les 65% restants, on privilégie mise en situation, entretien structuré, prise de référence renforcée.

Check-list pour utiliser un test psychotechnique sans se planter

  • Le poste justifie une mesure d'aptitudes cognitives (charge analytique réelle)
  • Le test choisi a une validité prédictive documentée sur votre type de poste
  • L'étalonnage français du test date de moins de 5 ans
  • Le test est placé après le 1er entretien, jamais avant
  • Le candidat est informé en amont (article L.1221-8)
  • Le score est pondéré dans une grille, jamais éliminatoire seul
  • Un retour qualitatif est garanti à chaque candidat, retenu ou non
  • Les résultats sont stockés chiffrés, accès limité au RH habilité
  • La conservation respecte la limite CNIL de 2 ans
  • Le test ne remplace ni l'entretien structuré ni la prise de référence