Nos conseils pour bien utiliser les tests psychotechniques

Q: Quels sont les tests psychotechniques les plus utilisés en recrutement français en 2026 ?

Les quatre références du marché : Raven SPM et APM (raisonnement abstrait, validité 0,40-0,55), BLS4 de Pearson (raisonnement verbal, validité 0,42), NV5 et NV7 de Pearson (raisonnement numérique, validité 0,45). L'OPQ32 de SHL est souvent rangé dans cette catégorie mais c'est un test de personnalité, pas un test d'aptitudes cognitives.

Q: Quelle est la validité prédictive d'un test psychotechnique ?

Selon la méta-analyse de référence Schmidt & Hunter (1998, 85 ans de données, 32 000 études), les tests d'aptitudes cognitives atteignent un coefficient de validité de 0,51 sur la performance professionnelle. C'est supérieur à l'entretien non structuré (0,38), au CV (0,18) ou aux références (0,26). Combinés à un entretien structuré, on atteint 0,63, la meilleure validité connue.

Q: Quand le test psychotechnique est-il pertinent dans un recrutement ?

Trois conditions cumulatives. Le poste demande une charge cognitive élevée (analyse, technique, stratégie). Le volume de candidatures dépasse 30. L'évaluateur sait interpréter le résultat dans le contexte. Sur les métiers manuels qualifiés, relationnels ou de direction sur expérience, le test apporte peu de valeur. Sur les missions Lity, on recommande un test sur 35% des recrutements environ.

Q: Où placer le test dans le processus de recrutement ?

Après le 1er entretien manager, avant l'entretien final. Placé trop tôt (avant tout entretien), il fait fuir 40% des profils qualifiés. Placé trop tard (juste avant signing), il devient un filtre théâtral sans impact décisionnel. Le candidat doit avoir validé l'intérêt du poste avant d'engager 30 à 60 minutes de passation.

Q: Les tests psychotechniques sont-ils légaux et conformes au RGPD ?

Oui, à conditions strictes. L'article L.1221-8 du Code du travail impose d'informer le candidat de la méthode utilisée. Les résultats sont confidentiels, communication obligatoire si demandée. Conservation maximale recommandée par la CNIL : 2 ans après dernière communication. Pas de réutilisation pour un autre poste sans consentement explicite renouvelé. Le stockage doit être chiffré, l'accès limité au RH habilité.

Q: Existe-t-il des alternatives aux tests psychotechniques ?

Oui, et souvent plus pertinentes. Les work sample tests (étude de cas, live coding, take-home test) atteignent une validité de 0,54, équivalente aux meilleurs tests cognitifs, avec une meilleure acceptabilité candidat. L'entretien structuré comportemental (méthode STAR) atteint 0,51. Les mises en situation sur cas réels apportent plus d'information qu'un test générique sur les postes spécialisés.

Les tests psychotechniques sont l'outil le plus puissant et le plus mal utilisé du recrutement français. Ce guide cadre l'usage des tests d'aptitudes cognitives (Raven SPM/APM, BLS4, NV5/NV7), leur validité prédictive selon Schmidt & Hunter, les biais culturels à corriger, la conformité RGPD et la place exacte dans un processus structuré. Méthodologie Lity 2026.

Julie PorchezHead of Data and AI Recruitment · 29 novembre 2024

Sommaire+

Tests psychotechniques, tests de logique pure, tests de personnalité : trois familles distinctes
Ce que mesure vraiment un test psychotechnique
Les 4 outils du marché français : ce qu'ils valent vraiment
Raven SPM et APM : la référence du raisonnement abstrait
BLS4 : le test de raisonnement verbal Pearson
NV5 et NV7 : les tests de raisonnement numérique
OPQ32 : à classer à part
Quand utiliser un test psychotechnique : la règle des 3 conditions
Postes où le test apporte de la valeur
Postes où le test est superflu ou contre-productif
Où placer le test dans le processus : pas trop tôt, pas trop tard
Le brief candidat avant le test
Interpréter un résultat : ce que le score dit et ne dit pas
Le score brut, le rang centile, et l'étalonnage
Le seuil de décision : pas une note éliminatoire
Biais culturels et discrimination : les angles morts à corriger
Le biais linguistique sur les profils non francophones natifs
Le biais socio-culturel des Progressive Matrices
La discrimination algorithmique des tests gamifiés
Conformité RGPD : ce que la loi française impose
Article L.1221-8 du Code du travail
RGPD : durée de conservation et finalité
Alternatives aux tests psychotechniques : quand le test n'est pas l'outil
Les mises en situation et études de cas
Les tests d'échantillon de travail (work sample tests)
L'entretien structuré comportemental
La méthode Lity sur l'usage des tests psychotechniques
Erreurs fréquentes à éviter
1. Utiliser le test comme filtre éliminatoire
2. Faire passer un test sans débrief
3. Choisir un test sans étalonnage adapté
4. Confondre score et performance future
Quand Lity recommande ou déconseille un test sur ses missions
Check-list pour utiliser un test psychotechnique sans se planter

Les tests psychotechniques sont l'outil le plus puissant et le plus mal utilisé du recrutement français. Sur les missions Lity, on voit régulièrement des comités décider sur la base d'un Raven SPM passé en 12 minutes sans contextualisation, ou d'un test maison sans validation statistique. C'est l'erreur méthodologique la plus coûteuse en évaluation.

Ce guide cadre l'usage des tests d'aptitudes cognitives en recrutement. Les vrais tests psychotechniques (mesure de raisonnement, mémoire, attention), pas les tests de personnalité (sujet à part). Validité prédictive, choix d'outil, biais culturels, conformité RGPD, et la place exacte de ces tests dans un processus structuré.

Tests psychotechniques, tests de logique pure, tests de personnalité : trois familles distinctes

Première confusion à lever. Les tests psychotechniques mesurent les aptitudes cognitives générales : raisonnement abstrait, raisonnement numérique, raisonnement verbal, mémoire de travail, attention soutenue. Les tests de logique pure (suites de chiffres, énigmes) sont un sous-ensemble. Ils ne mesurent qu'une dimension. Les tests de personnalité (Big Five, MBTI, AssessFirst) mesurent des traits comportementaux. Sujet traité dans un article frère sur les tests de personnalité.

Ce que mesure vraiment un test psychotechnique

Le facteur g, ou intelligence générale, isolé en 1904 par Charles Spearman. Trois sous-dimensions reviennent dans 95% des outils du marché : raisonnement fluide (logique abstraite face à un problème nouveau), raisonnement cristallisé (connaissances stockées), vitesse de traitement. Une bonne batterie combine au moins deux sous-dimensions pour éviter le sur-poids d'un seul type de cognition.

L'apport scientifique fondamental : la méta-analyse Schmidt & Hunter

Frank Schmidt et John Hunter ont publié en 1998 la méta-analyse la plus citée en psychologie du travail (85 ans de données, 32 000 études). Conclusion : les tests d'aptitudes cognitives prédisent la performance professionnelle avec un coefficient de validité de 0,51, supérieur à l'entretien non structuré (0,38), au CV (0,18) ou aux références (0,26). Combinés à un entretien structuré, on monte à 0,63. C'est la combinaison la plus prédictive connue à ce jour.

Les 4 outils du marché français : ce qu'ils valent vraiment

Raven SPM et APM : la référence du raisonnement abstrait

Les Progressive Matrices de John Raven mesurent le facteur g sans support linguistique. SPM (Standard) : 60 items, 45 minutes, calibré pour des candidats opérationnels et confirmés. APM (Advanced) : 48 items, 60 minutes, conçu pour des profils cadres et dirigeants. Validité prédictive de 0,40 à 0,55 selon les méta-analyses. Faible dépendance culturelle, mais pas nulle.

BLS4 : le test de raisonnement verbal Pearson

Édité par Pearson Talentlens. 80 items, 18 minutes, mesure la capacité d'inférence logique en français écrit. Très utilisé sur les fonctions support (juridique, RH, finance, communication). Validité de 0,42 sur les fonctions à composante rédactionnelle. Attention aux candidats non francophones natifs : biais culturel élevé, à compenser systématiquement.

NV5 et NV7 : les tests de raisonnement numérique

Édités également par Pearson, dérivés du DAT (Differential Aptitude Test). NV5 : niveau opérationnel et confirmé, 40 items, 30 minutes. NV7 : niveau cadre, 36 items, 30 minutes, items plus complexes (lecture de tableaux, ratios, projections). Validité de 0,45 sur les fonctions data, finance, contrôle de gestion. Bon prédicteur de la capacité d'analyse quantitative.

OPQ32 : à classer à part

Souvent rangé dans les tests psychotechniques par les RH, l'OPQ32 (édité par SHL) est en réalité un test de personnalité au format questionnaire. Pas un test d'aptitude cognitive. À utiliser en complément d'un Raven ou d'un BLS4, jamais en remplacement.

Test	Mesure	Durée	Validité prédictive	Cas d'usage
Raven SPM	Raisonnement abstrait	45 min	0,40-0,55	Tous niveaux
Raven APM	Raisonnement abstrait avancé	60 min	0,45-0,55	Cadres et dirigeants
BLS4 (Pearson)	Raisonnement verbal	18 min	0,42	Fonctions support
NV5 (Pearson)	Raisonnement numérique	30 min	0,45	Data, finance, gestion
NV7 (Pearson)	Raisonnement numérique cadre	30 min	0,45	Cadres analytiques
OPQ32 (SHL)	Personnalité	40 min	0,30	Complément, pas substitut

Quand utiliser un test psychotechnique : la règle des 3 conditions

Un test d'aptitudes n'est pertinent que si trois conditions sont remplies. Le poste demande une charge cognitive élevée. La sélection produit un volume de candidats supérieur à 30. L'évaluateur sait interpréter le résultat dans le contexte du poste.

Postes où le test apporte de la valeur

Fonctions analytiques : data analyst, contrôleur de gestion, consultant en stratégie, actuaire. Fonctions techniques exigeantes : développeur senior, ingénieur process, chef de projet complexe. Fonctions à fort volume de candidatures où le tri qualitatif manuel devient impraticable.

Postes où le test est superflu ou contre-productif

Métiers manuels qualifiés : artisanat, BTP, restauration. La validité prédictive chute à 0,20. Métiers relationnels où l'empathie prime : commerciaux terrain, customer success, service client. Le test mesure mal ce qui compte. Postes de direction où l'expérience pèse plus que l'aptitude brute. Un dirigeant de 25 ans de carrière n'a pas à passer un Raven.

Le piège du test obligatoire pour tous

Imposer un test psychotechnique à 100% des candidats sur tous les postes du cabinet est une erreur stratégique. Les profils confirmés et chassés refusent souvent de passer un test. Sur les missions Lity 2026, 38% des candidats seniors approchés en direct déclinent un process incluant un test obligatoire. On réserve le test aux postes où il apporte de la valeur prédictive réelle.

Où placer le test dans le processus : pas trop tôt, pas trop tard

Le placement optimal d'un test psychotechnique dans un funnel de recrutement

100

Candidatures reçuestri CV et lettre de motivation

Call qualif RH20 min, alignement attentes

Entretien managerévaluation motivation et fit poste

Test psychotechniquefinalistes uniquement, post-entretien 1

Entretien final + référencesdécision en comité avec score test

Signingoffre formelle

Le test arrive après le premier entretien, jamais avant. Raison : le test demande 30 à 60 minutes d'engagement. Le candidat doit déjà avoir validé l'intérêt du poste. Placé trop tôt, le test fait fuir 40% des profils qualifiés. Placé trop tard (juste avant signing), il devient un filtre théâtral sans impact décisionnel. Source : Méthodologie Lity 2026 sur 60 missions cabinet

Le brief candidat avant le test

On explique au candidat pourquoi on lui demande de passer ce test. Pas par tradition, pas pour le piéger. On précise la durée, les conditions (calme, sans coupure, ordinateur personnel), et le délai de restitution. On garantit un retour sur le résultat, qu'il soit retenu ou non. C'est une obligation déontologique, pas une option.

Interpréter un résultat : ce que le score dit et ne dit pas

Le score brut, le rang centile, et l'étalonnage

Un score brut sur 60 items n'a aucune valeur en soi. On compare au rang centile sur la population de référence (cadres français, 25-45 ans, cursus universitaire). Un candidat à 75ᵉ centile fait mieux que 75% de la population de référence. C'est l'information qui compte, pas le nombre absolu de bonnes réponses.

Le seuil de décision : pas une note éliminatoire

Sur les missions Lity, on ne fixe jamais un seuil binaire. On pondère le score test dans la grille d'évaluation globale, comme un critère parmi d'autres. Un candidat à 60ᵉ centile peut très bien signer si son entretien et son track record le justifient. Un candidat à 90ᵉ centile peut être écarté si ses soft skills ne correspondent pas à la culture en place.

Pourquoi le test seul ne décide jamais

La validité prédictive d'un test psychotechnique culmine à 0,55 dans les meilleurs cas. Cela veut dire que 70% de la variance de performance future reste expliquée par d'autres facteurs. Un test seul donne une orientation, pas une décision. C'est exactement pour cela que Schmidt et Hunter recommandent la combinaison test + entretien structuré, qui monte à 0,63 de validité.

Biais culturels et discrimination : les angles morts à corriger

Le biais linguistique sur les profils non francophones natifs

BLS4 et tous les tests à support verbal pénalisent systématiquement les candidats dont le français n'est pas la langue maternelle. Sur un même niveau de raisonnement réel, l'écart de score peut atteindre 15 points centiles. Solution : utiliser des tests non verbaux (Raven SPM ou APM), ou proposer la passation dans la langue maternelle du candidat quand l'éditeur le permet.

Le biais socio-culturel des Progressive Matrices

Le Raven a longtemps été présenté comme culture-free. Les méta-analyses récentes nuancent. Les candidats issus de cursus scientifiques européens performent en moyenne mieux que ceux issus de cursus littéraires ou de parcours non académiques, à intelligence réelle égale. Solution : croiser le score avec d'autres indicateurs (entretien comportemental, mise en situation, références).

La discrimination algorithmique des tests gamifiés

Les nouveaux tests gamifiés (Pymetrics, Arctic Shores) sont vendus comme moins biaisés. Les audits indépendants montrent au contraire des biais sur l'âge (les 45+ obtiennent des scores inférieurs sur des dimensions de vitesse de traitement) et sur l'accessibilité (candidats avec troubles dys ou TDAH désavantagés). Si vous utilisez un test gamifié, demandez à l'éditeur les rapports d'audit d'équité (fairness reports) avant achat.

Conformité RGPD : ce que la loi française impose

Article L.1221-8 du Code du travail

Le candidat doit être expressément informé des méthodes et techniques d'aide au recrutement utilisées à son égard. Les résultats restent confidentiels. Communication du résultat obligatoire si le candidat en fait la demande.

RGPD : durée de conservation et finalité

Les résultats de test sont une donnée sensible au sens du RGPD. Conservation maximale : 2 ans après la dernière communication avec le candidat (recommandation CNIL). Finalité : strictement l'aide à la décision de recrutement sur le poste précis. Pas de réutilisation pour un autre poste sans consentement explicite renouvelé.

Trois fautes RGPD fréquentes sur les tests

1. Stocker les résultats en pièce jointe dans un ATS sans chiffrement. 2. Partager le rapport complet avec le manager opérationnel (seul le RH habilité doit avoir accès au détail). 3. Conserver les scores pour alimenter des modèles prédictifs internes sans base légale. Ces trois pratiques exposent à une sanction CNIL et à un risque de discrimination prouvée.

Alternatives aux tests psychotechniques : quand le test n'est pas l'outil

Les mises en situation et études de cas

Sur un poste de consultant en stratégie, une étude de cas business de 90 minutes apporte plus d'information qu'un Raven APM. Sur un poste de développeur, un live coding ou un take-home test prédit mieux la performance que n'importe quel test d'aptitude. Le principe : tester la compétence réelle dans le contexte réel du poste, pas l'aptitude abstraite.

Les tests d'échantillon de travail (work sample tests)

Validité prédictive de 0,54 selon Schmidt et Hunter, équivalente aux meilleurs tests cognitifs. Avantage : forte acceptabilité par les candidats, biais culturels limités, lien direct avec le poste. Désavantage : coût de conception et d'administration plus élevé.

L'entretien structuré comportemental

Validité de 0,51 selon les méta-analyses. Mêmes questions, même grille d'évaluation, pour tous les candidats. Méthode STAR (Situation, Tâche, Action, Résultat) sur des compétences précises identifiées dans la scorecard du poste.

La méthode Lity sur l'usage des tests psychotechniques

Matrice : quel outil d'évaluation selon le poste

Volume candidatures élevé (>30)

Volume candidatures faible (<30)

Charge cognitive faible (relationnel, manuel)

Charge cognitive élevée (analytique, technique)

Test psychotechnique pertinent

Raven SPM ou APM, NV5 ou NV7 selon profil. Placé après le 1er entretien. Pondération 15-25% dans la grille d'évaluation finale.

Tri par mise en situation

Étude de cas courte (45-60 min) en amont. Test cognitif optionnel sur finalistes. Entretien structuré obligatoire.

Pas de test, entretien comportemental

Le test apporte peu de valeur prédictive. Mises en situation + références suffisent. Préserver l'expérience candidat.

Work sample test recommandé

Take-home test, live coding, cas business. Validité 0,54. Plus pertinent qu'un test cognitif générique sur un profil spécialisé.

◀ Charge cognitive faible (relationnel, manuel)

Charge cognitive élevée (analytique, technique) ▶

Règle d'or

Un test psychotechnique n'est jamais l'outil par défaut. C'est un outil contextuel à choisir en fonction de la charge cognitive du poste et du volume de candidatures à trier.

Source : Méthodologie Lity 2026

Erreurs fréquentes à éviter

1. Utiliser le test comme filtre éliminatoire

Aucun test au monde ne justifie une élimination automatique sur seuil. Le score s'intègre à une grille pondérée, croisée avec entretien, référencement, mise en situation.

2. Faire passer un test sans débrief

Le candidat qui passe 60 minutes de test a droit à un retour. Pas le détail item par item, mais une lecture qualitative : forces observées, axes de progression, score global relatif. C'est une obligation déontologique.

3. Choisir un test sans étalonnage adapté

Un test étalonné sur une population américaine de 1995 ne donne aucun résultat exploitable sur un candidat français en 2026. On exige un étalonnage français récent (moins de 5 ans) et adapté au niveau du poste (cadres, opérationnels, dirigeants).

4. Confondre score et performance future

Un score élevé ne garantit ni l'engagement, ni la culture fit, ni la résilience. Un score moyen n'exclut ni la performance ni le leadership. Le test informe sur une dimension parmi d'autres.

Quand Lity recommande ou déconseille un test sur ses missions

Sur 60 missions cabinet 2026, on recommande un test psychotechnique sur environ 35% des recrutements : profils analytiques, postes à forte charge cognitive, premières embauches sur une fonction critique. Sur les 65% restants, on privilégie mise en situation, entretien structuré, prise de référence renforcée.

Cadrer un processus de recrutement avec Lity →

Check-list pour utiliser un test psychotechnique sans se planter

Le poste justifie une mesure d'aptitudes cognitives (charge analytique réelle)
Le test choisi a une validité prédictive documentée sur votre type de poste
L'étalonnage français du test date de moins de 5 ans
Le test est placé après le 1er entretien, jamais avant
Le candidat est informé en amont (article L.1221-8)
Le score est pondéré dans une grille, jamais éliminatoire seul
Un retour qualitatif est garanti à chaque candidat, retenu ou non
Les résultats sont stockés chiffrés, accès limité au RH habilité
La conservation respecte la limite CNIL de 2 ans
Le test ne remplace ni l'entretien structuré ni la prise de référence

Questions fréquentes

On répond aux questions qu'on nous pose le plus.

Quels sont les tests psychotechniques les plus utilisés en recrutement français en 2026 ?+