Scorecard de recrutement · DATA

Scorecard Data Engineer

Recruter un Data Engineer sur un CV, c’est risquer le profil qui empile les outils sans jamais livrer une donnée fiable. Cette scorecard prête à l’emploi pose les critères à noter, les questions qui révèlent le vrai niveau et les signaux d’alerte, pour décider sur des faits plutôt que sur un buzzword.

i

Un exemple à adapter. Cette scorecard est un modèle, pas une grille à appliquer telle quelle. Gardez les critères qui correspondent à votre poste et à votre équipe, ajustez ou retirez les autres. Le bon profil dépend de votre contexte.

Scorecard de recrutement

Data Engineer

La mission en une phrase

Résultats attendus
1

Livrer des pipelines de données fiables en production

Ingestion, transformation et exposition de la donnée, sans ruptures silencieuses ni retards récurrents.

2

Améliorer la qualité et la fraîcheur de la donnée

Ex : moins d’incidents de données, tests de qualité en place, délais de mise à disposition raccourcis.

3

Devenir référent d’un domaine de données

Un périmètre (un produit, une source, un data mart) que l’équipe lui confie.

4

Réduire la dette et les coûts de la plateforme data

Optimisation des requêtes, du stockage et des traitements, documentation des modèles.

Compétences à noter de 1 à 5
1-2 Insuffisant
3 Correct, à challenger
4-5 Excellent
MUST-HAVESQL et modélisation de données
12345

✗ Faible · Écrit des requêtes qui tournent mais mal optimisées, modélise au cas par cas sans penser usage.

✓ Excellent · Maîtrise le SQL avancé, modélise pour l’usage (star schema, normalisation), comprend index et coûts.

MUST-HAVEPipelines et orchestration (ETL/ELT, Airflow, dbt)
12345

✗ Faible · Scripts isolés lancés à la main, aucune idempotence ni reprise sur erreur.

✓ Excellent · Construit des pipelines idempotents, orchestrés et testés, qui se reprennent proprement après incident.

MUST-HAVEPython (ou Scala) pour la donnée
12345

✗ Faible · Code en vrac, pas de tests, dépend d’un notebook pour tout faire tourner.

✓ Excellent · Écrit du code lisible et testé, structure ses traitements, sait packager et industrialiser.

MUST-HAVEData warehouse / lakehouse (BigQuery, Snowflake, Spark)
12345

✗ Faible · Connaît un outil en surface, ignore les coûts et le partitionnement.

✓ Excellent · Modélise et optimise sur l’entrepôt (partition, clustering, coûts), choisit le bon moteur selon le besoin.

MUST-HAVEQualité, tests et observabilité de la donnée
12345

✗ Faible · Découvre les problèmes quand le métier se plaint, aucun test sur les données.

✓ Excellent · Met en place tests de qualité, contrôles de fraîcheur et alertes, détecte les anomalies avant les utilisateurs.

NICE-TO-HAVECloud et infrastructure data (Docker, IaC, CI/CD)
12345

✗ Faible · Dépend des autres pour déployer, ne touche pas à l’infra.

✓ Excellent · Conteneurise, déploie via pipeline, gère son infra data en infrastructure as code.

NICE-TO-HAVESens du produit et compréhension métier
12345

✗ Faible · Livre une table sans se demander à quoi elle sert.

✓ Excellent · Questionne l’usage, dialogue avec le métier, priorise selon l’impact business de la donnée.

Savoir-être

Autonomie

✗ Faible · Attend des specs détaillées, se bloque sans alerter.

✓ Excellent · Avance avec un besoin flou, débloque ses sujets, demande de l’aide au bon moment.

Rigueur

✗ Faible · Bâcle tests et documentation, laisse traîner les incidents.

✓ Excellent · Soigne qualité, tests et doc, traite les causes racines plutôt que les symptômes.

Communication avec le métier

✗ Faible · Noie les non-techniques sous le jargon data.

✓ Excellent · Vulgarise, traduit un besoin métier en modèle de données, alerte tôt en cas de risque.

Esprit d’équipe

✗ Faible · Garde son savoir, revues de code à charge.

✓ Excellent · Partage, fait des revues constructives, documente pour les autres.

Questions d'évaluation
1

Compétences techniques

Une table de production est fausse depuis ce matin. Comment tu diagnostiques et tu corriges ?

Qualité et observabilité

Comment tu modélises pour qu’une requête analytique reste rapide et peu coûteuse à grande échelle ?

SQL et entrepôt

2

Réalisations & expérience

Raconte-moi un pipeline que tu as conçu de bout en bout : la source, les transformations, et ce qui a été le plus dur à fiabiliser.

Autonomie bout-en-bout

3

Mise en situation

Ton pipeline nocturne échoue une fois sur trois. Comment tu le rends fiable ?

Pipelines et idempotence

4

Motivation & fit

Qu’est-ce qui te ferait rester trois ans dans une équipe data, et qu’est-ce qui te ferait partir au bout de six mois ?

Fit et rétention

Qu’est-ce que tu cherches dans ta prochaine plateforme data et ton prochain produit ?

Alignement projet

5

Savoir-être & collaboration

Le métier te demande une donnée que tu sais peu fiable. Comment tu gères ?

Communication et rigueur

Signaux d'alerte
!

Empile les outils à la mode sans savoir quel problème ils résolvent

Sur-ingénierie : il complexifiera la plateforme au lieu de la fiabiliser.

!

Ne teste jamais ses données et découvre les bugs via le métier

Qualité subie : la confiance dans la donnée finit par s’effondrer.

!

Ignore totalement les coûts du cloud et de l’entrepôt

Facture qui dérape et optimisations jamais faites.

!

Incapable d’expliquer un choix de modélisation simplement

Communication faible : friction garantie avec le métier et les analysts.

!

N’a jamais géré un incident de données en production

Profil théorique : il découvrira la pression du réel sur votre plateforme.

Lecture du score

Notez chaque compétence et savoir-être de 1 à 5. Repère de décision : moyenne supérieure ou égale à 4 sur les must-have et aucun red flag majeur = go ; 3 à 4 avec réserves = à challenger en second tour ; un must-have sous 3 ou un red flag majeur = no-go. Un nice-to-have faible ne doit jamais éliminer un bon profil.

Questions fréquentes

Qu'est-ce qu'une scorecard pour recruter un Data Engineer ?

Une scorecard data engineer est une grille d'évaluation structurée : elle liste les compétences et savoir-être à noter de 1 à 5, les questions d'entretien à poser et les signaux d'alerte. Elle permet de comparer les candidats sur des critères objectifs plutôt que sur une impression. On parle aussi de scorecard ingénieur data, scorecard ingénieur données, scorecard data eng.

Comment utiliser cette scorecard Data Engineer ?

Téléchargez-la en PDF, Excel ou Notion, notez chaque critère de 1 à 5 pendant l'entretien, puis additionnez les scores du panel pour décider sur des faits. La version Excel calcule la moyenne et la décision automatiquement.

Qu’est-ce qu’une scorecard de recrutement ?

Une grille d’évaluation structurée qui définit, avant les entretiens, les résultats attendus, les compétences à noter et les signaux d’alerte. Elle permet de comparer les candidats sur des critères objectifs plutôt que sur une impression.

Comment utiliser cette scorecard Data Engineer ?

Avant le process, validez les critères avec le manager. Pendant chaque entretien, notez les compétences de 1 à 5 et consignez les questions posées. Après, comparez les scores du panel pour décider sur des faits. Le PDF se remplit à la main, le fichier Excel et le Notion calculent le score automatiquement.