Scorecard Data Engineer
Recruter un Data Engineer sur un CV, c’est risquer le profil qui empile les outils sans jamais livrer une donnée fiable. Cette scorecard prête à l’emploi pose les critères à noter, les questions qui révèlent le vrai niveau et les signaux d’alerte, pour décider sur des faits plutôt que sur un buzzword.
Un exemple à adapter. Cette scorecard est un modèle, pas une grille à appliquer telle quelle. Gardez les critères qui correspondent à votre poste et à votre équipe, ajustez ou retirez les autres. Le bon profil dépend de votre contexte.
Data Engineer
La mission en une phrase
Livrer des pipelines de données fiables en production
Ingestion, transformation et exposition de la donnée, sans ruptures silencieuses ni retards récurrents.
Améliorer la qualité et la fraîcheur de la donnée
Ex : moins d’incidents de données, tests de qualité en place, délais de mise à disposition raccourcis.
Devenir référent d’un domaine de données
Un périmètre (un produit, une source, un data mart) que l’équipe lui confie.
Réduire la dette et les coûts de la plateforme data
Optimisation des requêtes, du stockage et des traitements, documentation des modèles.
✗ Faible · Écrit des requêtes qui tournent mais mal optimisées, modélise au cas par cas sans penser usage.
✓ Excellent · Maîtrise le SQL avancé, modélise pour l’usage (star schema, normalisation), comprend index et coûts.
✗ Faible · Scripts isolés lancés à la main, aucune idempotence ni reprise sur erreur.
✓ Excellent · Construit des pipelines idempotents, orchestrés et testés, qui se reprennent proprement après incident.
✗ Faible · Code en vrac, pas de tests, dépend d’un notebook pour tout faire tourner.
✓ Excellent · Écrit du code lisible et testé, structure ses traitements, sait packager et industrialiser.
✗ Faible · Connaît un outil en surface, ignore les coûts et le partitionnement.
✓ Excellent · Modélise et optimise sur l’entrepôt (partition, clustering, coûts), choisit le bon moteur selon le besoin.
✗ Faible · Découvre les problèmes quand le métier se plaint, aucun test sur les données.
✓ Excellent · Met en place tests de qualité, contrôles de fraîcheur et alertes, détecte les anomalies avant les utilisateurs.
✗ Faible · Dépend des autres pour déployer, ne touche pas à l’infra.
✓ Excellent · Conteneurise, déploie via pipeline, gère son infra data en infrastructure as code.
✗ Faible · Livre une table sans se demander à quoi elle sert.
✓ Excellent · Questionne l’usage, dialogue avec le métier, priorise selon l’impact business de la donnée.
Autonomie
✗ Faible · Attend des specs détaillées, se bloque sans alerter.
✓ Excellent · Avance avec un besoin flou, débloque ses sujets, demande de l’aide au bon moment.
Rigueur
✗ Faible · Bâcle tests et documentation, laisse traîner les incidents.
✓ Excellent · Soigne qualité, tests et doc, traite les causes racines plutôt que les symptômes.
Communication avec le métier
✗ Faible · Noie les non-techniques sous le jargon data.
✓ Excellent · Vulgarise, traduit un besoin métier en modèle de données, alerte tôt en cas de risque.
Esprit d’équipe
✗ Faible · Garde son savoir, revues de code à charge.
✓ Excellent · Partage, fait des revues constructives, documente pour les autres.
Compétences techniques
Une table de production est fausse depuis ce matin. Comment tu diagnostiques et tu corriges ?
→ Qualité et observabilité
Comment tu modélises pour qu’une requête analytique reste rapide et peu coûteuse à grande échelle ?
→ SQL et entrepôt
Réalisations & expérience
Raconte-moi un pipeline que tu as conçu de bout en bout : la source, les transformations, et ce qui a été le plus dur à fiabiliser.
→ Autonomie bout-en-bout
Mise en situation
Ton pipeline nocturne échoue une fois sur trois. Comment tu le rends fiable ?
→ Pipelines et idempotence
Motivation & fit
Qu’est-ce qui te ferait rester trois ans dans une équipe data, et qu’est-ce qui te ferait partir au bout de six mois ?
→ Fit et rétention
Qu’est-ce que tu cherches dans ta prochaine plateforme data et ton prochain produit ?
→ Alignement projet
Savoir-être & collaboration
Le métier te demande une donnée que tu sais peu fiable. Comment tu gères ?
→ Communication et rigueur
Empile les outils à la mode sans savoir quel problème ils résolvent
Sur-ingénierie : il complexifiera la plateforme au lieu de la fiabiliser.
Ne teste jamais ses données et découvre les bugs via le métier
Qualité subie : la confiance dans la donnée finit par s’effondrer.
Ignore totalement les coûts du cloud et de l’entrepôt
Facture qui dérape et optimisations jamais faites.
Incapable d’expliquer un choix de modélisation simplement
Communication faible : friction garantie avec le métier et les analysts.
N’a jamais géré un incident de données en production
Profil théorique : il découvrira la pression du réel sur votre plateforme.
Lecture du score
Notez chaque compétence et savoir-être de 1 à 5. Repère de décision : moyenne supérieure ou égale à 4 sur les must-have et aucun red flag majeur = go ; 3 à 4 avec réserves = à challenger en second tour ; un must-have sous 3 ou un red flag majeur = no-go. Un nice-to-have faible ne doit jamais éliminer un bon profil.
Qu'est-ce qu'une scorecard pour recruter un Data Engineer ?
Une scorecard data engineer est une grille d'évaluation structurée : elle liste les compétences et savoir-être à noter de 1 à 5, les questions d'entretien à poser et les signaux d'alerte. Elle permet de comparer les candidats sur des critères objectifs plutôt que sur une impression. On parle aussi de scorecard ingénieur data, scorecard ingénieur données, scorecard data eng.
Comment utiliser cette scorecard Data Engineer ?
Téléchargez-la en PDF, Excel ou Notion, notez chaque critère de 1 à 5 pendant l'entretien, puis additionnez les scores du panel pour décider sur des faits. La version Excel calcule la moyenne et la décision automatiquement.
Qu’est-ce qu’une scorecard de recrutement ?
Une grille d’évaluation structurée qui définit, avant les entretiens, les résultats attendus, les compétences à noter et les signaux d’alerte. Elle permet de comparer les candidats sur des critères objectifs plutôt que sur une impression.
Comment utiliser cette scorecard Data Engineer ?
Avant le process, validez les critères avec le manager. Pendant chaque entretien, notez les compétences de 1 à 5 et consignez les questions posées. Après, comparez les scores du panel pour décider sur des faits. Le PDF se remplit à la main, le fichier Excel et le Notion calculent le score automatiquement.