
de skillsbench1,301
Compétence d'ingénierie des données prête pour la production pour la conception de pipelines ETL/ELT et de streaming en temps réel, la qualité des données et l'optimisation des performances des pipelines.
Fournit une boîte à outils complète d'ingénierie des données axée sur la production : génération de DAG Airflow, squelettes de jobs de streaming (Flink/Spark), générateurs de configuration Kafka, validation de la qualité des données et analyse des performances. Il aide à construire des pipelines ETL/ELT de bout en bout et des architectures de streaming en temps réel avec surveillance et intégration CI/CD.
Utilisez cette compétence lorsque vous devez concevoir ou implémenter des pipelines de données de production (batch ou streaming), ajouter des contrôles automatisés de qualité des données, créer des squelettes de jobs streaming/Flink, générer des configurations Kafka, ou profiler et optimiser les performances des pipelines. Idéal pour l'ETL d'entreprise, la construction de data-lake/warehouse et l'infrastructure de données ML de production.
Idéalement conçu pour les agents capables d'exécuter des outils Python et de s'intégrer aux systèmes Git/CI (Copilot/assistants de code, Claude Code/Cursor), et pouvant fonctionner avec des piles de données conteneurisées ou cloud.
Cette compétence n'a pas encore été examinée par notre pipeline d'audit automatisé.