Data Engineer Banque(F/H)
Contexte
Dans le cadre du développement d’une Squad Usages Data Avancés & IA, nous recherchons un(e) Data Engineer confirmé(e) pour contribuer à la conception, l’industrialisation et l’amélioration continue de solutions data à forte valeur ajoutée.
Vous évoluerez dans un environnement orienté DataOps, MLOps et industrialisation de solutions analytiques, au sein d’une équipe pluridisciplinaire (Data Scientists, DevOps, Product Owner…).
La squad intervient sur :
-
La conception et la maintenance d’applications data
-
L’amélioration continue des produits existants
-
La construction de nouveaux usages Data & IA
Vos missions
Conception & Architecture
-
Participer à la définition des solutions applicatives data
-
Contribuer aux choix d’architecture (batch, streaming, microservices data)
-
Concevoir des pipelines robustes, scalables et performants
Développement & Intégration
-
Construire et maintenir des pipelines ETL / ELT (données structurées et non structurées)
-
Développer des traitements en Python (PySpark, FastAPI) et SQL
-
Intégrer des flux temps réel via Kafka / Spark
-
Réaliser les phases d’intégration et de recette technique
Industrialisation – DataOps / MLOps
-
Mettre en œuvre des chaînes CI/CD et de déploiement (Docker, Kubernetes, GitHub/GitLab Actions)
-
Industrialiser des modèles statistiques ou de Machine Learning
-
Versionner données, modèles et code
-
Monitorer la performance, la qualité et les coûts des traitements
-
Assurer l’observabilité des solutions (ELK, Prometheus/Grafana, MLflow)
Qualité & Amélioration Continue
-
Mettre en place des tests automatisés (Pytest)
-
Maintenir un haut niveau de qualité de code (SonarQube)
-
Améliorer l’efficacité des processus
-
Maintenir une documentation claire et à jour
Collaboration
-
Travailler en étroite collaboration avec les membres de la squad
-
Préparer des datasets pour l’exploration et l’analyse
-
Accompagner les utilisateurs dans la prise en main des solutions
-
Docker
-
Kubernetes
-
GitHub Actions ou GitLab CI
-
Compétences techniques requises
Langages & Frameworks: Python (PySpark, FastAPI), SQL
Big Data & Streaming: Apache Spark, Apache Kafka
Bases de données: PostgreSQL, Teradata, MySQL
MLOps / CI-CD / Conteneurisation: Docker, Kubernetes, GitHub Actions ou GitLab CI
Qualité & Observabilité: Pytest, SonarQube, Stack ELK, Prometheus / Grafana, MLflow
Profil recherché
Data Engineer expérimenté(e) disposant de minimum 5 ans d’expérience, capable de concevoir, développer et industrialiser des solutions data de bout en bout.
Vous êtes autonome, rigoureux(se), orienté(e) qualité et performance, et vous appréciez le travail en équipe dans des environnements exigeants et structurés.