Logo expertise détection de fraude de Datawok

Nos réalisations
en Détection de Fraude

USE-CASE :
détection de fraude dans le e-commerce

Enjeux et problématique

Leader français de la lutte contre la fraude et expert dans le profilage numérique, notre client est une fintech qui propose des services innovants pour imaginer et construire l’avenir du e-commerce.
Ses services regroupent un ensemble de solutions visant à fluidifier et sécuriser l’expérience client.

Ce client nous a challengé sur la création d’un outil basé sur des modèles de Machine Learning pour la détection de fraude à l’achat pour le e-commerce.

L'accompagnement Datawok

Notre domaine d’intervention était large. Il s’étendait de la mise en place de l’environnement de R&D et des process de déploiement jusqu’à la création et la mise en production d’outils de monitoring pour les équipes Fraud Analyst.

Dans le cadre de ce projet, notre équipe Data a réalisé :

  • l’implémentation et l’entraînement de modèles de Machine Learning de détection de fraude,
  • l’intégration d’un webservice Flask au sein de l’architecture microservice du projet,
  • l’enrichissement du feature engineering à l’aide d’analyse de langage naturel (NLP) sur les descriptions de produits,
  • le développement de plugins Data Science Studio (Dataiku) afin de permettre aux Analystes et Business de monitorer les modèles et gérer leurs activations,
  • l’amélioration du produit de classification de documents avec le framework de deep learning Caffe.

Stack technique

USE-CASE :
détection de fraude à l'assurance

Enjeux et problématique

Le Lab d’Innovation de notre client a pour mission de transformer le groupe d’assurance dont il est issu, en une société centrée sur le traitement de l’information, en développant une part significative de ses activités (création de produits, services, outils, …) autour des datas.

Différentes filiales du groupe étaient demandeuses d’un outil pour traiter efficacement les sinistres et identifier les fraudes à l’assurance.

L'accompagnement Datawok

Au sein de ce Lab d’Innovation, nous avons ainsi participé à l’implémentation de briques de data engineering et de modèles de détection de fraude à l’assurance. Puis développé une application web de gestion des sinistres.

Dans le cadre de ce projet, notre équipe Data a donc réalisé : 

  • la création d’un data flow robuste et réplicable en PySpark,
  • l’implémentation de features “Réseaux” à partir de données structurées en graphe distribué en Scala / Spark,
  • la mise en place de webservices Python pour entraîner et appeler les modèles,
  • la mise en place de tests sur l’ensemble du data flow,
  • la R&D sur les approches semi-supervisées avec des données très peu labellisées,
  • l’implémentation de briques d’interprétabilité des modèles de Machine Learning,
  • l’implémentation d’un ELT en Scala/Spark pour une intégration multi-entités des données de fraude.

Stack technique

Vous pouvez aussi retrouver des retours d’expérience et les réflexions de notre équipe Data à travers leurs articles de blog sur des sujets de Data Science.

Envie d'en savoir plus ? Contactez-nous.