logo_OCR_expertise_datawok

OPTICAL CHARACTER RECOGNITION

USE CASE #1

Extraction de données depuis des documents non structurés

Cette organisation privée est un investisseur global et multi actifs au sein d’un groupe du CAC40. Leur équipe Structured Finance & Derivative utilise et développe un progiciel pour l’aide à la décision dans l’émission d’un prêt. Cet outil est alimenté en données depuis des rapports financiers aux formats variés.

Afin d’automatiser l’extraction puis l’insertion de données des rapports vers leur progiciel, l’équipe SFD a souhaité disposer d’un outil d’OCR (Optical Character Recognition)  et de classification de tokens pour l’extraction automatique de champs depuis un rapport financier, le plus souvent au format .pdf.

  • Réalisation d’un premier modèle en POC
  • Développement d’un outil modulable et configurable par le client qui automatise l’entraînement et le déploiement de modèles.
  • Accompagnement du client sur la définition de sa stratégie Data
  • Formation du client à l’utilisation de l’outil
  • Formation du client aux concepts et pratiques de la Data Science

Stack

USE CASE #2

Le but du projet était de fournir un outil interne permettant d’extraire les champs clés automatiquement de plusieurs factures toutes les 5 minutes pour ensuite rentrer dans un pipeline de génération de paiement automatique.

Société leader en France de l’administration de biens et de transactions immobilières.

Le groupe reçoit 2 à 3 millions de factures à l’année et utilisait un service de recherche d’informations manuel à Madagascar.

  • Evangélisation de la Data Science en sein du groupe
  • Etude des données et mise en avant des champs essentiels et des faiblesses du système précédent
  • Mise en place d’un pipeline complet de traitement des données en trois étapes : extraction du texte provenant des images, extraction automatique d’informations et validation/cleaning des champs extraits
  • Mise en production d’un micro-service en accord avec l’architecture du client

Stack

Nos références

Expertise Datawok FRAUD DETECTION
FRAUD DETECTION
Expertise Data wok NLP
NLP
Expertise Data wok OCR
OCR
Expertise Data wok OLAP
OLAP
Expertise Data wok RTDM
RTDM
Expertise Data wok TIMES SERIES
Times Series
Expertise Data wok DATA LAKE
Datalake
Expertise Data wok COMPUTER VISION
Computer Vision

Envie d'en savoir plus ?