Informations

Il s’agit d’un extrait de la formation. Cette formation peut se faire en présentiel ou à distance. Pour en savoir plus, merci de me contacter.

1 Introduction

Les gestionnaires de fraudes ont en général accumulé beaucoup d’expériences métiers dans la détection des fraudes. Dans un premier temps, il est important de savoir réutiliser ces règles déterministes. Il s’agit de faire travailler l’homme et la machine de façon conjointe pour améliorer l’efficacité de la détection.

En effet, dans certains cas, des règles déterministes peuvent être très efficaces dans la détection de fraudes. Par exemple, pour détecter de fausses déclarations, on peut vérifier les déclarations précédentes pour savoir si les mêmes factures avait déjà été déclarées. Pour savoir si l’activité est déclarée correctement, on peut utiliser les données de la base Sirene.

Dans certains cas, il peut s’agir simplement de la qualité des données. Par exemple, une date de naissance peut être mal saisie, ce qui cause un impact tarifiaire. De façon générale, avant de commencer à construire des modèles de détection sur les données, il est important de s’assurer de la bonne qualité des données.

La première étape consiste ainsi à contrôler les données de façon déterministe, ainsi on peut faire deux choses en même temps:

De prime abord, les deux types d’anomalies sont indistinguables: comment savoir si une donnée a été véritablement mal saisie ou s’il s’agit d’une erreur intentionnelle ? En effet, si quelques anomalies sont relevées par hasard, il est difficile d’en savoir plus. En revanche, un contrôle exhaustif de tous les contrats peut nous donner une analyse statistiquement robuste quant à la nature de ces erreurs.