Bénéfices et impacts de la data-science dans les dispositifs de contrôle de la qualité des données
Durée: 1 jour
1 Objectifs de la formation
Connaître les exigences de Solvabilité 2 sur la qualité des données
Comprendre comment la data-science augmente l’efficience d’un dispositif de maîtrise de la qualité des données
Apprendre à mettre en place des algorithmes d’évaluation de qualité des données, et construire des indicateurs de qualité avec des cas pratiques
Automatiser la détection et la correction des anomalies dans les données
2 Programme
Évaluer les risques et les enjeux financiers et réglementaires liés à la qualité des données
Traduire les exigences de Solvabilité 2 en matière de gouvernance de la qualité des données
Appréhender les risques et les coûts d’une mauvaise qualité des données
Définir une donnée de bonne qualité : pertinence, intégrité, disponibilité, auditabilité, traçabilité, conformité et sécurité
Appliquer les principes de la détection des anomalies pour identifier les incohérences
Comprendre la différence entre l’approche exploratoire descriptive et l’approche décisionnelle globale et prédictive
Définir les types d’anomalies : erreurs de saisie, fautes d’orthographe, erreurs intentionnelles, défaillance du système
Explorer des exemples concrets d’anomalies: adresse mal saisie menant à des contrats en déshérence ou impact de la qualité des données sur la production des rapports QRT et répercussions (solvabilité & sanctions)
S’approprier les bonnes pratiques d’organisation et de pré-traitement des données : organisation de fichiers, de données, classification
Comment intégrer la data-science dans les projets d’analyse et de contrôle de la qualité des données
Comprendre les fonctions et cas d’usage de la data-science dans la gestion de la qualité de la donnée
Les techniques au service de l’exploration des données : webscraping, text-mining, machine learning, analyse des séries temporelles
Sélectionner et adapter la technique de data-science de traitement en fonction de la problématique à modéliser
Détecter des valeurs aberrantes avec les méthodes de clustering
Calculer un score de qualité avec les méthodes de classification
Mettre en œuvre l’automatisation de la détection et la correction d’anomalies
Savoir industrialiser les méthodes sélectionnées en tenant compte des contraintes temps réel
Mettre en place des indicateurs clés et des tableaux de bords pour évaluer la qualité
Cas pratique d’automatisation de l’exécution des contrôles & visualisation des résultats
3 Publics concernés
Direction des risques ; Actuaire ; Responsable conformité ; Risk manager ; Responsable du contrôle interne ; Auditeur interne ; Contrôleur interne ; Direction des Systèmes d’Information (DSI) ; Auditeur IT ; Data-Scientist ; Responsable de la qualité des données ; Chief data officer (CDO) et plus largement toute personne partie prenante et / ou garante d’un projet de qualité de données et / ou gérant des bases de données
Société d’assurance et de réassurance, mutuelle et institution de prévoyance