Analyse et visualisation des accidents automobiles
Durée: 2 jours
1 Préambule
Le Ministère de l’Intérieur publie des données des accidents corporels de la circulation sur le site de data.gouv.fr. Ces données peuvent être intéressantes à étudier pour les assureurs auto, afin de comparer les sinistres internes de l’entreprise et les données externes.
Aussi, les techniques de Data Science utilisées sur ces bases peuvent également être appliquées aux données internes.
2 Objectif
L’objectif de cette formation est d’appliquer les outils de Data Science avec R, aux bases de données publiques des sinistres automobile corporels.
A qui s’adresse cette formation ?
Aux actuaires ou à toutes personnes qui travaillent avec les données en assurance, banque et finance.
A tous ceux qui souhaitent découvrir des outils de Data Science avec R.
Pour obtenir quoi ?
Découverte et pratique des outils de Data Science avec R.
Des techniques d’exploration des données
Des outils de nettoyage des données
Machine learning
Data visualisation
Comment se déroule la formation ?
les apports théoriques sont complétés par des exercices pratiques sous R et Rstudio.
Quels sont les pré-requis ?
Aucun.
Y a-t-il besoin d’ordinateurs ?
Ordinateur avec R et Rstudio installés
3 Programme
Introduction
Processus Data Science en assurance
Objectifs de machine learning en assurance
Processus de la construction d’un algorithme
Import des données
Présentation des outils de collecte des données
Utilisation des fonctions et packages R pour importer les données
Processus efficace d’import
Comparaison des fonctions
Transformation des données
Techniques de nettoyage des données
Tranformation des données de plusieurs types (textuel, numérique, temporel)
Comparaisons des différents packages pour la transformation des données