2 jours
Avez-vous des données textuelles (adresse, marque de véhicule, commentaires clients) qui ne sont pas de bonne qualité et rencontrez-vous des difficultés quant à l’exploitation de ces données? Certains essaient de corriger à la main: “bld” et “blvd”, c’est pareil que “boulevard”. Mais avez-vous oublié d’autres écritures potentielles comme “boulvd” ou “bd” ?
Savez-vous qu’il y a des techniques plus efficaces?
Plus généralement, les données textes sont souvent décrites comme du Dark Data dans les entreprises, car elles ne sont pas suffisamment exploitées et ne sont parfois simplement pas du tout exploitées. Pourtant ces données textuelles peuvent contenir des informations précieuses, qui peuvent améliorer la prise de décision.
A l’issue de cette formation, vous allez apprendre à
Points forts
Source de données
Transformation des données textes
Nettoyage des données textuelles
Machine learning
Visualisation
Cas d’application
Durée: 2 jours
Pour obtenir quoi ?
Comment ?
Les différentes techniques de collecte, de nettoyage et d’analyse de données seront illustrées avec des exemples pratiques, codés sous R.
Quels sont les pré-requis ?
Aucun en particulier. L’intérêt et l’utilisation des outils numériques sont cependant fortement recommandés. Chaque participant se munira d’un ordinateur portable pour les travaux pratiques.