1 Sources de données

  • Données internes structurées
  • Dark Data (présentes en entreprises, mais non exploitées)
    • Données web méta données
    • Données des réseaux sociaux suite aux actions de marketing
    • Mailing (taux d’ouverture, taux de réponse, etc.)
    • Enquêtes de satisfaction (choix et données textuelles)
    • Données voix via téléphone
    • Images
  • Données publiques
  • Données à la vente par des prestataires
  • Données des autres entreprises (Kaggle, et autres compétitions)
  • Données des objets connectées

2 Dark Data

Une grande partie des données stockées par les entreprises ne sont pas exploitées. Pour cause, certaines données sont non-structurées et nécessitent des techniques de nettoyage de données.

On peut citer quelques exemples:

3 Web-scraping

Des données affichées sur des sites internet peuvent être récupérées de façon structurée grâce à des techniques de web-scraping.


Site internet de Kezhan SHI