1 Objectif

  • Vous avez vu mon petit projet d’analyse des prix immobiliers à Paris et vous souhaitez savoir comment faire?
  • Vous voulez découvrir les différentes techniques utilisées en Data Science?
  • Vous avez besoin de réaliser un prototype pour un projet d’analyse de données?

Je vous propose un programme de mentoring à distance pour découvrir la Data Science, basé sur le projet d’analyse des prix immobilier:

  • Cette formation a pour but de démystifier la Data Science en vous proposant un projet à réaliser avec R.
  • Cette formation se fait à distance, à votre bureau ou chez vous, vous passerez environ 2 h par jour pour réaliser les différents exercices.
  • En 5 jours, vous pourrez découvrir un ensemble de techniques, et des pistes pour aller plus loin dans chaque étape.
  • Vous pourrez envoyer vos questions à tout moment, et vous recevez une réponse en moins d’une heure.
  • Cette formation vous apprend à être autodidacte, et continuer à approfondir les techniques.

Ces techniques peuvent être appliquées dans des exemples divers en assurance

  • Marketing: conversion, acquisition et rétention
  • Tarification: modèles de tarification et utilisation des données externes
  • Résilisation: causes et détection
  • Sinistres: prédiction de la sévérité
  • Fraudes: souscription et sinistres
  • Innovation produits

2 Déroulement

Pendant 5 jours, vous allez découvrir un projet Data Science avec toutes les étapes de traitements des données avec R.

Les dispositifs pour un apprentissage efficace sont :

  • 1h de mentoring par appel vidéo
  • 2h d’exercice par jour (temps estimé pour la réalisation des exercices de programmation avec R)
  • Assistance pour la programmation
  • Réponses à toutes vos questions (téléphone, appel vidéo, mail)

Supports et exercices

Les supports vous seront envoyés par mail, et ils comprendront:

  • les explications sur les différentes techniques et fonctions
  • quelques exercices
  • mise en pratique pour la réalisation du projet

Envoi des réponses

Chaque jour avant 20h, les réponses aux questions doivent être envoyés.

Forum de discussions

Vous pouvez poser des questions à tout moment, et la question sera traitée en moins de 2 heures de 9h à 22h

Envoi du projet

Vous devez envoyer le projet finalisé dans un dossier comprenant:

  • un fichier rmd
  • un fichier html, directement compilé à partir du fichier rmd
  • si nécessaire, un dossier qui contient les données utilisées

Correction

A la fin de la formation, vous recevrez la correction pour la réalisation du projet.

3 Programme

  • Jour 1: introduction à R
  • Jour 2: webscrapping
  • Jour 3: nettoyage de données
  • Jour 4: visualisation des données
  • Jour 5: machine learning
  • Projet final: analyse du prix immobilier à Paris

On peut détailler un peu plus:

  • Webscrapping
    • Connaissance de la structure des pages html
    • Manipulation des codes html
    • Manipulation des expressions régulières
  • Nettoyage de données
    • Manipulation des vecteurs et des data.frame
    • Fusion et sélection de données
  • Machine learning
    • Apprentissage supervisé
    • Régression
    • Prédiction du prix immobilier
  • Visualisation des données
    • Utilisation du package ggplot2
    • Types de visualisation
    • Graphiques interactifs
    • Formattage des tables
  • Visualisation géographique
    • Manipulation des fichiers shapefile
    • Carte choroplète
    • Graphiques interactifs
  • Outil de production
    • Rmarkdown
    • htmlwidgets
    • Tableaux de bord

4 Exemples

Pour mieux comprendre ce que vous allez apprendre une partie des résultats est consultable sur cet article : analyse des prix immobiliers

Un autre exemple de prédiction du prix est présenté dans cet article.


Copyright © 2017 Site de Kezhan Shi