Objectif
- Vous avez vu mon petit projet d’analyse des prix immobiliers à Paris et vous souhaitez savoir comment faire?
- Vous voulez découvrir les différentes techniques utilisées en Data Science?
- Vous avez besoin de réaliser un prototype pour un projet d’analyse de données?
Je vous propose un programme de mentoring à distance pour découvrir la Data Science, basé sur le projet d’analyse des prix immobilier:
- Cette formation a pour but de démystifier la Data Science en vous proposant un projet à réaliser avec R.
- Cette formation se fait à distance, à votre bureau ou chez vous, vous passerez environ 2 h par jour pour réaliser les différents exercices.
- En 5 jours, vous pourrez découvrir un ensemble de techniques, et des pistes pour aller plus loin dans chaque étape.
- Vous pourrez envoyer vos questions à tout moment, et vous recevez une réponse en moins d’une heure.
- Cette formation vous apprend à être autodidacte, et continuer à approfondir les techniques.
Ces techniques peuvent être appliquées dans des exemples divers en assurance
- Marketing: conversion, acquisition et rétention
- Tarification: modèles de tarification et utilisation des données externes
- Résilisation: causes et détection
- Sinistres: prédiction de la sévérité
- Fraudes: souscription et sinistres
- Innovation produits
Déroulement
Pendant 5 jours, vous allez découvrir un projet Data Science avec toutes les étapes de traitements des données avec R.
Les dispositifs pour un apprentissage efficace sont :
- 1h de mentoring par appel vidéo
- 2h d’exercice par jour (temps estimé pour la réalisation des exercices de programmation avec R)
- Assistance pour la programmation
- Réponses à toutes vos questions (téléphone, appel vidéo, mail)
Supports et exercices
Les supports vous seront envoyés par mail, et ils comprendront:
- les explications sur les différentes techniques et fonctions
- quelques exercices
- mise en pratique pour la réalisation du projet
Envoi des réponses
Chaque jour avant 20h, les réponses aux questions doivent être envoyés.
Forum de discussions
Vous pouvez poser des questions à tout moment, et la question sera traitée en moins de 2 heures de 9h à 22h
Envoi du projet
Vous devez envoyer le projet finalisé dans un dossier comprenant:
- un fichier rmd
- un fichier html, directement compilé à partir du fichier rmd
- si nécessaire, un dossier qui contient les données utilisées
Correction
A la fin de la formation, vous recevrez la correction pour la réalisation du projet.
Programme
- Jour 1: introduction à R
- Jour 2: webscrapping
- Jour 3: nettoyage de données
- Jour 4: visualisation des données
- Jour 5: machine learning
- Projet final: analyse du prix immobilier à Paris
On peut détailler un peu plus:
- Webscrapping
- Connaissance de la structure des pages html
- Manipulation des codes html
- Manipulation des expressions régulières
- Nettoyage de données
- Manipulation des vecteurs et des
data.frame
- Fusion et sélection de données
- Machine learning
- Apprentissage supervisé
- Régression
- Prédiction du prix immobilier
- Visualisation des données
- Utilisation du package
ggplot2
- Types de visualisation
- Graphiques interactifs
- Formattage des tables
- Visualisation géographique
- Manipulation des fichiers shapefile
- Carte choroplète
- Graphiques interactifs
- Outil de production
- Rmarkdown
- htmlwidgets
- Tableaux de bord
Exemples
Pour mieux comprendre ce que vous allez apprendre une partie des résultats est consultable sur cet article : analyse des prix immobiliers
Un autre exemple de prédiction du prix est présenté dans cet article.
Copyright © 2017 Site de Kezhan Shi