Dans la partie précédente, on a vu des graphiques pour comparer des variables. Quand on veut comparer les variables selon une variable continue, on arrive alors à une série temporelle. Dans cette partie, on a créer des graphiques pour visualiser l’évolution des variables au cours du temps.
On va voir les graphiques les plus classiques pour l’évolution:
Pour visualiser une évolution, le plus classique est le graphique à lignes.
Dans un premier temps, on va créer une série de données dont les variables sont: département, année, nombre d’accidents.
c("750","130","920","930","940","690")
(on peut enlever le zéro).On voit qu’on peut améliroer le graphique, notamment en mettant la légende juste à côté des lignes afin d’améliorer la lisibilité.
On va utiliser geom_line
pour créer un graphique à ligne.
Afin d’optimiser la lecture, on peut placer la légende juste à côté des lignes.
L’évolution du nombre uniquement avec les années permet de donner la tendance globale. Parfois, on a besoin de plus de précisions. Ainsi, on peut essayer de donner les mois aussi.
Pour cela, on va créer une variable anneemois
qui permet d’avoir un nombre continu pour représenter l’évolution temporelle avec une périodicité plus fine.
On peut alors créer un autre graphique à lignes.
Sur ce graphique, on peut dire qu’il est difficile de représenter la légende à côté des lignes, cela deviendrait illisibilité. Ainsi, on recense le besoin d’interactivité.
Lorsqu’on représente un grand nombre de points, il devient alors intéressant de créer un graphique interactif pour améliorer la lisibilité.
Une méthode simple consiste à transformer un graphie ggplot en un graphique plotly.
Ainsi, on peut lire de façon interactive les valeurs. Les différentes fonctionnalités de plotly permettent également:
On peut aussi afficher toutes les valeurs journalières. Ce type de graphiques est souvent utilisé pour les séries temporelles, comme le cours d’une action.
Comme on a pu remarquer précédemment, il y a des périodicités dans l’évolution des données. On va les analyser par la suite.
Ainsi, on voit qu’il y a nettement moins d’accidents le dimanche, et vendredi est le jour le plus accidenté.
On va continuer l’exploration de la périodicité, maintenant on va analyser le nombre d’accident au cours d’une journée.
On peut voir le graphique en fonction des jours de la semaine.
Pour mieux se rendre compte de la périodicité de l’évolution, on peut créer un graphique circulaire.
On peut également voir la différence entre les différents jours
Pour les données au cours de la journée, on a choisi quelques éléments statistiques. Il serait intéressant de voir la distribution de façon plus détaillée. Cela fait l’objet de la prochaine partie: visualisation de la distribution.
Copyright © 2017 Blog de Kezhan Shi