Traces numériques de mobilité comment suivre la piste ?

Traces numériques de mobilité
comment suivre la piste ?
NTIC & transport
Etienne Côme, Latifa Oukhellou
COSYS/GRETTIA
3 mars 2014
Plan
1
Contexte et positionnement
2
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Clustering de matrices O-D dynamiques
Travaux actuels & futurs
3
Quelques exemples de visualisations
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
2 / 56
Contexte et positionnement
Contexte
Latifa Oukhellou (DR), Etienne Côme (CR),
Yufei Han (Post-Doc) et Andry Randriamanamihaga (Doc)
GRETTIA, COSYS
Analyse de données, Clustering, Apprentissage statistique,...
Fouille de données de mobilité : ex VLS (Vélib’,Velov,...), GPS,
bluetooth, billetique
Terrain d’expérimentation
Données billetique (projet Mobilletic)
Données VLS
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
3 / 56
Traces numériques de mobilité
De nombreux capteurs
Différentes formes : Trajectoires
Différentes formes : Points
Différentes formes : Origines-Destinations
Nécessite de fouiller ! !
Contexte et positionnement
Contexte
Problématique
Traces numériques de plus en plus nombreuses
Générée en particulier lors de nos déplacements
⇒ Pertinentes pour l’étude des mobilité
Usage détourné + Volume important
⇒ Outils de traitement et d’analyse
Complémentarité / substitution enquêtes classiques
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
10 / 56
Un exemple avec les traces VLS, et le Vélib
Un exemple avec les traces VLS, et le Vélib
Exemple : VLS (Vélib)
Traces numériques ?
Données d’occupation des stations (captation depuis juillet 2013)
Données des trajets effectués sur 5 mois de 2011 (Mairie de
Paris et JC. Decaux)
Données temporelles : dates et heures de départ et d’arrivée
Données spatiales : stations de départ et d’arrivée
Type d’abonnement (longue ou courte durée)
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
12 / 56
Un exemple avec les traces VLS, et le Vélib
Exemple : VLS (Vélib)
Objectifs "Opérationnels"
Eviter le problème d’une station vide au départ et pleine au retour
⇒ Optimisation des politiques de re-déploiements des vélos
Concevoir de nouveaux systèmes, ou étendre un système existant
⇒ Positionnement et dimensionnement des stations en fonction
des données socio-économiques et géographiques, ...
Objectifs "Traitements"
Rechercher des motifs d’usage récurrents du Vélib’, modèles
spatio-temporels
Construire des modèles de prédiction d’usage, estimation de la
demande
Lire la ville et son rythme au travers de données de mobilité
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
13 / 56
Un exemple avec les traces VLS, et le Vélib
Effets temporels
35 000
Subscription :
30 000
Short
Long
Trips
25 000
20 000
15 000
10 000
5 000
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
Time
F IGURE 1: Nombre de trajets / heure (courte / longue abonnements)
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
14 / 56
Un exemple avec les traces VLS, et le Vélib
Effets spatiaux
F IGURE 2: trajets entrants entre [6h,7h] en semaine
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
15 / 56
Un exemple avec les traces VLS, et le Vélib
Analyse exploratoire : laisser parler les données
Méthodologie générale
Utiliser des algorithmes de clustering (regroupement automatique)
pour trouver des formes d’usage type du Vélib’
Croiser les groupes ou clusters trouvés avec des données
géographiques et socio-économiques de la ville
⇒ Facteurs influents sur l’usage du système VLS.
Deux pistes de travail :
1
Grouper les stations avec des profils d’usage similaires
→ Clustering de stations ou de couples O/D
2
Segmenter / Résumer la dynamique temporelle du système
→ Adaptation de LDA à la fouille de matrices O/D dynamiques
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
16 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Clustering de stations avec
des profils d’usage similaires
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
17 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Regroupement de stations à partir de leurs profils
d’usage temporels
Objectifs :
Stations décrites par les dynamiques de flux entrants et sortants
Prise en compte des jours de semaine / week end
modèle pour données de comptage
Croiser les résultats avec d’autres variables explicatives :
population, emplois, loisirs, ...
Analyse réalisée avec 8 groupes
(bon compromis : interprétations/attache aux données)
Related work
[Borgnat et al., 2011], [Froehlich et al., 2009], [Lathia et al., 2012]...
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
18 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Pôles multimodaux
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
19 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Pôles multimodaux
Week-end
Week
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
20 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Parcs
Week
Week-end
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
21 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Parcs
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
22 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Sorties nocturnes
Week
Week-end
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
23 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Sorties nocturnes
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
24 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Sorties nocturnes et week-end
Week
Week-end
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
25 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Sorties nocturnes et week-end
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
26 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Logements
Week
Week-end
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
27 / 56
Logements
Inhabitants / ha
0
200
400
600
800
1 000
1 200
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Emplois(1)
Week
Week-end
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
29 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Emplois (2)
Week-end
Week
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
30 / 56
Emplois (1 et 2)
Jobs / ha
0
500
1 000
1 500
2 000
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Usage mixte
Week
Week-end
5
4
Departures
3
2
Activity
1
0
5
4
Arrivals
3
2
1
0
0
E. Côme, L. Oukhellou (COSYS/GRETTIA)
5
10
15
20
0
Hours
5
Traces numériques
10
15
20
3 mars 2014
32 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Usage mixte
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
33 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Croisement données population-emplois-services
Sorties (1)
Sorties (2)
Parcs
Gares
Logements
Emplois(1)
Emplois(2)
Moyennes
hab/ha
162
367
261
172
209
375
138
157
301
emp/ha
237
189
322
90
206
108
409
456
163
serv/ha
4.2
6.3
7.7
2
2.4
3.8
4.5
5.7
3.8
com/ha
3.7
4.4
6.9
1.7
1.8
2.7
2.8
5.6
2.8
TABLE 1: Comparaison des moyennes de densités de population, d’emplois,
de services et de commerces pour les différentes groupes de stations.
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
34 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de stations avec des profils d’usage similaires
Conclusions sur le clustering de stations
Résultats
Des stations bien différenciées en termes d’usage
Interprétation aisée des groupes de stations
Densités de population, d’emplois et d’équipements explicatives
des groupes de stations
Profils temporels des clusters interprétables et informatifs
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
35 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Clustering de matrices O-D
dynamiques
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
36 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Clustering de matrices O-D dynamiques
Objectifs
Représentation des données : matrices OD dynamiques
⇒ Recherche de stationnarités et de points de changement dans
la dynamique des matrice OD
Modèle utilisé “Latent Dirichlet Allocation”
Résultats
Segmentation temporelle et cycles
Distribution spatiale des flux (OD de référence) / segment
⇒ Permet de caractériser le déséquilibre du réseau / segment
Représentation synthétique de la dynamique du réseau
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
37 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Interprétation temporelle
12000
# trips / hour
9000
6000
3000
0
Avril 04
Avril 11
Avril 18
Avril 25
Mai 02
12000
# trips / hour
9000
6000
3000
0
Avril 18
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
38 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Interprétation temporelle
Remarques
La cyclostationnarité est clairement visible
Faible mélange entre les différentes activités latentes
Interprétation temporelle des 5 "activités" obtenues :
1
2
3
4
5
Domicile ↔ Travail
Déjeuner
Travail ↔ Domicile
Loisirs nocturnes
Loisirs
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
39 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Analyse spatiale
Quelles stations
génèrent des départs
durant une activitée a // comportement moyen du système ?
Quelles stations
génèrent des arrivées
durant une activitée a // comportement moyen du système ?
Comment les stocks évoluent
balance des vélos
(vélos arrivant - vélos partant)
durant chacune des activité ?
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
40 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
"Domicile-Travail", stations avec un fort flux entrant
F IGURE 3: Spécificité entrante / stations
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
41 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
"Loisirs", stations avec un fort flux sortant
F IGURE 4: Spécificité sortante / stations
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
42 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Interprétation spatiale : déséquilibre du réseau
Balance
+30
+20
+10
0
-10
-20
-30
F IGURE 5: Activité latente "Domicile→Travail", déséquilibre du réseau pour
Ndep = 10 000
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
43 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
"Travail→Domicile"
Balance
+30
+20
+10
0
-10
-20
-30
F IGURE 6: Activité latente "Travail→Domicile", déséquilibre du réseau pour
Ndep = 10 000
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
44 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
"Déjeuner"
Balance
+30
+20
+10
0
-10
-20
-30
F IGURE 7: Activité latente "Déjeuner", déséquilibre du réseau pour
Ndep = 10 000
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
45 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
"Loisirs nocturnes"
Balance
+30
+20
+10
0
-10
-20
-30
F IGURE 8: Activité latente "Loisirs nocturne", déséquilibre du réseau pour
Ndep = 10 000
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
46 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
"Loisirs"
Balance
+30
+20
+10
0
-10
-20
-30
F IGURE 9: Activité latente "Loisirs", déséquilibre du réseau pour
Ndep = 10 000
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
47 / 56
Un exemple avec les traces VLS, et le Vélib
Clustering de matrices O-D dynamiques
Résultats
Meilleure compréhension de la dynamique du réseau
Modèle synthétique de la dynamique
Mise en évidence des cycles
Appliqué aussi à des données Bluetooth (TRB)
Limites
Prise en compte uniquement de la demande satisfaite
Pas de liens explicites avec les données socio-économiques et
géographiques
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
48 / 56
Un exemple avec les traces VLS, et le Vélib
Travaux actuels & futurs
Travaux actuels & futurs
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
49 / 56
Un exemple avec les traces VLS, et le Vélib
Travaux actuels & futurs
Travaux actuels & futurs
Estimation/Prédiction de la demande (satisfaite + satisfaite)
Objectifs :
prédire l’évolution des stocks à courts termes
fournir des outils d’aide au dimensionnement
→ pour l’extension d’un réseau → pour l’implantation d’un
nouveau réseau
Travaux :
source d’information contextuelle (socio-éco, transport,...)
modèle de régression pour données de comptages
prise en compte des effet liés à la saturation des stations
extension LDA semi-paramétrique avec prise en compte des
données contextuelles
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
50 / 56
Quelques exemples de visualisations pour se détendre
http://www.comeetie.fr/galerie/velib
Quelques exemples de visualisations pour se détendre
http://www.comeetie.fr/blog/?p=255
Quelques exemples de visualisations pour se détendre
http://vlsstats.ifsttar.fr
Quelques exemples de visualisations
Publications
1
E. Côme, L. Oukhellou. Model-based count series clustering for Bike-sharing system usage mining, a case study with the
Vélib’ system of Paris. Accepeted in ACM TIST.
2
A. Randriamanamihaga, E. Côme, L. Oukhellou, G. Govaert. Clustering the Vélib’ origin-destinations flows by means of
Poisson mixture models. In Proceedings of the European Symposium on Artificial Neural Networks, 2013. +
Neurocomputing
3
E. Côme, A. Randriamanamihaga, L. Oukhellou. Spatio-temporal analysis of Dynamic Origin-Destination data using
Latent Dirichlet Allocation. Application to the Vélib’ Bike Sharing System of Paris.. In Proceedings of TRB 2014
(accepted)
4
H. Yufei, E. Côme, L. Oukhellou. Toward Bicycle Demand Prediction of Large-Scale Bicycle-Sharing System. In
Proceedings of TRB 2014 (accepted)
5
P-A Laharotte, R. Billot, E. Côme, L. Oukhellou, A. Nantes, N-E El Faouzi. Spatio-temporal clustering Analysis of
Bluetooth OD (B-OD). Application to a large urban network. In Proceedings of TRB 2014 (submitted)
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
54 / 56
Quelques exemples de visualisations
Merci pour votre attention !
[email protected]
[email protected] (@comeetie)
mobilletic.ifsttar.fr
vlsstats.ifsttar.fr
www.comeetie.fr
Ifsttar
Centre de Marne-la-Vallée
Batiment le “Bienvenue”
14-20 Bd Newton Cité Descartes, Champs sur Marne
F-77447 Marne la Vallée Cedex 2
Tél. +33 (0)1 81 66 87 19
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
55 / 56
References
References
Borgnat, P., Abry, P., Flandrin, P., Robardet, C., Rouquier, J.-B. and Fleury, E. (2011).
Shared Bicycles in a City : A Signal processing and Data Analysis Perspective.
Advances in Complex Systems, 14, 1–24.
Froehlich, J., Neumann, J. and Oliver, N. (2009).
Sensing and Predicting the Pulse of the City through Shared Bicycling.
In Proceedings of the 21st International Joint Conference on Artificial Intelligence pp. 1420–1426,.
Lathia, N., Ahmed, S. and Capra, L. (2012).
Measuring the impact of opening the London shared bicycle scheme to casual users.
Transportation Research Part C : Emerging Technologies 22, 88–102.
E. Côme, L. Oukhellou (COSYS/GRETTIA)
Traces numériques
3 mars 2014
56 / 56