Telemachus: An Open Pivot Specification for Synthetic and Real Mobility Data
Le projet Telemachus est né de la convergence entre la simulation réaliste des trajectoires véhicules (RS3) et la volonté de standardiser les formats de données de mobilité.
Ce travail propose un cadre de normalisation scientifique pour la donnée de mobilité, combinant simulation et observation. Telemachus vise à garantir la traçabilité, la comparabilité et la reproductibilité des expérimentations dans le domaine des trajectoires véhicules.
Ce papier présente la genèse, la structure et les principes scientifiques de la spécification Telemachus, conçue comme un pivot universel entre les jeux de données inertiels, GNSS, CAN et environnementaux.
1. Contexte et motivation
Les jeux de données de mobilité sont souvent hétérogènes, incomplets ou dépendants de formats propriétaires (OEM, API fermées, SDK).
Telemachus vise à combler ce manque en définissant :
- un schéma pivot inspiré des standards scientifiques (NetCDF, SensorML, OpenDrive) ;
- une hiérarchie de champs commune (GNSS, IMU, CAN, Events) ;
- une interopérabilité ascendante avec RS3 (simulation) et descendante avec les sources réelles (véhicules connectés, smartphones, plateformes télématiques).
L’objectif est de permettre une reproductibilité scientifique et une comparabilité inter-domaines, en réduisant la dépendance aux outils propriétaires.
2. Architecture et gouvernance
Telemachus repose sur une gouvernance scientifique ouverte :
- les évolutions sont publiées sous forme de RFCs (Request For Comments) ;
- chaque RFC documente une évolution du schéma, des datasets ou des outils associés ;
- les discussions et validations sont publiques via GitHub (telemachus3/telemachus-spec).
Principes de versionnement
- v0.x : versions exploratoires liées à RS3.
- v1.0 : pivot stable, structuré autour des groupes de champs (FieldGroups).
- v1.x+ : extensions thématiques (Fleet, Altitude, Curvature, etc.).
Validation formelle
Chaque évolution du schéma est soumise à une revue par les pairs sous forme de RFCs publiques.
Des outils automatiques (telemachus-py) garantissent la conformité syntaxique et sémantique, assurant ainsi la robustesse scientifique du standard.
3. Liens avec T001 – Telemachus RFCs & Specifications
Ce document s’appuie sur les RFCs fondamentaux de la spécification Telemachus :
- RFC-0001 — Structure du format pivot et principes généraux
- RFC-0003 — Schéma de dataset et logique d’intégration
- RFC-0005 — Architecture des adaptateurs et validation
- RFC-0007 — Framework de validation et tests automatiques
- RFC-0009 — Intégration RS3 → Telemachus
- RFC-0011 — Gouvernance, versioning et extensions
Chaque RFC représente un artefact scientifique validé, traçable et publié sous licence ouverte.
Ces documents définissent les fondations du standard et sa méthodologie d’évolution incrémentale.
3.1 Contexte GNSS et sémantique des événements (Ajout)
Les derniers travaux de recherche (ESGNSS, GNSSContextGRU, analyses LoRaWAN, trajectoire urbaine dégradée) mettent en évidence les limites structurelles des signaux GNSS bruts en conditions réelles :
- multipath urbain,
- coupures tunnels / canyons,
- décrochages smartphone,
- variations de cadence et de précision.
Telemachus introduit une sémantique d’événements unifiée permettant d’analyser ces comportements :
gnss_lost,gnss_recovered,imu_saturation,connectivity_drop,event_source_quality.
Cette couche d’événements donne une interprétation robuste aux interruptions GNSS et offre un support analytique pour les systèmes de reconstruction.
4. Cas d’usage et validation
La spécification Telemachus a été mise en œuvre sur plusieurs cas d’usage illustrant sa robustesse et son extensibilité scientifique :
- Simulation RS3 (10 Hz) — génération de trajectoires GNSS/IMU réalistes.
- Fusion et validation — comparaison des signaux simulés vs réels.
- Publication ouverte — export et documentation des jeux de données sur Zenodo.
Ces cas démontrent la compatibilité ascendante entre recherche expérimentale et standardisation de la donnée.
4.1 Reconstruction de trajectoires et signaux compressifs (Ajout)
De nombreux travaux récents (CompressiveCVData2018, CompressiveCVRecovery2018, TransitTrajectoryReconstruction2023) démontrent que les pipelines de mobilité doivent gérer :
- des séries partielles,
- des mesures sous-échantillonnées,
- des reconstructions à partir de dictionnaires épars,
- des estimations hybrides GNSS/IMU/communication.
Telemachus normalise ces flux en :
- distinguant données brutes vs reconstruites (
source = raw | reconstructed); - documentant les paramètres de reconstruction (
reconstruction_method,confidence); - encodant les lacunes via des événements (
missing_segment,reconstructed_segment); - permettant la comparaison transparente entre sources simulées, réelles et reconstruites.
Cette structuration rend les expériences reproductibles et comparables entre méthodes compressives, deep learning ou modèles physiques.
5. Discussion et perspectives
L’ambition de Telemachus dépasse la simple structuration de fichiers :
il s’agit d’un cadre scientifique ouvert, visant à rapprocher les communautés data science, ingénierie des véhicules et infrastructure routière.
Telemachus se positionne ainsi comme la couche pivot reliant :
- les signaux GNSS imparfaits,
- les reconstructions par filtres ou modèles compressifs,
- la détection événementielle,
- et les environnements simulés RS3.
Les perspectives incluent :
- la publication du Telemachus v1.0 Dataset sur Zenodo ;
- l’extension du schéma à de nouveaux capteurs (Lidar, caméra) ;
- la standardisation de la RoadGenome API pour relier géométrie, topographie et trajectoire.
Impact académique
Telemachus introduit une méthodologie ouverte inspirée des RFCs Internet, transposée à la donnée de mobilité.
Ce modèle favorise la reproductibilité scientifique, la citabilité des versions et l’interopérabilité interdomaines (simulation, recherche, industrie).
6. Conclusion
Telemachus incarne une approche “science ouverte par design”, où la rigueur scientifique rencontre la diffusion libre des connaissances.
Telemachus offre une infrastructure ouverte pour la science des données de mobilité, alignée avec les principes FAIR (Findable, Accessible, Interoperable, Reusable).