inTformer – Crash likelihood aux intersections avec données de véhicules connectés
- Référence : CrashLikelihood2023
- Titre : inTformer: A Time-Embedded Attention-Based Transformer for Crash Likelihood Prediction at Intersections Using Connected Vehicle Data
- Auteurs : Shahraki et al.
- Source : arXiv:2307.03854v4 (2024)
- Thème : détection / sécurité routière
- Mots-clés : crash likelihood, intersections, connected vehicles, transformer, attention, SHAP
1. Problème et contexte
Objectif : prédire la probabilité d’accident à une intersection, à court terme, à partir de données de véhicules connectés (CV), et non plus seulement à partir d’historiques de sinistres ou de comptages agrégés.
Contexte :
- Les intersections sont des hotspots de sinistralité, avec de nombreuses configurations de conflits (gauche, traversée, arrière, piétons…).
- Les approches classiques :
- s’appuient sur des statistiques agrégées (nombre de crashes sur plusieurs années),
- ou sur des modèles de sécurité statiques (HSM, SPF, etc.).
- Avec la montée des véhicules connectés (trajectoires, vitesses, états de feux, etc.), on peut envisager une estimation dynamique du risque au pas de temps.
La question centrale :
Peut-on prédire, en quasi temps réel, le risque de crash à une intersection en utilisant uniquement les trajectoires et mesures CV, via un modèle séquentiel de type Transformer ?
2. Données & périmètre expérimental
- Données de véhicules connectés :
- Trajectoires CV issues de capteurs de trafic / sondes type INRIX et CATT Lab Signal Analytics Platform (données SPaT, trajectoires, phases de feux).
- Observations au niveau des approches d’intersection et des zones internes (within-intersection vs approach zones).
- Chaque “échantillon” est un segment temporel (fenêtre de quelques secondes) avec :
- séries temporelles agrégées par mouvement :
- vitesses (moyenne, percentiles),
- angles / déflexions de trajectoires,
- temps de parcours, retard,
- indicateurs de congestion (nb de véhicules, files, etc.),
- contexte d’intersection (phases de feux, mouvements conflictuels…).
- séries temporelles agrégées par mouvement :
- Labels :
- 1 = crash observé (ou “near crash”) dans une fenêtre de temps associée,
- 0 = fonctionnement normal.
- Jeu de données fortement déséquilibré (peu d’accidents vs beaucoup de situations normales), classique en sécurité routière.
3. Modèle proposé : inTformer
3.1. Architecture globale
inTformer = Time-Embedded Attention-Based Transformer :
-
Embedding temporel :
- Encode les pas de temps dans les séquences de features (position dans la fenêtre temporelle).
- Permet au modèle d’exploiter l’ordre et la dynamique (approche vs collision imminente).
-
Encoders de mouvement / zone :
- Entrées : séquences de vecteurs de features (vitesse, angles, retards, nb de trajectoires, etc.) pour :
- la zone d’approche,
- la zone d’intersection.
- Chaque séquence passe par un encoder Transformer avec :
- self-attention multi-têtes,
- MLP feed-forward,
- normalisation couche + residuals.
- Entrées : séquences de vecteurs de features (vitesse, angles, retards, nb de trajectoires, etc.) pour :
-
Fusion et tête de prédiction :
- Les représentations encodées (approach + intersection) sont fusionnées.
- Passage dans une MLP + couche sigmoid → probabilité de crash à court terme sur l’intersection.
Le modèle est explicitement conçu pour capturer les interactions spatio-temporelles :
- comment la dynamique des véhicules (vitesse, accélération implicite, déflection d’angle) évolue à l’approche de l’intersection ;
- comment la densité de trafic et les trajectoires “en conflit” contribuent au risque.
3.2. Entraînement & métriques
- Problème binaire : crash vs non-crash.
- Perte type binary cross-entropy, entraînement supervisé.
- Jeu très déséquilibré → importance des métriques :
- rappel / sensibilité (détecter les crashs),
- taux de fausses alertes (éviter les alarmes permanentes),
- précision, F1, éventuellement ROC-AUC.
inTformer est comparé à plusieurs baselines :
- réseaux récurrents (LSTM/GRU),
- CNN/LSTM sur séries temporelles,
- modèles classiques (logistic regression, random forest, XGBoost…).
4. Résultats principaux
Sur les intersections étudiées :
- inTformer surpasse les baselines en :
- rappel des crashs,
- stabilité du modèle entre intersections,
- capacité à exploiter des séquences plus longues sans “oublier” le contexte.
- Le modèle gère mieux les cas où :
- plusieurs mouvements conflictuels coexistent,
- le pattern dynamique qui mène à l’accident est subtil (ex. accélération tardive + files longues + phases de feux particulières).
Interprétabilité via SHAP :
-
Permet de ranker les features critiques par zone :
-
Zone d’intersection :
- vitesse moyenne maximale,
- angle de déflexion moyen,
- angle différentiel de virage à gauche,
- 5ᵉ percentile de vitesse (lenteur → congestion / situations atypiques),
- nombre de trajectoires entrants.
-
Zone d’approche :
- retard moyen des véhicules,
- diff. de temps de trajet par rapport à un profil de référence,
- nombre de trajectoires à proximité,
- mesures liées aux files d’attente.
-
En pratique :
Plus la situation s’écarte du “profil nominal” (retard, files, vitesses hétérogènes, angles atypiques), plus le modèle estime un risque élevé.
5. Points d’intérêt pour RS3 / Telemachus / VAE
5.1. Lien direct avec V006 et B017
- V006 : géométrie routière & risque conducteur
inTformer montre comment un flux de données micro (trajectoires CV) peut être transformé en score de risque localisé sur l’infrastructure (l’intersection). - B017 : détection d’événements de conduite & risque
Ici, on passe de l’événement isolé (freinage brusque, virage serré) à une agrégation séquentielle sur plusieurs véhicules / plusieurs cycles de feux pour aboutir à un score de crash likelihood.
→ Très complémentaire des travaux sur :
- DrivingRiskAnomalyTelematics2025 (détection d’anomalies télématiques non supervisée),
- DrivingVolatility2018 / SpeedingEffects2023 (liens volatilité / excès de vitesse ↔ risque).
Tu peux te servir de cet article pour :
- justifier l’usage d’architectures séquentielles modernes (Transformers) sur des données télématiques 10 Hz,
- montrer que le risque d’accident peut être estimé sans caméra, uniquement avec des signaux CV / télématiques.
5.2. Pistes d’intégration RS3 → Telemachus
-
RS3/Telemachus fournissent exactement les briques nécessaires :
- trajectoires GNSS/IMU à 10 Hz,
- événements (freinage, virage, stop…),
- bientôt géométrie RoadGeometry (courbure, pente, jonctions).
-
Tu peux reproduire la logique inTformer avec un pipeline :
- RS3 → génération de scénarios sur des carrefours complexes (ronds-points, carrefours à feux).
- Export Telemachus → calcul de features “à la inTformer” :
- distributions de vitesses, temps de parcours, congestion (nb de trajectoires),
- événements inertiels (fortes décélérations à l’approche d’un feu).
- Entraînement d’un Transformer simplifié sur ces features pour prédire :
- occurrences de quasi-accidents dans les scénarios simulés,
- ou classes “safe vs risky pattern” à l’échelle d’un mouvement.
-
Cela s’insère très bien :
- dans V006 (géométrie & risque),
- dans une future extension de B017 sur les patterns de trafic (pas seulement les événements individuels),
- et éventuellement dans un futur papier “Telematics-based Crash Likelihood at Intersections” si tu veux aller plus loin.
6. Limites / critiques
- Données : dépendantes de la qualité et de la pénétration des véhicules connectés sur les sites étudiés.
- Spatialement : modèles calibrés sur un ensemble d’intersections – la généralisation à d’autres contextes (villes, pays) reste un sujet.
- Modèle :
- architecture relativement lourde vs modèles plus simples ;
- nécessité de stratégies de gestion de l’imbalance (classe minoritaire crash) bien maîtrisées pour une exploitation industrielle.
- Ne prend pas explicitement en compte :
- la géométrie détaillée (courbure locale, visibilité),
- les facteurs environnementaux (météo, luminosité) → complémentarité évidente avec RoadGeometry et tes travaux “météo / pente / courbure / inertie”.
7. Idées concrètes pour ton écosystème
- V006 : citer inTformer comme exemple d’architecture moderne pour passer des signaux GNSS/IMU/trajets à un score de risque localisé.
- B017 : ajouter un paragraphe “Et après les événements isolés ?” en mentionnant les travaux inTformer, en les reliant à DrivingRiskAnomalyTelematics2025.
- Artefact futur (optionnel) : un AR type
AR0xx_IntersectionRisk:- RS3 → scénarios d’intersection,
- Telemachus → extraction features,
- proto inTformer → score de crash likelihood simulé.