inTformer – Crash likelihood aux intersections avec données CV

inTformer – Crash likelihood aux intersections avec données de véhicules connectés

Référence : CrashLikelihood2023
Titre : inTformer: A Time-Embedded Attention-Based Transformer for Crash Likelihood Prediction at Intersections Using Connected Vehicle Data
Auteurs : Shahraki et al.
Source : arXiv:2307.03854v4 (2024)
Thème : détection / sécurité routière
Mots-clés : crash likelihood, intersections, connected vehicles, transformer, attention, SHAP

1. Problème et contexte

Objectif : prédire la probabilité d’accident à une intersection, à court terme, à partir de données de véhicules connectés (CV), et non plus seulement à partir d’historiques de sinistres ou de comptages agrégés.

Contexte :

Les intersections sont des hotspots de sinistralité, avec de nombreuses configurations de conflits (gauche, traversée, arrière, piétons…).
Les approches classiques :
- s’appuient sur des statistiques agrégées (nombre de crashes sur plusieurs années),
- ou sur des modèles de sécurité statiques (HSM, SPF, etc.).
Avec la montée des véhicules connectés (trajectoires, vitesses, états de feux, etc.), on peut envisager une estimation dynamique du risque au pas de temps.

La question centrale :

Peut-on prédire, en quasi temps réel, le risque de crash à une intersection en utilisant uniquement les trajectoires et mesures CV, via un modèle séquentiel de type Transformer ?

2. Données & périmètre expérimental

Données de véhicules connectés :
- Trajectoires CV issues de capteurs de trafic / sondes type INRIX et CATT Lab Signal Analytics Platform (données SPaT, trajectoires, phases de feux).
- Observations au niveau des approches d’intersection et des zones internes (within-intersection vs approach zones).
Chaque “échantillon” est un segment temporel (fenêtre de quelques secondes) avec :
- séries temporelles agrégées par mouvement :
  - vitesses (moyenne, percentiles),
  - angles / déflexions de trajectoires,
  - temps de parcours, retard,
  - indicateurs de congestion (nb de véhicules, files, etc.),
- contexte d’intersection (phases de feux, mouvements conflictuels…).
Labels :
- 1 = crash observé (ou “near crash”) dans une fenêtre de temps associée,
- 0 = fonctionnement normal.
Jeu de données fortement déséquilibré (peu d’accidents vs beaucoup de situations normales), classique en sécurité routière.

3. Modèle proposé : inTformer

3.1. Architecture globale

inTformer = Time-Embedded Attention-Based Transformer :

Embedding temporel :
- Encode les pas de temps dans les séquences de features (position dans la fenêtre temporelle).
- Permet au modèle d’exploiter l’ordre et la dynamique (approche vs collision imminente).
Encoders de mouvement / zone :
- Entrées : séquences de vecteurs de features (vitesse, angles, retards, nb de trajectoires, etc.) pour :
  - la zone d’approche,
  - la zone d’intersection.
- Chaque séquence passe par un encoder Transformer avec :
  - self-attention multi-têtes,
  - MLP feed-forward,
  - normalisation couche + residuals.
Fusion et tête de prédiction :
- Les représentations encodées (approach + intersection) sont fusionnées.
- Passage dans une MLP + couche sigmoid → probabilité de crash à court terme sur l’intersection.

Le modèle est explicitement conçu pour capturer les interactions spatio-temporelles :

comment la dynamique des véhicules (vitesse, accélération implicite, déflection d’angle) évolue à l’approche de l’intersection ;
comment la densité de trafic et les trajectoires “en conflit” contribuent au risque.

3.2. Entraînement & métriques

Problème binaire : crash vs non-crash.
Perte type binary cross-entropy, entraînement supervisé.
Jeu très déséquilibré → importance des métriques :
- rappel / sensibilité (détecter les crashs),
- taux de fausses alertes (éviter les alarmes permanentes),
- précision, F1, éventuellement ROC-AUC.

inTformer est comparé à plusieurs baselines :

réseaux récurrents (LSTM/GRU),
CNN/LSTM sur séries temporelles,
modèles classiques (logistic regression, random forest, XGBoost…).

4. Résultats principaux

Sur les intersections étudiées :

inTformer surpasse les baselines en :
- rappel des crashs,
- stabilité du modèle entre intersections,
- capacité à exploiter des séquences plus longues sans “oublier” le contexte.
Le modèle gère mieux les cas où :
- plusieurs mouvements conflictuels coexistent,
- le pattern dynamique qui mène à l’accident est subtil (ex. accélération tardive + files longues + phases de feux particulières).

Interprétabilité via SHAP :

Permet de ranker les features critiques par zone :
- Zone d’intersection :
  - vitesse moyenne maximale,
  - angle de déflexion moyen,
  - angle différentiel de virage à gauche,
  - 5ᵉ percentile de vitesse (lenteur → congestion / situations atypiques),
  - nombre de trajectoires entrants.
- Zone d’approche :
  - retard moyen des véhicules,
  - diff. de temps de trajet par rapport à un profil de référence,
  - nombre de trajectoires à proximité,
  - mesures liées aux files d’attente.

En pratique :

Plus la situation s’écarte du “profil nominal” (retard, files, vitesses hétérogènes, angles atypiques), plus le modèle estime un risque élevé.

5. Points d’intérêt pour RS3 / Telemachus / VAE

5.1. Lien direct avec V006 et B017

V006 : géométrie routière & risque conducteur
inTformer montre comment un flux de données micro (trajectoires CV) peut être transformé en score de risque localisé sur l’infrastructure (l’intersection).
B017 : détection d’événements de conduite & risque
Ici, on passe de l’événement isolé (freinage brusque, virage serré) à une agrégation séquentielle sur plusieurs véhicules / plusieurs cycles de feux pour aboutir à un score de crash likelihood.

→ Très complémentaire des travaux sur :

DrivingRiskAnomalyTelematics2025 (détection d’anomalies télématiques non supervisée),
DrivingVolatility2018 / SpeedingEffects2023 (liens volatilité / excès de vitesse ↔ risque).

Tu peux te servir de cet article pour :

justifier l’usage d’architectures séquentielles modernes (Transformers) sur des données télématiques 10 Hz,
montrer que le risque d’accident peut être estimé sans caméra, uniquement avec des signaux CV / télématiques.

5.2. Pistes d’intégration RS3 → Telemachus

RS3/Telemachus fournissent exactement les briques nécessaires :
- trajectoires GNSS/IMU à 10 Hz,
- événements (freinage, virage, stop…),
- bientôt géométrie RoadGeometry (courbure, pente, jonctions).
Tu peux reproduire la logique inTformer avec un pipeline :
1. RS3 → génération de scénarios sur des carrefours complexes (ronds-points, carrefours à feux).
2. Export Telemachus → calcul de features “à la inTformer” :
  - distributions de vitesses, temps de parcours, congestion (nb de trajectoires),
  - événements inertiels (fortes décélérations à l’approche d’un feu).
3. Entraînement d’un Transformer simplifié sur ces features pour prédire :
  - occurrences de quasi-accidents dans les scénarios simulés,
  - ou classes “safe vs risky pattern” à l’échelle d’un mouvement.
Cela s’insère très bien :
- dans V006 (géométrie & risque),
- dans une future extension de B017 sur les patterns de trafic (pas seulement les événements individuels),
- et éventuellement dans un futur papier “Telematics-based Crash Likelihood at Intersections” si tu veux aller plus loin.

6. Limites / critiques

Données : dépendantes de la qualité et de la pénétration des véhicules connectés sur les sites étudiés.
Spatialement : modèles calibrés sur un ensemble d’intersections – la généralisation à d’autres contextes (villes, pays) reste un sujet.
Modèle :
- architecture relativement lourde vs modèles plus simples ;
- nécessité de stratégies de gestion de l’imbalance (classe minoritaire crash) bien maîtrisées pour une exploitation industrielle.
Ne prend pas explicitement en compte :
- la géométrie détaillée (courbure locale, visibilité),
- les facteurs environnementaux (météo, luminosité) → complémentarité évidente avec RoadGeometry et tes travaux “météo / pente / courbure / inertie”.

7. Idées concrètes pour ton écosystème

V006 : citer inTformer comme exemple d’architecture moderne pour passer des signaux GNSS/IMU/trajets à un score de risque localisé.
B017 : ajouter un paragraphe “Et après les événements isolés ?” en mentionnant les travaux inTformer, en les reliant à DrivingRiskAnomalyTelematics2025.
Artefact futur (optionnel) : un AR type AR0xx_IntersectionRisk :
- RS3 → scénarios d’intersection,
- Telemachus → extraction features,
- proto inTformer → score de crash likelihood simulé.

Réseau 2 sortants 0 entrants

Sources · Liens sortants

B017 — Détection d’Événements de Conduite par IMU : Vers une Intelligence Embarquée Fiable
V006 — Maîtriser la géométrie routière comme proxy de sécurité, énergie et risque conducteur

Cité par · Liens entrants

Aucune citation détectée.