inTformer – Crash likelihood aux intersections avec données CV

inTformer – Crash likelihood aux intersections avec données de véhicules connectés

  • Référence : CrashLikelihood2023
  • Titre : inTformer: A Time-Embedded Attention-Based Transformer for Crash Likelihood Prediction at Intersections Using Connected Vehicle Data
  • Auteurs : Shahraki et al.
  • Source : arXiv:2307.03854v4 (2024)
  • Thème : détection / sécurité routière
  • Mots-clés : crash likelihood, intersections, connected vehicles, transformer, attention, SHAP

1. Problème et contexte

Objectif : prédire la probabilité d’accident à une intersection, à court terme, à partir de données de véhicules connectés (CV), et non plus seulement à partir d’historiques de sinistres ou de comptages agrégés.

Contexte :

  • Les intersections sont des hotspots de sinistralité, avec de nombreuses configurations de conflits (gauche, traversée, arrière, piétons…).
  • Les approches classiques :
    • s’appuient sur des statistiques agrégées (nombre de crashes sur plusieurs années),
    • ou sur des modèles de sécurité statiques (HSM, SPF, etc.).
  • Avec la montée des véhicules connectés (trajectoires, vitesses, états de feux, etc.), on peut envisager une estimation dynamique du risque au pas de temps.

La question centrale :

Peut-on prédire, en quasi temps réel, le risque de crash à une intersection en utilisant uniquement les trajectoires et mesures CV, via un modèle séquentiel de type Transformer ?


2. Données & périmètre expérimental

  • Données de véhicules connectés :
    • Trajectoires CV issues de capteurs de trafic / sondes type INRIX et CATT Lab Signal Analytics Platform (données SPaT, trajectoires, phases de feux).
    • Observations au niveau des approches d’intersection et des zones internes (within-intersection vs approach zones).
  • Chaque “échantillon” est un segment temporel (fenêtre de quelques secondes) avec :
    • séries temporelles agrégées par mouvement :
      • vitesses (moyenne, percentiles),
      • angles / déflexions de trajectoires,
      • temps de parcours, retard,
      • indicateurs de congestion (nb de véhicules, files, etc.),
    • contexte d’intersection (phases de feux, mouvements conflictuels…).
  • Labels :
    • 1 = crash observé (ou “near crash”) dans une fenêtre de temps associée,
    • 0 = fonctionnement normal.
  • Jeu de données fortement déséquilibré (peu d’accidents vs beaucoup de situations normales), classique en sécurité routière.

3. Modèle proposé : inTformer

3.1. Architecture globale

inTformer = Time-Embedded Attention-Based Transformer :

  1. Embedding temporel :

    • Encode les pas de temps dans les séquences de features (position dans la fenêtre temporelle).
    • Permet au modèle d’exploiter l’ordre et la dynamique (approche vs collision imminente).
  2. Encoders de mouvement / zone :

    • Entrées : séquences de vecteurs de features (vitesse, angles, retards, nb de trajectoires, etc.) pour :
      • la zone d’approche,
      • la zone d’intersection.
    • Chaque séquence passe par un encoder Transformer avec :
      • self-attention multi-têtes,
      • MLP feed-forward,
      • normalisation couche + residuals.
  3. Fusion et tête de prédiction :

    • Les représentations encodées (approach + intersection) sont fusionnées.
    • Passage dans une MLP + couche sigmoid → probabilité de crash à court terme sur l’intersection.

Le modèle est explicitement conçu pour capturer les interactions spatio-temporelles :

  • comment la dynamique des véhicules (vitesse, accélération implicite, déflection d’angle) évolue à l’approche de l’intersection ;
  • comment la densité de trafic et les trajectoires “en conflit” contribuent au risque.

3.2. Entraînement & métriques

  • Problème binaire : crash vs non-crash.
  • Perte type binary cross-entropy, entraînement supervisé.
  • Jeu très déséquilibré → importance des métriques :
    • rappel / sensibilité (détecter les crashs),
    • taux de fausses alertes (éviter les alarmes permanentes),
    • précision, F1, éventuellement ROC-AUC.

inTformer est comparé à plusieurs baselines :

  • réseaux récurrents (LSTM/GRU),
  • CNN/LSTM sur séries temporelles,
  • modèles classiques (logistic regression, random forest, XGBoost…).

4. Résultats principaux

Sur les intersections étudiées :

  • inTformer surpasse les baselines en :
    • rappel des crashs,
    • stabilité du modèle entre intersections,
    • capacité à exploiter des séquences plus longues sans “oublier” le contexte.
  • Le modèle gère mieux les cas où :
    • plusieurs mouvements conflictuels coexistent,
    • le pattern dynamique qui mène à l’accident est subtil (ex. accélération tardive + files longues + phases de feux particulières).

Interprétabilité via SHAP :

  • Permet de ranker les features critiques par zone :

    • Zone d’intersection :

      • vitesse moyenne maximale,
      • angle de déflexion moyen,
      • angle différentiel de virage à gauche,
      • 5ᵉ percentile de vitesse (lenteur → congestion / situations atypiques),
      • nombre de trajectoires entrants.
    • Zone d’approche :

      • retard moyen des véhicules,
      • diff. de temps de trajet par rapport à un profil de référence,
      • nombre de trajectoires à proximité,
      • mesures liées aux files d’attente.

En pratique :

Plus la situation s’écarte du “profil nominal” (retard, files, vitesses hétérogènes, angles atypiques), plus le modèle estime un risque élevé.


5. Points d’intérêt pour RS3 / Telemachus / VAE

5.1. Lien direct avec V006 et B017

  • V006 : géométrie routière & risque conducteur
    inTformer montre comment un flux de données micro (trajectoires CV) peut être transformé en score de risque localisé sur l’infrastructure (l’intersection).
  • B017 : détection d’événements de conduite & risque
    Ici, on passe de l’événement isolé (freinage brusque, virage serré) à une agrégation séquentielle sur plusieurs véhicules / plusieurs cycles de feux pour aboutir à un score de crash likelihood.

→ Très complémentaire des travaux sur :

  • DrivingRiskAnomalyTelematics2025 (détection d’anomalies télématiques non supervisée),
  • DrivingVolatility2018 / SpeedingEffects2023 (liens volatilité / excès de vitesse ↔ risque).

Tu peux te servir de cet article pour :

  • justifier l’usage d’architectures séquentielles modernes (Transformers) sur des données télématiques 10 Hz,
  • montrer que le risque d’accident peut être estimé sans caméra, uniquement avec des signaux CV / télématiques.

5.2. Pistes d’intégration RS3 → Telemachus

  • RS3/Telemachus fournissent exactement les briques nécessaires :

    • trajectoires GNSS/IMU à 10 Hz,
    • événements (freinage, virage, stop…),
    • bientôt géométrie RoadGeometry (courbure, pente, jonctions).
  • Tu peux reproduire la logique inTformer avec un pipeline :

    1. RS3 → génération de scénarios sur des carrefours complexes (ronds-points, carrefours à feux).
    2. Export Telemachus → calcul de features “à la inTformer” :
      • distributions de vitesses, temps de parcours, congestion (nb de trajectoires),
      • événements inertiels (fortes décélérations à l’approche d’un feu).
    3. Entraînement d’un Transformer simplifié sur ces features pour prédire :
      • occurrences de quasi-accidents dans les scénarios simulés,
      • ou classes “safe vs risky pattern” à l’échelle d’un mouvement.
  • Cela s’insère très bien :

    • dans V006 (géométrie & risque),
    • dans une future extension de B017 sur les patterns de trafic (pas seulement les événements individuels),
    • et éventuellement dans un futur papier “Telematics-based Crash Likelihood at Intersections” si tu veux aller plus loin.

6. Limites / critiques

  • Données : dépendantes de la qualité et de la pénétration des véhicules connectés sur les sites étudiés.
  • Spatialement : modèles calibrés sur un ensemble d’intersections – la généralisation à d’autres contextes (villes, pays) reste un sujet.
  • Modèle :
    • architecture relativement lourde vs modèles plus simples ;
    • nécessité de stratégies de gestion de l’imbalance (classe minoritaire crash) bien maîtrisées pour une exploitation industrielle.
  • Ne prend pas explicitement en compte :
    • la géométrie détaillée (courbure locale, visibilité),
    • les facteurs environnementaux (météo, luminosité) → complémentarité évidente avec RoadGeometry et tes travaux “météo / pente / courbure / inertie”.

7. Idées concrètes pour ton écosystème

  • V006 : citer inTformer comme exemple d’architecture moderne pour passer des signaux GNSS/IMU/trajets à un score de risque localisé.
  • B017 : ajouter un paragraphe “Et après les événements isolés ?” en mentionnant les travaux inTformer, en les reliant à DrivingRiskAnomalyTelematics2025.
  • Artefact futur (optionnel) : un AR type AR0xx_IntersectionRisk :
    • RS3 → scénarios d’intersection,
    • Telemachus → extraction features,
    • proto inTformer → score de crash likelihood simulé.
Réseau 2 sortants 0 entrants

Sources · Liens sortants

  • B017 — Détection d’Événements de Conduite par IMU : Vers une Intelligence Embarquée Fiable
  • V006 — Maîtriser la géométrie routière comme proxy de sécurité, énergie et risque conducteur

Cité par · Liens entrants

Aucune citation détectée.