Description
Date depot: 1 janvier 1900
Titre: Modélisation 3D de l'environnement et de la manoeuvrabilité d'un véhicule
Directrice de thèse:
Anne VERROUST-BLONDET (Inria-Paris (ED-130))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé:
Afin d’assurer ses fonctionnalités de conduite autonome, un véhicule doit avoir une connaissance fine de son environnement proche. En particulier, la manœuvrabilité du véhicule est souvent abordée sous des hypothèses très restrictives (espace navigable délimité par des lignes de marquage, cartes pré-enregistrées rarement mises à jour, etc.). De telles contraintes sont inadaptées à une infrastructure où les routes comportent souvent des aspérités telles que trous, nids de poules, etc. Une estimation fine de la géométrie de la surface carrossable permettrait de gagner en confort et sécurité.
L’objectif de cette thèse est de détecter la zone navigable par l’extraction du minimum d’information permettant d’assurer l’intégrité d’un véhicule ; à savoir délimiter dans son environnement la zone qu’un véhicule peut physiquement traverser. Il s’agit donc de modéliser la géométrie du voisinage local du véhicule ainsi que sa position afin de pouvoir estimer ses capacités de déplacement en fonction de ses caractéristiques physiques et dynamiques. Cette information est nécessaire pour permettre aux véhicules autonomes de réagir dans des situations complexes, telles que : contour d'un obstacle en travers de la voie, dégagement d'urgence, etc.
Ces techniques s’apparentent plus à la problématique du véhicule tout-terrain. Toutefois, la thèse devra étudier la pertinence des méthodes existantes ou de nouvelles méthodes dans un contexte plus large, incluant la conduite en milieu urbain dense. Dans le cas de la conduite autonome urbaine notre expérience montre que les données des capteurs sont souvent occultées (self-occlusion, scene-occlusion). La méthode envisagée devra donc être compatible avec une situation du type « route ou rue encombrée » et prendre en compte au mieux ce type de scénario complexe. Contrairement aux travaux existants, le calcul de l'espace carrossable ne se restreindra pas aux contraintes liées au code de la route, comme, par exemple, bas-côté, sens interdit, trottoir, etc.
La compréhension générale de scènes (intérieur ou extérieur) nécessite à la fois une estimation de la profondeur [SSN08, SSN09] et de l’orientation des surfaces [HEH05a, HEH05b]. Dans la littérature,
différentes hypothèses sur les connaissances géométriques et/ou photométriques de la scène, peuvent être utilisées :
- la planéité par morceaux des surfaces pour la modélisation de l’environnement urbain
• dans les images à partir des droites détectées ou des points de fuites [SSS09, MK10]
• dans un nuage de points 3D [Bart07],
• dans la carte de profondeurs [GFP10]
- la cohérence photométrique intra-image pour le regroupement de pixels et la réduction de la complexité algorithmique avec des approches superpixels [ASS+12, Fel04] ;
- la cohérence photométrique inter-images pour l’estimation du flux optique [LYT08, GKH10].
De nombreuses méthodes ont été introduites pour détecter l'espace navigable autour du véhicule dans le cadre de la conduite urbaine. Certaines d'entre elles obtiennent de bons résultats sur le benchmark de KITTI dédié à cette problématique [GLU12, FKG13]
(détection des bords de route pour [SRW14], approches évaluées sur le benchmark de KITTI pour [VVF14] et [WFR14]).
L'environnement urbain considéré dans la plupart des approches est structuré, la route bien entretenue, elle peut comporter des lignes de
marquage, mais être partiellement obstruée par des voitures, etc. Dans la majorité des cas, ces approches utilisent une fusion vision + laser, mais rares sont celles qui explorent la navigabilité du terrain.
Le cas plus complexe des routes de campagne a récemment fait
l'objet de travaux de recherche. Wuensche et al. [MHL11, BWu14] proposent une stratégie de fusion des données issues de plusieurs capteurs pour repérer la route, ses intersections et ses embranchements et les reporter sur une carte locale. Yeo et Zhang [YXZ16] combinent les données issues d'un LiDAR 3D et d'une caméra monoculaire pour générer une carte 2D sémantique à partir d'une segmentation de la scène rurale. A notre connaissance, même dans ce cadre, une modélisation fine 3D de l'espace carrossable n'a pas été
proposée.
Bibliographie
[ASS+12] Achanta 12] R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua & S. Susstrunk. SLIC Superpixels Compared to State-of-the-art Superpixel Methods'. PAMI, 2012.
[Bart07] A. Bartoli. 'A random sampling strategy for piecewise planar scene segmentation'. CVIU, 2007.
[BTS14] Berger, M., Tagliasacchi, A., Seversky, L., Alliez, P., Levine, J., Sharf, A., & Silva, C. , State of the art in surface reconstruction from point clouds. EUROGRAPHICS star reports (Vol. 1, No. 1, pp. 161-185), 2014.
[BWu14] S. F. X. Bayer & H-J Wuensche, Detection and Tracking of Rural Crossroads Combining Vision and LiDAR Measurements, ITSC, 2014.
[Fel04] P. F. Felzenszwalb & D. P. Huttenlocher. Efficient Graph-Based Image Segmentation. IJCV, 2004.
[FKG13] Fritsch J., Kuehnl T., & Geiger A., A New Performa
Doctorant.e: Roldao Jimenez Luis Guillermo