Projet de recherche doctoral numero :3300

Description

Date depot: 1 janvier 1900
Titre: Contribution d'un modèle computationnel bio-inspiré de sélection de stratégies de navigation aux hypothèses relatives à l'apprentissage spatial.
Directrice de thèse: Agnès GUILLOT (LPEM (EDITE))
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini

Resumé: De nombreuses expériences montrent la capacité des mammifères, particulièrement étudiée chez le rat, à pouvoir utiliser plusieurs types de navigation pour rejoindre un but. Ces stratégies seraient utilisées en fonction de la disponibilité de différents types d’amers présents dans l’environnement, situés à la proximité ou loin du but (respectivement amers proximaux et distaux). Les études ont notamment porté ces dernières décennies sur les systèmes de mémoires engagés dans l’utilisation de ces stratégies, l’hypothèse dominante étant que des systèmes apprennent en parallèle des types distincts de stratégies, reposant ou non sur la construction d’une représentation interne de l’environnement. L’hypothèse d’une telle représentation spatiale (théorie dite « cognitive ») et de systèmes parallèles ayant des capacités différentes d’apprentissage est supportée par des comparaisons entre animaux intacts et animaux ayant des lésions de structures nerveuses concernées par ces fonctions. Cette hypothèse est toutefois remise en question par la nature de l’apprentissage impliqué: la construction d’une représentation spatiale et son utilisation est contraire à nombre d’observations tendant à montrer que le comportement spatial est avant tout dirigé par une compétition entre les amers disponibles, résultant du même apprentissage procédural que celui mis en œuvre dans un conditionnement opérant (théorie dite « associative »). Des expériences démontrent en effet que certains amers peuvent être occultés ou bloqués par d’autres, remettant ainsi en question la possibilité d’intégrer ces amers de manière redondante. Nous adoptons ici l’hypothèse, déjà formulée par d’autres neurobiologistes, que ces deux points de vue antagonistes pourraient s’expliquer par une gestion modulaire de la navigation, permettant des apprentissages différenciés et parallèles de plusieurs stratégies, et dont le mécanisme de sélection pourrait favoriser soit les compétitions entre amers, soit la nécessité de leur intégration. La conception du modèle computationnel proposé dans ce travail et sous-tendu par cette hypothèse a nécessité de fait la mise en place d’une règle de sélection ne dépendant pas de la nature de l’apprentissage des stratégies et pouvant privilégier soit certains amers, soit l’utilisation d’une représentation spatiale construite avec plusieurs amers. Ce modèle sélectionne en ligne des stratégies apprises par des algorithmes d'apprentissage procéduraux (apprentissage par renforcement) et déclaratifs (recherche de graphe). Ces acquisitions s’effectuent en parallèle et peuvent favoriser une coopération entre les stratégies, car chacune peut apprendre des comportements de l’autre. Le module de sélection de ces stratégies peut inciter des interactions compétitives, car il effectue ses choix sur la base d’un apprentissage de type associatif. L’existence d’un tel module de sélection, indépendant des systèmes d’apprentissage des stratégies, est corroboré par certains travaux récents démontrant l’implication de structures du cortex préfrontal et des ganglions de la base dans cette fonction. Le dispositif expérimental utilisé est la piscine de Morris, dans laquelle le comportement spatial de rats a été étudié de façon approfondie depuis une trentaine d’années. Nous avons limité nos analyses aux interactions entre stratégies de guidage - utilisant directement des indices visuels - et stratégies de lieu - utilisant une carte cognitive construite à partir de cellules de lieu simulées par un modèle d’hippocampe intégré au modèle. Après avoir démontré le comportement du modèle dans des situations où seuls certains types d’amers (proximaux ou distaux) sont présents, nous avons reproduit diverses expériences dans lesquelles l’influence de l’interaction de ces types d’amers a donné lieu à des interprétations issues de l’une ou de l’autre des deux théories antagonistes. Nous avançons notamment que l’utilisation d’une stratégie fondée sur une carte cognitive (intégration d’amers) ne peut pas être écartée, car elle se révèle indispensable pour expliquer certains effets de blocage ou d’occultation caractéristiques de la théorie associative. Nous suggérons aussi que l’existence de deux stratégies de guidage, l’une ayant un cadre de référence égocentré (apprenant les trajets conduisant au but en fonction de l’orientation du corps), l’autre un cadre de référence allocentré (apprenant une direction générale conduisant au but en fonction d’un repère absolu) doit nécessairement être prise en compte pour générer certaines interactions compétitives ou coopératives observées entre systèmes de navigation. Nous montrons aussi qu’une intégration d’amers n’est pas forcément utilisée par les animaux car une stratégie de guidage allocentrée, même fondée sur une compétition d’amers, peut être suffisante dans certains contextes pour expliquer leur comportement. En résumé, ce modèle de navigation, associant des systèmes parallèles d’apprenti

Doctorant.e: Dolle Laurent