Description
Date depot: 26 janvier 2022
Titre: Computational fact-checking and disinformation detection
Directeur de thèse:
Paolo PAPOTTI (Eurecom)
Domaine scientifique: Sciences et technologies de l'information et de la communication
Thématique CNRS : Non defini
Resumé: The phenomenon of disinformation, produced and spread on the Web via social media platforms, websites, and forums is not new, but it has taken on an unprecedented scale since the Brexit campaign, the last US presidential election, and the health crisis associated with Covid-19. Online social media platforms try to limit the virality of disinformation spread for example through human content moderation. While these measures show some effectiveness in limiting the diffusion of misleading or fake information, they cannot scale to the amount of claims that are produced everyday and computational methods are needed to support human moderators. Moreover, identifying disinformation and reporting its status to the users is not enough to counter it.
This thesis is part of the ATTENTION project, which proposes to address this urgent need by designing intelligent (semi-)automated ways to generate counter-arguments to fight the spread of disinformation online. A counter-argument is a non-aggressive response, expressed in natural language, that offers feedback through fact-bound arguments, and can be considered as the most effective approach to withstand disinformation. The goal of the thesis is to detect incorrect information spread online and produce high quality counter-arguments for such claims. This process will be done automatically with NLP and data management techniques. First, we will automatically identify suspicious content possibly containing disinformation, and second, we will build factual evidence that will feed the creation of counter-arguments, which are eventually proposed to humans
Résumé dans une autre langue: Le phénomène de la désinformation, produite et diffusée sur le Web via les plateformes de réseaux sociaux, les sites Web et les forums, n'est pas nouveau, mais il a pris une ampleur sans précédent depuis la campagne du Brexit, la dernière élection présidentielle américaine et la crise sanitaire liée au Covid-19. Les plateformes de réseaux sociaux en ligne tentent de limiter la diffusion de la désinformation en utilisant par exemple la modération humaine du contenu. Bien que ces mesures montrent une certaine efficacité pour limiter la diffusion d'informations trompeuses ou fausses, elles ne peuvent pas s'adapter à la quantité d'allégations produites chaque jour et des méthodes informatiques sont nécessaires pour soutenir les modérateurs humains. De plus, l'identification de la désinformation et le signalement de son état aux utilisateurs ne suffisent pas à la contrer.
Cette thèse fait partie du projet ATTENTION, qui propose de répondre à ce besoin urgent en concevant des moyens intelligents (semi-)automatisés pour générer des contre-arguments afin de combattre la propagation de la désinformation en ligne. Un contre-argument est une réponse non agressive, exprimée en langage naturel, qui offre un retour par des arguments liés aux faits, et peut être considéré comme l'approche la plus efficace pour lutter contre la désinformation. L'objectif de la thèse est de détecter les informations incorrectes diffusées en ligne et de produire des contre-arguments de haute qualité pour de telles affirmations. Ce processus sera réalisé automatiquement à l'aide de techniques de NLP et de gestion de données. Premièrement, nous identifierons automatiquement les contenus suspects susceptibles de contenir de la désinformation, et deuxièmement, nous construirons des preuves factuelles qui alimenteront la création de contre-arguments, qui seront finalement proposés aux humains.
Doctorant.e: Bussotti Jean-Flavien