Marion Laignelet est linguiste, mais pas n’importe quelle linguiste. Sa spécialité, c’est le traitement informatique des données linguistiques. La Linguistique-Informatique consiste plus précisément à modéliser ce que l’être humain fait naturellement, sans se poser de questions, lorsqu’il parle, pour qu’un ordinateur soit capable d’en faire de même. Son champ théorique et pratique recoupe ainsi en partie celui des travaux sur l’intelligence artificielle. Plus concrètement, la Linguistique-Informatique développe des modèles mathématiques pour rendre compte des phénomènes de langues, et des logiciels pour aider les linguistes dans leurs recherches, et pour utiliser, organiser et traiter les données linguistiques. On est bien loin de l’image que l’on se fait souvent de la Linguistique comme d’une discipline littéraire. « Quand on me demande quel est mon travail et que je réponds que je suis linguiste, les gens me disent “Ah bon ? C’est un travail ?” Puis, ils me demandent : “En quelle langue ? ” Et lorsque je leur réponds : “En français”, ils sont surpris. C’est vrai que les linguistes sont souvent associés soit aux langues étrangères, soit à la littérature. Et pourtant, si on regarde les formations universitaires, c’est trois cursus différents, » observe Marion. Étant d’abord passée par les Lettres Modernes avant de bifurquer vers les Sciences du Langage, elle sait de quoi elle parle. « En Lettres Modernes, il y a une réflexion qui est portée sur la norme, et beaucoup de grammaire, alors qu’en Linguistique, moi, ce qui m’intéressait, c’était plutôt de travailler sur l’usage. Il y a des normes, c’est bien, mais comment les gens les utilisent ? C’est quoi la différence entre la norme qui est prescrite et la réalité des échanges parlés ? » D’où sa décision de se spécialiser dans le domaine de la Linguistique-Informatique après un DEUG de Lettres Modernes préparé dans le cadre d’un cursus intégré entre l’Université de Dijon et l’Université de Mayence en Allemagne.
Ce choix a fini par la conduire à réaliser une thèse de Doctorat intitulée Associer analyse syntaxique et analyse discursive pour le repérage automatique d’informations potentiellement obsolescentes dans des documents encyclopédiques. Derrière ce titre peu glamour se cache un travail des plus utiles sur l’élaboration d’algorithmes informatiques basés sur des règles linguistiques permettant de retrouver automatiquement des passages destinés à être relus en priorité pour, si nécessaire, les corriger. « L’idée, c’était de donner du contenu présélectionné au relecteur pour qu’il n’ait pas tout à lire mais qu’il n’ait que certains éléments ayant un taux de probabilité important de mises à jour à effectuer. » Autrement dit, il s’agissait de faciliter le travail des éditeurs d’encyclopédies lorsque ces derniers doivent mettre à jour leurs publications. Marion a ainsi fait partie de ces chercheurs qui travaillent en collaboration avec une entreprise et élaborent leur projet de recherche en fonction des besoins de cette entreprise, dans le cadre d’un contrat CIFRE (Convention Industrielle de Formation par la Recherche). Sa thèse, elle l’a préparée avec la société d’édition Initiales, et en partenariat d’abord avec les éditions Atlas, puis avec Larousse. Elle a de ce fait pu toucher aux applications concrètes de la Linguistique, et développer les compétences et les outils nécessaires pour s’insérer dans le monde professionnel.
Après des contrats d’enseignement à l’Université du Mirail, elle est engagée à CFH, entreprise spécialisée dans le traitement linguistique de données sensibles dans de nombreux domaines tels que l’aéronautique, les transports ou le médical, où elle met en place des algorithmes pour intégrer des ressources linguistiques et analyser de grandes quantités de données textuelles, tout en tenant compte de leur diversité et du contexte où elles apparaissent. « Par exemple, si on veut rechercher, dans une grande quantité de données, des situations où on est face à un humain qui est fatigué, la manière d’exprimer la fatigue est diverse. On peut dire « fatigué », « un peu fatigué », « très fatigué », « mal dormi ». Du coup, il s’agit d’organiser toutes ces ressources linguistiques en fonction de toutes ces connaissances, et d’analyser le contexte, sans oublier pourquoi on veut récupérer ces données. Et ceci, on le réalise sur une grande quantité de données. » Dans ce cadre, Marion travaille essentiellement sur des corpus en français et en anglais. « Mais ce n’est pas l’anglais de Shakespeare. C’est de l’anglais technique, donc aéronautique, ferroviaire,…, c’est-à-dire une langue avec un vocabulaire particulier, des tournures particulières, des codes particuliers. Par conséquent, il s’agit aussi de simplifier le langage par rapport à une langue naturelle pour éviter toute ambiguïté en face. Mais il ne faut pas que penser la langue de façon simplifiée. » Un travail qui la passionne puisqu’il lui permet de réemployer au quotidien ce qu’elle a appris au cours de ses années dans la recherche universitaire.
Elle tient par ailleurs à souligner qu’après un Doctorat, « on est à même de rebondir, par exemple dans tout ce qui est gestion des connaissances. Il n’y a pas que la linguistique pure, il peut y avoir d’autres endroits où un linguiste peut avoir complètement sa place, comme la documentation, la gestion de ressources,… Beaucoup de linguistes bossent dans ces domaines. » Comme quoi, l’étude du langage ouvre à de nombreux horizons.
Au-delà du traitement automatisé des données linguistiques, Marion œuvre aussi à la promotion de l’occitan, une langue qu’elle met un point d’honneur à apprendre à ses enfants et qu’elle approfondit chaque semaine grâce à Marion Quenut, fondatrice de Toulangues. Pour elle, savoir parler occitan n’a rien d’inutile, c’est s’approprier un héritage culturel, et « une culture, ça sert à être, à exister. » Parole de linguiste : toutes les langues sont importantes.
Propos recueillis par Viviane Bergue