la modélisation mathématique des langues naturelles

Connférence de Sylvain Kahane.

L‘objet central de la linguistique contemporaine est de modéliser les langues naturelles et leur fonctionnement, c’est-à-dire comment un locuteur exprime un sens dans une langue donnée ou comment à partir d’un énoncé linguistique il récupère son sens. De questions sur la langue sont nées des branches fondamentales des mathématiques : la modélisation du sens (et du raisonnement) a donné la logique et la modélisation de la syntaxe a donné la théorie des langages formels et les bases de l’informatique.

Alors que ces objets mathématiques venus de la linguistique poursuivent une vie autonome, les modèles mathématiques de la langue continuent d’évoluer sur des architectures de plus en plus complexes intégrant un véritable calcul du sens et prenant en compte la diversité des comportements des mots et leur faculté de former toujours de nouveaux sens. Nous illustrerons notre propos par un fragment de modèle mathématique pour le français. Nous comparerons ces modèles symboliques avec les modèles statistiques basés sur l’analyse automatique de grands corpus textuels annotés. Nous nous intéresserons également aux (non) liens institutionnels entre linguistique et mathématique, ainsi qu’à la position de la linguistique mathématique par rapport à la linguistique informatique et au traitement automatique de la langue.