Ce cours permet de découvrir le domaine du traitement automatique des langues : une branche de l'intelligence artificielle qui cherche à modéliser le langage humain sous la forme écrite (texte) et orale (parole). Nous nous concentrerons dans ce cours sur le langage écrit, donc sur les systèmes capables de comprendre et de générer du texte. Le cours est composé de cinq modules : (1) représentation et manipulation de textes, (2) génération de textes à base de modèles probabilistes, (3) classification de textes par apprentissage automatique, (4) analyse linguistique et extraction d'informations, et (5) traduction automatique et évaluation. Chaque module est composé d'un cours pour introduire les notions, d'une séance de travaux dirigés pour pratiquer et maîtriser ces notions, et d'une séance de travaux pratiques pour les implémenter sur des données réalistes.
- 教師: RAMISCH Carlos