| Code | US-OMU-S1-W1-LER |
|---|---|
| Organizational unit | University of Silesia in Katowice |
| Form of studies | Full-time |
| Level of education | First cycle |
| Language(s) of instruction | French |
| Admission limit | 17 |
| Duration | classes will start in the summer semester, since February 2026, 30 hours. Classes will be held on Mondays between 1:45 p.m. and 8:30 p.m. |
| Ask a question | |
|
General data |
syllabus |
|
group instructor |
dr Paweł Golda |
|
ECTS credit allocation |
3 ECTS |
|
Type of class |
Classes, 30 hours |
|
ISCED |
023 Languages |
|
Course mode |
remote/online |
|
Language |
French |
Course description
Ce cours vise à familiariser les étudiants avec le concept des expressions régulières, c’est-à-dire des chaînes de symboles interprétées selon des règles syntaxiques définies. Il a également pour objectif de développer des compétences pratiques en manipulation de données, en enseignant l’utilisation des expressions régulières pour traiter, filtrer, éditer, organiser et modifier divers types de textes. Une seconde finalité est d’initier les étudiants au logiciel Unitex, un outil utilisé en linguistique de corpus. Ils apprendront ainsi à exploiter les expressions régulières pour analyser les résultats d’extraction dans ce programme.
Ce cours permet aux étudiants d’acquérir une maîtrise efficace des expressions régulières dans le cadre du traitement des textes, des corpus et des données. Il comprend une introduction théorique, abordant les symboles des expressions régulières (par ex. : « . » pour un caractère quelconque, « ^ » pour le début d’une ligne, « $ » pour la fin d’une ligne, « \d » pour un chiffre) ainsi que leur syntaxe (par ex. : « .\d+$ » désigne un caractère suivi d’un nombre en fin de ligne, tandis que « ^... » correspond aux trois premiers caractères en début de ligne). Les étudiants apprendront à appliquer les expressions régulières à divers scénarios de traitement textuel, comme le filtrage de données (ex. : conversion d’une bibliographie en un inventaire des noms), l’édition ou la modification d’informations (ex. : transformation automatique des prénoms en initiales dans une bibliographie). L’accent sera mis sur l’application des expressions régulières à l’analyse de textes en français, notamment pour identifier des structures linguistiques spécifiques (ex. : phrases interrogatives, groupes nominaux, noms au pluriel, etc.). La seconde partie du cours portera sur l’apprentissage des bases du logiciel Unitex, un outil avancé en linguistique de corpus. Les étudiants découvriront comment utiliser ce programme pour le traitement de textes et l’exploitation des résultats d’extraction de corpus. Ce cours privilégie une approche pratique : après une introduction aux bases des expressions régulières et aux fonctionnalités d’Unitex, les étudiants réaliseront des exercices, seuls et en groupe, en progressant des tâches élémentaires aux analyses plus complexes.

