Details
Code	US-OMU-S1-W1-LER
Organizational unit	University of Silesia in Katowice
Form of studies	Full-time
Level of education	First cycle
Language(s) of instruction	French
Admission limit	17
Duration	classes will start in the summer semester, since February 2026, 30 hours. Classes will be held on Mondays between 1:45 p.m. and 8:30 p.m.
Ask a question

There is currently no active phase.

Past phases in this registration:

Phase 1 (15.01.2026 10:00 – 20.02.2026 23:59)

General data	syllabus
group instructor	dr Paweł Golda
ECTS credit allocation	3 ECTS
Type of class	Classes, 30 hours
ISCED	023 Languages
Course mode	remote/online
Language	French

Course description

Ce cours vise à familiariser les étudiants avec le concept des expressions régulières, c’est-à-dire des chaînes de symboles interprétées selon des règles syntaxiques définies. Il a également pour objectif de développer des compétences pratiques en manipulation de données, en enseignant l’utilisation des expressions régulières pour traiter, filtrer, éditer, organiser et modifier divers types de textes. Une seconde finalité est d’initier les étudiants au logiciel Unitex, un outil utilisé en linguistique de corpus. Ils apprendront ainsi à exploiter les expressions régulières pour analyser les résultats d’extraction dans ce programme.

Ce cours permet aux étudiants d’acquérir une maîtrise efficace des expressions régulières dans le cadre du traitement des textes, des corpus et des données. Il comprend une introduction théorique, abordant les symboles des expressions régulières (par ex. : « . » pour un caractère quelconque, « ^ » pour le début d’une ligne, « $ » pour la fin d’une ligne, « \d » pour un chiffre) ainsi que leur syntaxe (par ex. : « .\d+$ » désigne un caractère suivi d’un nombre en fin de ligne, tandis que « ^... » correspond aux trois premiers caractères en début de ligne). Les étudiants apprendront à appliquer les expressions régulières à divers scénarios de traitement textuel, comme le filtrage de données (ex. : conversion d’une bibliographie en un inventaire des noms), l’édition ou la modification d’informations (ex. : transformation automatique des prénoms en initiales dans une bibliographie). L’accent sera mis sur l’application des expressions régulières à l’analyse de textes en français, notamment pour identifier des structures linguistiques spécifiques (ex. : phrases interrogatives, groupes nominaux, noms au pluriel, etc.). La seconde partie du cours portera sur l’apprentissage des bases du logiciel Unitex, un outil avancé en linguistique de corpus. Les étudiants découvriront comment utiliser ce programme pour le traitement de textes et l’exploitation des résultats d’extraction de corpus. Ce cours privilégie une approche pratique : après une introduction aux bases des expressions régulières et aux fonctionnalités d’Unitex, les étudiants réaliseront des exercices, seuls et en groupe, en progressant des tâches élémentaires aux analyses plus complexes.

	The project „e-UW - development of e-services of the University of Warsaw related to education” is co-financed from the funds of the Regional Operational Program Mazovia Voivodeship 2014-2020. The project is being implemented in 2016-2019. Find out more

Les expressions régulières dans l'application pratique et la linguistique de corpus

Course description