Recruitment procedure for Transfrom4Europe BA Tracks 2025/2026 at the University of Silesia in Katowice

switch registrations cancel selection

The offer displayed on this page is limited to the selected registration. If you want to see the rest of the offer, select a different registration.

Les expressions régulières dans l'application pratique et la linguistique de corpus

Details
Code US-OMU-S1-W1-LER
Organizational unit University of Silesia in Katowice
Form of studies Full-time
Level of education First cycle
Language(s) of instruction French
Admission limit 17
Duration classes will start in the summer semester, since February 2026, 30 hours. Classes will be held on Mondays between 1:45 p.m. and 8:30 p.m.
  Ask a question
Phase 1 (15.01.2026 10:00 – 15.02.2026 23:59)

 

General data

syllabus

group instructor

dr Paweł Golda

ECTS credit allocation

 3 ECTS

Type of class

Classes, 30 hours

ISCED

 023 Languages

Course mode

 remote/online

Language

 French

Course description

Ce cours vise à familiariser les étudiants avec le concept des expressions régulières, c’est-à-dire des chaînes de symboles interprétées selon des règles syntaxiques définies. Il a également pour objectif de développer des compétences pratiques en manipulation de données, en enseignant l’utilisation des expressions régulières pour traiter, filtrer, éditer, organiser et modifier divers types de textes. Une seconde finalité est d’initier les étudiants au logiciel Unitex, un outil utilisé en linguistique de corpus. Ils apprendront ainsi à exploiter les expressions régulières pour analyser les résultats d’extraction dans ce programme.

Ce cours permet aux étudiants d’acquérir une maîtrise efficace des expressions régulières dans le cadre du traitement des textes, des corpus et des données. Il comprend une introduction théorique, abordant les symboles des expressions régulières (par ex. : « . » pour un caractère quelconque, « ^ » pour le début d’une ligne, « $ » pour la fin d’une ligne, « \d » pour un chiffre) ainsi que leur syntaxe (par ex. : « .\d+$ » désigne un caractère suivi d’un nombre en fin de ligne, tandis que « ^... » correspond aux trois premiers caractères en début de ligne). Les étudiants apprendront à appliquer les expressions régulières à divers scénarios de traitement textuel, comme le filtrage de données (ex. : conversion d’une bibliographie en un inventaire des noms), l’édition ou la modification d’informations (ex. : transformation automatique des prénoms en initiales dans une bibliographie). L’accent sera mis sur l’application des expressions régulières à l’analyse de textes en français, notamment pour identifier des structures linguistiques spécifiques (ex. : phrases interrogatives, groupes nominaux, noms au pluriel, etc.). La seconde partie du cours portera sur l’apprentissage des bases du logiciel Unitex, un outil avancé en linguistique de corpus. Les étudiants découvriront comment utiliser ce programme pour le traitement de textes et l’exploitation des résultats d’extraction de corpus. Ce cours privilégie une approche pratique : après une introduction aux bases des expressions régulières et aux fonctionnalités d’Unitex, les étudiants réaliseront des exercices, seuls et en groupe, en progressant des tâches élémentaires aux analyses plus complexes.