Linguistique Informatique russe | ![]() |
Ce site n'est pas le site officiel de l'Inalco
Tous parcours avec le russe, recommandé pour parcours « sciences du langage » et parcours « enseignement »
Ce cours n'est pas assuré en 2014-2015, il aura lieu en 2015-2016
Corpus de textes numériques russes
Objectif du cours : Utiliser les corpus de textes électroniques et leurs logiciels d’exploitation Ce cours peut être utile aux étudiants qui souhaitent travailler avec les nouvelles technologies, s'orienter vers les métiers de l'enseignement, de l'édition numérique, de la conception des méthodes de langues, ou de l'application des nouvelles technologies dans l'étude et l'enseignement de la langue ou de la culture
Pré-requis : niveau Informatique C2.
Contenu du cours: Présentation des
différentes ressources comportant des textes russes électroniques ( Internet,
CD ROM, bibliothèques électroniques). Principes de la constitution de corpus.
Rappels sur les polices, tables
de caractères et transcodage. Utilisation de logiciels d’exploitation de
corpus, initiation aux principes d’étiquetage de textes.
Evaluation : Examen théorique et pratique avec constitution de dossier (somme des travaux pratiques effectués pendant le semestre)
Ce cours est crédité de 3 ECTS ou 6 ECTS si un dossier est réalisé :
Code Inalco
code M1 RUS4A02C (3 ECTS) et UE RUS4A12 (6 ECTS) RUS4A02C RUS4A02D
et pour le M2 RUS5A02A
Horaire : 13
semaines, soit 19h30 de cours
3-4. Définition et utilité des corpus de textes. Les corpus de textes
en ligne / les corpus de textes constitués / méthodes de recherche dans les
corpus. Consultation des différents
corpus et constitution de son propre corpus
5-7. Maniement des logiciels
d’exploitation de corpus ( Nooj, Unitex, Simple Concordance etc.) Constitution
de concordances.
8-10. Etude des lemmatiseurs,
des normes d’étiquetage ( parsage)
11-13 . Réalisation pratique d'un dossier