Formation de maîtrise et de doctorat en méthodes et outils numériques : Textométrie et histoire

 

Du 1er au 5 juin 2020

L’édition de cette année concerne l’analyse de données textuelles (lexicométrie, textométrie ou text mining selon les appellations). L’objectif est de permettre aux étudiants, ainsi qu’aux enseignants-chercheurs, de se former aux méthodes de structurations, de visualisation et d’exploration de ces données, ainsi qu’aux enjeux épistémologiques de leur application aux sciences sociales en général, et à l’histoire en particulier. À la fois théorique et applicative, cette école se situe au carrefour du domaine d’étude individuel de chaque participant, de leur formation académique ou continue, et d’une approche méthodologique commune. Elle s’adresse en priorité aux doctorants qui ont besoin, pour leur thèse, d’analyser des corpus textuels qui peuvent être très variés, allant des chartes médiévales aux réseaux sociaux en passant par les discours politiques.

Le schéma d’enseignement des années précédentes, ayant fait ses preuves et ayant été plébiscité par les étudiants, sera reconduit cette année. L’école est une formation de courte durée (5 jours), dispensée dans le cadre d’une formation universitaire. S’y articulent la découverte théorique des notions qui sous-tendent la textométrie et l’exploitation pratique des données. Pour atteindre cet objectif, les journées s’organisent selon un schéma simple : les matinées débutent par une heure de discussion sur des lectures recommandées ou des exercices à réaliser, suivie par des conférences méthodologiques ; les après-midis sont consacrés à la prise en main des logiciels et à l’expérimentation individuelle ou en groupes pour favoriser l’apprentissage.

Les intérêts de cette école sont multiples. D’abord, il s’agit d’assurer la formation à une méthode informatique de recherche qui a fait ses preuves depuis les années 1960, mais qui a aussi connu de nombreux bouleversements avec le développement de l’informatique personnelle et des logiciels dédiés. Cette formation dépasse, cependant, la formule traditionnelle d’un enseignement académique par le cadre de travail qu’elle propose, par la diversité des intervenants et des participants et par les multiples opportunités de rencontres et d’échanges qu’elle offre. Elle est en effet également l’occasion de créer des liens internationaux entre les formateurs de France et du Canada, mais aussi entre les étudiants, entre eux et avec les formateurs étrangers. Elle est, à ce titre, l’occasion d’échanges riches et stimulants non seulement sur les méthodes, les pratiques et les compétences mais sur le contenu même de la recherche. Elle favorise donc l’émergence de réseaux de recherche et de chercheurs qui ont encore du mal à se cristalliser autour d’initiatives structurantes dans ce domaine particulier. Enfin et au-delà des aspects professionnels, c’est aussi l’occasion pour les étudiants de découvrir une culture différente et d’autres façons de faire des sciences humaines, d’enseigner et d’apprendre.

 

Comité scientifique : Benjamin Deruelle (UQAM), Octave Julien (Paris 1), Stéphane Lamassé (Paris I), et Julien Alerini (Paris 1)
Comité d’organisation : Grégoire Binois (Paris 1), Benjamin Deruelle (UQAM), Stéphane Lamassé (Paris I), Julien Alerini (Paris 1), François Dominic Laramée (Ottawa)

 

Stocker et manipuler les données textuelles

Mots de bienvenue et tour de table de présentation (9h-10h)

Conférence inaugurale sur la lexicométrie (10h-12h)

Installation et présentation des logiciels utilisés durant la formation (13h30-14h30)

Apprentissages des expressions régulières pour la manipulation des textes (15h-17h)

 

Exploration des corpus

(9h, A-6290) : Retour sur les travaux de la veille et tour de table autour des lectures fournies aux participants

Conférence de Benjamin Deruelle (UQAM) et Julien Alerini (Paris 1), Textes, corpus et représentation (10h-12h, A-6290)

La préparation du corpus : balisage, lemmatisation et étiquetage (13h30-15h00)

La description du corpus : index et dictionnaires : (15h30-17h00)

 

Les spécificités textuelles

9h-10h : Retour sur les travaux de la veille et tour de table autour des lectures fournies aux participants

Conférence de Stéphane Lamassé (Paris 1), Les mots en contextes (10h-12h)

Cooccurrences et réseaux lexicaux (13h30-15h)

La temporalité des discours (15h30-17h00)

 

 

La classification textuelle

9h-10h : Retour sur les travaux de la veille et tour de table autour des lectures fournies aux participants

Conférence Julien Alerini (Paris 1) et François Dominic Laramée (Ottawa), Statistiques lexicales et analyse de tableaux lexicaux (10h-12h)

Exercices de prises en main logiciel pour les classifications textuelles  (13h30-17h)  

 

Hackathon

9h-12h : Mise en activité au tour d’un projet collectif (par équipe). Les discours du Trône des Premiers ministres du Québec et du Canada ou Les cahiers de doléances de 1789

Présentation des enquêtes (présentation et analyse réflexive sur les productions  (13h30-15h30)

Bilan de l’école d’été (15h30-16h30)

Du 1er au 5 juin 2020

Université du Québec à Montréal,
Pavillon Hubert-Aquin, UQAM
1255 rue Saint-Denis,
Montréal (Québec)

Tous droits réservés - Université du Québec à Montréal - 2013