Formation doctorale en lexicométrie

Formation doctorale en lexicométrie

 

 

 

Du 24 au 27 mai 2022

Présentation ___

L’École d’été internationale de Montréal 2022 est la cinquième école d’été numérique organisée par le GRHS (UQAM), le GRHG (UQAM), le PIREH (Université de Paris 1) et l’IHMC (Université de Paris 1). Elle s’inscrit dans le cadre d’un partenariat qui a pour objectif de favoriser l’échange des pratiques du numérique entre le Québec et la France, leur apprentissage par les étudiant.e.s des cycles supérieurs, et la mobilité étudiante. L’esprit de cette école est de promouvoir l’usage des méthodes informatiques de la recherche en sciences humaines et sociales dans la discipline historique. Organisée par des enseignants-chercheurs expérimentés, elle aborde des méthodologies et des thématiques innovantes, appliquées au sein d’une pédagogie adaptée aux spécificités des sciences humaines, aux besoins des étudiant.e.s et aux impératifs de la recherche.

Méthodes et outils ___

L’édition 2022 concerne l’analyse de données textuelles (lexicométrie, textométrie ou text mining selon les appellations). L’objectif est de permettre aux étudiant.e.s, ainsi qu’aux enseignant.e.s-chercheur.e.s, de se former aux méthodes de structurations, de visualisation et d’exploration de ces données, ainsi qu’aux enjeux épistémologiques de leur application aux sciences sociales en général, et à l’histoire en particulier. À la fois théorique et applicative, cette école se situe au carrefour du domaine d’étude individuel de chaque participant.e, de leur formation académique ou continue, et d’une approche méthodologique commune. Elle s’adresse en priorité aux doctorant.e.s qui ont besoin, pour leur thèse, d’analyser des corpus textuels qui peuvent être très variés, allant des chartes médiévales aux réseaux sociaux en passant par les discours politiques.

Déroulement ___

Le schéma d’enseignement des années précédentes ayant fait ses preuves et ayant été plébiscité par les étudiant.e.s sera reconduit cette année. L’école est une formation de courte durée (4 jours), dispensée dans le cadre d’une formation universitaire. S’y articulent la découverte théorique des notions qui sous-tendent la lexicométrie et l’exploitation pratique des données. Pour atteindre cet objectif, les journées s’organisent autour de conférences et de travaux pratiques au cours desquelles sont abordées les notions et les enjeux de l’usage des méthodes informatiques pour la recherche, la prise en main des logiciels et à l’expérimentation individuelle ou en groupes pour favoriser l’apprentissage.

Cette école assure la formation à une méthode informatique de recherche qui a fait ses preuves depuis les années 1960, mais qui a aussi connu de nombreux bouleversements avec le développement de l’informatique personnelle et des logiciels dédiés. Elle dépasse, cependant, la formule traditionnelle d’un enseignement académique par le cadre de travail qu’elle propose, par la diversité des intervenant.e.s et des participant.e.s et par les multiples opportunités de rencontres et d’échanges qu’elle offre. Elle est en effet également l’occasion de créer des liens internationaux entre les formateurs de France et du Canada, mais aussi entre les étudiant.e.s, et entre eux et les formateurs. Elle est, à ce titre, l’occasion d’échanges riches et stimulants non seulement sur les méthodes, les pratiques et les compétences mais sur le contenu même de la recherche. Elle favorise donc l’émergence de réseaux de recherche et de chercheur.e.s qui ont encore du mal à se cristalliser autour d’initiatives structurantes dans ce domaine particulier. Enfin et au-delà des aspects professionnels, c’est aussi l’occasion pour les étudiant.e.s de découvrir une culture différente et d’autres façons de faire des sciences humaines, d’enseigner et d’apprendre.

Programme de l’école ___

Mardi 24 mai 2022

Présentation de la textométrie et prise en main des logiciels
9h-10h – Mots de bienvenue et tour de table de présentation
10h-12h – Conférence d’ouverture : Benjamin Deruelle et Stéphane Lamassé, Historiographie (à partir des années 60), corpus et préparation du corpus
14h-17h – Atelier-conférence : Présentation d’un panel de logiciels (Lexico 3, Hyperbase, Txm, Iramuteq, R cran) ; Description du corpus à partir de la prise en main du logiciel (partition) ; Exemple de corpus avec multipartition (comparaison de partition)


Mercredi 25 mai 2022

La statistique lexicale (de la description aux spécificités textuelles et à l’AFC)
Lectures obligatoires :
André Salem, « Segments répétés et analyse statistique des données textuelles »Histoire & Mesure, 1, 1986, p. 5-28.
Damon Mayaffre, Bénédicte Pincemin et Céline Poudat, « Explorer, mesurer, contextualiser. Quelques apports de la textométrie à l’analyse des discours »Langue française, 2019, p. 101-115.

9h-10h – Retour sur les travaux de la veille et tour de table autour des lectures
10h-12h – Travaux pratiques : Prise en main avancée des logiciels
14h-15h30 – Présentation de l’AFC
15h30-17h – Travaux dirigés sur l’AFC


Jeudi 26 mai 2022

Les coocurrences
Lectures obligatoires :
Magali Guaresi, « La forme député. L’approche co-occurrentielle, un bond qualitatif? L’environnement lexical du lemme ‘député’ dans les Professions de foi des candidates à la députation (1958-2002) », Corela, HS-15, 2014.
William Martinez, « Au-delà de la cooccurrence binaire… Poly-cooccurrences et trames de cooccurrence », Corpus, 11, 2012.
Martinez, le médiator

9h-10h – Retour sur les travaux de la veille et tour de table autour des lectures
10h-12h – Conférence : Julien Alerini et Gaëtan Bonnot, Les cooccurrences.
14h-17h – Travaux pratiques de prise en main : cooccurrence binaire et AFC sur cooccurrence


Vendredi 27 mai 2022

La textométrie et l’Intelligence artificielle
Lecture obligatoire :
Magali Guaresi et Damon Mayaffre, « Intelligence artificielle et discours politique. Quelles plus-values interprétatives? Application aux corpus parlementaire et présidentiel contemporains », in Damon Mayaffre et Laurent Vanni (dir.), L’intelligence artificielle des textes, Paris, Champion, 2021, p. 131-182.

9h-10h – Retour sur les travaux de la veille et tour de table autour des lectures
10h-12h – Conférence : Damon Mayaffre, De la profondeur du texte
14h-15h30 – Bilan de l’école
16h30 – Pot de l’amitié

Organisation et candidature ___

Comité scientifique :
Julien Alerini (Paris 1), Gaetan Bonnot (Paris 1), Benjamin Deruelle (UQAM), Stéphane Lamassé (Paris 1), Damon Mayaffre (Côte d’Azur).

Candidature :
Pour les étudiant.e.s français.e.s :

Pour les étudiant.e.s d’Amérique du nord :