Des corpus oraux aux humanités numériques : aller et retour - Université Paris Nanterre
Communication Dans Un Congrès Année : 2018

Des corpus oraux aux humanités numériques : aller et retour

Olivier Baude

Résumé

Quelques années seulement après l’apparition des premiers appareils permettant d’enregistrer la parole, les collections raisonnées d’archivage non graphique du langage avaient pour objectif de bouleverser la linguistique. Cinquante ans plus tard l’informatique outillait toutes les sciences humaines et sociales et orientait la linguistique de corpus vers une science des données. Actuellement, les humanités numériques visent une transformation du rapport aux savoirs et apportent de nouvelles perspectives théoriques et méthodologiques. La continuité qui existe entre les moyens numériques utilisés pour archiver et traiter les données de la recherche en linguistique et ceux pour analyser et disséminer les résultats, modifie en retour l’objet produit par te travail d’observation, de description et de modélisation. En m’appuyant sur l’exemple du Corpus d’Orléans, issu des ESLO (Enquêtes sociolinguistiques à Orléans), j’aborderai les points de convergence et de divergence qui existent entre une linguistique de la variation fondée sur corpus oraux et les sciences humaines et sociales à l’ère des humanités numériques. Le corpus d’Orléans est ainsi passé du statut d’enregistrements sonores sur bandes magnétiques à un objet numérique, transcrit, annoté et explorable à l’aide d’outils informatiques mais aussi enrichi et lié à d’autres données disponibles sur le Web. Reste à savoir quels sont les apports et quelles sont les limites de ces évolutions technologiques, méthodologiques et théoriques pour l’étude de la variation linguistique et en quoi il est fondamental que celle-ci s’impose au moment où les données disponibles deviennent centrales dans la construction des savoirs ? Ainsi, ces interrogations, à partir du cas de la linguistique sur corpus oraux, rejoignent les nombreuses questions posées par une approche critique des humanités numériques. Cette présentation abordera certaines de ces questions par le prisme de projets de recherche en cours de réalisation : En quoi les aspects éthiques et juridiques liés à la collecte, le traitement, l’archivage et la diffusion ont modifié la démarche du chercheur, et au-delà l’objet même de disciplines qui ont abordé un tournant numérique ? Quels sont les effets de l’analyse du texte (au sens large) comme document structuré, et de l’exigence de standardisation et normalisation des données et métadonnées sur le travail d’interprétation ? Dans quelles conditions les opérations d’extraction de connaissances, de visualisation, d’exploration quantitative de corpus deviennent des instruments nouveaux de construction et d’accès aux savoirs ? Quelles sont les effets de l’exigence du partage des données et celui des plateformes et infrastructures dédiées à cet objectif dans le champ de la linguistique et dans l’espace social ? In fine, il s’agira de se demander si l’étude de la variation est soluble dans une linguistique sur corpus numériques, ouverte à l’interdisciplinarité et quelles sont alors les conditions d’une démarche réflexive indispensable à un champ en pleine mutation.

Domaines

Linguistique
Fichier non déposé

Dates et versions

hal-04097627 , version 1 (15-05-2023)

Identifiants

  • HAL Id : hal-04097627 , version 1

Citer

Olivier Baude. Des corpus oraux aux humanités numériques : aller et retour. 50 ans de linguistique sur corpus oraux : Apports à l'étude de la variation, Laboratoire Ligérien de Linguistique UMR 7270, Nov 2018, Orléans, France. ⟨hal-04097627⟩
29 Consultations
0 Téléchargements

Partager

More