Codage et interprétation du langage spontané d'enfants de 1 à 3 ans - Université Paris Nanterre Accéder directement au contenu
Article Dans Une Revue Corpus Année : 2007

Codage et interprétation du langage spontané d'enfants de 1 à 3 ans

Résumé

Transcription of oral data is a difficult art for it is a complex form of language activity which includes an interpretation process of other people's verbal productions. Ideally, researchers would prefer descriptions free of any interpretation, but this is impossible. A solution would be to follow a clear and simple consensual interpretation process, easily understood by all potential users of the data, using precise and clear coding standards, as unambiguous as possible, as well as linkage between the transcript and the multimedia recordings. This could be completed with an enriched context, both linguistic (phonology, syntax, semantic, pragmatic descriptions) and extra-linguistic (situation, action, descriptions of the surroundings...). In this paper, the technical difficulties of this type of coding are presented within the framework of the transcription process of young children's data. The tools and formats used are those of the CHILDES project with our own additions brought about by the choices we made to face the specific difficulties linked to transcription of child language data.
La transcription de corpus de langage oral est un art difficile car c'est une activité langagière. En particulier, elle inclut le processus d'interprétation des propos d'autrui que l'on trouve dans toute interaction langagière. Or ce qu'attend le scientifique est une description des données de langage qui s'affranchirait de cette interprétation, ce qui est impossible. On doit donc chercher à générer un processus d'interprétation simple, consensuel, qui puisse être compris par tout utilisateur d'un corpus. Pour cela, on utilise des normes de codage précises, claires, aussi peu ambiguës que possible, ainsi qu'un alignement sur du matériel sonore ou audiovisuel. On peut aussi accompagner les transcriptions d'un contexte très riche, soit langagier (phonologique, syntaxique, sémantique, pragmatique), soit extra-langagier (situation, actions, description de scène). Ces difficultés techniques sont présentées dans le cas de corpus de jeunes enfants (projet Léonard) qui exemplifie les problèmes de transcription de langage oral. Les outils et formats utilisés sont ceux du projet CHILDES avec des évolutions spécifiques qui reflètent les difficultés que nous avons relevées dans notre travail de corpus et les solutions adoptées.

Domaines

Linguistique
Fichier principal
Vignette du fichier
Morgen-Parisse-070920-ok.pdf (244.87 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00353020 , version 1 (14-01-2009)

Identifiants

  • HAL Id : halshs-00353020 , version 1

Citer

Aliyah Morgenstern, Christophe Parisse. Codage et interprétation du langage spontané d'enfants de 1 à 3 ans. Corpus, 2007, 6, pp.55-78. ⟨halshs-00353020⟩
199 Consultations
356 Téléchargements

Partager

Gmail Facebook X LinkedIn More