Méthode pour l’annotation pragmatique des intentions implicites exprimées dans les questions
Résumé
Ce travail propose une annotation des intentions des locuteurs exprimées dans des questions lors d’interactions au quotidien, dans le but d’en effectuer la classification automatique. Les intentions correspondent ici à l’activité illocutoire d’un énoncé (Ducrot, 1972), qui permet de le caractériser selon son but, que celui-ci soit explicite – repérable directement dans l’énoncé – ou implicite – s’appuyant sur les connaissances communes des locuteurs – (Chen et coll., 2013). Elles s’inscrivent dans la continuité des recherches portant sur les actes de langage illocutoires (Austin, 1962), également définis comme des actions intentionnelles (Allen et Perrault, 1980), ainsi que sur les actes de langage directs et indirects (Searle, 1975). À partir de l’exploration des transcriptions du corpus ESLO, nous avons pu dégager des classes explicites (demande d’information et demande d’accord) et implicites (avis, doute et volonté) et ainsi constituer notre corpus de référence. Nous avons procédé à l’évaluation collaborative des étiquettes grâce à un formulaire en ligne proposant l’annotation de questions issues du corpus et à des mesures d’accord inter-annotateur. Celles-ci ont montré un accord supérieur à 0,73 pour l’explicite et à 0,6 pour l’implicite pour la moitié des participations et un accord supérieur à 0,86 pour l’explicite et à 0,8 pour l’implicite pour un quart des participations. Nous avons obtenu pour la tâche de classification automatique des questions en tant qu’intentions implicites des scores de précision, rappel et f-mesure avoisinant 0,62, ce qui montre une certaine cohérence entre les annotations manuelles et les étiquettes retrouvées automatiquement. Les enjeux de ce travail sont multiples car il s’agit d’établir une typologie permettant une analyse plus fine de la conversation en s’intéressant à des aspects nécessitant une interprétation.