Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus - Université Paris Nanterre Accéder directement au contenu
Thèse Année : 2021

Intersecting views on online reviews : NLP and corpus linguistics approaches

Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus

Hyun Jung Kang
  • Fonction : Auteur
  • PersonId : 1070101

Résumé

This thesis aims to study evaluative language in online restaurant reviews. Opinion mining, in which we are interested, has become an active research area in Natural Language Processing (NLP) for its practical aspects, such as monitoring or analyzing trends of opinions over a period of time. Thus, online reviews play a significant role in the digital era. We show why reviewers write their opinions, analyze the linguistic devices used to express and share their experiences, and identify the characteristics of evaluative language in online reviews. Throughout this study, we used linguistic tools and NLP methods to study the evaluative language. Finally, we assessed the generalizability of our approach to other reviews of a different domain (hotel) and language (Korean).
Cette thèse vise à étudier des évaluations de restaurants rédigées par des clients en ligne. Elle s’inscrit dans le domaine du traitement automatique des langues (TAL) et relève de la fouille d’opinions, devenue essentielle dans de nombreux champs d’application tels que la veille d’opinions et l’analyse de tendances ou de marchés. Les évaluations diffusées en ligne occupent ainsi une place importante dans l’ère numérique. L’étude réalisée permet de montrer les raisons qui poussent les clients à laisser leurs avis, d’analyser les moyens linguistiques qu’ils utilisent pour exprimer et partager leurs expériences, ainsi que de relever les caractéristiques propres aux évaluations rédigées en ligne. Pour atteindre cet objectif, le corpus est étudié en exploitant les méthodes de linguistique outillée et du TAL. La détection automatique d’informations contenues dans l’évaluation est réalisée. La généralisabilité du modèle développé est testée ensuite sur d’autres données : un corpus relevant du domaine de l’hôtellerie et un corpus écrit dans une autre langue – le coréen.
Fichier non déposé

Dates et versions

tel-04110670 , version 1 (30-05-2023)

Identifiants

  • HAL Id : tel-04110670 , version 1

Lien texte intégral

Citer

Hyun Jung Kang. Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus. Informatique et langage [cs.CL]. Université Paris Nanterre, 2021. Français. ⟨NNT : 2021PA100037⟩. ⟨tel-04110670⟩
20 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More