Sur les limites de l'identification par l'humain de textes générés automatiquement

La génération de textes neuronaux fait l'objet d'une grande attention avec la publication de nouveaux outils tels que ChatGPT. La principale raison en est que la qualité du texte généré automatiquement peut être attribuée à un·e rédacteurice humain·e même quand l'évaluation est faite par un humain. Dans cet article, nous proposons un nouveau corpus en français et en anglais pour la tâche d'identification de textes générés automatiquement et nous menons une étude sur la façon dont les humains perçoivent ce texte. Nos résultats montrent, comme les travaux antérieurs à l'ère de ChatGPT, que les textes générés par des outils tels que ChatGPT partagent certaines caractéristiques communes mais qu'ils ne sont pas clairement identifiables, ce qui génère des perceptions différentes de ces textes par l'humain.

Mots clés

identification humaine génération de texte avec des modèles neuronaux ChatGPT

Domaines

Informatique et langage [cs.CL]

Fichier principal

0930.pdf (77.52 Ko)

Origine	Fichiers éditeurs autorisés sur une archive ouverte

Matthieu Labeau : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-04623002

Soumis le : vendredi 28 juin 2024-11:15:11

Dernière modification le : lundi 9 décembre 2024-03:31:00

Dates et versions

hal-04623002 , version 1 (28-06-2024)

Licence

Paternité

Identifiants

HAL Id : hal-04623002 , version 1

Citer

Nadège Alavoine, Maximin Coavoux, Emmanuelle Esperança-Rodier, Romane Gallienne, Carlos-Emiliano González-Gallardo, et al.. Sur les limites de l'identification par l'humain de textes générés automatiquement. 35èmes Journées d'Études sur la Parole (JEP 2024) 31ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2024) 26ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2024), Jul 2024, Toulouse, France. pp.18-19. ⟨hal-04623002⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-TLSE2 UNIV-RENNES1 UGA CNRS INRIA UNIV-PARIS3 INSA-RENNES IRISA LIG LIG_TDCGE_GETALP UT1-CAPITOLE CENTRALESUPELEC UR1-MATH-STIC UNIV-PARIS-SACLAY UR1-UFR-ISTIC UNIV-ROCHELLE UNIV-RENNES IRIT IRIT-IRIS TALN-RECITAL UR1-MATH-NUM LISN IRIT-GD GS-COMPUTER-SCIENCE LIG_SIDCH TOULOUSE-INP UNIV-UT3 UT3-TOULOUSEINP JEP-TALN-RECITAL2024

353 Consultations

114 Téléchargements