Vers la génération automatique de gloses pour la documentation automatique des langues - Traitement du Langage Parlé
Conference Papers Year : 2022

Vers la génération automatique de gloses pour la documentation automatique des langues

Shu Okabe
François Yvon

Abstract

Une étape du processus de la documentation d’une langue consiste à annoter des énoncés recueillis sur le terrain – après enregistrement et transcription phonétique – au niveau des morphèmes. Concrètement, pour chaque unité minimale segmentée dans la séquence d’entrée, il s’agit d’attacher soit une (plus rarement) plusieurs étiquettes morphosyntaxiques, soit une étiquette de concept, le plus souvent représenté par le mot anglais correspondant. Dans la perspective d’automatiser cette phase d’annotation, nous présentons les résultats d’une étude préliminaire où nous la considérons comme une tâche d’étiquetage de séquences, dont nous chercherons à estimer la difficulté, en la comparant à une tâche d’étiquetage morphosyntaxique standard. La question principale qui nous anime étant d’évaluer la faisabilité de cette annotation lorsque les données d’apprentissages sont très limitées.
Fichier principal
Vignette du fichier
8811.pdf (131.45 Ko) Télécharger le fichier
Origin Publisher files allowed on an open archive

Dates and versions

hal-03846843 , version 1 (14-11-2022)

Identifiers

  • HAL Id : hal-03846843 , version 1

Cite

Shu Okabe, François Yvon. Vers la génération automatique de gloses pour la documentation automatique des langues. Journées Jointes des Groupements de Recherche Linguistique Informatique, Formelle et de Terrain (LIFT) et Traitement Automatique des Langues (TAL), Nov 2022, Marseille, France. pp.198-203. ⟨hal-03846843⟩
163 View
57 Download

Share

More