Bilingual Synchronization: Restoring Translational Relationships with Editing Operations

Jitao Xu; Josep Crego; François Yvon

Communication Dans Un Congrès Année : 2022

Bilingual Synchronization: Restoring Translational Relationships with Editing Operations

(1) , (2) , (1)

1
2

Jitao Xu

Fonction : Auteur
PersonId : 184998
IdHAL : xujitao

Traitement du Langage Parlé - LISN

Josep Crego

Fonction : Auteur
PersonId : 1178167

SYSTRAN

François Yvon

Fonction : Auteur
PersonId : 5347
IdHAL : francois-yvon
ORCID : 0000-0002-7972-7442
IdRef : 057593531

Traitement du Langage Parlé - LISN

Résumé

Machine Translation (MT) is usually viewed as a one-shot process that generates the target language equivalent of some source text from scratch. We consider here a more general setting which assumes an initial target sequence, that must be transformed into a valid translation of the source, thereby restoring parallelism between source and target. For this bilingual synchronization task, we consider several architectures (both autoregressive and non-autoregressive) and training regimes, and experiment with multiple practical settings such as simulated interactive MT, translating with Translation Memory (TM) and TM cleaning. Our results suggest that one single generic edit-based system, once fine-tuned, can compare with, or even outperform, dedicated systems specifically trained for these tasks.

Domaines

Informatique et langage [cs.CL]

Fichier principal

emnlp_arxiv.pdf (336.03 Ko)

Origine	Fichiers produits par l'(les) auteur(s)

Jitao Xu : Connectez-vous pour contacter le contributeur

https://hal.science/hal-03827010

Soumis le : lundi 24 octobre 2022-14:32:43

Dernière modification le : mardi 6 février 2024-14:40:08

Archivage à long terme le : mercredi 25 janvier 2023-19:15:51

Dates et versions

hal-03827010 , version 1 (24-10-2022)

Licence

Paternité

Identifiants

HAL Id : hal-03827010 , version 1

Citer

Jitao Xu, Josep Crego, François Yvon. Bilingual Synchronization: Restoring Translational Relationships with Editing Operations. The 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), Dec 2022, Abou Dabi, United Arab Emirates. ⟨hal-03827010⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA CENTRALESUPELEC GENCI UNIV-PARIS-SACLAY LISN GS-COMPUTER-SCIENCE LISN-TLP

240 Consultations

70 Téléchargements

Bilingual Synchronization: Restoring Translational Relationships with Editing Operations

Résumé

Domaines

Dates et versions

Licence

Identifiants

Citer

Exporter

Collections

Partager