Can Synthetic Translations Improve Bitext Quality?

Briakou, Eleftheria; Carpuat, Marine

doi:10.18653/v1/2022.acl-long.326

Citation Details

Can Synthetic Translations Improve Bitext Quality?

Synthetic translations have been used for a wide range of NLP tasks primarily as a means of data augmentation. This work explores, instead, how synthetic translations can be used to revise potentially imperfect reference translations in mined bitext. We find that synthetic samples can improve bitext quality without any additional bilingual supervision when they replace the originals based on a semantic equivalence classifier that helps mitigate NMT noise. The improved quality of the revised bitext is confirmed intrinsically via human evaluation and extrinsically through bilingual induction and MT tasks. more »

Award ID(s):: 1750695

PAR ID:: 10399217

Author(s) / Creator(s):: Briakou, Eleftheria; Carpuat, Marine

Date Published:: 2022-05-01

Journal Name:: Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)

Page Range / eLocation ID:: 4753 to 4766

Format(s):: Medium: X

Sponsoring Org:: National Science Foundation

Free Publicly Accessible Full Text
Accepted Manuscript1.0
Conference Paper:
https://doi.org/10.18653/v1/2022.acl-long.326

More Like this