Pascal Médeville s’exprime sur le nouveau traducteur automatique anglais-khmer proposé par le ministère cambodgien des Postes et Télécommunications qu’il a testé pour nous.
Le ministère cambodgien de l’Information a publié récemment un article annonçant le lancement d’un moteur de traduction automatique de l’anglais vers le khmer et vice-versa, proposé par le Département des technologies de l’information et de la communication du ministère cambodgien des Postes et Télécommunications.
La traduction automatique, ou traduction-machine, s’est largement développée ces dernières années et commence, malheureusement, à remplacer la traduction « humaine ». La « faute » à l’intelligence artificielle (IA), bien sûr.
Mais on a beau louer de façon dithyrambique les succès de l’IA, il n’en reste pas moins qu’elle n’a d’intelligence que le nom : en matière de traduction, elle se contente de s’appuyer sur de gigantesques bases de données créées à partir de corpus de textes bilingues, pour sélectionner et recracher, sans aucune analyse critique, les traductions qui lui semblent statistiquement les plus plausibles, ce qui donne souvent lieu à des aberrations.
Par exemple, demandez à Google Traduction de traduire « pleuvoir comme vache qui pisse » en anglais, et vous obtiendrez « rain like a pissing cow ». L’expression anglaise la plus proche serait « rain like a cow pissing on a flat rock » (pleuvoir comme une vache qui pisse sur une pierre plate), mais l’expression la plus courante serait plutôt « it’s raining cats and dogs » (il pleut des chats et des chiens). Idem, la machine traduit littéralement « pleuvoir des hallebardes » par « raining halberds », et « pleuvoir des cordes » par « raining down ».
Il faut savoir aussi que cette traduction automatique implique toujours un passage vers l’anglais : par exemple, pour traduire du chinois à l’italien, les moteurs de traduction automatique commencent par traduire du chinois vers l’anglais, puis de l’anglais vers l’italien, multipliant ainsi par deux les risques d’absurdités.
Si la traduction automatique entre langues courantes (p.ex. anglais-français) donne en général des résultats relativement acceptables, ces traductions automatiques doivent toujours et impérativement être relues par un traducteur professionnel. Si vous utilisez ces traductions directement sans les faire vérifier par un traducteur qualifié, vous risquez bien des déconvenues. Et ce n’est même pas la peine d’essayer de traduire les langues rares : les résultats sont le plus souvent risibles.
Pour en revenir au traducteur automatique cambodgien, il faut tout d’abord savoir que cet outil a une sérieuse limitation : il ne traduit que du texte. Si vous devez traduire le texte d’une image ou d’un pdf, il vous faudra d’abord le convertir au format texte… en sachant que la reconnaissance automatique des caractères (OCR) fonctionne pour l’instant assez mal pour le khmer.
La qualité des traductions produites est assez mauvaise, ce qui s’explique certainement par le fait que les corpus de textes bilingues anglais-khmer sont très limités. La machine n’a donc qu’une base de données réduite dans laquelle puiser les traductions les plus probables.
J’ai fait un test de traduction avec les deux phrases anglaises « rain like a cow pissing on a flat rock » et « it’s raining cats and dogs », les résultats sont édifiants .
La première phrase est traduite ភ្លៀងដូចគោ pissing នៅលើថ្មផ្ទះល្វែង : le système ne connaît pas le mot « pissing », et a donc choisi de le conserver en anglais… et il n’a pas compris que « flat » signifiait « plat » et non « appartement » et traduit donc l’expression « flat rock » par ថ្មផ្ទះល្វែង « pierre d’appartement » ;
Quant à la deuxième expression, elle est traduite par ភ្លៀងធ្លាក់ ហើយឆ្មានិងឆ្កែ : « la pluie tombe et chats et chiens », ce qui évidemment n’a aucun sens.
Le seul usage utile auquel je puisse penser pour cet outil de traduction automatique est de pouvoir obtenir, pour un non-khmérisant, une idée très vague de ce que pourrait signifier un texte khmer.
L’outil est disponible ici