Quelle technologie Google Traduction utilise-t-il ?
Google Traduction utilise la fréquence des paires de mots entre deux langues comme base de données pour ses résultats de traduction. Initialement, il s’appuyait sur la technologie de TA statistique, qui utilise un ensemble de traductions existantes (corpus) pour créer des modèles statistiques permettant de traduire des mots spécifiques dans les phrases.
Bien qu’efficace, les défauts de la TA statistique ont conduit Google à introduire la NMT en 2016. Elle est appelée « Google Neural Machine Translation » (GNMT).
Au lieu d’exécuter un ensemble de règles prédéfinies dès le départ, les réseaux neuronaux ; inspirés du fonctionnement du cerveau humain, peuvent traiter des phrases complètes comme exemples d’entrées (texte source) et de sorties (texte traduit) pour prédire le résultat de la traduction. Cela a permis d’améliorer la précision, la personnalisation, la rentabilité et l’évolutivité.
Comment Google Traduction s’est-il amélioré au fil du temps ?
L’amélioration de la qualité de sa traduction a été un processus lent pour Google et il lui a fallu environ une décennie pour passer à un modèle plus efficace. Il n’est pas resté inactif pendant ces 10 ans pour autant.
En prenant conscience des failles de son approche SMT, il a déployé beaucoup d’efforts pour améliorer la qualité de ses traductions.
Est-ce que Google Translate est précis et peut-on lui faire confiance ?
Comme la langue et la traduction sont toutes deux des catégories dynamiques qui reflètent intrinsèquement des processus, la précision doit également être considérée comme un concept relatif. L’exactitude de la traduction dépendra de l’intention originale de l’auteur et de la destination du message. Par exemple, les attentes en matière d’exactitude de la grammaire, du style et du registre pour un courriel seront très différentes des attentes en matière d’exactitude pour un roman.
Une opinion fréquemment entendue est que le service gratuit de TA de Google Traduction est suffisamment exact pour la plupart des utilisateurs parce qu’ils ont besoin de traduire des messages simples et ce qui compte le plus est que le public soit capable d’en saisir le sens plutôt que le message « natif » complet. Il peut alors être considéré comme suffisamment précis car les attentes sont faibles.
Voici où l’outil de TA gratuit de Google Traduction manque surtout de précision :
- lorsqu’il est utilisé comme un dictionnaire pour traduire des mots uniques : Google Traduction peine à produire un résultat précis, c’est-à-dire conforme à l’intention de l’auteur, en raison des nombreuses significations qu’un seul mot peut avoir ; cela est vrai pour l’anglais comme pour les autres langues largement parlées ;
- selon les paires de langues, de meilleurs résultats sont obtenus entre les langues les plus « courantes » ;
- lors de la traduction d’expressions familières qui n’ont pas d’équivalent direct dans la langue cible ;
- lorsque les expressions non verbales constituent une partie importante du message ;
- lorsque les règles grammaticales ne sont pas correctement utilisées dans la langue source ou utilisées différemment dans la langue cible, comme le subjonctif en anglais.
Google Traduction sera-t-il un jour parfait ?
La traduction ne consiste pas seulement à convertir des mots d’une langue dans une autre. Si c’était le cas, un dictionnaire serait le seul outil nécessaire du métier et nous avons tous vu les très mauvais (et parfois très drôles) résultats de travailler de cette façon. En effet, un message n’est pas seulement composé de mots ; il contient également un contexte, une intention, des aspects non verbaux, etc.
Cela dit, Google Tradution a rapidement progressé au fil des ans mais il ne peut toujours pas faire beaucoup de choses que les traducteurs humains peuvent faire :
- poser des questions ;
- comprendre le contexte ;
- recevoir l’ironie ;
- traduire de manière créative ;
- faire des choix réfléchis ;
- faire des recherches ;
- observer la cohérence ;
- garantir l’exhaustivité ;
- l’exclusion ou l’inclusion délibérée d’informations.
Nul ne sait si et quand la technologie pourra atteindre le niveau humain d’acuité sémantique, mais c’est exactement l’objectif de beaucoup. L’informatique quantique, par exemple, vise à augmenter le nombre d’opérations et de données pouvant être traitées, de sorte qu’un jour, elle pourra peut-être apprendre sans interaction humaine et mieux comprendre la création du langage.