THE RELIABILITY AND LIMITATIONS OF GOOGLE TRANSLATE: A BILINGUAL, BIDIRECTIONAL AND GENRE-BASED EVALUATION – Blanca Roig Allué, Universidad de Zaragoza

 En Publicaciones

ABSTRACT
The popularity of machine translation systems (or CAT, computer-assisted translation), which enable their users to obtain automatically generated translations of any text, has been increasing ever since they were created. One of the most widely used machine translation is Google Translate, a statistical system whose performance is the object of study of this paper. In order to evaluate its reliability, a small-scale study has been carried out in which translations of tourist texts and football match reports published online generated by the tool have been analysed, and the most representative mistakes found in terms of frequency have been classified at a lexicogrammatical, syntactic, pragmatic and punctuation level. Based on these findings, the main linguistic limitations of Google Translate have been established. It is worth highlighting the fact that three crucial variables have intervened in the corpus compilation, namely language (English/Spanish), direction of the translation (English into Spanish and vice versa) and genre of the texts (tourist and sports).
RESUMEN
La popularidad de los sistemas de traducción automática, que permiten a los usuarios obtener al instante traducciones de cualquier texto, se ha visto aumentada desde su creación. Uno de los sistemas más utilizados es Google Translate, herramienta de traducción automática estadística en la que se centra este trabajo. Con el objetivo de evaluar su fiabilidad, se han analizado traducciones de textos turísticos y de resúmenes de partidos de fútbol en línea, proporcionadas por la herramienta, y los errores más relevantes de las mismas se han clasificado en cuatro categorías: léxico-gramaticales, sintácticos, pragmáticos y de puntuación. A través de esta clasificación, se han determinado las principales limitaciones lingüísticas de Google Translate. Es importante mencionar las tres variables fundamentales que se han combinado para la creación del corpus: idioma (inglés/español), dirección de la traducción (de inglés a español y viceversa) y género de los textos (turísticos y de prensa deportiva).

https://revistas.uma.es/index.php/revtracom/article/view/11240/11584
Contacta con nosotros

Puedes enviarnos un email y te responderemos lo antes posible, gracias.

Not readable? Change text.

Escriba el texto y presione enter para buscar