Clasificación de errores y comparación de las traducciones español‒finés de los traductores automáticos MT@EC y eTranslation de la Comisión Europea
Tuohisaari, Annika (2019-03-22)
Clasificación de errores y comparación de las traducciones español‒finés de los traductores automáticos MT@EC y eTranslation de la Comisión Europea
Tuohisaari, Annika
(22.03.2019)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2019042913581
https://urn.fi/URN:NBN:fi-fe2019042913581
Tiivistelmä
En este trabajo de fin de máster categorizamos los errores cometidos por los traductores automáticos de la Comisión Europea en sus traducciones español‒finés. El traductor más antiguo, MT@EC, está basado en estadísticas, y el traductor más moderno, eTranslation, se basa en redes neuronales. También evaluamos la calidad de las traducciones desde el punto de vista del post-editor. Finalmente comparamos la frecuencia y el tipo de los errores cometidos y el nivel de calidad entre las traducciones.
Nuestro objetivo es ofrecer información útil tanto para los post-editores de las traducciones como para los programadores de los sistemas de la traducción automática. Asimismo, queremos introducir el concepto de la traducción automática, que es cada vez más utilizada en el campo de la traducción, y plantear los retos surgidos a la hora de traducir del o al finés.
Como método de investigación usamos análisis manual y cualitativo de errores. Analizamos los segmentos traducidos con profundidad, categorizando todos los errores encontrados y post-editando los segmentos para formar traducciones de referencia. Finalmente calculamos la frecuencia de cada tipo de error y comparamos los resultados entre los traductores. Clasificamos la calidad de los segmentos en cinco niveles: ok, edit+, edit, edit- y malo, basándonos en el esfuerzo cognitivo requerido a la hora de post-editarlos.
Observamos que eTranslation comete menos errores en sus traducciones (365) que MT@EC (460). Categorizamos los errores en ocho tipos: error morfológico; declinación y conjugación, sinónimo incorrecto, traducción incorrecta, palabra extra, palabra ausente, error en la puntuación y error en el orden de palabras. Los tipos de errores más frecuentes en caso de los dos traductores son las palabras ausentes (MT@EC 32% del total, eTranslation 22% del total) y los errores morfológicos (MT@EC 22%, eTranslation 25%). ETranslation produce más segmentos con nivel de calidad edit+ y edit que MT@EC.
Concluimos que eTranslation produce menos errores y calidad más fácil de post-editar, por tanto, calidad más alta. Es necesario modificar ligeramente las clasificaciones de errores ya existentes. Comprobamos que aún queda mucho para que las traducciones español‒finés alcancen una calidad aceptable: depende de la cantidad disponible del corpus y de calidad del mismo y, por ejemplo, de la distinta y variada tipología del finés. No obstante, observamos que la calidad es suficiente para post-editar las traducciones. En el futuro sería fructífero estudiar los errores morfológicos distinguiendo entre casos gramaticales o analizar cómo afecta el tipo de texto en la frecuencia de los errores.
Nuestro objetivo es ofrecer información útil tanto para los post-editores de las traducciones como para los programadores de los sistemas de la traducción automática. Asimismo, queremos introducir el concepto de la traducción automática, que es cada vez más utilizada en el campo de la traducción, y plantear los retos surgidos a la hora de traducir del o al finés.
Como método de investigación usamos análisis manual y cualitativo de errores. Analizamos los segmentos traducidos con profundidad, categorizando todos los errores encontrados y post-editando los segmentos para formar traducciones de referencia. Finalmente calculamos la frecuencia de cada tipo de error y comparamos los resultados entre los traductores. Clasificamos la calidad de los segmentos en cinco niveles: ok, edit+, edit, edit- y malo, basándonos en el esfuerzo cognitivo requerido a la hora de post-editarlos.
Observamos que eTranslation comete menos errores en sus traducciones (365) que MT@EC (460). Categorizamos los errores en ocho tipos: error morfológico; declinación y conjugación, sinónimo incorrecto, traducción incorrecta, palabra extra, palabra ausente, error en la puntuación y error en el orden de palabras. Los tipos de errores más frecuentes en caso de los dos traductores son las palabras ausentes (MT@EC 32% del total, eTranslation 22% del total) y los errores morfológicos (MT@EC 22%, eTranslation 25%). ETranslation produce más segmentos con nivel de calidad edit+ y edit que MT@EC.
Concluimos que eTranslation produce menos errores y calidad más fácil de post-editar, por tanto, calidad más alta. Es necesario modificar ligeramente las clasificaciones de errores ya existentes. Comprobamos que aún queda mucho para que las traducciones español‒finés alcancen una calidad aceptable: depende de la cantidad disponible del corpus y de calidad del mismo y, por ejemplo, de la distinta y variada tipología del finés. No obstante, observamos que la calidad es suficiente para post-editar las traducciones. En el futuro sería fructífero estudiar los errores morfológicos distinguiendo entre casos gramaticales o analizar cómo afecta el tipo de texto en la frecuencia de los errores.