AMETRA
Ayuda a la traducción basada en memorias de traducción.

Documentos, informes y especificaciones

 

AMETRA es un proyecto tecnológico de cooperación, cofinanciado por el Departamento de Industria del Gobierno Vasco, a través del INTEK.

Objetivos del proyecto

Descripción del objetivo

El proyecto AMETRA se sitúa en el terreno de los sistemas de memorias de traducción y tiene como objetivo el desarrollo de una herramienta de Traducción Asistida por Ordenador (TAO), en la que se combinen técnicas de Memorias de Traducción, Análisis Lingüístico y Métodos Estadísticos.
Se plantea como continuación natural del proyecto ACOTE (2000-2001), cuyo objeto era el desarrollo de útiles de ayuda a la traducción (alineador de corpus bilingües y visualizador de concordancias).

Al igual que en el anterior proyecto, las lenguas tratadas serán el castellano y el euskera, y se plantea su aplicación en el ámbito de las traducciones administrativas (boletines oficiales, documentos legales, etc.).

Formalización del objetivo

La práctica totalidad de sistemas de ayuda a la traducción (Trados, WordFast...) se basan en comparaciones de las frases de entrada con las almacenadas en las memorias de traducción, y utilizan para ello técnicas basadas en lógica difusa, que dan como resultado las frases almacenadas en la base de datos que más se asemejan formalmente a la frase de entrada, expresando dicha similitud en porcentajes. Últimamente, algunos (principalmente, DéjàVu) han aplicado técnicas de análisis lingüístico, pero a un nivel muy superficial, para conseguir cierto tipo de segmentación inferior a la frase. Dicho análisis lingüístico se limita a las derivaciones de palabras que se puedan establecer a nivel formal, y a la etiquetación de categoría gramatical para cada una de las palabras. En ninguno de los casos se aplican técnicas de análisis estadístico orientado a los corpus y la traducción.

A consecuencia de las limitaciones de los actuales sistemas basados en memorias de traducción, el grado de insatisfacción de los traductores humanos que utilizan estos programas es alto, debido en gran medida a que el grado de similitud real entre las unidades de traducción de los textos supuestamente repetitivos es bastante menor de lo que a primera vista podría parecer.

Partiendo de la experiencia que en diversos campos poseemos los participantes en este proyecto, nuestra propuesta es la aplicación, de forma cooperante, de diversos análisis y modelos, para poder aprovechar la repetición y similitud real (no formal) de los textos para la creación de nuevas traducciones. Se propone utilizar e integrar las siguientes técnicas:

Asimismo, se integrarán también los siguientes mecanismos suplementarios:

La aplicación cooperante, en una sola herramienta, de todas esas técnicas, nos hace presuponer un avance importante en la productividad de los traductores humanos y una mejora de expectativas de cara a la traducción automática.

Génesis del objetivo

Entendemos este proyecto como continuación natural del proyecto ACOTE, que a su vez surgió de la necesidad planteada en diversas ocasiones por diferentes grupos de traductores de textos al euskera, de una herramienta que permita aprovechar el corpus de textos alineados disponible para facilitar la traducción de textos que generan un bajo nivel de variaciones fundamentales.

Objetivos del futuro próximo

El resultado del proyecto AMETRA proporcionará las bases suficientes para la creación de un sistema de Traducción Automática Basada en Ejemplos (EBMT, Example-Based Machine Translation). Dicho objetivo de futuro supondría el paso de la Traducción Asistida por Ordenador (TAO), a la Traducción Automática (TA) para textos en cuyo ámbito existan corpus bilingües mínimamente significativos.

PARTICIPANTES

ENTIDADES

Adur Software Productions S.C.: Líder
Rosetta Testu Zerbitzuak, S.L.

ENTIDAD SUBCONTRATADA

Institut Tecnològic d’Informàtica

AGENTES DE LA RED VASCA DE TECNOLOGIA

Ametzagaiña A.I.E.: Agente tecnológico
UPV-EHU: Agente tecnológico

DURACION DEL PROYECTO

Enero 2002 - Diciembre 2004