Reglamento General de Protección de Datos
Trucos y métodos

Un método sencillo para convertir textos bilingües en forma de tabla en memorias en formato TMX

En esta entrada vamos a explorar un método sencillo para convertir textos bilingües en forma de tabla en memorias de traducción en formato TMX.

Al traducir, en muchas ocasiones utilizamos como referencia textos de carácter oficial que ya están disponibles en varios idiomas. Así, es de esperar que nuestra traducción respete los términos y expresiones empleados. Pensemos en normas y estándares, legislación europea o incluso la propia Constitución española.

En muchos casos basta con descargarnos en pdf las versiones de los idiomas con los que estemos trabajando e ir haciendo búsquedas a medida que vamos encontrando términos dudosos o citas extraídas de la norma. Pero parece que no es la forma más segura ni más rápida de sacarle todo el jugo a estos bitextos.

Por suerte, hay formas mucho más prácticas de aprovechar esa documentación, por ejemplo, si convertimos los dos textos en una memoria y los incorporamos a nuestro proyecto. Para ello yo utilizo dos métodos:

  • alineación con SDL Trados
  • creación de archivos TMX con Xbench

Aunque la alineación con SDL Trados (o herramientas similares como la gratuita LF Aligner) es muy útil cuando disponemos de dos documentos independientes, en esta entrada nos vamos a centrar en la segunda opción, perfecta cuando los textos están en formato de tabla.

Además, Xbench es una herramienta independiente (con una versión freeware), muy completa y compatible con numerosos programas de traducción asistida.

El método

Para nuestro ejemplo partiremos de un documento muy en boga estos últimos tiempos: el Reglamento (UE) 2016/679 sobre el tratamiento de datos personales. Como ya sabemos, un reglamento europeo es un acto legislativo vinculante, que los Estados miembros de la Unión deben aplicar directamente y en su totalidad.

El Reglamento general de protección de datos (RGPD) entró en vigor en España el 25 de mayo de 2018, por lo que muchas empresas tomaron medidas para cumplirlo y publicaron documentación al respecto que hubo que traducir. En nuestras traducciones era fundamental que respetásemos la terminología y el estilo en citas y alusiones al reglamento.

En este ejemplo, trabajaremos con las versiones del RGPD en inglés y español.

Selección del texto bilingüe

Lo primero que debemos hacer es localizar el documento en sus versiones correspondientes. Para ello, lo más fácil es acudir a EURLex, la base de datos de legislación de la UE. Aparece la siguiente página de resultados:

Como vemos, el primer resultado de la búsqueda es el reglamento que necesitamos. Al hacer clic en él, se abre una nueva pantalla en la podemos elegir descargar los documentos o ver hasta tres idiomas en paralelo.

Si elegimos inglés y español, el resultado es este:

RGPD bilingüe inglés español

Solo tenemos que seleccionar el texto con el puntero, copiarlo y pegarlo en un documento. Como la alineación entre textos (sobre todo si son largos) no siempre es correcta y resulta más fácil de revisar en Word, yo suelo hacerlo así. Una vez bien alineados los textos, habrá que copiar la tabla y pegarla en Excel (si no hubiera problemas de alineación, es evidente que este paso nos lo podríamos saltar y pegar directamente en Excel el texto de la web).

El resultado en Word es este:

Y, en Excel, este otro:

El siguiente paso es guardar el archivo de Excel como texto delimitado por tabulaciones (*.txt) para después poder cargarlo en Xbench.

Conversión en Xbench

Tras abrir Xbench, debemos crear un proyecto nuevo. En la ventana de propiedades del proyecto, tras hacer clic en “Agregar” se abrirá la ventana de tipos de archivos.

En ella elegiremos “Texto delimitado por tabulaciones” y, tras hacer clic en “Siguiente” buscaremos y seleccionaremos nuestro archivo. Una vez cargado tendrá este aspecto:

Ahora tenemos que convertirlo a TMX y, para ello, solo hay que hacer clic en “Herramientas” > “Exportar elementos”. Aparecerá la siguiente ventana:

En esta ventana podemos configurar distintos ajustes y el formato en el que queremos exportar nuestra tabla. En este caso, elegiremos una memoria TMX con la combinación de idiomas correspondiente, y le asignaremos un nombre de archivo y una ruta.

El archivo TMX se guardará y, a continuación, podremos agregarlo a nuestra herramienta TAO como referencia. ¡Listo!

Conclusión

Una vez que le pillamos el truco al proceso, convertir una tabla en una memoria de traducción es realmente rápido y nos permitirá generar fácilmente distintos corpus a partir de textos bilingües para agilizar nuestro trabajo y garantizar la coherencia de nuestras traducciones especializadas.