A favor del uso de los corpus electrónicos en la enseñanza de la traducción

In Favour of the Use of Electronic Corpora in the Teaching of Translation

 

Stéphane Patin - stephane.patin@u-paris.fr

Universidad de París, Francia

 

Resumen

Este trabajo pretende demostrar en qué medida los distintos corpus electrónicos constituyen una herramienta complementaria en la labor traslativa y en su enseñanza. En una primera parte, se definirá el marco teórico, el de la traductología de corpus en que se sustenta el uso de los corpus en la labor traslativa; luego, se explicará cómo, paradójicamente, los corpus, aunque omnipresentes en el entorno del traductor, le son invisibles. Luego, tras exponer las reflexiones sobre las ventajas de los corpus en traducción, se ilustrará esta perspectiva mediante la compilación ad hoc de un minicorpus especializado    y su explotación.

 

Palabras clave: corpus electrónicos, enseñanza, traducción

 

Abstract

This study aims to demonstrate the extent to which the various electronic corpus constitute a complementary tool in translational work and in its teaching. In the first part, the theoretical framework will be defined, that of corpus-based translation studies, which supports the use of corpus in translational work. Then, it will be explained how paradoxically, corpus, although omnipresent in the translator's environment, are invisible to him/her. Then, after exposing the reflections on the advantages of corpus in translation, this perspective will be illustrated through the compilation of a specialized ad hoc minicorpus and its exploitation.

 

Keywords: electronic corpus, teaching, translation

 


A favor del uso de los corpus electrónicos en la enseñanza de la traducción

 

1. Introducción

 

El mundo de la traducción y de la traductología ha cambiado mucho en estos últimos dos decenios. La irrupción informática de principios del siglo XX trajo nuevas herramientas a los traductores y a los traductólogos, herramientas que permitieron perspectivas nuevas en la traducción como proceso (actividad traslativa) y como producto (texto traducido). Entre los traductores profesionales, el modo de trabajar cambió radicalmente con los programas de traducción asistida por ordenador (TAO) y con las memorias de traducción integradas (MT). La traducción automática (TA) se está instalando no para reemplazar la biotraducción, sino para ofrecer una herramienta de ayuda suplementaria y complementaria. Los investigadores en traductología, ya desde los años 90, se interesaron en la manera en que el análisis de traducciones compiladas en corpus podía permitir analizar la labor traslativa, comparando, entre otros, la lengua traducida con la lengua no traducida. Esos mismos investigadores, muchas veces formadores de futuros traductores en centros universitarios, se centraron en la manera en que el uso de esos bancos de datos lingüísticos podían mejorar la formación de los estudiantes con la adquisición de competencias para las distintas fases del proceso traslativo: comprensión y análisis del texto fuente, búsqueda de información, toma de decisión en la reformulación en la lengua meta, posedición y revisión.

El presente trabajo versa sobre el uso de los corpus electrónicos en la enseñanza de la traducción y la formación para traductores. Pero antes de entrar en el meollo de la cuestión, quisiéramos aportar dos aclaraciones de índole terminológica. Primero, cuando hablamos de traducción nos referimos exclusivamente a la traducción especializada, es decir, a la traducción de un texto de lengua natural considerada como instrumento de transmisión de conocimiento especializado. Segundo, cuando hablamos de corpus electrónicos remitimos a los bancos de datos textuales utilizables de manera automática y sistemática, es decir, de manera informática.

Ahora bien, si el uso de los corpus electrónicos en el ámbito de la docencia en traducción es un tema que dista de ser novedoso en la investigación[1], su uso entre los traductores profesionales es poco frecuente no por ser desconocido, sino por el hecho de que estos prefieren usar otras herramientas, entre ellas, las memorias de traducción. En efecto, los corpus no han adquirido aún el estatus de la herramienta de ayuda para la traducción que deseamos que sea, como traducción asistida por ordenador (TAO).

Por ello, el trabajo pretende demostrar que:

- la compilación y la explotación de corpus no son ni fastidiosas ni laboriosas, sino que permiten ganar tiempo y calidad;

- que los corpus dan información que otras herramientas no dan, en cuanto al uso de la lengua en contexto;

- que los distintos corpus pueden ser útiles en función de la etapa de proceso de traducción;

- y que, al fin y al cabo, los corpus pueden adquirir el estatus de herramienta de traducción asistida por ordenador.

De ahí que este trabajo se articule en tres ejes. Primero, abordaremos el marco teórico de la traductología de corpus en que se sustenta el uso de los corpus en la labor traslativa; luego, se explicará cómo, paradójicamente, los corpus, aunque omnipresentes en el entorno del traductor, le son invisibles a él. Por último, tras exponer las reflexiones sobre las ventajas de los corpus en traducción, se ilustrará esa perspectiva mediante la compilación de un minicorpus ad hoc especializado y su explotación, para recalcar cómo ese tipo de corpus puede ayudar al traductor en sus opciones de traducciones.

 

2. La traductología de corpus

 

Los corpus-based translation studies, estudios de traducción basados en corpus o traductología de corpus (Loock, 2012), reúnen los preceptos de la lingüística de corpus aplicados a la traductología. En otras palabras, son el fruto del encuentro entre la traductología descriptiva y la lingüística de corpus (Laviosa, 2002). De ahí que repasemos los preceptos de esas dos disciplinas.

 

2.1. La traductología

 

La traductología, translation studies (Holmes, 1972), es la disciplina que se interesa en «el complejo de problemas que se agrupan en torno al fenómeno de la traducción y de las traducciones» (Holmes, 1988, p. 67). Esa definición fundadora tiene el mérito de considerar la traducción no solo como un proceso cognitivo y comunicativo (actividad traslativa), sino también como el resultado de ese proceso. Hurtado Albir (1996, p. 53) basándose en las ramas de la traductología propuesta por Holmes (1988) —la descriptiva, la teórica y la aplicada—, determina seis variables objeto de estudio: si se considera la traducción como proceso o como resultado, la noción que se analiza (equivalencia, invariable, unidad de traducción, etc.), el problema de traducción estudiado en concreto (metáfora, nombre propio, humor, ironía, etc.), la variedad de traducción analizada, las lenguas y culturas implicadas en el análisis, y la dimensión histórica (enfoque sincrónico o diacrónico). De esta manera, bien entendemos que los enfoques de la traductología pueden ser varios: estudios descriptivos o aplicados, estudios lingüísticos y comparativos, estudios socioculturales, estudios psicolingüísticos, estudios filosófico-hermenéuticos.

 

2.2. La lingüística de corpus

 

La lingüística de corpus, de índole funcionalista en oposición al formalismo, tiene como objetivo analizar datos lingüísticos empíricos que proceden de la lengua «auténtica»[2], actualizada en contexto, para describir la lengua, el habla, en el sentido saussuriano, de alguna comunidad lingüística dada. Para ello, se vale de la descripción del uso observado en textos digitales compilados en corpus para llegar a la regla de gramática y apreciar si el uso se aleja o no de ella.

De esta manera, para la lingüística de corpus, un corpus sirve como herramienta de indagación. En efecto, según la definición canónica de Sinclair (1991, p. 171) el corpus es «[...] una colección de textos de ocurrencias de lenguaje natural, escogidos para caracterizar un estado o una variedad de lengua». Crystal (1991, p. 32) enriquece la anterior definición afirmando que es «una colección de datos lingüísticos, ya sea de textos escritos o de transcripciones de habla grabada, que pueden ser utilizados como punto de partida para descripciones lingüísticas o como un medio de verificación de hipótesis acerca de una lengua». El grupo EAGLES (1996), en un proyecto europeo, apunta la dimensión computacional del estudio de los corpus:

 

una colección de partes de una lengua que son seleccionadas y ordenadas de acuerdo a explícitos criterios lingüísticos, con el fin de ser empleadas como ejemplos de esa lengua […] Un corpus es codificado de un modo estandarizado y homogéneo para responder a tareas específicas de recuperación (EAGLES, 1996, p. 4).

 

Parodi (2008, p. 106) coincide, afirmando que un corpus es un «conjunto amplio de textos digitales de naturaleza específica que cuenta con una organización predeterminada en torno a categorías identificables para la descripción y análisis de una variedad de lengua» y que su análisis se realiza mediante herramientas informáticas.

Si tomamos en cuenta las definiciones anteriores, podemos considerar que se destacan tres características. 1) En cuanto a su índole, un corpus debe estar compuesto por textos producidos en situaciones reales. 2) En cuanto a su estructura y finalidad, los criterios de compilación de los datos textuales deben ser explícitos para que sus objetivos estén claros. 3) En cuanto a la metodología de análisis, un corpus debe estar disponible en formato electrónico con el fin de ser analizado por medio de programas informáticos.

De hecho, Parodi (2008, p. 95) define la lingüística de corpus con esos mismos parámetros: «constituye un conjunto o colección de principios metodológicos para estudiar cualquier dominio lingüístico y se caracteriza por brindar sustento a la investigación de la lengua en uso a partir de corpus lingüísticos con sustrato en tecnología computacional y programas informáticos ad hoc».

 

2.3. La traductología de corpus

 

Desde hace unos veinte años, aprovechando la revolución informática de finales del siglo XX, la traductología de corpus adopta un enfoque lingüístico de los fenómenos de traducción a partir de corpus constituidos por textos digitales mediante su explotación automática para sacar a la luz los fenómenos de traducción más significativos.

La traductología de corpus se vale, principalmente, de dos tipos de corpus. Los corpus paralelos que compilan textos en lengua de origen junto con sus traducciones en una (varias) lengua(s) meta, y los corpus comparables que aúnan textos de lenguas originales o traducidas con temáticas y características enunciativas similares. A esa metodología, se le asignan tres objetivos, entre los cuales dos son de índole descriptiva y aplicada.

Desde su vertiente aplicada, la traductología de corpus constituye una herramienta complementaria en traducción, que puede ser útil para los estudiantes y para los profesionales, tanto más cuanto que los corpus forman parte del entorno del (aprendiz) traductor sin que lo sepa forzosamente. Es esa paradoja la que vamos a tratar a continuación.

Desde su vertiente descriptiva, la traductología de corpus analiza el texto traducido. Mediante la comparación interlingüística con corpus comparables de textos originales en varias lenguas, observa y describe el comportamiento y las formas textuales de dos o más lenguas en situaciones comunicativas parecidas. Se enfoca en detectar patrones recurrentes (sintáctico, semántico y colocacional) para sacar las equivalencias por anisomorfismo o isomorfismo. Con la comparación intralingüística, busca caracterizar la lengua traducida (Baker, 1993, 1995) mediante el uso de los corpus comparables monolingües con el fin de observar el comportamiento traductor en la lengua meta y observar los posibles universales de traducción propuestos por Baker (1993, p. 243), es decir, las «características que suelen aparecer en el texto traducido y no en las expresiones originales y que no son el resultado de la interferencia de sistemas lingüísticos específicos». Esos universales de traducción hacen que los textos traducidos suelan ser más simples y menos ambiguos, más explícitos y convencionales, más normalizados y conservadores, lo que Zanettin (2012, p. 13) resume perfectamente:

 

Los hipotéticos universales, juntos, pueden ser vistos como una señal de un proceso general por el cual la traducción como un tipo específico de actividad de escritura implica la «descomplejificación» del lenguaje. Se supone que los traductores simplifican los textos originales, recortando los márgenes de los usos más creativos y ajustándose más a los patrones típicos de una lengua, al tiempo que añaden información complementaria cuando se percibe una necesidad.

 

Entre los autores más representativos de esta corriente, citemos a Baker y Olohan (2000) para el inglés, que observaron, por ejemplo, que that después de los verbos declarativos (say, tell, report...) es más frecuente en los textos traducidos (TT) (explicitación) que en los textos no traducidos (TNT). Asimismo, Olohan (2003) comprobó menos casos de contracción en los textos traducidos al inglés que en los textos ingleses sin traducir. Para el español, Jiménez Crespo (2011) señala una presencia más importante del sujeto sintáctico en los textos traducidos que en los textos que no están traducidos. Los trabajos de Laviosa (1996, 1997, 1998, 2002) demostraron que la variedad léxica, que se puede cuantificar con el ratio entre type y token, es más importante en inglés traducido a la par que lo es también la densidad léxica (ratio entre lexemas y gramemas). Todos estos estudios convergen hacia el mismo punto: comprobar científica y cuantitativamente la existencia de lo que anteriormente varios autores habían evidenciando con el concepto de «interlengua» (Selinker, 1972) o de «tercer código» (Frawley, 1984). Ahora bien, ¿cómo se puede interpretar ese tercer código? A nuestro parecer, son dos las interpretaciones posibles.

La primera se basa en la teoría de los universales de traducción que, de hecho, ha sido cuestionada[3]. Según esta teoría, la lengua traducida sería un tipo de variación que resulta de las interferencias de la lengua fuente. Las diferencias intralingüísticas serían, en este caso, naturales, en la medida que esos universales de traducción se observarían en todas las lenguas y en cualquier situación de comunicación, que, por lo tanto, el traductor no puede y no debe evitar. Si las diferencias entre TT y TNT se deben a las interferencias de la lengua fuente, entonces, el fenómeno estaría fuertemente relacionado con las lenguas en cuestión y, por consiguiente, sería específico y variable según la lengua fuente y la lengua meta.

La segunda interpretación, a la que suscribimos, consiste en considerar la lengua traducida como un residuo de la actividad traslativa que el traductor debe reducir al máximo porque constituye un obstáculo al precepto de traducir en una lengua meta natural. Según esta interpretación, la lengua traducida no es un tipo de variación aceptable, sino que evidencia características lingüísticas que deben ser homogéneas con la lengua original.

 

3. Omnipresencia invisible de los corpus en traducción

 

En el entorno profesional de la traducción, las herramientas automáticas e informáticas para la consulta de corpus son minoritarias por no decir inexistentes. En efecto, la encuesta del proyecto MELLANGE (Multilingual eLearning in LANGuage Engineering, 2006)[4], de mayor transcendencia en Europa, a la que 1015 encuestados, estudiantes y profesionales en traducción e interpretación respondieron, arroja luz sobre el uso de los corpus entre los traductores profesionales en el Reino Unido, Francia, Italia y Alemania. Los resultados son elocuentes. Según esta encuesta, un 85 % afirma su interés por los corpus y desea conocer más sus ventajas, pero solo un 54 % «lee» los corpus, lo que permite inferir que los usa sin herramientas informáticas automáticas para consultarlos. Otro dato llamativo: un 40 % compila textos de Internet, de algún ámbito específico, lo que permite deducir que no se conforman con herramientas de traducción y que necesitan informarse constituyendo «un corpus comparable»; y de ese 40 %, un 70 % lo hace de manera electrónica. Una encuesta similar en España, llevada a cabo por Gallego Hernández (2015), muestra que cerca del 50 % de los 526 encuestados[5] afirma que en 2013 «nunca o casi nunca» utilizaban corpus para traducir.

De esa constatación, el (aprendiz) traductor usa corpus sin darse cuenta de que lo son, como el señor Jourdain de Molière, entonces, que habla en prosa sin que lo sepa. En efecto, los corpus están integrados en las distintas herramientas de ayuda para traducir pero con otra designación.

¿Cómo explicar esa paradoja? Con el desarrollo de la informática a finales del siglo XX, dos tecnologías convergieron hacia la traducción: las memorias de traducción y la traducción automática que forman parte, hoy en día, de las herramientas de ayuda para traducir. La traducción automática estadística combina datos, bilingües o monolingües, con un algoritmo para determinar la traducción más probable. Las memorias de traducción[6] (MT) explotan traducciones ya realizadas, alineadas a nivel de la frase para que un programa informático pueda buscar correspondencias totales o parciales y proponérselas al traductor durante la traducción de un nuevo texto. En ambos casos, la explotación de los corpus es imprescindible, pero lo extraño es que nunca refieren a «corpus». Las memorias de traducción no son sino corpus paralelos bilingües alineados a nivel de la frase. El mercado que impuso el uso de las MT prefirió llamarlas de otra manera con designación menos técnica y más explícita para insistir en la capacidad de reciclaje de lo ya traducido. La traducción automática, y hoy la neuronal, utilizan corpus bilingües o monolingües muy extensos (SYSTRAN). De la misma manera, los corpus paralelos se esconden en las web de traducción automática (cada vez más neuronal) del tipo DeepL Translator (https://www.deepl.com/translator), Google Translator (https://translate.google.es/). Los corpus están también en los diccionarios de nueva generación que ofrecen traducciones contextuales bajo la forma de concordancias bilingües de textos paralelos, como Linguee (https://www.linguee.es), Reverso Context (https://context.reverso.net/traduccion/) o TradooIT (https://www.tradooit.com/). Estos dos últimos tienen la ventaja de indicar el número de ocurrencias por cada equivalente de traducción.

¿Por qué los traductores desconocen la existencia de los corpus y no los integran en su caja de herramientas? Primero, porque el uso de los corpus electrónicos en traducción no se imparte en todos los centros universitarios o escuelas de traducción, aunque las cosas están cambiando[7] y ya son numerosas las monografías sobre la traducción que se publican desde hace 10 años[8]. De ahí que pocos traductores profesionales sepan algo sobre el uso de los corpus.

Segundo, los corpus presentan un problema de ergonomía en la medida en que existe cierta confusión en cuanto a la existencia de numerosos tipos: corpus monolingües (BNC, COCA, CREA, CORPES XXI, etc.), corpus multilingües (Europarl), corpus monolingüe de lengua traducida (Translational English Corpus), corpus de referencia (CREA) de lengua general, corpus de aprendices (CAES, Corpus de aprendices de español como lengua extranjera, del Instituto Cervantes), corpus paralelo que presenta un texto alineado con su(s) respectiva(s) traducción(es) en otra(s) lengua(s), corpus comparables que compilan textos de lenguas originales (o traducidas) con características similares en cuanto a la temática, al tipo y a la estructura, el corpus ad hoc (corpus montado para un problema específico), etc.

Luego, no todos los corpus ofrecen la misma accesibilidad. Algunos tienen una accesibilidad mediante una interfaz internet, libre (CREA, CORPES XXI) o con autorización previa (Frantext); otros, con un programa informático para compilar y analizarlos. Este puede ser de acceso libre (AntConc) o con licencia (Sketch Engines).

Por último, los corpus pueden compilar textos de género muy heterogéneo, lo que puede dificultar la comparación o el análisis; por ejemplo, el corpus francés Frantext reúne textos literarios y filosóficos, o el corpus CREA compila textos periodísticos.

Así, como bien resume Frérot (2010, en línea): «la impopularidad de los corpus entre los profesionales de la traducción se debe al tiempo necesario para su creación y explotación, y al hecho de que el aumento de productividad no es inmediato», un problema al que queremos dar solución en este artículo, insistiendo en el papel que han de desempeñar los centros universitarios o escuelas de traducción y en las ventajas de usar los corpus en traducción.

 

4. Los corpus en la enseñanza de la traducción

 

Los beneficios de utilizar el corpus como herramienta de traducción (especialmente en programas con tres años de educación superior) han fomentado la aparición de modelos de aptitudes en traducción para la formación de traductores. De esta manera, en los últimos años, el contexto académico internacional impulsó el uso de los corpus en la enseñanza de la traducción con la creación de modelos de competencias que integran la competencia «corpus» en la formación de traductores. Con este fin, el grupo PACTE (2003, p. 136) incluyó los corpus en la subcompetencia instrumental, remitiendo principalmente al aspecto técnico relacionado con la compilación de un corpus y la explotación de herramientas de análisis de corpus. El modelo de competencias desarrollado como parte del European Master‘s in Translation (EMT, 2009) también reconoce el uso de los corpus como un componente esencial entre las habilidades de traducción. En este marco de referencia de competencias, los corpus están incluidos en la competencia «búsqueda de información». Es el aspecto técnico al que también se ha dado prioridad en el diseño del modelo del EMT.

En el aula, la implementación de corpus y herramientas de análisis de corpus se basan en dos prácticas distintas pero complementarias, denominadas «uso del corpus para aprender a traducir» y «uso del corpus de aprendizaje para traducir» que Beeby, Rodríguez Inés y Sánchez Gijón (2009, p. 1) definen en su introducción:

 

La primera parte, el uso de corpus para aprender a traducir, dará ideas a los profesores que quieran preparar materiales de aprendizaje y tareas utilizando corpus. La segunda parte, el uso del corpus de aprendizaje para traducir, trata de ayudar a los estudiantes a convertirse en usuarios autónomos de corpus como parte de su competencia de traducción.

 

El primer enfoque se centra en el análisis de corpus a partir de datos proporcionados y preseleccionados por el profesor, que se utilizan en ejercicios diseñados para estudiar una determinada dificultad de traducción. El segundo enfoque se centra en la construcción de corpus y en los diferentes pasos involucrados como explica Krüger (2012, p. 509):

 

Este enfoque no se centra principalmente en los aspectos relacionados con el uso inmediato del corpus sino en las diversas cuestiones relacionadas con la traducción y la compilación del corpus, por ejemplo, el diseño del corpus, las estrategias de búsqueda, la evaluación de las posibles fuentes del corpus, la evaluación de la idoneidad y pertinencia de los textos del corpus y los conocimientos generales de softwares.

 

En los últimos años, este segundo eje ha sido fuertemente impulsado a través de la constitución de corpus recopilados para la ocasión (Córtez Gódinez, 2010; Gallego Hernández 2012; Loock, 2016; Zanettin, 2012), comúnmente conocido como «Do It Yourself (DIY)», «corpus desechable» o «corpus ad-hoc» (Varantola, 2003). Una de las principales ventajas de este tipo de corpus es precisamente que puede construirse ad hoc para solucionar un problema específico de traducción. El papel del docente en esas tareas es imprescindible, consiste en racionalizar el uso de los corpus asociándolos a las diferentes etapas del proceso de traducción, de comprensión del texto fuente a la fase de revisión, para demostrar que pueden integrarse como una herramienta más de la TAO.

Para tal objetivo, previamente dicho docente ha de explicar los diferentes tipos de corpus útiles para la traducción e indicar la accesibilidad de ellos. Luego, ha de insistir en la función de cada uno de ellos en el proceso traslativo. Por último, con la compilación y explotación del corpus comparable ad hoc con un programa informático del tipo AntConc (Anthony, 2014), fácil de usar, el profesor debe guiar a los aprendices para que se den cuenta de que son tareas fáciles de realizar.

En la etapa de la comprensión del texto fuente, la consulta de los corpus monolingües de referencia de lengua general puede ser útil para observar el cotexto de aparición de un término con numerosos ejemplos contextuales. Sirve también para apreciar los fenómenos de colocación (atracción preferente entre lexemas: error garrafal, miedo cerval, trabar amistad), de prosodia semántica (connotación negativa o positiva de la coaparición: cometer un crimen), que, en resumidas cuentas, constituyen hechos lingüísticos imprescindibles para el traductor porque están relacionados con fenómenos fraseológicos[9]. Se usa también ese tipo de corpus para comprobar los fenómenos posibles de variación diatópica o diafásica.

En la fase de traducción, los corpus paralelos permiten al traductor tener acceso a traducciones ya realizadas e inspirarse en los que encuentre en los corpus para tomar decisiones. La búsqueda de información en corpus paralelos representa un método muy conocido porque esos corpus se encuentran, como explicamos, en la forma de MT. Los corpus paralelos se hallan también en páginas web especializadas y en las de traducción automática. Sirven para sacar a la luz las diferencias interlingüísticas para evitar la trampa de los calcos.

En la etapa de posedición y de revisión, son útiles los corpus comparables de lengua fuente/meta originales que sirven para averiguar la homogeneización lingüística entre el texto traducido y la lengua original. Por último, la compilación y explotación de un minicorpus ad hoc especializado, comparable de lengua fuente y lengua meta originales, y su consulta con un programa sirven para corroborar la solución de traducción encontrada.

¿Para qué usar los corpus? El objetivo final de esas prácticas es para que el traductor sea invisible: el traductor debe, además de restituir el mensaje del texto fuente, producir un texto en una lengua meta natural[10] (Salkie, 1997). Ese criterio de invisibilidad del traductor está muy de moda ahora (Venutti[11], 1995)[12]. Un buen traductor sería un «criminal experimentado»: traducir sin que lo pillen in fraganti.

Para lograr este objetivo, el traductor suele consultar documentos escritos en el idioma de destino original sobre el mismo tema que el texto por traducir, con el fin de observar las elecciones terminológicas, fraseológicas y gramaticales realizadas por los expertos en la materia. Más allá de la consulta de algunos documentos, es posible compilar un minicorpus especializado casero (corpus Do It Yourself) para encontrar respuestas precisas a los problemas de traducción que otras herramientas no proporcionarían. Este método permite aumentar el número de fuentes consultadas y, por lo tanto, reducir los riesgos.

A continuación, se explica cómo proceder a partir de un problema de traducción específico de un texto en español que ha de traducirse al francés.

 

5. Minicorpus ad hoc económico

 

Consideremos el fragmento corto siguiente:

 

Los subprime son préstamos hipotecarios concedidos a hogares con una situación financiera precaria, gracias a los cuales muchos estadounidenses tuvieron acceso a la propiedad en los años 2000.[13]

 

El texto puede plantear varias dificultades no de traducción terminológica relacionadas con el ámbito económico, sino con la elección de soluciones que las herramientas en línea proponen. Veamos algunos ejemplos.

 

«Los subprime»:

 

                   IATE propone en francés una explicitación del tipo crédit hypothécaire à risque con una doble variante en cuanto al adjetivo y en la forma en plural (crédit immobilier à risques).

                   Termium Plus indica la misma estrategia de traducción, pero con otra variante que afecta, esta vez, al sustantivo: prêt hypothécaire à risque o crédit hypothécaire à risque, explicando que ha de evitarse el anglicismo.

                   Los diccionarios de nueva generación que ofrecen traducciones contextualizadas dan como resultados los siguientes. Linguee y Reverso Contexto proponen el préstamo inglés en plural: subprimes (34 ocurrencias). TradooIt ofrece la misma solución con 35 ocurrencias contra 11 en singular (subprime).

                   En cuanto a las web de traducción automática (neuronal), DeepL Translator da prêts subprime, un elemento en singular de una palabra compuesta, mientras que Google Translator indica un sustantivo simple, Les subprimes en plural.

 

A la luz de estas observaciones, surgen varias preguntas: ¿Deberá el traductor elegir el préstamo inglés sabiendo que Termium Plus preconiza evitarlo y que los diccionarios y la traducción automática neuronal proponen subprimes? Si opta por el préstamo, ¿se escribirá en plural o en singular? Si opta por la explicitación, ¿con cuál se quedaría?

 

«Préstamos hipotecarios»:

 

                   IATE propone una variable en el sustantivo: prêts/crédits hypothécaires.

                   Linguee da la misma variable: prêts/crédits hypothécaires, proponiendo, además, prêts immobiliers. Reverso Contexto indica prêts immobiliers (20), crédit hypothécaire (19), prêt hypothécaire (10), lo que da precisamente TradooIt, como solución mayoritaria (175), después de crédits hypothécaires (20) o prêts immobiliers (12).

                   DeepL y Google Translator proponen prêts hypothécaires.

 

Tras la consulta de las herramientas citadas, el (aprendiz) traductor deberá elegir entre las distintas propuestas.

 

                   Para los subprime tiene prêt hypothécaire à risque, crédit hypothécaire à risque, crédit immobilier à risques, les subprimes, les subprime, les prêts subprime.

                   Para préstamos hipotecarios dispone de prêts/crédits hypothécaires, prêts immobiliers.

 

Para optar por una solución entre ellas u otras que no estuvieran en las herramientas utilizadas, el traductor suele consultar artículos periodísticos y científicos con las palabras clave, en lengua meta original, es decir, en francés, aquí subprimes y 2008, en el curso del año 2008:

 

A partir de estos 7 artículos escritos en francés original sobre el mismo tema, que podemos asumir que fueron escritos por especialistas en la materia, el traductor puede, entonces, para mayor velocidad y eficiencia, reunirlos en un minicorpus ad hoc especializado, guardando cada artículo en un mismo archivo de texto sin formato (.txt) con codificación UTF-8 que permite el soporte de caracteres especiales como los caracteres acentuados.

Para ello, basta con seleccionar el texto a grandes rasgos en las páginas web en cuestión, copiarlo en un archivo de texto sin limpiarlo, es decir, sin eliminar fotografías, leyendas, anuncios, hipervínculos, etc. (es aconsejable, sin embargo, evitar incluir comentarios de los usuarios de internet). Guardar, luego, el archivo en formato .txt garantizará que solo se conserve el texto, que incluirá texto «parásito» como subtítulos o anuncios, pero que no aparecerá en el momento de la explotación específica del corpus. Por lo tanto, no es necesario «limpiar» los archivos. Recomendamos mantener el archivo tal como está y utilizar un corpus que no haya sido limpiado y que, por lo tanto, permanezca parcialmente «sucio», lo que no tendrá ningún impacto en la investigación llevada a cabo.

La compilación de este corpus tiene dos ventajas. Primero, ahorra tiempo ya que no se trata de leer todos los artículos, sino de interrogar el corpus a través de palabras clave (consultas). Segundo, mejora la calidad ya que la consulta del corpus proporcionará una respuesta más fiable que la lectura de 2 o 3 artículos sobre el tema[14].

Se trata, entonces, de interrogar el corpus, compuesto en nuestro caso de 21 447 palabras en total, para encontrar rápidamente la selección más adecuada frente a las variables traslativas propuestas. Esa etapa de contextualización se realiza con cierta confianza gracias a las concordancias, es decir, gracias a un programa informático que permitirá formular consultas lingüísticas para observar los términos buscados en su contexto, teniendo acceso inmediato y visualmente práctico a los diferentes ocurrencias del «nodo» (término buscado), a través del formato de visualización, KWIC (KeyWord In Context) en forma de líneas de concordancia.

Utilizaremos aquí el programa AntConc, desarrollado por Laurence Anthony y disponible gratuitamente[15]. Usaremos pocas funcionalidades y no se procederá a una descripción exhaustiva de todo lo que la herramienta puede ofrecer.

Retomemos las propuestas de traducción de «los subprime»: prêt hypothécaire à risque, crédit hypothécaire à risque, crédit immobilier à risques, les subprimes, les subprime, les prêts subprime. En el corpus, figura el sintagma les subprimes con 7 ocurrencias. La forma en plural aparece de manera mayoritaria (71) sobre todo en el esquema léxico-gramático crises des subprimes (36) (fig. 1):

 

Fig. 1. Fragmento de los clusters que incluyen subprimes

 

 

Mientras que la forma en singular o invariable aparece en 20 ocurrencias en clusters[16] del tipo:

 

 

Fig. 2. Fragmento de los clusters que incluyen subprime

 

En cuanto a las explicitaciones definitorias, suelen ir acompañadas del préstamo, en la mitad de los casos:

 

Fig. 3. Fragmento de concordancias de subprimes

 

De estas observaciones, podemos proponer como traducción al francés tanto el préstamo acompañado de una explicitación definitoria. Queda por elucidar cuál fórmula elegir. En cuanto los segmentos à risque o à risques, el corpus da preferencia de uso para la primera (fig. 4, 5 y 6):

 

 

 

Fig. 4: Fragmento de los clusters que incluyen a à risque

 

Fig. 5: Fragmento de los clusters que incluyen a à risques

 

 

 

Fig. 6: Fragmento de las concordancias que incluyen a à risques

 

En cuanto a la traducción de préstamos hipotecarios como prêts/crédits hypothécaires, prêts immobiliers, el corpus registra 8 ocurrencias de crédits hypothécaires contra una sola en singular y 9 ocurrencias de prêts hypothécaires contra 1 sola en singular; por lo que descartamos las formas en singular. Se usará prêts o crédits, según el contexto lingüístico al que pertenecen, es decir, manteniendo la diferencia semántica entre ambas formas, como en español.

 

6. Conclusiones

 

El desarrollo de actividades de enseñanza específicas basadas en los corpus, especialmente cuando se comparan con recursos más tradicionales como los diccionarios bilingües, puede ser muy útil para sensibilizar a los aprendices de traducción sobre la contribución que representan los corpus a la mejora de la calidad de las traducciones (respeto por el uso, precisión terminológica, rentabilidad).

Además, tener en cuenta en el diseño de las clases de traducción las necesidades expresadas por los traductores profesionales en relación con las herramientas de traducción informatizadas es crucial para formar a los traductores cuya competencia será reconocida en el mercado laboral. Así, la integración en la formación universitaria de los traductores en herramientas de traducción, como los distintos tipos de corpus, para construir, enriquecer y navegar en un corpus comparable o paralelo es esencial para satisfacer las necesidades de la profesión. Desde el punto de vista del rendimiento de las herramientas de apoyo a la traducción, parece pertinente poder evaluar con precisión la contribución de las herramientas de investigación basadas en corpus en relación con las memorias de traducción, que siguen estando, al menos en el contexto universitario francés, mucho más integradas en la formación de traductores.

Si bien los corpus de traducción son ampliamente valorados en un contexto educativo porque proporcionan a los estudiantes un marco propicio para el análisis de datos lingüísticos auténticos en una perspectiva complementaria a los recursos más tradicionales, su integración a nivel profesional no goza de la misma popularidad. Las limitaciones económicas relacionadas con la productividad y los plazos de entrega, así como los requisitos tecnológicos impuestos por los clientes (uso de MT), desempeñan, sin duda, un papel esencial. Estas fuertes limitaciones deben tenerse en cuenta en el entorno pedagógico y debe considerarse la integración de los corpus en el propio proceso de traducción. Así, dentro de los másteres en traducción, la enseñanza actual relacionada con los corpus, que puede describirse como relativamente «conmovedora» dada la heterogeneidad de los contenidos y las prácticas, debe estructurarse.

 


Referencias bibliográficas

 

Alonso Campo, A.; Martínez, M.; Polo, N.; Puertas, G.; Yzaguirre de, L.; Tebé, C.; Cabré, M. T. (2001). La utilización de corpus paralelos alineados en la docencia de la traducción y de los lenguajes de especialidad. En L. Iglesias y S. Doval (eds.), Studies in Contrastive Linguistics (pp. 71-82). Santiago de Compostela, España: Publicacións de la Universidade de Santiago de Compostela.

Anthony, L. (2014). AntConc (Version 3.4.3). Tokyo, Japón: Waseda University. Recuperado de www.laurenceanthony.net

Baker, M. (1993). Corpus Linguistics and Translation Studies: Implications and Applications. En M. Baker, G. Francis y E. Tognini-Bonelli (eds.), Text and Technology. In honor of John Sinclair (pp. 233-250). Filadelfia, Estados Unidos/Ámsterdam, Países Bajos: John Benjamins.

Baker, M. (1995). Corpora in Translation Studies: An Overview and Some Suggestions for Future Research. Target, 7(2), 223-243.

Baker, M. y Olohan, M. (2000). Reporting that in Translated English: Evidence for Subconscious Processes of Explicitation? Across Languages and Cultures, 1(2), 141-158.

Beeby, A., Rodríguez I. P. y Sánchez-Gijón, P. (2009). Corpus Use and Translating. Filadelfia, Estados Unidos/Ámsterdam, Países Bajos: John Benjamins.

Bernardini, S. y Castagnoli, S. (2008). Corpora for translator education and translation practice. En E. Yuste Rodrigo (ed.), Topics in Language Resources for Translation and Localisation (pp. 39-55). Filadelfia, Estados Unidos/Ámsterdam, Países Bajos: John Benjamins.

Bowker, L., Pearson, J. (2002). Working with Specialized Language: A Practical Guide to Using Corpora. Londres, Inglaterra: Routledge.

Bowker, L. (2006). Investigating Semantic Prosody in Language for Special Purposes: A Corpus-based Study in the Specialized Field of Labour Relations with some Implications for Translation. Translation Studies in the New Millennium4, 15-31.

Cabré, M. T. (2007). Constituir un corpus de textos de especialidad: condiciones y posibilidades. En M. Ballard y C. Pineira-Tresmontant (eds.), Les corpus en linguistique et en traductologie (pp. 89-106), Arras, Francia: Artois Presses Université.

Corpas Pastor, G. (1995). El uso de córpora en traducción e interpretación. En C. Martín Vide (ed.), Actas del XI Congreso de Lenguajes Naturales y Lenguajes Formales (pp. 381-387). Barcelona, España: PPU.

Corpas Pastor, G. (2004). La traducción de textos médicos especializados a través de recursos electrónicos y corpus virtuales. En L. González y P. Hernúñez (eds.), Las palabras del traductor. Actas del II Congreso Internacional «El español, lengua de traducción» (pp. 137-164). Bruselas, Bélgica: ESLETRA.

Corpas Pastor, G. (2004). Localización de recursos y compilación de corpus via internet: aplicaciones para la didáctica de la traducción médica especializada. En C. Gonzalo García y V. García Yebra (eds.), Manual de documentación y Terminología para la traducción especializada (pp. 223-258). Madrid, España: Arco.

Corpas Pastor, G. (2002). Traducir con corpus: de la teoría a la práctica. En J. García Palacios y M. T. Fuentes Morán (eds.), Texto, terminología y traducción (pp. 189-226). Salamanca, España: Almar.

Corpas Pastor, G. (2008). Investigar con corpus en traducción: los retos de un nuevo paradigma. Frankfurt am Main, Alemania: Peter Lang.

Corpas Pastor, G. (2001).Compilación de un corpus ad hoc para la enseñanza de la traducción inversa especializada. Trans, 5, 155-184.

Córtez Gódinez, J. (2010). El corpus ad hoc como herramienta de traducción. En D. Heffington y A. Marín-Marín (eds.), Memorias del VI Foro Internacional de Estudios en Lenguas [Proceedings of the 6th International Congress on Languages] (pp. 73-95). Chetumal, México: Universidad de Quintana Roo.

Crystal, D. (1991). A Dictionary of Linguistics and Phonetics (3a ed.). Oxford, Inglaterra: Blackwell.

EAGLES (1996). Text Corpora Working Group Reading Guide. Documento Eagles (Expert Advisory Group on Language Engineering.

Frawley, W. (1984). Translation. Literary, Linguistic & Philosophical Perspectives. Newark, Estados Unidos: University of Delaware Press.

Frérot, C. (2010). Outils d’aide à la traduction : pour une intégration des corpus et des outils d’analyse de corpus et dans l’enseignement de la traduction et la formation des traducteurs. Les Cahiers du GEPE, 2, Recuperado de www.cahiersdugepe.fr/index.php?id=1164

Frérot, Cécile (2016). Corpora and corpus technology for translation purposes in professional and academic environments. Major achievements and new perspectives. Cadernos de Traduçâo, 36(1). Recuperado de https://doi.org/10.5007/2175-7968.2016v36nesp1p36

Gallego Hernández Daniel (2015). The use of corpora as translation resources: a study based on a survey of Spanish professional translators. Perspectives: Studies in Translatology, 23, 375-391. Recuperado de www.tandfonline.com/doi/abs/10.1080/0907676X.2014.964269

Holmes, J. S. (1972/1988). The name and nature of Translation Studies. En James S. Holmes y Raymond van den Broeck (eds), Translated! Papers on Literary Translation and Translation Studies (pp. 67–80). Ámsterdam, Países Bajos: Rodopi.

House, J. (2008). Beyond intervention: universals in translation. Trans-kom, 1, 6-19.

Hurtado Albir, A. (1996). La traductología: lingüística y traductología. TRANS, 1, 151-160.

Jiménez Crespo, M. A. (2011). The future of «universal» tendencies: a review of papers using localized websites. Proceedings of UCCTS 2010, Using Corpora in Contrastive and Translation Studies, Reino Unido. Recuperado de http://www.lancs.ac.uk/fass/projects/corpus/UCCTS2010Proceedings/

Krüger Ralph (2012).Working with corpora in the translation classroom. Studies in second language learning and teaching4, 505-525.

Kübler Natalie (2011). Working with different corpora in translation teaching. En A. Frankenberg-Garcia, L. Flowerdew y G. Aston (eds.), New Trends in Corpora and Language Learning (pp. 62-80.). Londres, Inglaterra: Continuum.

Kübler N.,Volanschi, A. (2012). Semantic prosody and specialised translation, or how a lexico-grammatical theory of language can help with specialised translation. En A. Boulton, S. Carter-Thomas y E. Rowley-Jolivet (eds.), Corpus-informed Research and Learning in ESP: Issues and Applications (pp. 105-135). Filadelfia, Estados Unidos/Ámsterdam, Países Bajos: John Benjamins.

Kübler, N.y Aston, G. (2010). Using Corpora in Translation .En M. Mc Carthy y A. O'Keefe (eds.), The Routledge Handbook of Corpus Linguistics (pp. 505-515). Londres, Inglateraa: Routledge.

Laursen, A. L., Arinas Pellón Ismael (2012). Text corpora in translation training. A case study of the use of comparable corpora in classroom teaching. The interpreter and translator trainer61, 45-70. Recuperado de www.tandfonline.com/doi/abs/10.1080/13556509.2012.10798829#.VPd20nyG-So

Laviosa, S. (1996). The English Comparable Corpus (ECC): A Resource and a Methodology for the Empirical Study of Translation (Tesis de doctorado). Department of Language Engineering, UMIST, Manchester.

Laviosa, S. (1997). Investigating Simplification in an English Comparable Corpus of Newspaper Articles. En K. Klaudy. y J. Kohn (eds.), Transferre Necesse Est. Proceedings of the 2nd International Conference on Current Trends in Studies of Translation and Interpreting (pp. 531-540). Budapest, Hungría: Scholastica.

Laviosa, S. (1998). Core Patterns of Lexical Use in a Comparable Corpus of English Narrative Prose, Meta: journal des traducteurs / Meta: Translators’ Journal, 43(4), 557-570.

Laviosa, S. (2002). Corpus-based Translation Studies. Theory, Findings, Applications. Filadelfia, Estados Unidos/Ámsterdam, Países Bajos: Rodopi.

Loock, R. (2012). La traductologie de corpus : étude de cas et enjeux. En N. D’Amelio (ed.), Au cœur de la démarche traductive: débat entre concepts et sujets. Actas del congreso internacional “Traduction / Traductologie. Conceptualisations et nœuds de subjectivité en traduction (pp. 99-116). Mons, Bélgica: CIPA.

Lock, R. (2016). La traductologie de corpus. Villeneuve D’Ascq, Francia: Presses Universitaires du Septentrion.

McEnery, A. M. y Wilson, A. (2001). Corpus linguistics: an introduction. Edinburgh, Escocia: University Press.

MELLANGE (2006). Corpora & E-learning Survey Results, ITI Bulletin.

Olohan, M. (2004), Introducing corpora in translation studies. Londres, Inglaterra: Routledge.

Olohan, M. (2003). How frequent are the contractions? Target, 15(1), 59-89.

PACTE Group (2003). Building a translation competence model. En Alves (ed.), Triangulating translation: Perspectives in process oriented research (pp.43-66). Ámsterdam, Países Bajos: John Benjamins.

Parodi, G. (2008). Lingüistica de corpus: una introduccion al ámbito. RLA. Revista de lingüística teórica y aplicada46(1), 93-119.

Rodríguez, P. (2009). Evaluating the process and not just the product when using corpora in translator education. En A. Beeby, P. Rodríguez Inés y P. Sánchez-Gijón (eds.), Corpus use and translating. Corpus use for learning to translate and learning corpus use to translate (pp. 129-149). Ámsterdam, Países Bajos: John Benjamins.

Salkie, R. (1997). Naturalness and contrastive linguistics. En J. Melia y B. Lewandowska-Tomaszczyk (eds.), Proceedings of PALC 97 (pp. 297-312). Lodz, Polonia: University of Lodz, publicado en W. Teubert & R. Krishnamurthy (eds.), Corpus Linguistics (Critical Concepts in Linguistics)4, 336-351. Londres, Inglaterra: Routledge.

Selinker, L. (1972). Interlanguage. International Review of Applied Linguistics, 10, 209-31.

Sinclair, J. (1991). Corpus, Concordance, Collocation. Oxford, Inglaterra: UK Oxford University Press.

Varantola, K. (2003). Translators and disposable corpora. En F. Zanettin, S. Bernard, y D. Stewart (eds), Corpora in Translator Education (pp. 55-70). Mánchester/Northampton, Inglaterra: St Jerome.

Venutti,L. (1995). The Translator’s Invisibility. Nueva York, Estados Unidos: Routledge.

Zanettin,F. (2012). Translation-driven corpora. Mánchester, Inglaterra: St Jerome.

Zanettin, F.; Bernardini S. y Stewart, D. (2003). Corpora in Translator Education. Mánchester, Inglaterra: St Jerome.

 

 

 

Corpus de prensa digital utilizado

 

Conseil d’analyse économique (2008). La crise des subprimes. La Documentation française. p. 11-61. Disponible en https://www.ladocumentationfrancaise.fr/rapports-publics/084000588/index.shtml.

 

 Cobbaut, R. (2008). La crise des subprimes. La Revue Nouvelle, 4. Disponible en https://www.revuenouvelle.be/La-crise-des-subprimes.

D’Arvisenet, Ph. (2008). La crise du ‘subprime’ et ses répercussions. Revue d'économie financière, Hors-série, 7 91-95. Disponible en http://www.persee.fr/doc/ecofi_0987-3368_2008_hos_7_1_5190.

Gatinois, C. & Michel, A. (2008). Subprimes, marchés, inflation: retour sur un enchaînement. Le Monde. Disponible en https://www.lemonde.fr/economie/article/2008/03/20/subprimes-marches-inflation-retour-sur-un-enchainement_1025501_3234.html.

Le Figaro (2008).  «Subprime, l'onde de choc (2008)». Disponible en http://www.lefigaro.fr/marches/2008/02/07/04003-20080207ARTFIG00636-subprime-l-onde-de-choc.php.

L’Obs. (2008). «Crise des subprimes : si vous n'avez toujours rien compris...». Disponible en https://www.nouvelobs.com/rue89/rue89-etats-unis/20080903.RUE5643/crise-des-subprimes-si-vous-n-avez-toujours-rien-compris.html.

Rimbert, P. (2010) « Des subprime à l’effondrement des dominos européens ». Disponible en http://www.monde-diplomatique.fr/carnet/2010-04-30-Crise-financiere.

 

 

 



[1] Por ejemplo, véanse los trabajos de Corpas Pastor (1995, 2001, 2002, 2004, 2008), Bernardini, Castagnoli (2008), Krüger (2012), Laursen, Arinas Pellón (2012), RodríguezI. (2009), Zanettin, Bernardini y Stewart (2003).

[2] McEnery & Wilson (2001, p. 1) definen la lingüística de corpus como «el estudio de la lengua basado en ejemplos de uso de la lengua en la vida real».

[3] Entre otros por House, J. (2008) o Corpas Pastor, G. (2008).

[4] Encuesta llevada a cabo por la Universidad de Paris Diderot, responsable del proyecto, la Universidad de Viena, la Universidad de Leeds, la Universidad de Pompeu Fabra, la Facultad de Traducción e Interpretación de la Universidad de Ginebra y la Universidad de Boloña.

[5] Los encuestados procedían de varias agencias de traducción y de foros de discusión; además, colaboraron más de 4 500 traductores jurados.

[6] Las más usadas son las que se encuentran en SDL Trados Studio, MemoQ o Wordfast.

[7] Beeby, Rodríguez Inés y Sánchez Gijón, 2009; Bowker y Pearson, 2002; Frérot, 2016 ; Kübler, 2003, 2011; Kübler y Aston, 2010; Zanettin, Bernard y Stewart, 2003.

[8] Beeby, Rodríguez Inés y Sánchez Gijón, 2009; Kübler, 2011; Olohan, 2004; Zanettin, 2012.

[9] Bowker, 2006; Kübler y Volanschi, 2012; Zanettin, 2012.

[10] El énfasis es del propio autor.

[11] «Un texto traducido [...] es considerado aceptable por la mayoría de los editores, críticos y lectores cuando lee con fluidez, cuando la ausencia de peculiaridades lingüísticas o estilísticas hace que parezca transparente, dando la apariencia [...] de que la traducción no es de hecho una traducción, sino el 'original’» (1995, p. 2).

[12] Ese criterio excluye, por supuesto, la traducción literaria y el fenómeno de extranjerización.

[13] Fragmento extraído de El léxico de la crisis financiera de 2008 (https://www.swissinfo.ch/spa/afp/el-l%C3%A9xico-de-la-crisis-financiera-de-2008/44372376) publicado el 4 de septiembre de 2018.

[14] Nunca son inmunes a una calidad lingüística poco fiable: un periodista no francófono nativo, no especialista en el tema, idiosincrasias, o simplemente, mal escritor.

[15] Disponible en la dirección siguiente: www.laurenceanthony.net/software/antconc/ (Anthony, 2014).

[16] Los clusters en el programa seleccionado remite a la coaparición de elementos contiguos que se repiten al menos dos veces.