Hace algún tiempo, el hombre imaginaba que
al comienzo del nuevo milenio los coches volarían, y nos
desplazaríamos como Harrison Ford en Blade Runner, que
se podría visitar Marte, y que existirían máquinas
que realizasen por nosotros los trabajos más tediosos y
difíciles. Pues bien, aquí estamos, y los coches
no vuelan, son pocos los elegidos que han salido de la órbita
de la tierra, y seguimos suspirando por C3PO, un androide como
el que tenía Luke Skywalker en La guerra de las galaxias,
que podía hablar, (y no sólo una lengua), y que
traducía directamente de un idioma a otro sin ningún
problema.
|
C3PO,
el traductor automático ideal |
Teniendo en cuenta lo rápido que avanzan
las nuevas tecnologías, tendremos que esperar menos siglos
que Ícaro para ver nuestros sueños y deseos cumplidos.
Sin ir más lejos, ni siquiera Julio Verne con su portentosa
imaginación habría soñado que muchas de las
predicciones que hizo en sus libros se viesen realizadas apenas
un siglo más tarde. ¿Cuánto nos tocará
de esperar a nosotros? Quizá no mucho.
El hombre busca el modo de hacerse la vida más
fácil, por lo que seguirá intentando desarrollar
la tecnología que esté a su alcance, para lograr
una mejor calidad de vida. ¿A quién no le gustaría
tener una máquina que realizase los trabajos que nos resultan
más tediosos, difíciles y que requieren un determinado
esfuerzo, ya sea físico o mental?
1. ¿QUÉ ES LA TRADUCCIÓN AUTOMÁTICA
(TA)?
Se podría decir que se llama TA a los sistemas
informáticos que llevan a cabo traducciones de una lengua
a otra con o sin intervención humana. Se usa el ordenador
para traducir de un idioma a otro incorporando investigación
en el entendimiento y generación del lenguaje natural.
De este modo, la traducción automática
desempeña la misma función que un traductor humano,
traduciendo textos o documentos de una lengua a otra, o a más
de una, pero sin la intervención humana, simplemente con
un programa informático.
En teoría, estos sistemas deben respetar
tres puntos básicos a la hora de traducir:
· decir todo lo que dice el original
· no decir nada que el original no diga
· decirlo todo con la corrección y naturalidad que
permite la lengua a la que se traduce.
El término TA engloba la TA de alta calidad
y la TA con participación humana. La traducción
automática de alta calidad es la realizada por un ordenador,
sin ningún tipo de presencia humana, desde que el texto
se introduce en él hasta que acaba de realizarla. Por otro
lado, en la traducción automática con participación
humana el programa es el que lleva a cabo la traducción,
pero el traductor interviene cuando es necesario. Esto puede ocurrir
a petición de la propia aplicación o simplemente
mediante la revisión de la traducción obtenida.
Se puede clasificar esta intervención humana
en tres etapas: interacción, preedición y postedición.
Hay que señalar que estas tres etapas no son excluyentes,
es decir, que la utilización de una no conlleva que no
se apliquen las otras dos, sino que suelen ser complementarias.
2. ¿CUÁNDO
EMPEZÓ?
Desde el siglo XVII se han intentado desarrollar
diferentes métodos de traducción, evidentemente
unos con más éxito que otros: desde los más
rudimentarios, como el propuesto por Descartes basado en un código
numérico, hasta los últimos que se han elaborado
a partir de la segunda mitad del siglo XX llevados a cabo por
ordenadores.
|
Warren
Weaver, matemático y pionero de la
traducción automática |
Aunque la diferencia principal estriba en el uso
de computadoras, los problemas lingüísticos que hay
que enfrentar son realmente similares. Imagino que Descarte estaría
muy satisfecho con los resultados conseguidos dos siglos más
tarde, pero nosotros que vivimos en la era de la tecnología,
no nos conformamos y aunque se haya llegado más lejos de
lo que él podría suponer, no lo es tanto como lo
que al principio de la TA se planteó.
Se empezó a trabajar en TA a finales de
la década de 1950, con unas expectativas poco realistas,
que llevaron a que las fuentes de financiación fuesen retiradas
al no conseguirse los resultados inmediatos y tan espléndidos
que se esperaban. En 1949, Weaver, en lo que se conoce como "Memorandum
Weaver" dio a conocer públicamente la idea de TA sugiriendo
varios métodos, entre ellos:
· los análisis estadísticos
· la exploración de la lógica subyacente
· las técnicas criptográficas del periodo
de guerras
· las características universales del lenguaje
A partir de aquí, se iniciaron proyectos
de TA en Estados Unidos y en 1951 se nombró al primer investigador
de TA, Yehoshua Bar-Hillel que se dedicó exclusivamente
a esta aplicación.
En la década de los 60, se trabajó en la TA a partir
de métodos empíricos de tanteo, a menudo con base
estadística.
En la década de los 70, se pasó la
euforia del primer momento y los proyectos más importantes
se realizan en países como Canadá, y en la década
de los 80 se proponen nuevas estrategias para obtener mejores
resultados. En la última década del siglo XX, se
continuó en la línea de la década anterior.
3. ¿SON IGUALES
TODOS LOS SISTEMAS DE TA?
Desde que la traducción automática
se empezó a desarrollar a finales de los años 50,
se ha mejorado el diseño de los programas que se han ido
elaborando .
Podemos clasificar los sistemas de TA atendiendo a diferentes
criterios, como el número de lenguas, la dirección
en la que traducen o el enfoque.
Número de lenguas: se dividen
en sistemas bilingües y multilingües. Los sistemas bilingües
están están desarrollados para un único par
de lenguas. Uno de los sistemas bilingües más eficaces
es Météo, creado por el grupo TAUM, en Montreal,
para traducir partes meteorológicos del francés
al inglés.
Otros sistemas, los multilingües, se desarrollaron
para traducir a diversos pares de lenguas. De una lengua de origen
traducen a más de una lengua meta, como es el caso de Systran.
En 1964, Peter Toma empezó a desarrollarlo para el par
ruso-inglés y desde mediados de los años 70, se
elaboraron versiones de Systran para la traducción de lenguas
comunitarias tras un acuerdo con la UE.
Dirección de la traducción:
si traducen en una única dirección, son llamados
unidireccionales, por ejemplo, si sólo traducen del inglés
al español. Son bidireccionales los que traducen de una
lengua a otra y viceversa, por ejemplo, del inglés al español
y del español al inglés.
Enfoque: desde el punto de vista
del diseño, hay tres enfoques diferentes de traducción
automática, generalmente emplazados en tres generaciones
diferentes, lo que no quiere decir que sean exclusivos de esa
etapa y que ya no se hayan vuelto a utilizar, sino que fue en
esa etapa en donde se desarrollaron. Son los sistemas directos,
los sistemas de transferencia y los sistemas interlingua.
 |
Página
web de Systran |
4.¿EN QUÉ
CONSISTEN LOS DIFERENTES ENFOQUES DE TA?
La diferencia fundamental entre los sistemas se
basa en el tipo de enfoque que adoptan. Según sea la relación
que se establece entre la lengua de origen y la lengua meta, por
ejemplo, una relación más o menos directa o con
pasos intermedios, los sistemas adoptan un determinado tipo de
diseño, que permite que las traducciones se desarrollen
de una forma u otra y el resultado obtenido varia. Los sistemas
de primera generación son directos, mientras que los de
segunda y tercera generación no hacen un proceso directo
de una lengua a otra, sino que utilizan o bien una lengua intermedia
en el caso de los de segunda generación o representaciones
abstractas en el caso de los de tercera.
Los sistemas de primera generación se llaman
sistemas directos, los de la segunda, interlingua y los de la
tercera son sistemas de transferencia.
Los sistemas de traducción directa
consisten básicamente en grandes diccionarios. Dado que
la información sintáctica que utilizan es mínima,
la traducción que realizan es casi palabra por palabra,
y por lo tanto, aunque son muy rápidos y compatibles con
ordenadores de sobremesa tipo PC/Windows, la calidad de traducción
que ofrecen es muy pobre.
Los sistemas de transferencia contienen,
además de grandes léxicos monolingües y bilingües,
un amplio conocimiento sintáctico-semántico de las
lenguas tratadas. Esto les permite realizar un análisis
morfosintáctico y obtener una estructura de constituyentes
para cada frase que se traduce. A partir de esta estructura y
de la información contenida en ella se efectúa la
trasferencia léxica (es decir, se traducen las palabras
de una lengua a otra teniendo en cuenta las condiciones del contexto
morfológico, sintáctico y semántico de la
frase; por ejemplo, el verbo inglés “make”
se traduce en castellano por “cometer” cuando el complemento
directo de “cometer” es “error”, pero
se traduce como “hacer” en otros contextos. Al mismo
tiempo se lleva a cabo la transferencia estructural (los cambios
en el orden de elementos y en la estructura de la frase; por ejemplo
la oración en inglés " He was given a new opportunity"
se transforma en castellano en “Se le dio una nueva oportunidad”).
Finalmente, existe una fase de generación en la cual se
obtiene la frase final traducida.
Los sistemas interlingua son un
caso particular de los sistemas de transferencia en los que se
lleva a cabo un análisis mucho más profundo de cada
frase, obteniéndose una representación formal “interlingual”
del significado mismo de la frase. A partir de esta representación
del significado de la frase de entrada se genera una frase en
el idioma de salida. Aunque teóricamente se trataría
del mejor enfoque de los tres, en realidad estos sistemas están
en fase de laboratorio o se utilizan para aplicaciones muy restringidas,
debido a los problemas prácticos que presenta el diseño
y la implementación de una “interlingua” eficaz.
Hay que tener en cuenta que no hay sistemas puros
de traducción directa, de transferencia o de interlingua
sino sistemas que se aproximan más a un enfoque determinado,
pero que pueden tener características de uno de los otros.
5. ¿ES RENTABLE
LA TA?
Las expectativas que se tienen sobre los sistemas
de TA son confusas fuera de los círculos especializados.
Hay que tener en cuenta que estamos hablando de una tecnología
muy desarrollada, pero que trabaja con algo tan complejo como
la lengua. Evidentemente, a día de hoy, no se puede esperar
que un programa informático sea capaz de manejar el lenguaje
humano como lo hacen las personas. La carencia de conocimiento
intuitivo del mundo real supone un claro límite para esta
tecnología.
Solamente podremos sacar provecho de los sistemas
de Ta si somos conscientes de que pueden ser muy útiles
para aplicaciones y en entornos determinados. Es inútil
que intentemos traducir una novela del inglés al castellano
o al gallego con un sistema de traducción automática:
el resultado será desastroso. En cambio, es muy probable
que nos ahorremos tiempo y esfuerzo empleando este tipo de sistemas
si tenemos que traducir del castellano al gallego un informe técnico
o administrativo.
Se puede hablar de TA de baja calidad, que es rentable desde el
punto de vista económico y temporal, aunque no sea una
buena traducción, y que es capaz de ofrecer bastante información
para que alguien que conozca el área específica
pueda entender lo suficiente.
 |
Traducción
de la primera estrofa de Johnny B. Goode hecha por Babelfish |
6. ¿A QUÉ
TIPO DE PROBLEMAS SE ENFRENTA LA TA EN EL PROCESO DE TRADUCCIÓN?
Los más importantes no son de índole
informática, sino lingüística. Los problemas
lingüísticos que competen a la TA se basan en una
teoría general, que se aplica a las lenguas particulares
a las que se traducen los textos.
La mayor dificultad reside en la ausencia de conocimiento
del mundo real que tienen los ordenadores y a característica
propias de las lenguas como la arbitrariedad o la recursividad.
Por ejemplo, ¿cómo conseguir que los ordenadores
puedan entender todas estas características y las apliquen
de forma adecuada? ¿Cómo resolver una anáfora?
¿ Cómo interpretar los actos de habla?
También hay que tener en cuenta la complejidad
de las lenguas, y en los principios que rigen la lengua de origen,
que no tiene por qué ser compartidos por la lengua meta,
y viceversa. Es decir, no se puede aplicar los principios de la
lingüística universal a lenguas particulares, ya que
los universales no siempre se corresponden.
7. ¿QUÉ
EXPECTATIVAS HAY?
Se sigue investigando para poder crear sistemas
rentables desde el punto de vista lingüístico y comercial.
Como ya se ha señalado, algunos sistemas resultan muy útiles
cuando de trata de parafrasear un texto para que lo entienda,
por ejemplo, una determinada comunidad. Es decir, si se trata
de un lenguaje médico, es posible que a un médico
le resulte muy útil un sistema de TA que esté disponible
en el mercado, pues no necesita una traducción de alta
calidad. El camino que se está siguiendo va orientado a
la creación de sistemas de TA basados en sublenguajes,
como pueden ser el médico, el jurídico, el científico,
etc. para poder limitar el vocabulario y la sintaxis de estos
textos y hacer más fácil su traducción. Es
el caso de Météo, que se instaló en 1976,
y desde el año siguiente ha estado produciendo partes diarios
para el Servicio meteorológico de Canadá. En la
actualidad el programa traduce alrededor de 37.000 palabras diarias
con una precisión del 90%. Sistemas como Météo
permiten demostrar que la TA es rentable y útil en algunos
casos, pero no para todos los ámbitos de la traducción.