viernes, octubre 13, 2006

Google : ¿Delirios de grandeza?


Google aims high, (en español, Google tiene grandes propósitos).

Muchos saben que Google tiene un servicio de traducción automática. Con Google podemos traducir desde palabras hasta páginas web completas. Sin embargo, el resultado de estas traducciones dista mucho de ser aceptable. Por ejemplo, Google traduce "Time flies" en español como "Moscas de Tiempo". Lo interesante es que Google está trabajando en una tremenda aspiración cuyo fundamento principal es la traducción.

Según una nota en World Peace Herald, Google pretende derribar las barreras del idioma en lo que acceso a información se refiere. Alan Eustace, Senior Vice President de Ingeniería e Investigación en Google, dice al respecto: «en cinco o diez años, podremos acceder a toda la información, de todos los países, sin importar el idioma».

¿Cómo?
Desde hace algún tiempo, Google está trabajando para hacer esto realidad. Para ello está perfeccionando su propio sistema de traducciones automáticas. Lo más sorprendente es que para lograrlo no está trabajando con traductores humanos o especialistas en gramática. Según lo que entendí en este artículo, podríamos explicar el proceso como un procedimiento de alineación de textos, tal como lo haríamos con WinAlign, solo que en gran escala. Lo que hace el sistema es comparar textos con el mismo contenido, en varios idiomas, es decir, se alimenta de traducciones ya realizadas. Dado el poder de indexación de Google, la cantidad de textos comparados es enorme, tanto que solamente en la fase de pruebas Google logró examinar más de 200 mil millones de palabras, utilizando para ello las colecciones de documentos del sitio Web de las Naciones Unidas.

La indexación de grandes volúmenes de texto permite obtener análisis estadísticos y el uso de algoritmos para dar con la traducción más adecuada para un texto determinado. Podríamos decir que el servicio de traducción automática de Google se convertirá en la memoria de traducción más grande y completa que exista, con el plus de que no será de dos idiomas sino que de múltiples lenguas.

Si esto se convierte en realidad y si el nuevo sistema de traducción de Google funciona como se espera, estaremos frente a un nuevo paradigma de la Web, un hito que marcará el antes y el después en Internet. Sólo imaginemos que con Google podríamos leer todo el contenido de las búsquedas en nuestro idioma, sin importar si ese contenido fue originalmente escrito en japonés, ruso, italiano o hebreo: Google lo traducirá automáticamente para nuestra comodidad. En resumen, todo el contenido de la Internet estará disponible en nuestro idioma (o en chino, o en japonés o en italiano... you name it).

¿Mucha maravilla? Google nos tiene acostumbrados a las grandes sorpresas. Habrá que esperar y ver si Google logra superarse a sí misma. Honestamente, me conformaría con que el sistema traduzca "Time flies" como "El tiempo vuela"...

3 comentarios:

Anónimo dijo...

Grandes propósitos en realidad... ¡Ver para creer!
Me parece que eliminar el "factor humano" es bastante pretencioso, pero quién sabe, se ha logrado más con menos.
Lo preocupante, a mi juicio, es que NO resultara y la gente creyera que SÍ...

Anónimo dijo...

Bueno, tratándose de Google, será un eterno Beta..

pd: Gracias por avisarme de los errores en el documento. Ciertamente fue un error técnico de Blogger, que ya corregí. :D

Anónimo dijo...

La traducción automática basada en ejemplos es un cuento relativamente no tan viejo y es bien interesante, porque junta las memorias, la "inteligencia" del sistema que va "aprendiendo" para generar los textos. Lo "lindo" es que es se basa en la producción humana para aprender, y no sólo en el conjunto de gramáticas y diccionarios que se programen. Lo complicado es la la elección para la generación del texto meta es lo automático, por lo tanto, es importate que los algoritmos para aprender sean buenos... y que la fuente del aprendizaje esté bien traducida.

Pero yo digo... si han llegado a traducir del inglés al chino y dicen con mucha alegría que lo hicieron "sin que ninguno de los involucrados sepa chino"... ¿cómo saben que está bien traducido? Porque todos sabemos que se puede escribir muy lindo, sin traducir bien. Por ejemplo, en los comentarios al artículo sobre el avance de Google, una persona mencionó que, oh, sorpresa, el texto fuente original en árabe estaba MAL escrito y eso, obviamente, hizo que el sistema entregara una pésima traducción. El punto es que la persona que hizo el comentario indicaba que un traductor humano se habría dado cuenta al tiro del error. La máquina no.

Entonces, sí, ver para creer, pero todas las investigaciones y publicaciones serias sobre traducción automática siempre reconocen que el factor humano, el "saber de mundo", el manejo de una ironía, en fin, no se puede pasar al computador.