Traductor estadístico wixarika - español usando descomposición morfológica
Fecha
2016-09Autor
Mager Hois, Jesús Manuel
Barrón Romero, Carlos
Meza Ruiz, Ivan Vladimir
Metadatos
Mostrar el registro completo del ítemResumen
En este artículo, se presenta un traductor automático entre las lenguas español y wixarika, usando
traducción estadística y recursos gramaticales complementarios. El wixarika es una lengua indígena hablada en los estados mexicanos de Jalisco, Nayarit, Zacatecas y Durango. Este trabajo se enfoca en dos problemas: la escasa existencia de corpus paralelos y la dificultad de alinear una lengua fusionante (español) con una altamente polisintética (wixarika). En situaciones límite, los traductores típicos, basados en traducción estadística, usan entre 100 y 300 MB de texto alineado. Nuestra propuesta introduce un analizador morfológico que descompone los verbos del wixarika y los expone a la fase de alineamiento.
Colecciones
El ítem tiene asociados los siguientes ficheros de licencia: