Limitaciones de SimiDic y otros diccionarios electrónicos

Estamos muy cerca de terminar con la digitalización del diccionario “Vocabulario Políglota Incaico” que es una comparación del quechua de Cuzco, Ayacucho, Junín, Ancash y el aymara de Julí. Gracias a todo el trabajo de Irma Alvarez Ccoscco y Yumey Tupa y el apoyo financiero de Clemente Lamy de Kisimira/iFaro para realizar la digitalización y corrección del texto.

Ayer escribí un script para convertir el texto del Poliglota a los diccionarios electrónicos (StarDict, GoldenDict y SimiDic). Lo que me di cuenta es que SimiDic no es un programa adecuado para este tipo de diccionario, porque sólo puede buscar desde el comienzo de las palabras claves, pero necesitamos la habilidad de hacer búsquedas de full text, para encontrar la segunda palabra, tercera palabra, etc. También necesitamos la habilidad de buscar en las definiciones. He modificado mi script para reordenar las palabras en las entradas para que simidic pueda encontrar todas las palabras, pero es una solución muy fea–un hack en el peor sentido de la palabra. Hablé con Pedro Terán (uno de los programadores de SimiDic) acerca de la idea de añadir búsquedas de “full text” en SimiDic, pero esta funcionalidad requiere cambios de las bases de datos y código nuevo en SimiDic y SimiDic-Builder. Entonces, no podemos añadir nueva funcionalidad sin lanzar otra versión de SimiDic. Por eso, las bases de datos para el Poliglota en SimiDic serán enormes y lentas para cargar.

Los creadores de StarDict y GoldenDict tampoco ha solucionado este problema. Por ejemplo, StarDict permite búsquedas en todo el texto de las definiciones (aunque es poco utilizado), pero no permite búsquedas en todo el texto de las palabras claves. StarDict tampoco permite búsquedas por letras relacionadas. Por ejemplo, en StarDict, una búsqueda de “anata” no encuentra “añata” ni “Añata”. En cambio, GoldenDict puede buscar letras relacionadas y puede buscar en todo el texto de las palabras claves, pero no tiene una opción para buscar en las definiciones y no permite la introducción de letras por sus códigos Unicode. Entonces ningún diccionario electrónico es adecuado en mi opinion para el uso de lenguas originarios en mi opinión.

En el caso de SimiDic, necesitamos financimiento para añadir estas funcionalidades al código, pero no hemos recibido ningún apoyo todavía. El Ministerio de Culturas de Bolivia nos han informado que no va a financiar el proyecto que hemos propuesto este año, entonces ahora no tenemos plata para pagar por cambios al código de SimiDic.

One comment on “Limitaciones de SimiDic y otros diccionarios electrónicos

  1. [...] Estamos muy cerca de terminar con la digitalización del diccionario “Vocabulario Políglota Incaico” que es una comparación del quechua de Cuzco, Ayacucho, Junín, Ancash y el aymara de Julí. Gracias a todo el trabajo de …  [...]

Agregue un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *

Usted puede utilizar las etiquetas HTML y atributos: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>