Conozca los programas que reconocen la voz para la PC
El software de reconocimiento del lenguaje hablado que trae incorporado Windows Vista, el nuevo sistema operativo de Microsoft, ha sido recibido con entusiastas aunque contradictorios comentarios de parte de la comunidad de Internet. El programa permite al usuario la ejecución de tareas normales sin necesidad de usar el teclado, incluyendo la redacción de correos electrónicos. Pero quienes quieran disfrutar de una vida informática sin usar las manos tendrán, al parecer, que considerar el uso de un programa especialista más amplio. Entérese sobre los programas existentes, cómo funcionan y cuánto cuestan.La revista alemana de computación ““PC Welt” daba cuenta este mes de sus primeros ensayos con el programa de reconocimiento del lenguaje hablado de Vista. “Cuando no tengo ganas de clicar el botón Inicio con el ratón y abrir un programa, me basta decir ‘Abrir Word’ o ‘Escribir Correo’ “, señalaba el especialista Kolokythas Panagiotis.
Vista entra a competir con otros programas de reconocimiento de voz especializados ya existentes en el mercado, de los cuales los más populares son Via Voice de IBM, Dragon Naturally Speaking 9 de Nuance o Voice Pro 11 de Linguatec. Dragon ofrece reconocimiento de 44 idiomas, incluyendo español de España, latinoamericano, colombiano y argentino, además de portugués de Portugal y Brasil, y catalán y vasco.
Tal como los demás programas, el usuario debe cumplir con Vista un programa de una hora de entrenamiento antes de lograr que la computadora reconozca su voz y su idioma y obedezca sus órdenes. Vista mantiene funcionando de fondo un programa para ejecutar tareas de reconocimiento de voz.
A juicio de expertos, el programa de reconocimiento de la voz en Vista trabaja de forma relativamente fiable. No obstante, no se presta muy bien para usuarios profesionales, señalándose que quienes suelen dictar textos como parte de su trabajo diario están mejor servidos con programas especializados.
Nadie olvida que, en agosto de 2006, al presentarse la primera versión de Vista, cuando un programador de Microsoft le dictó una carta encabezada por “Dear mother” (Querida mamá), el programa escribió “Dear Aunt” (Querida tía), ante la hilaridad de los periodistas presentes.
Por una parte, los programas especializados no necesitan pausas en el dictado, puesto que las llamadas “secretarias de software” vienen listas para distinguir voces y dialectos. En realidad, al crear Voice Pro, actualmente en su versión 11, Linguatec invitó al laboratorio de desarrollo de IBM a numerosas personas, entre hombres y mujeres, para que leyeran textos en voz alta. “Nos aseguramos de que los lectores vinieran de diversas regiones en que se hablaba el lenguaje en cuestión”, dice Rike Bacher, linguista informático empleado por Linguatec.
Cada palabra es comparada con una muestra conocida por el sistema, explica Martin Held, desarrollador de Nuance en Munich. “Si el sistema es confrontado con una palabra que no conoce, entonces no hay reconocimiento”. Esto significa que ningún programa de reconocimiento del lenguaje hablado podrá ser jamás cien por cien efectivo.
Otra cosa ocurre en situaciones en que hay un vocabulario limitado: “Médicos o abogados trabajan muy bien dictando con un número reducido de tópicos”, dice Held.
A estos grupos especializados se les ofrecen programas preparados con vocabulario pertinente a sus disciplinas. Así, los programas de reconocimiento de voz ofrecen, entre otras, versiones especializadas tanto para abogados en su bufete como para médicos sentados frente a un ecógrafo.
Pero incluso en casos en que la computadora se enfrenta a un vocabulario altamente inusual, tal como el de un arqueólogo, hay también una solución. “Las herramientas de análisis de vocabulario pueden tomar un texto escrito y analizarlo para establecer el vocabulario personal del usuario”, dice Rieke Bacher, de Linguatec. Esto se aplica también a Dragon Naturally Speaking 9 de Nuance.
Tanto Dragon Naturally Speaking como Voice Pro funcionan con sistemas de dictado digital y cascos de audífono-micrófono inalámbricos. Esto, por ejemplo, permite que una persona dicte mientras conduce al volante de su vehículo, convirtiendo sus notas dictadas automáticamente en texto escrito.
Voice Pro 11 de Linguatec se ofrece en versión USB con un casco USB y vocabulario para procesamiento de datos y situaciones de negocios por 199 dólares (147 euros), mientras la versión standard de Dragon Naturally Speaking 9 cuesta 99 dólares (74 euros). Nuance vende también IBM Via Voice, antes distribuido por IBM, que en su versión standard cuesta 99 dólares (74 euros).
DPA