Con la tecnología de Blogger.
RSS

Diseño de un sistema de RAH

Los sistemas actuales de Reconocimiento Automático del Habla (RAH) se componen de varias etapas en las que se pueden utilizar distintos tipos de metodologías:


  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

Clasificación de los Sistemas de Rah

Los sistemas de reconocimiento de voz se pueden clasificar atendiendo a los siguientes criterios:
  • Entrenabilidad: Indica si va a ser necesario o no entrenar al sistema para comenzar con su uso.
  • Dependencia del hablante: Va a determinar si el sistema es apto para funcionar con una única persona (en este caso se denomina dependiente del locutor) o por el contrario es apto para funcionar con cualquier persona(es independiente del locutor).Los sistemas independientes del locutor son sistemas con una mayor calidad, aunque sin embargo suelen ser más difíciles de llevar a cabo, y además presentan un precio más alto en el mercado.

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

Técnicas más utilizadas aplicadas al Rah

Las técnicas que más se utilizan en el reconocimiento automático del habla son:

Técnicas de Programción Dinámica(DTW)

Esta técnica consite en realizar una comparación entre los patrones o plantillas de las que dispone el sistema con la señal acústica recibida como entrada, de esta forma se obtienen posibles candidatos a los que puede pertenecer la señal recibida. Para realizar esta tarea tan compleja se parametriza la señal recibida y se transforma la señal de entrada en coeficientes espectrales para analizarla de forma correcta. Una vez se obtiene los espectros de la señal comienza el proceso de reconocimiento comparandolo con los patrones almacenados. Esta técnica, es utilizada tanto para resolver problemas de reconocimiento de habla continua como aislada. Sin embargo esta técnica suele tener algunos problemas debido a: la duración de la palabra no tiene que ser de una duración determinada, por lo que puede que no coincida con la de la plantilla; y el ritmo con el que se realiza la pronunciación no tiene que mantenerse constante por lo que no se ajustará a la plantilla en ese sentido, ya que este depende de la persona.

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

El Problema del Rah


La gran dificultad de estos sistemas es determinar cuáles pueden ser las causas que hacen tan difícil realizar un reconocimiento automático del habla, de forma que se pueda encontrar una solución global lo más óptima posible. Algunas de las causas son:

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS

Que es el Reconocimiento de voz en informatica


El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es una disciplina (y a la vez es un arte) de la inteligencia artificial que tiene como objetivo permitir la comunicación hablada entre seres humanos y computadoras. El problema que se plantea en un sistema de este tipo es el de hacer cooperar un conjunto de informaciones que provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica, léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades, incertidumbres y errores inevitables para llegar a obtener una interpretación aceptable del mensaje acústico recibido.

  • Digg
  • Del.icio.us
  • StumbleUpon
  • Reddit
  • RSS