Los sistemas actuales de Reconocimiento Automático del Habla (RAH) se componen de varias etapas en las que se pueden utilizar distintos tipos de metodologías:
Clasificación de los Sistemas de Rah
12:32 |
Los sistemas de reconocimiento de voz se pueden clasificar atendiendo a los siguientes criterios:
-
- Entrenabilidad: Indica si va a ser necesario o no entrenar al sistema para comenzar con su uso.
- Dependencia del hablante: Va a determinar si el sistema es apto para funcionar con una única persona (en este caso se denomina dependiente del locutor) o por el contrario es apto para funcionar con cualquier persona(es independiente del locutor).Los sistemas independientes del locutor son sistemas con una mayor calidad, aunque sin embargo suelen ser más difíciles de llevar a cabo, y además presentan un precio más alto en el mercado.
Técnicas más utilizadas aplicadas al Rah
12:30 |
Las técnicas que más se utilizan en el reconocimiento automático del habla son:
Técnicas de Programción Dinámica(DTW)
Esta técnica consite en realizar una comparación entre los patrones o plantillas de las que dispone el sistema con la señal acústica recibida como entrada, de esta forma se obtienen posibles candidatos a los que puede pertenecer la señal recibida. Para realizar esta tarea tan compleja se parametriza la señal recibida y se transforma la señal de entrada en coeficientes espectrales para analizarla de forma correcta. Una vez se obtiene los espectros de la señal comienza el proceso de reconocimiento comparandolo con los patrones almacenados. Esta técnica, es utilizada tanto para resolver problemas de reconocimiento de habla continua como aislada. Sin embargo esta técnica suele tener algunos problemas debido a: la duración de la palabra no tiene que ser de una duración determinada, por lo que puede que no coincida con la de la plantilla; y el ritmo con el que se realiza la pronunciación no tiene que mantenerse constante por lo que no se ajustará a la plantilla en ese sentido, ya que este depende de la persona.
El Problema del Rah
12:21 |
La gran dificultad de estos sistemas es determinar cuáles pueden ser las causas que hacen tan difícil realizar un reconocimiento automático del habla, de forma que se pueda encontrar una solución global lo más óptima posible. Algunas de las causas son:
Que es el Reconocimiento de voz en informatica
11:59 |
El reconocimiento automático del habla (RAH) o
reconocimiento automático de voz es una disciplina (y a la vez es un arte) de
la inteligencia artificial que tiene como objetivo permitir la comunicación
hablada entre seres humanos y computadoras. El problema que se plantea en un
sistema de este tipo es el de hacer cooperar un conjunto de informaciones que
provienen de diversas fuentes de conocimiento (acústica, fonética, fonológica,
léxica, sintáctica, semántica y pragmática), en presencia de ambigüedades,
incertidumbres y errores inevitables para llegar a obtener una interpretación
aceptable del mensaje acústico recibido.
Suscribirse a:
Entradas (Atom)