Analítica de voz

Contenido

Definición: ¿Qué significa Speech Analytics?
Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.
Techopedia explica Speech Analytics

Definición: ¿Qué significa Speech Analytics?

La analítica de voz es el proceso de extracción de contenido relevante y vital de un archivo de audio grabado. Tiene la capacidad de identificar, categorizar y hacer referencias cruzadas automáticamente información importante con respecto a lo que se dice o la sustancia o significado real del discurso, no solo palabras individuales. Para que esto sea posible, el análisis de voz hace uso de varios tipos de aplicaciones de software, como el reconocimiento automático de voz y las herramientas de minería de audio.

Una introducción a Microsoft Azure y la nube de Microsoft | A lo largo de esta guía, aprenderá de qué se trata la computación en la nube y cómo Microsoft Azure puede ayudarlo a migrar y administrar su negocio desde la nube.

Techopedia explica Speech Analytics

Existen tres enfoques principales en el análisis del habla: reconocimiento de voz directo, frase directa y fonética.

Speech-to-: utiliza bi-gramos o tri-gramos como unidades básicas para analizar el habla y necesita que coincida con miles de palabras. El resultado es un flujo de palabras que facilita el trabajo y también es preciso.
Reconocimiento directo de fase: analiza directamente el habla buscando frases predefinidas en lugar de convertirlas en fonemas. Aunque este es el método más largo, también es el más preciso ya que no se pierde información al convertir los datos.
Fonética: la forma más rápida de procesamiento ya que la unidad básica utilizada es un fonema. Dado que solo se conocen unos pocos fonemas en la mayoría de los idiomas, se utiliza una larga lista de estos que el software hace referencias cruzadas para fonemas de destino al más cercano en la lista.