Tecnología de reconocimiento de voz: ¿útil o dolorosa?

Autor: Judy Howell
Fecha De Creación: 28 Mes De Julio 2021
Fecha De Actualización: 23 Junio 2024
Anonim
Tecnología de reconocimiento de voz: ¿útil o dolorosa? - Tecnología
Tecnología de reconocimiento de voz: ¿útil o dolorosa? - Tecnología

Contenido


Para llevar:

La interacción con la electrónica conversacional es cada vez más común y necesaria. Pero hasta ahora, los resultados son decididamente mixtos.

¿Alguna vez ha llamado a una compañía para obtener ayuda o pagar su factura, solo para ser recibido por una agradable voz grabada que quiere tener una conversación con usted, pero no puede entender la mitad de lo que está diciendo? O tal vez tienes un iPhone, y si bien Siri parecía un buen aliado por primera vez, te has dado cuenta de que a veces (OK, seamos honestos, a menudo) ella simplemente no lo entiende. La tecnología de reconocimiento de voz (VRT), también conocida como discurso a, cae en una trampa común: tiene el potencial de ser increíblemente genial (y vaya, lo apoyamos), pero con mayor frecuencia, es un ejercicio de rechinar los dientes en la frustración.

Alguna vez una idea que pertenecía al ámbito de la ciencia ficción, el reconocimiento de voz ha crecido desde su infancia en la década de 1950, cuando el sistema Audrey de Bell Laboratories fue diseñado para reconocer dígitos hablados en una sola voz, a la red moderna de electrónica conversacional con la que ahora interactuamos. diariamente, con resultados mixtos.

Para hablar con un humano, presione 0

Muchas de las empresas de hoy en día usan sistemas llamados respuesta de voz interactiva (IVR) para manejar las llamadas de servicio al cliente. El uso más común es para los menús de navegación por voz, pero algunas compañías usan sistemas IVR que pueden acceder a la información de la cuenta del cliente y responder preguntas menores. El software del Menú IVR generalmente tiene un vocabulario limitado, que puede estar restringido a "sí", "no" y números. Los sistemas más complicados pueden reconocer palabras y frases específicas de la compañía.

Estos sistemas se están volviendo más populares, al menos para las empresas, por una simple razón: son rentables. Según un informe de 2010 del Wall Street Journal, una llamada típica de un cliente que llega a un agente cuesta entre $ 3 y $ 9, mientras que una llamada manejada a través de un sistema automatizado solo cuesta entre cinco y siete centavos. Y, por supuesto, los programas de computadora no se cansan, llaman enfermos o se frustran con los clientes (¡aunque los clientes ciertamente se frustran con ellos!).

Afortunadamente, esto no siempre significa que la IVR le quita trabajos a las personas, o al menos que todas las personas están desapareciendo de los centros de llamadas. Estos ayudantes activados por voz permiten que los representantes de servicio al cliente humano sean más productivos al dirigir llamadas y responder preguntas simples.

Por supuesto, para los usuarios humanos que interactúan con estas tecnologías, no siempre es fácil navegar. La tecnología está ayudando a mejorar los problemas comunes en la tecnología IVR, como los problemas con los acentos, pero el saqueo de sistemas automatizados sigue siendo un tema común en línea. Echa un vistazo a esta comedia sobre un ascensor equipado con reconocimiento de voz, que resalta la frustración que pueden producir los fallos de funcionamiento en los sistemas IVR.

Aplicaciones telefónicas personales: Siri, Google Now

La mayoría de las personas están familiarizadas con el reconocimiento de voz para teléfonos inteligentes. Si bien la mayoría de los últimos modelos de teléfonos vienen con realidad virtual, su popularidad y notoriedad aumentaron cuando Apple presentó a Siri, el "asistente personal" ligeramente sarcástico y activado por voz para el iPhone 4S en 2011. Google pronto creó un competidor directo: Google Ahora para el sistema operativo Android Jelly Bean. Ambos sistemas cuentan con voces femeninas y funciones de reconocimiento sofisticadas que permiten a los usuarios "hablar" con sus teléfonos usando un lenguaje informal.

Pero si bien estos sistemas son considerablemente más sofisticados y funcionales que sus predecesores, también muestran que la tecnología aún tiene un largo camino por recorrer. Las bromas sobre el fracaso de Siris se han convertido en un popular meme de Internet. Un hombre incluso demandó a Apple por publicidad falsa con respecto a las capacidades de Siris.

Quizás es por eso que mientras Apple creó a Siri para ser avanzado e informativo, el software de realidad virtual también es un poco descarado. Por ejemplo, si habla una de las líneas de tecnología de inteligencia más infames en la historia del cine de la película de 1968 "2001: Una odisea del espacio" - "abra las puertas de la bahía de pod" - Siri responderá con la línea de respuesta de la película " Lo siento (tu nombre), me temo que no puedo hacer eso ", o lo que es más sarcástico," nosotros los agentes de inteligencia nunca vivirán así, aparentemente ".

Llamarte por tu nombre es solo una de las funciones que intenta hacer que Siri sea más fácil de amar y un poco más humano. El asistente de realidad virtual puede seguir los comandos de voz para realizar llamadas, tomar dictados y s s, realizar búsquedas de información en Internet, encontrar tiendas cercanas, dar instrucciones de manejo y más, todo sin la necesidad de tocar nada. Las respuestas son pronunciadas simultáneamente por el teléfono y se muestran en la pantalla.

Google Now, la parte de realidad virtual de la plataforma Android Jelly Bean, es muy similar a Siri. El sistema ofrece las mismas capacidades de reconocimiento extensivo al traducir el discurso casual en comandos que permiten a los usuarios hacer llamadas, enviar búsquedas, realizar cálculos y conversiones, tomar definiciones de palabras, configurar alarmas, reproducir canciones y obtener mapas y direcciones.

Con asistentes de voz personales como Siri y Google Now, los beneficios son obvios. Todo, desde llamadas y llamadas hasta búsquedas y entretenimiento, es más rápido y fácil. Solo di lo que quieras y (la mayoría de las veces) la aplicación de realidad virtual lo toma por ti. La tecnología de manos libres de realidad virtual es especialmente útil durante la conducción. Y si bien muchas personas han denunciado los defectos de Siris, y los escritores han argumentado que la capacidad de Google Now para ejecutar esencialmente las vidas de los usuarios es un tanto espeluznante, un poco insultante, la mayoría de las personas todavía sienten que estas tecnologías futuristas son bastante geniales.

Por supuesto, las aplicaciones de teléfonos personales como Siri y Google Now están lejos de ser perfectas, aunque sí muestran hacia dónde podría dirigirse esta tecnología en el futuro. Eso significa que incluso cuando Siri aparece una respuesta incorrecta, es probable que se rían y la perdonen, sabiendo que la próxima versión será mucho mejor.

Donde VR cae plano

Si alguna vez encontró un IVR cuando llamó a un negocio, es posible que haya notado ciertas barreras a la comunicación. Algunos programas usan una voz robótica a voz que pronuncia mal las palabras y hace que las cosas sean difíciles de entender. Otros tienen problemas de sensibilidad que hacen que el software no pueda procesar lo que está diciendo si es demasiado alto, demasiado suave o no se enuncia con cuidado.

Además, muchas personas todavía no se sienten cómodas hablando con una máquina. Si realiza algunas búsquedas en IVR, encontrará listas que la gente ha reunido de formas de evitar los sistemas IVR y llegar a una "persona real". Estas soluciones van desde "seguir presionando 0 para un operador" hasta "insultar a la máquina hasta que atrape a un ser humano". Como resultado, gran parte del desarrollo reciente en los sistemas IVR ha girado en torno a hacerlos más agradables para los humanos; haciendo que las voces sean más comprensivas y menos robóticas, haciendo que el sistema sea más fácil de navegar y que las personas que llaman sepan cuánto tiempo llevará todo de principio a fin. Eso sugiere que la mejor tecnología es solo la mitad de la batalla aquí; la otra mitad está haciendo que los usuarios se unan para hablar con una máquina.

Lo que depara el futuro

A pesar de estos desafíos, la tecnología de reconocimiento de voz está mejorando todo el tiempo. Las aplicaciones como Siri y Google Now (defectos y todo) siguen siendo extraordinariamente impresionantes en su rendimiento, y varias compañías están expandiendo las capacidades de realidad virtual a otras aplicaciones.

Por ejemplo, Nuance, los creadores del software de voz a software Dragon NaturallySpeaking, ya ha desarrollado controles de voz para televisores y automóviles, y las versiones de esta tecnología están incorporadas en algunos televisores Samsung y los sistemas de entretenimiento SYNC utilizados en ciertos vehículos Ford.

Y a medida que Google y Apple continúan encontrando nuevos usos para sus tecnologías de reconocimiento de voz, es probable que cada vez más hablen con todo tipo de máquinas cotidianas, desde nuestros televisores hasta nuestras tostadoras. Y, una vez más, parece que la ciencia ficción tenía razón. Bueno, solo tengo que esperar que esos escritores inteligentes estuvieran equivocados sobre una cosa. Si estas máquinas se están haciendo cargo, podría tener muchos problemas la próxima vez que le pida a Siri que "abra las puertas de la bahía de pod".