El aprendizaje por refuerzo puede dar un buen giro dinámico al marketing

Autor: Roger Morrison
Fecha De Creación: 1 Septiembre 2021
Fecha De Actualización: 1 Mes De Julio 2024
Anonim
El aprendizaje por refuerzo puede dar un buen giro dinámico al marketing - Tecnología
El aprendizaje por refuerzo puede dar un buen giro dinámico al marketing - Tecnología

Contenido



Fuente: Juliatimchenko / Dreamstime.com

Para llevar:

El aprendizaje de refuerzo es un subconjunto de inteligencia artificial y aprendizaje automático que puede predecir resultados y ayudar a los usuarios a tomar mejores decisiones.

Los especialistas en marketing buscan constantemente soluciones escalables e inteligentes cuando intentan obtener una ventaja en las condiciones de marketing cada vez más competitivas. No es de extrañar que la inteligencia artificial (IA) y el aprendizaje automático (ML) estén siendo adoptados en masa por las marcas y sus organizaciones de marketing. (Para obtener más información sobre los conceptos básicos de ML, consulte Machine Learning 101.)

Para los no iniciados, la IA generalmente se puede considerar como una tecnología cuando una computadora automatiza las tareas definidas que un humano haría de otra manera. El aprendizaje automático, como un área funcional dentro de la IA, es cuando a una computadora se le da un objetivo final, pero necesita calcular la mejor ruta por sí misma.


Hoy en día, estamos viendo estas tecnologías, especialmente el aprendizaje automático, implementadas en muchas áreas de marketing, incluida la detección de fraude publicitario, el pronóstico del comportamiento del consumidor, los sistemas de recomendación, la personalización creativa y más.

Si bien todo eso está muy bien, existe una nueva tecnología derivada que, para los especialistas en marketing, realmente satisfará la demanda que está creando el aprendizaje automático. Se llama "aprendizaje de refuerzo" (RL).

¿Qué es el aprendizaje por refuerzo?

El cambio de paso de ML a RL es más que una simple carta. La mayoría de las tareas transferidas al aprendizaje automático implican el uso de un solo paso, como "reconocer esta imagen", "comprender el contenido del libro" o "detectar el fraude". Para un vendedor, un objetivo comercial como "atraer, retener e involucrar a los usuarios" es Inherentemente un paso múltiple y a largo plazo, que no se logra fácilmente con el aprendizaje automático.


Aquí es donde entra en juego el aprendizaje de refuerzo. Los algoritmos de RL tienen que ver con la optimización para un viaje en desarrollo y en constante cambio, uno donde ocurren problemas dinámicos. Al emplear una "función de recompensa" matemática para calcular el resultado de cada permutación, RL puede ver el futuro y tomar la decisión correcta.

Hoy en día, las mejores formas de realización de esta tecnología de vanguardia se pueden ver en juegos y automóviles sin conductor. Cuando el sistema AlphaGo de Google venció al mejor jugador del mundo del juego de mesa Go el año pasado, su salsa secreta fue el aprendizaje de refuerzo. Mientras que los juegos han establecido reglas, las opciones de un jugador para la ruta hacia la victoria cambian dinámicamente según el estado del tablero. Con el aprendizaje por refuerzo, el sistema tiene en cuenta todas las permutaciones posibles que pueden cambiar en función de cada próximo movimiento.

Del mismo modo, un automóvil autónomo realiza un viaje en el que las reglas de la carretera y la ubicación del destino permanecen fijas, pero las variables a lo largo del camino, desde peatones hasta bloqueos de carreteras y ciclistas, cambian dinámicamente. Es por eso que OpenAI, la organización fundada por Elon Musk de Tesla, emplea algoritmos avanzados de RL para sus vehículos.

Sin errores, sin estrés: su guía paso a paso para crear software que cambie su vida sin destruir su vida


No puede mejorar sus habilidades de programación cuando a nadie le importa la calidad del software.

Máquinas para vendedores

¿Qué significa todo esto para los vendedores?

Los desafíos centrales de muchos especialistas en marketing se crean por el hecho de que la condición comercial cambia todo el tiempo. Una estrategia de campaña ganadora puede desfavorecerse con el tiempo, mientras que una estrategia antigua puede ganar una nueva tracción. RL es un paso para imitar la verdadera inteligencia humana donde aprendemos del éxito y / o fracaso de múltiples resultados, y formamos una estrategia ganadora del futuro. Déjame dar algunos ejemplos:

1. Mejora del compromiso del usuario

Centrémonos en la participación del cliente para una cadena de restaurantes y en el objetivo de multiplicarlo por diez durante el próximo año. Hoy en día, una campaña de marketing podría incluir un saludo de cumpleaños con una oferta de descuento, tal vez incluso en función de las preferencias alimentarias. Este es un pensamiento lineal donde el vendedor ha definido un punto inicial y final.

En un mundo ocupado, la vida de los clientes cambia constantemente en tiempo real, a veces están más comprometidos, a veces menos. En el aprendizaje por refuerzo, un sistema constantemente recalibraría qué tácticas en el arsenal de marketing, en un momento dado, tienen la mejor oportunidad de mover al receptor hacia el objetivo final de un compromiso 10x.

2. Asignación presupuestaria dinámica

Ahora imagine un escenario publicitario en el que tiene un presupuesto de $ 1 millón y necesita gastar algo todos los días hasta fin de mes, asignado a través de cuatro canales diferentes: TV, promociones de lealtad y Google. ¿Cómo puede asegurarse de gastar el presupuesto de la manera más óptima? La respuesta depende del día, los usuarios objetivo, el precio del inventario y una serie de otros factores.

En el aprendizaje por refuerzo, los algoritmos usarían datos históricos de resultados de anuncios para escribir funciones de recompensa que califiquen ciertas decisiones de gasto. Pero también tiene en cuenta factores en tiempo real como la fijación de precios y la probabilidad de una recepción positiva por parte del miembro de la audiencia objetivo. A través del aprendizaje iterativo, la asignación de la inversión publicitaria a lo largo del mes cambiaría dinámicamente. Aunque el objetivo final está establecido, RL habrá asignado el presupuesto de la mejor manera posible en todos los escenarios. (Para más información sobre IA en marketing, vea Cómo la inteligencia artificial revolucionará la industria de las ventas).

Próximamente

El aprendizaje por refuerzo reconoce la complejidad y reconoce que las personas son heterogéneas y explica estas verdades, mejorando cada acción a lo largo del tiempo a medida que las piezas de su tablero de juego cambian a su alrededor.

El aprendizaje por refuerzo sigue siendo en gran medida una reserva de proyectos de investigación y adoptadores de vanguardia. El concepto y la técnica matemática ha existido durante más de 40 años, pero no ha sido posible su implementación hasta hace relativamente poco tiempo, gracias a tres tendencias:

  1. Proliferación de la potencia informática a través de unidades de procesamiento de gráficos (GPU) de alta potencia.

  2. La computación en la nube hace que la potencia del procesador de alta gama esté disponible a una fracción del costo de comprar las GPU, lo que permite a terceros alquilar una GPU para entrenar su modelo RL durante varias horas, días o semanas a un precio relativamente económico.

  3. Mejora en algoritmos numéricos o heurística inteligente. Algunos pasos numéricos críticos en un algoritmo RL ahora pueden converger a un ritmo mucho más rápido. Sin estos trucos numéricos mágicos, aún no serían factibles incluso con las computadoras más potentes de la actualidad.

Pensando más grande

Todo esto significa que los nuevos poderes del aprendizaje por refuerzo pronto estarán disponibles a escala para las marcas y los vendedores. Sin embargo, aceptarlo requerirá un cambio de mentalidad. Para un gerente de marketing, esta tecnología significa la capacidad de quitarse las manos del volante.

Cada negocio tiene un objetivo, pero cuando estás en las trincheras, las acciones diarias tomadas hacia ese objetivo pueden volverse confusas. Ahora, la tecnología RL permitirá a los tomadores de decisiones establecer el objetivo, teniendo más confianza en que los sistemas trazarán su mejor rumbo hacia él.

En publicidad, por ejemplo, en estos días, muchas personas se dan cuenta de que las métricas como el porcentaje de clics (CTR) son simplemente indicadores de resultados comerciales reales, contados solo porque son contables. Los sistemas de mercadotecnia impulsados ​​por RL quitarán énfasis a tales métricas intermedias y todo el trabajo pesado asociado con ellas, permitiendo a los jefes centrarse en los objetivos.

Esto requerirá que las empresas piensen en sus grandes problemas de una manera mucho más proactiva y a largo plazo. Cuando la tecnología esté madura, lograrán su objetivo.

Camino a la Adopción

El aprendizaje por refuerzo aún no está listo para el uso a gran escala por parte de las marcas; sin embargo, los especialistas en marketing deberían tomarse el tiempo para comprender este nuevo concepto que podría revolucionar la forma en que las marcas hacen marketing, cumpliendo algunas de las primeras promesas del aprendizaje automático.

Cuando llegue el poder, vendrá en software de marketing con una interfaz de usuario, pero las tareas requeridas por ese software se simplificarán radicalmente. Para el personal, habrá menos interruptores móviles y números de entrada, así como menos lectura de informes analíticos y acción sobre ellos. Detrás del tablero, el algoritmo manejará la mayor parte de eso.

Es poco probable que RL pueda igualar la inteligencia humana desde el principio. La velocidad de su desarrollo dependería de los comentarios y sugerencias de los especialistas en marketing. Debemos asegurarnos de pedirle a una computadora que resuelva el problema correcto y penalizarlo cuando no lo hace. Parece que le enseñarías a tu propio hijo, ¿no?