Un recorrido por los modelos de aprendizaje profundo

Video: Aprende sobre Modelos de Aprendizaje Reforzado

Contenido

Estilo neuronal
Narrador Neural
Datos
Char-RNN TED
Conclusión

Fuente: Kran77 / Dreamstime.com

Para llevar:

Los modelos de aprendizaje profundo están enseñando a las computadoras a pensar por sí mismas, con algunos resultados muy divertidos e interesantes.

El aprendizaje profundo se está aplicando a más y más dominios e industrias. Desde autos sin conductor, hasta jugar Go, y generar imágenes de música, todos los días salen nuevos modelos de aprendizaje profundo. Aquí repasaremos varios modelos populares de aprendizaje profundo. Los científicos y desarrolladores están tomando estos modelos y modificándolos de formas nuevas y creativas. Esperamos que este escaparate pueda inspirarte para ver lo que es posible. (Para conocer los avances en inteligencia artificial, consulte ¿Las computadoras serán capaces de imitar el cerebro humano?)

Estilo neuronal

No puede mejorar sus habilidades de programación cuando a nadie le importa la calidad del software.

Narrador Neural

Neural Storyteller es un modelo que, cuando se le da una imagen, puede generar una historia de romance sobre la imagen. Es un juguete divertido y, sin embargo, puedes imaginar el futuro y ver la dirección en la que se mueven todos estos modelos de inteligencia artificial.

La función anterior es la operación de "cambio de estilo" que permite al modelo transferir subtítulos de imágenes estándar al estilo de historias de novelas. El cambio de estilo se inspiró en "Un algoritmo neuronal de estilo artístico".

Datos

Hay dos fuentes principales de datos que se utilizan en este modelo. MSCOCO es un conjunto de datos de Microsoft que contiene alrededor de 300,000 imágenes, y cada imagen contiene cinco subtítulos. MSCOCO es la única información supervisada que se utiliza, lo que significa que es la única información en la que los humanos tuvieron que ingresar y escribir explícitamente subtítulos para cada imagen.

Una de las principales limitaciones de una red neuronal de retroalimentación es que no tiene memoria. Cada predicción es independiente de los cálculos anteriores, como si fuera la primera y única predicción que la red haya realizado. Pero para muchas tareas, como la traducción de una oración o párrafo, las entradas deben consistir en datos secuenciales y relacionados entre sí. Por ejemplo, sería difícil dar sentido a una sola palabra en una oración sin la estafa proporcionada por las palabras circundantes.

Los RNN son diferentes porque agregan otro conjunto de conexiones entre las neuronas. Estos enlaces permiten que las activaciones de las neuronas en una capa oculta retroalimenten en el siguiente paso de la secuencia. En otras palabras, en cada paso, una capa oculta recibe tanto la activación de la capa debajo de ella como también del paso anterior de la secuencia. Esta estructura esencialmente le da memoria a las redes neuronales recurrentes. Entonces, para la tarea de detección de objetos, un RNN puede recurrir a sus clasificaciones anteriores de perros para ayudar a determinar si la imagen actual es un perro.

Char-RNN TED

Esta estructura flexible en la capa oculta permite que los RNN sean muy buenos para los modelos de lenguaje a nivel de caracteres. Char RNN, creado originalmente por Andrej Karpathy, es un modelo que toma un archivo como entrada y entrena a un RNN para aprender a predecir el siguiente personaje en una secuencia. El RNN puede generar carácter por carácter que se verá como los datos de entrenamiento originales. Se ha entrenado una demostración utilizando transcripciones de varias conversaciones TED. Alimente al modelo con una o varias palabras clave y generará un pasaje sobre las palabras clave en la voz / estilo de un TED Talk.

Conclusión

Estos modelos muestran nuevos avances en inteligencia artificial que se han hecho posibles gracias al aprendizaje profundo. El aprendizaje profundo muestra que podemos resolver problemas que nunca antes pudimos resolver, y aún no hemos alcanzado esa meseta. Espere ver muchas cosas más emocionantes, como los autos sin conductor en los próximos años como resultado de la innovación de aprendizaje profundo.