Se resume aquí un interesante artículo de Daniel Lange sobre la aplicación de la inteligencia artificial y el aprendizaje profundo al desarrollo de juegos, cuyo título original es
Bringing gaming to life with AI and deep learning
cuyo autor es Danny Lange
El desarrollo de juegos es un proceso complejo en el que
artistas gráficos, narradores y ingenieros de software deben trabajar de forma
coordinada. Existen ahora nuevas técnicas que proceden del desarrollo de
aspectos de la inteligencia artificial como el aprendizaje profundo y hay
grandes esperanzas puestas en el aprendizaje automático.
Como siempre, el desarrollo se alimenta de la necesidad de
aumentar los ingresos. El aprendizaje automático lo empezó a utilizar Amazon en
el año 2000, desarrollando algoritmos para descubrir las preferencias de los
usuarios, lo que supone un aumento de ventas. Amazon había estado trabajando
duro en sus propios algoritmos de recomendación, tratando de descubrir las
preferencias de los usuarios y a su vez convertir esas preferencias en ventas
más altas.
Los algoritmos de recomendación, por ejemplo, han
evolucionado desde la recomendación hasta aplicar una mezcla de exploración y
explotación para obtener una visión más completa sobre las preferencias de los
usuarios. Algoritmos como los bandidos utilizan esta capacidad de explorar y
explotar. Estos algoritmos tienen presencia en muchas páginas cuando se visita
Amazon.
DeepMind en 2015 introdujo en los juegos el concepto de
aprendizaje profundo de refuerzo, capaz de aprender las secuencias de acciones
necesarias para maximizar una recompensa acumulativa futura.
Es muy ilustrativo el video que aparece en el artículo sobre
el juego en el que un pollo aprende a cruzar una carretera muy concurrida sin que
acabe aplastado por un camión que se acerca mientras recoge paquetes de regalo.
Se proporciona al pollo una recompensa positiva cuando recoge un paquete de
regalo y una recompensa negativa cuando lo golpea un camión. Con cuatro
movimientos del pollo, izquierda, derecha, hacia adelante y hacia atrás, los píxeles
en bruto y una puntuación como entrada, y estas instrucciones muy sencillas, el
pollo logra capacidades extraordinarias.
Para conseguirlo se
utilizó un API de Python que permitió conectar el juego Unity a un servicio
TensorFlow que se ejecuta en Amazon Web Services (AWS). Cuando se inicia el proceso
de entrenamiento, el pollo se dedica a explorar, pero a medida que avanza el
proceso de aprendizaje, gradualmente cambia al proceso de explotación. Este mismo
procedimiento es el que pueden utilizar Amazon, Netflix y Uber para mejorar el
servicio a sus clientes.
Las posibilidades con respecto a los primeros pasos de
aprendizaje automático, han aumentado con el desarrollo de redes neuronales
recurrentes expresivas (RNN) tales como la memoria a largo plazo (LSTM) para el
aprendizaje secuencial y las redes neuronales convolucionales (CNNs) para el
aprendizaje espacial de rasgos, así como una potencia computacional combinada y
el software escalable y sofisticado.
Si bien el uso del aprendizaje de refuerzo profundo en el
desarrollo de juegos aún se encuentra en su fase inicial, será una tecnología
de juego disruptiva. Los entornos de aprendizaje automático como TensorFlow que
se ejecuta en la nube junto con API de integración están facilitando el acceso
a los desarrolladores de juegos y a los investigadores de aprendizaje
automático.