Portanto, um modelo de difusão, dados de eliminação de ruído, relação sinal-ruído de pico, agente RL, modelo autorregressivo e termodinâmica entram em um bar … E agora podemos jogar o clássico jogo de tiro em primeira pessoa de 1993, RUÍNA, gerado em tempo real por IA.
Alguns caras do Google e da Universidade de Tel Aviv criaram um novo mecanismo de jogos, chamado GameNGen, que é totalmente alimentado em tempo real por um modelo neural, também conhecido como Inteligência Artificial.
A essência disso é que eles treinaram um agente de aprendizagem por reforço (um agente RL) para jogar RUÍNA. Repetidamente, esse agente RL jogava enquanto gravava e armazenava cada sessão, aprendendo como não levar um tiro, ser comido ou morrer de outra forma, ao mesmo tempo que aprendia como simplesmente interagir com o ambiente.
Em segundo lugar, um modelo de difusão – que é efetivamente um modelo que aprende a destruir uma imagem que de outra forma seria perfeita ao longo de muitas etapas com ruído antes de remover o ruído dos dados para restaurar a imagem de volta à sua antiga glória, o que o torna muito bom em prever e criar uma imagem. Neste caso específico, é um motor de jogo capaz de prever qual deverá ser o próximo quadro de jogo com base no quadro anterior.
GameNGen
Usando os dados aprendidos assistindo o agente RL jogar RUÍNA repetidamente, ele pode gerar todas as texturas, cores, modelos, skins e tudo mais necessário para visualizar os mapas em RUÍNA.
Normalmente, texturas, sprites, modelos, shaders, pré-fabricados, etc. são todos salvos localmente e carregados no início de cada nível. Cada um também terá uma interação física exclusiva pré-carregada.
O modelo do difusor pode prever e desenhar como deve ser o próximo quadro, digamos, quando uma arma é disparada, contra o que ela é disparada e quais implicações físicas os tiros de espingarda terão no objeto que atingir. Um cara mau? Agora eles estão mortos. Um barril de lama tóxica? Agora explodiu.
Adicione algumas entradas do usuário e agora você tem um jogo. Um jogo sendo gerado e interagido em tempo real, sem pré-carregamento ou cache. RUÍNA foi usado neste exemplo, mas qualquer jogo pode ser usado. Mesmo algo que talvez ainda não exista. A GameNGen poderia teoricamente criar seu próprio jogo se recebesse alguns parâmetros.
Tudo isso foi conseguido usando uma única unidade de processamento de tensor (TPU) – semelhante a uma GPU para processamento gráfico, mas projetada especificamente para atender à IA, para processamento computacional de alto volume e baixa precisão – e foi capaz de atingir 20 fps. Muito longe da linha de base de 60 fps para jogos modernos, mas como acontece com toda nova tecnologia, só vai melhorar. A versão tradicional de 1993 rodou a um máximo de 35 fps.
Com a configuração de TPU único, a memória se torna um problema e o modelo de IA é capaz de “lembrar” apenas cerca de três segundos de jogo antes de “esquecê-lo” enquanto o usuário avança pelos níveis. A IA, porém, é capaz de inferir a maioria dos dados, como sua contagem de munição e se você já venceu uma área específica do mapa, mas com uma duração de contexto de cerca de três segundos, às vezes isso levaria a erros.
Outro fato notável é que depender apenas do agente RL para treinamento também tem suas falhas; em vez de usar o agente RL na tentativa de atingir pontuações máximas e encontrar todos os locais secretos frequentemente escondidos em jogos FPS, ele foi treinado para coletar dados de maneiras que pessoas típicas poderiam jogar. O agente RL teve acesso às 32 ações anteriores realizadas durante o treinamento.
“Nosso agente, mesmo ao final do treinamento, ainda não explora todos os locais e interações do jogo, levando a comportamentos errôneos nesses casos”, segundo o whitepaper divulgado pela GameNGen.
Os videogames sempre foram criados por pessoas com milhões de linhas de código escritas. GameNGen é o primeiro a contar com um modelo neural; um potencial virada de jogodesculpe o trocadilho.
Desde que comecei a jogar na nuvem, há apenas alguns anos, tem sido ótimo poder jogar em velocidades e resoluções que meu antigo Xbox ou minha velha e áspera GTX 760 Ti simplesmente não conseguem. Não importa que eu possa pular os incômodos downloads de 160 GB para experimentar um jogo que não tenho certeza se vou gostar.
Desde ser originalmente lançado para DOS até ser gerado em execução pela IA… quem teria imaginado tal coisa há mais de 30 anos? Os motores de jogos generativos de IA são o futuro? Teremos apenas uma caixa conectada ao nosso holodeck e daremos algumas instruções para começar a jogar jogos totalmente exclusivos, adaptados ao nosso gosto? Eu sei que mal posso esperar para tentar RUÍNA em um display volumétrico!
Doom em um display volumétrico
Se você está se sentindo particularmente nerd, confira a íntegra white paper aqui (PDF).
Fonte: GameNGen