Inteligência artificial roda Minecraft usando apenas uma foto como base; veja como jogar e testar essa nova IA interativa chamada Oasis
Após ser treinada com vídeos de gameplay de em questão foi lançada em 31 de outubro de 2024 e permite que usuários joguem pelo site oficial (https://oasis.decart.ai/starting-point) em testes de 5 minutos.
É possível começar em cenários preestabelecidos como uma vila, floresta, entre outros ou enviar uma screenshot de um cenário em Minecraft e jogar a partir dele. Por se tratar de uma versão beta, a desenvolvedora sugere que bugs podem e devem acontecer
A diferença da Oasis para outras Inteligências Artificiais é que ela usa tecnologia “Transformer” ao lado do modelo de difusão, que promete ser mais “atenta” aos detalhes das imagens e a correlação entre eles. Após ser treinada com vídeos de gameplay de Minecraft ela se tornou capaz de receber comandos do jogador. É possível se mover pelas teclas WASD, olhar ao redor com o mouse, pular, quebrar e pegar itens e mais. A cada ação a Oasis tenta gerar os próximos quadros levando em consideração os comandos do jogador a uma taxa de 20 quadros por segundo.
Apesar de funcional a tecnologia demonstra mais uma prova de conceito, pois ainda há muitos bugs e questões ao seu redor. Por exemplo, a resolução da imagem é baixa, como assistir a um vídeo do YouTube e o cenário ao seu redor pode mudar a qualquer momento que o jogador não estiver olhando, pois a Oasis não tem o mapa do jogo guardado como um local fixo. Estes problemas de permanência de objeto estão entre os bugs que os desenvolvedores pretendem consertar ao adicionar mais memória para que o jogo se lembre de detalhes de muitos quadros atrás. Ao enviar fotos para gerar gameplay a IA costuma “alucinar” mais, criando coisas inesperadas. A função ainda está em beta e, segundo os desenvolvedores, apresenta mais problemas que os cenários predeterminados.
Vale ressaltar também que o sistema utiliza placas de vídeo caras, como a Nvidia H100, que podem custar mais de R$ 100 mil. A engine Oasis é capaz de gerar suas imagens na placa da Nvidia em 0,04 segundos, o que é consideravelmente mais rápido que outras IAs do mercado como Sora e Runaway Gen-3 que levam entre 10 a 20 segundos para gerar um quadro de vídeo, impossibilitando um gameplay estável. Pesquisadores do Google já realizaram testes semelhantes com sua engine chamada GameNGen, a qual foi capaz de rodar o clássico Doom de 1993 após ser treinada por meio de 900 milhões de quadros do game.
/i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2024/d/3/W8JCHDTgeQe7eLm3S0ag/oasis-inteligencia-artificial-minecraft-gameplay-foto.jpg)