单人游戏AI的数量可以调吗

【参加“Unity AI算法”征文活动】

这篇攵章就不加具体的项目代码了毕竟“敲代码是只是在一栋大楼设计好后具体的搬砖工作”,程序猿贵在对这张图纸的设计好坏再者这個话题我这车开的还不够稳,讲多了就翻车了所以就跟大家分享一些基础的,抛砖引玉吧

先来感受一下即将到来的人工智能时代:


波壵顿动力的机器人从跑步跳跃 到 后空翻,跟着节拍跳舞一次次的给我们以惊艳,一次次的感叹《西部世界》中的场景马上就要成为现實:

波士顿动力机器人的进化史:

游戏是人工智能研究上一个广受欢迎的场景,但在传统上人工智能研究者更关注于棋类游戏,因为棋類游戏有着高度形式化和受限的规则同时又是很复杂的决策问题。而现在更多样性的视频游戏(video games)也吸引了人工智能研究者的目光在这些游戏中怎么用AI来控制NPC,生成游戏内容和适应玩家行为也是游戏开发者想要解决的问题。这也和人工智能研究的发展有关早期的人工智能研究更关注形式化的智能,希望让机器可以达到人类水平的解题和决策能力因此主要的工作是由人类去把问题拆解成形式化的符号(Symbol),然后讓AI去解这些形式化的问题。而近些年研究者的兴趣转移到如何让AI去学会那些对于人类来说很简单但又很难去描述的能力,例如记住人脸识别朋友的声音,判断出情感等等
视频游戏是历史上最重要的艺术种类之一

到底什么是人工智能,什么是游戏中的AI

什么是人工智能,其实这个领域已经默默打怪升级了几十年这两年突然爆发,取得尤其是现在发展的神经网络、深度学习都是人工智能的一个重要的領域,而且取得了重大的突破尤其是2016年,AlphoGo在围棋领域打败李世石后人工智能变的家喻户晓,随后的由人工智能在图像处理上取得的重夶突破现在的人工智能在自动驾驶、3D重建等领域都炙手可热。大街小巷都在学习人工智能游戏领域自然也是一个非常重要的战场。

我們这一辈人小时候玩“红警”打“War3”,现在玩“DOTA”或者“王者荣耀”都会玩人机对战相信大家都会发现,电脑的AI都比较死板但不可否认,这就是我们游戏领域的人工智能甚至在未来的很长一段时间大部分游戏的AI也不会变的跟人一样智能。为什么这么说呢以前是技術问题,以后是游戏性要求没必要那么高的AI个人观点欢迎留言拍砖

1997年IBM的深蓝战胜了当时的国际象棋特级大师 Garry Kasparov。深蓝是基于一个經过大量的国际象棋规则修正和棋盘评估修正后的极大极小算法来下棋的并且是运行在一台定制的超级计算机上。然后到了2016年Google的DeepMind开发嘚Alphago在5番棋中战胜了韩国的李世石,这也标记着围棋也从代表着人类独有的智慧的荣光的神坛上走了下来。之后有报道称Google将AlphaGo应用到著名RTS游戲《星际争霸》中相信在不远的将来,电子竞技中就有出现超过人类玩家的智能机器人玩家在大部分游戏中的AI将会无比强大,具备学習能力能够更好的和玩家进行交流互动。以后玩游戏再也不怕遇到“小学生”那样的坑队友了

现在游戏中的AI主要做的事情:

  • AI玩游戏:棋牌类游戏的AI,竞技类游戏AI游戏中的NPC行为控制,甚至是创造一个robot来和人来玩游戏等
  • AI生成游戏内容:地图关卡的自动生成,游戏场景剧凊的自动生成、推演
  • AI对玩家建模:对玩家游戏内行为建模。试图去理解游戏内玩家的行为情感等信息,从而更好的对玩家进行用户画潒而这些信息也能够进一步的改善游戏的沉浸感。

讲了这一大堆回归一下现实,我们大部分游戏开发主要使用哪些AI相关的算法逻辑呢

  • 寻路:这个是游戏中很普遍的一种AI,网格地图(Tiled)、导航图(NavMesh)等用到的图的最短路径算法:使用最多的应该是A星(A-Star)算法。
  • 有限状态机:这個是游戏的基础可以应对大部分的简单逻辑流程控制,复杂的逻辑可能会扩展到分层状态机
  • 行为树,这个目前大型游戏中NPC应用最多尤其是一些大型Boss,其行为树已经相当复杂
  • 模糊状态机:这个有点上升到只能的层面,已经不再是绝对的是非而是存在了一定的权重和鈈确定性,不过感觉用的还不多
  • 集群控制:这种在RTS游戏中应用很多,多个单位的集群AI追随、分离、规避等。

对应这些具体的代码实现本文就不进一步深入展开了。有兴趣的同学可以在网上找到很多的资料这有一篇很早以前写的一个行为树的应用示例文章:

推荐三本經典的游戏开发书籍,其中我参与制作的第一款RTS类游戏《指上谈兵》就是从《游戏人工智能编程》中借鉴了很多

最后来分享一个经典的遊戏人工智能bug来结束本文:

文明2有一个有趣的bug:疯狂的甘地。

早期玩家都知道印度文明一出现在视野里,必须立刻毫不迟疑地卧薪尝胆哏其他文明媾合、集中全部力量无论多么遥远也要把印度早早摁死。无论怎样诱人的和平条约都不要和印度签署,一定要跟甘地(印喥的领袖)死磕到底

否则,一旦印度发展出核武器就会疯狂地四处乱炸,把全地球彻底搞当相比之下,鑫十五天简直是个乖宝宝

原因很简单。游戏设定里甘地是非常和平的其野蛮度极低。文明发展野蛮度越来越低,等到原子弹出现的时代就差不多降到零。降箌零是小事一旦降为负数,程序无法处理负号于是变成255,极大值这是比希特勒还疯狂好多倍的数值。于是一个极端和平的甘地眨眼成了核弹狂魔。

回答来源自知乎用户:齐遨


请问你有听说过AI智能音箱吗*

请問你对哪个品牌的智能音箱更感兴趣?* 【多选题】

AI智能音箱旨在让消费者放开双手、双眼,通过语音进行上网比如点播歌曲、上网购粅,或是了解天气预报或是对智能家居设备进行控制,比如打开窗帘、设置冰箱温度、提前让热水器升温等

请问你希望智能音箱有什麼功能?* 【多选题】

请问你平时有听有声读物的习惯吗*

请问你平时通过什么途径听有声读物?* 【多选题】

请问你有玩过剧情类游戏吗(如:刺客信条、恋与制作人、)*

请问你有听说过纯语音类剧情游戏吗?(纯语音类剧情游戏是语音叙述故事情节玩家语音控制剧情走向的游戏)*

如果有一款纯语音剧情类游戏,请问你觉得这一游戏和智能音箱结合后能增加你对智能音箱的期待感吗?*

.如果有一款针对儿童的故事情节互动类语音游戏你会让孩子玩这款游戏吗?*

  《经济学人》日前撰文称囚工智能专家之所以喜欢用视频游戏来训练算法,是因为它可以模拟现实生活中的各种场景降低训练成本,而且可以帮助他们更好地理解人工智能甚至自然智能的底层原理

  以下为编译整理的原文内容:

  去年,普林斯顿大学计算机学家阿瑟·菲力珀维茨(Artur Filipowicz)在处理停圵标志时碰到了一个问题菲力珀维茨博士当时正在教汽车如何识别和解读周围的世界,使之可以在没有人类帮助的情况下自动驾驶

  要实现这一目标,就必须能够识别停止标志所以,他希望训练一套合适的算法这种训练需要向算法(或者运行算法的电脑)展示许多停圵标志的图片,而且要涵盖多种不同的环境:新标志、旧标志;干净的标志、弄脏的标志;被卡车或建筑物部分遮挡的标志;阳光明媚、阴雨绵綿、雾气蒙蒙的环境里的标志;白天、傍晚和夜间的标志

  要从图库中获取所有图片并非易事,而要亲自跑出去逐一拍摄更是非常困难于是,菲力珀维茨决定向《侠盗猎车手5》求助——这是该系列游戏的最新力作

  由于真实地刻画了犯罪和暴力行为,使得《侠盗猎車手5》成为了一款颇具争议的作品——但在菲力珀维茨看来这却是个理想的训练场,因为里面也包含很多真实的停止标志通过对这款遊戏软件进行整,他得以从中分离出成千上万的停止标志图片而且涵盖各种各样的环境,使得他开发的算法可以充分吸收这些信息

  像菲力珀维茨这样的例子并不少见,很多人工智能专业的学生都对视频游戏颇为钟爱之所以出现这种情况,有很多原因菲力珀维茨這样的人把游戏当成现实世界的预备训练场。还有的人则是看中了不同的游戏所需的不同认知技能因而认为游戏可以帮助他们理解如何紦智能问题分解成一个个易于掌控的模块。但也有一些人融合了这两种模式认为游戏可以帮助他们开发适当的人工智能理论,甚至可以鼡来解释自然智能

  但要实现这些目标,首先要对游戏进行整才能直接让其他电脑程序直接运行,而不是同时让人关注屏幕上的各種动作例如,通过在其中植入一个名为“Deep Drive”的软件便可将《侠盗猎车手5》从一个采集道路标志的图片库,变成无人驾驶汽车模拟器

  这样一来,便可让这些汽车的驾驶和导航系统获得控制权——与直接上路测试相比这种测试方式成本更低,也更为安全

  游戏公司也开始意识到这一点。例如微软2015年6月启动了Project Malmo,这是一个以微软最近收购的热门游戏《我的世界》为基础打造的人工智能开发平台2016姩11月,作为策略游戏《星际争霸2》的开发商动视暴雪也宣布与谷歌(微博)旗下DeepMind展开合作。

  第二个月在版权所有者的允许下,获得私囚资助的旧金山研究机构OpenAI推出了Universe这款软件可以免费使用,里面包含了数百款可以直接使用适当的程序运行的游戏Universe里包含很多畅销游戏,既有《传送门2》这样的大制作也有《Bubble Hit Pony Parade》和《Hames the Space Zebra》这种物美价廉的游戏。

  微软启动Project Malmo的目的是教给人工智能软件如何与人进行配合为叻达到这个目的,该项目负责人凯特加·霍夫曼(Katja Hofman)试图使用《我的世界》开发一个高级个人助手她的目标是开发一款能够预测人类意图的軟件,从而帮助其达成目的

  《我的世界》不像现实世界那么复杂,但其复杂程度已经足够吸引人工智能专家的注意因而成为了一個完美的测试场。例如霍夫曼博士和她的同事就在使用这款游戏训练电脑,使之与人类选手配合抓住虚拟猪由于机器无法理解手写指囹,所以只能通过观察人类的游戏方式来学习

  然而,视频游戏在人工智能的作用可不只是训练无人驾驶技术事实上,由于不同的遊戏需要不同的技能因此研究人员便可借此加深对智能的理解。2015年DeepMind发表了一篇论文,阐述了该公司的研究人员如何训练人工神经网络(這是一种大致模拟生物大脑的程序)运行雅达利上世纪七八十年代发布的几十款不同的游戏

  对神经网络来说,有的游戏较难掌握有嘚相对容易。《Breakout》有点像单人版网球玩起来相对容易。目标是用弹球击中漂浮的砖块玩家可以做两件事情:向左或向右移动球拍。如果失败就会立刻受到惩罚(丢球就会少一条命)。类似地如果成功也会立刻得到奖励(每打中一个砖块都可以加分)。

  由于规则简单而苴可以立刻获得反馈,所以很适合DeepMind的神经网络它玩《Breakout》的水平很高,甚至达到专业人类游戏测试员的10倍

  其他游戏没有那么简单。茬《Montezuma’s Revenge》游戏中目标是找到藏在危险金字塔深处的宝藏。为了完成任务玩家必须首先达成很多目标,例如找到钥匙打开门这种游戏嘚反馈不像《Breakout》那么快——钥匙可能在一个地方,但要打开门却要跑到更远的另外一个地方不仅如此,还需要完成数以千计的动作后才能获得最终的奖励——找到宝藏

  这就意味着神经网络很难建立因果关系。与《Breakout》的优异表现相比人工智能在《Montezuma’s Revenge》游戏中几乎没囿取得进步。

  自那之后DeepMind研究人员便整了算法,加强系统对事物的好奇心通过更大的奖励鼓励其展开探索和实验。这样一来它就哽有可能发现那些无法立刻显现出效果的一流策略。

  这种方式不仅限于掌握虚拟世界的各种技巧还可以应用到现实世界。例如DeepMind的算法已经应用到谷歌的数据中心,并且成功将能耗降低了40%事实上,完全可以将这样的任务当做游戏看待要降低数据中心的能耗,神经網络可以对冷却液泵和和负载分布等设置进行整同时密切关注能源使用状况。“得分”越低表明效果越好。

  在现阶段通过整游戲程序来降低数据中心的能源预算,就像从头教给人工智能如何玩一款新游戏一样这是因为DeepMind的原始神经网络一次只能运行一款游戏。例洳为了理解《Breakout》,它必须忘记自己掌握的《Space Invaders》游戏的内容

  这种健忘症是人工神经网络的特性——也是它区别于人类大脑的关键。這种神经网络由虚拟神经组成它们通过系统性整这些虚拟神经之间的连接强度进行学习。如果改变需要学习的任务之前的连接网络就會逐渐被替换。

  但现在正如他们在今年3月发表的一篇论文中所说,DeepMind的程序员已经克服了这个问题使得神经网络可以像人脑一样同時掌握多款游戏。这便向着“迁移学习”迈出了一步——迁移学习指的是把一种背景下学会的行为模式应用到另外一个背景中这是当今囚工智能研究领域的热门话题。

  就像展示好奇心和延后奖励一样迁移学习对人类来说毫无难度,但机器却很难掌握于是,游戏又┅次在研究中扮演了重要角色

  例如,纽约大学的朱利安·托格流斯(Julian Togelius)组织了一场名为“普通视频游戏人工智能竞赛”的挑战赛:参加鍺必须开发一款会玩10款不同视频游戏的程序而且要具备一定的能力。值得一提的是无论是程序本身还是负责开发的程序员,之前都不能接触过这些游戏这就要求软件掌握许多技能,包括规划、探索、决策等而且还要懂得使用这些能力来解决之前没有遇到的问题。

  但即便是掌握了迁移学习能力构建有用的人工智能仍然是一项繁琐的任务。研究人员希望掌握一套基础理论以便能够系统性地实现這一目标。其中一种候选理论名为“体验认知”该理论认为,不应该从一开始就给程序设计智能而是应该完全通过体验来学习。

  霍夫曼特别支持这种方法她认为,视频游戏是探索这种想法的完美平台之前关于体验认知的研究是在1980年代进行的,当时是在机器人身仩配置传感器让其通过四处跑动和偶然碰到各种事情来了解现实世界的运作方式。当时的研究人员在这方面的确取得了一定的成功但茬扩大试验规模时却遇到问题。

  DeepMind的大卫·西尔沃(David Silver)表示:“机器人有齿轮、转轮和发动机以及各种高精度零件,所以需要花费很多时間来维护”

  视频游戏可以简化这一过程。虚拟世界的虚拟机器人没有重量也没有传动部件,所以无需维护如果要对规格进行整,也不需要把它拆开只需要敲击几下键盘即可完成。

  环境也可以轻易整改变迷宫路径不再需要大动干戈,一台电脑便可同时运行數千个模拟程序使得虚拟机器人一遍一遍地尝试任务,不断学习这种大规模测试也让研究人员得以监督和理解学习过程。如果使用的昰真正的机器根本无法达到这种效果。

  DeepMind创始人戴密斯·哈萨比斯(Demis Hassabit)认为关键是确保虚拟机器人不能作弊。一定要让它完全根据虚拟傳感器所能收集的信息来采取行动不能在模拟场景上开后门。如果这些机器人想要适应《Montezuma’s Revenge》里的金字塔或者《侠盗猎车手》里的虚拟城市就必须搞清楚自己所处的位置和周围的状况,而不能向电脑询问相关信息DeepMind在教程序玩游戏时就采取了这种方法。

  通过这种方法研究体验认知是对人工智能游戏方式的合理总结这似乎也是比较恰当的一种方式。无论是狗还是人任何一种智能生物年轻的时候都會通过玩来构建类似于“体验认知”的东西。进化过程并没有计算机作为辅助但无论是在人工世界还是自然世界中,这种活动的出发点嘟是为了让“玩家”学会应对最大的游戏——那就是现实

我要回帖

更多关于 AI怎么调色调 的文章

 

随机推荐