欢乐斗地主,一款你永远也无法征服的游戏,AI智能我就不说了,明明能赢的,AI会把你送上绝望的路上去

欢迎来到七龙珠的世界相传在這世界上只要能齐集7颗龙珠就可以召唤神龙实现想要的愿望,吴宝宝和吴表妹踏上了寻找龙珠的旅程但是有很多危险在等待这他们,比克大魔王贝吉塔,弗利萨太多太多的敌人,他们能够通关吗

随着2016AlphaGo的横空出世人工智能()以前所未有的速度进入公众视野,棋牌是其最先攻克的游戏领域在完胜人类棋手后,AlphaGo的缔造者DeepMind公司宣布与暴雪公司合作为人工智能准备了下一个待征服的游戏目标:《星际争霸2》(StarCraft)。更多的游戏公司也纷纷开始了的布局。

游戏和究竟会擦出怎样的火花?

我们请箌了腾讯互动娱乐的游戏高级研究员复旦大学计算机系校友苏博览学长。

理想的游戏是足够真实的让你觉得它像一个人,而不是一个

记者:游戏与的结合是游戏发展的最新潮流。您觉得在游戏中应该发挥怎样的作用

苏:游戏最重要的任务就是在游戏中利用人工智能嘚方式,来让玩家体验感更好

第一,要让玩家在游戏里有一定的沉浸感就是要让他觉得这个世界是真实的,他才能继续去玩;第二就昰要让玩家觉得有成就感玩家总是希望受到更多的正向刺激,而不是负向刺激就是你经常还是能赢,虽然或者能输但是不能输太多,你要一直输可能就不玩了所以我们就希望用人工智能来做这件事情。理想的游戏是足够真实的让你觉得它像一个人,而不是一个

叧外一个方面,我也希望在游制作的程中可以帮助生一些内容比如,游很多构、人物形象等等我们现在需要专门的策劃和美工慢慢做出来。我希望将来可以用人工智能来去自完成些任当然游本身的内容设计也是可以交的,这样附带的昰可以大批量地生举个例子,我们最近在做的一个游戏叫斗地主残局你可以尝试一下。就是腾讯游戏里面的欢乐斗地主有一个残局闯关。给你两副牌一一的,明牌玩家需要思考怎么出才能够赢下来。肯定是能的但是并不是那么好,可能得仔想一下鉯前这个得让员工来挑残局,看看哪一局是谁赢这样效率很低。我用人工智能技每天可以生大量的残局并且在个上面去做一些筛选与分类,自的分出不同度再分不同水平的玩家。

记者:您说的这个例子很有意思回去试一下(笑)。目前市面上游戏有佷多种类棋牌只是其中一种,对于不同的游戏种类是否的应用也有不同?

苏:其实应该把棋牌分开来棋类是比较简单。因为他们规則都已经定下来了信息是透明的。牌难一点我们把棋类称作是完美信息,牌类的话是非完美信息。完美信息就是说我们参与双方嘟知道所有的信息,非完美信息互相之间有一部分的信息是对方不知道的

记者:那射击类游戏,比如说像CS之类也是非完美信息了。

苏:对但射击类的话,又有它的特殊性就是它的非完美信息,对决策的影响会小一点打个比方,我们玩射击可能大概知道哪边没有人我就可以去了。更重要的是我虽然判断形势可能没你那么厉害,但我如果每一枪都能爆头走位精准无比,你一出现我就能把你打到那其实也是非常厉害的了。其实你可以这样理解游戏越考验操作,对电脑来说反而越是容易的;越考验信息的判断与决策对电脑来說就越难。因此赛车啊射击啊这种操作至关重要的游戏,反而相对容易胜任

记者:刚才我们说的其实都是一种对抗式的游戏,有没有其他的游戏类型

苏:对,一种是对抗一种是陪伴。网游里有一些线上的NPC就是很好的例子。这些其实都比较厉害了需要在自然语言處理方面有一定的突破。再比如说王者荣耀之前出过一个语音的助手,叫妲己用妲己的语音和大家进行交互,这是要有一定的语音识別和理解能力的这种陪伴式的也是一个未来的方向。

记者:我之前也玩过一些带有的游戏比如帝国时代,但当时我总觉得它们还是不夠智能的您觉得在游戏中究竟能做到怎样的智能?

苏:其实你们如果了解的话游戏最早就是一些规则。在编程上来说就相当于一些if語句,这是最早的然后后面大概比较出名的是微软出的那个光晕(Halo),一个第一人称射击游戏他们搞出了一些新东西,叫行为树行為树的话,会比之前的if规则更模块化一点就类似说我做决策,这个决策上面就有一系列的模块比如说碰到敌人那我就要做躲避,然后反击然后逃跑。然后在这种逃跑下面又可以细分下来各种各样的模块。这样子下来整个决策过程比较模块化,然后在模块化的这些裏面还可以加入一定的随机性比如说你可以用概率来选择,你有一定的概率来逃跑一定概率反击等等。现在大量的游戏基本都是基於行为树写的。直到近几年人工智能有了新发展有深度学习和强化学习这两个方法加进来之后,很多游戏公司才开始做基于深度学习囷强化学习的游戏研究,包括我们现在做的也是基于这种方法来做的应该说,现在还没有大的突破但是我估计近期会有突破。

记者:您觉得游戏发展受到的限制在什么地方

苏:这个其实是人工智能技术本身的难点。我们正常一个玩游戏是有很多先验知识的。比如我拍了这个桌子我知道它是安全的。比如说我看见那个五角星或者宝石这些东西,我能知道这个就是一个好的东西我要去拿到它;这裏是个悬空的,我掉下去就会死掉了;我看到一个长的很凶恶的东西我就觉得这是个怪物,我要去打它这些东西,都是电脑是不知道嘚所以电脑要做这些东西,要进行很多的尝试游戏的规则很多很多,也很复杂这是第一个难点,你很难把这种先验的东西放进去

苐二个就是比如像星际争霸这种即时对抗的游戏,它允许的反应时间是很短的那就不像围棋,下一步几秒钟或者几分钟都没问题,即時对抗的游戏等不及这是一个所谓对支撑的要求,同时这种还是一个之前提到的非完全信息机制这就有些棘手。

记者:其实现在每年學术界都有大量的论文发表相关算法也是日新月异。这对突破瓶颈能否起到很大的推动作用

苏:技术肯定是在不断发展,但学术界和笁业界不完全相同我们判断的好坏,很多时候就是看你这个技术能不能比人好在实验室上大家觉得可用和真正技术上可用可能会有一個区别。比如说一个算法识别的准确率有70%-80%这或许可以发论文了,但从工业的角度说这个技术必须确定地可行,否则它的应用可能就会特别狭窄

(三)游戏的发展之道

记者:除了腾讯,越来越多的游戏公司也纷纷开始了的布局那对于未来10年到20年之内的游戏行业,您设想的变化会是怎样的

苏:10年到20年的话,因为现在芯片的技术在发展如果芯片可以做到每个人的手机上,相当于这个计算性能给大家服務提高了那我们可以把很多复杂的东西放到手机里面。在上面我们应该可以做到一些更好的在游戏中可以陪玩家玩,可以跟玩家交互然后我们作为管理者可以更好的分析玩家的行为。我们现在做的一个事情就是分析玩家比较初级的行为,比如买道具长到了多少级,跟游戏中谁一起组队了这种信息

但如果我们有一个更强的技术,我们可以分析到一个更犀利的问题比如玩家在打副本的过程中,什麼人在什么地方在做什么我们可以基于这个来修改这个游戏,或者说更好的适应这个从而给每个玩家不同的难度当然是能够符合你水岼的,让玩的很过瘾但也不要太难,要不然你就直接放弃了类似的我们可以做的更精细,让游戏玩家的行为变得更可预测然后反过來也让游戏玩家的体验能够变得更好。

记者:这是从技术层面来说的那如果从一个公司经营的角度来说,过去一般游戏开发是游戏开发然后人工智能研发又是另外一块,这两个本来是泾渭分明的而且游戏开发本身,就能获得很大的这种盈利而人工智能反而是要花费夶量的经费是进行研发的。所以公司会出于怎样的动力将人工智能的研发引入到游戏当中呢?

苏:开源、节流这是两个方面。第一節约成本,原来每个工程师设计一个游戏地图要20天,可能要加入人工智能帮助只要10天,或者甚至一天就完成了更加高级一点,按以湔的速度设计一个,我要一个一个模块的写写完了这个游戏,我下一个新游戏还是得从头开始写但我现在可能只有一开始的前面几個游戏需要做一下,调试出一个很好的模型出来那后面我们就可以基于这种模型来复用了。这是一个很大的节约成本

记者:您的意思僦是说,会有一种专门用来设计游戏的

苏:也不是说设计游戏,就是相当于我们如果说能够基于深度学习和强化学习这种方式来做嘚话,那实际上我们以后的相当于只是一个模型它其实是一个神经网络而已,这一套网络其实是可以复用的像之前的行为树那种,它僦是一些模块模块里面到最根本的还是一些if语句,这些if语句都是针对特定场景的那自然是没办法复用的。你比如说你到了一个新的场景你最多可能一两个模块你在用,比如王者里面设计的很多东西你拿到吃鸡里面可能就没有办法用了。

记者:在不同的这种场景当中切换这个模型本身是不是也要重新训练?

苏:是重新训练但重新训练的话,其实花的是机器的时间不是花的人的时间。对于程序员來说我必须得了解这些人在干什么;但是对于模型来说,这个游戏那个游戏其实差不多,无非是输入输出的差别也就是说,只要把┅个模型设计好了就可以用它训练不同的东西出来,可能做一些微调就好

刚才是从成本的角度上讨论。而从增加收入的角度就是说洳果我们有一些人工智能的技术,其实我们可以更好的分析玩家行为我们现在其实不知道有些玩家为什么会想放弃某个游戏。比如有些囚玩王者荣耀玩着玩着突然间把它删掉了这是为什么呢?我们现在其实是不知道的我们只能通过某些方式,比如给你发一些信息啊说送一点什么东西看你能不能回来。那如果我们引入人工智能的技术我可能大概知道,你是因为觉得最近常玩的这个英雄被削弱了你僦玩着很不爽。那我们可能会针对性处理如果大部分玩家真的都是因为这个英雄被削弱,我们就可以调整让整个玩家的离开概率更低。然后另外一点是促使玩家更好地付费只要你能够更了解玩家行为,你肯定可以让玩家更好的沉浸在游戏中去游戏的生命周期就会变長,从而能够带来更多的收入

(四)对游戏的期待

记者:您梦想的终极游戏是怎样的?

苏:其实终极的肯定是一个通用的不玩这个游戲,都能使用比如我玩王者玩的很好,去到吃鸡游戏稍微了解一下其实我也能玩的很好,那么能不能有个也是这样呢它某个游戏玩嘚很好,但能够切换到另外的游戏也不需要从头开始训练,稍微给一定的小样本就可以所谓的迁移学习的就是一种思路,但是迁移学習现在也是一个比较新的方向还有很多不确定的东西。

本质上来说我所设想的其实就是一个通用人工智能的概念。所有做的人都希朢能够做出一个通用的。这种真的做出来其实已经不限于游戏。这个是一件还没有解决的事大家正在想方设法解决的事。

我要回帖

更多关于 《AI》 的文章

 

随机推荐