人工智能不仅能战胜围棋高手还能打《Dota2》?太牛了吧

发布时间 2017年08月14日 16:43    编辑:pipi    来源:界面新闻 时尚中国网 » 潮闻 » 头条新闻

人工智能挑落人类顶尖选手的故事可不再仅限于国际象棋和围棋,这次,沦陷的项目是《Dota2》。

在刚刚结束的第七届《Dota2》国际邀请赛(TI)中,8月11日的正式比赛结束后,一场表演赛开始了。一方是人类选手Dendi——乌克兰传奇选手,第一届TI的冠军获得者。而另一方来自一段AI,这个由OpenAI开发的人工智能程序在表演赛中出场,试图验证自己的实力。

这仍是一场人为设定规则的简化版对抗:Dendi和AI只能从中路出击;在双方同时使用一个英雄雄影魔(Shadow Fiend)的情况下,没有中立生物,没有神符,以及不能使用一些关键装备。减少了随机性的同时,让比赛看起来更像是类似围棋般的硬实力对抗。

“你觉得你对抗的是一个真人吗?”在第一局比赛过程中主持人向Dendi问道。Dendi的回答是:“不。”在过往的游戏练习中,Dendi也在少数时候被《Dota》的内置机器人(bot)击杀,OpenAI控制的对手看起来并没没有人类选手操作得那么有“流畅感”,甚至在前往中路的时候,OpenAI有时候还被己方小兵所卡住。

但这样仍不妨碍结果的一边倒,第一场比赛中OpenAI仅用10分钟就击败Dendi。而在第二局,当AI打出一个漂亮的越塔击杀后,Dendi爽快GG认负。

“它太强大了。”比赛结束后Dendi接受采访时说,“也许我得再多练习一段时间,才能发现如何击败它。”

Dendi的自我评价尚算中肯。实际上从现场直播来看,这位前世界冠军在比赛中可不是非常走心:主持人不时在比赛过程中向Dendi追问,干扰其操作。而后者的表现更像是“玩票”,一直和主持人谈笑风生。也许Dendi在游戏中的ID“HF(Have Fun,玩得开心)”更能体现他对这次比赛的态度。

而OpenAI却体现了一名职业玩家的应有素养。把握好出招时机后,OpenAI的正补、反补恰到好处,或是以一个合适的距离攻击Dendi。这让Dendi的英雄血量时常处于尴尬的贫血阶段。

很难想象,如果这不是一场表现赛,而Dendi又收起自己的戏谑态度全力应对的话,谁又会是最后的胜利者。

但至少在OpenAI开发人员眼里,这场胜利是一次顺理成章的成功。

“对AI来说,《Dota》是一个非常适合的对抗性游戏,游戏本身很复杂,也拥有高强度对抗场景。这意味着你需要一种新技术,来努力扩展、推进AI的边界。”OpenAI的首席技术官Greg Brockman(下称Brockman)透露。这也是他们为何选择《Dota》作为AI训练主战场的原因。

Brockman表示,在《Dota》中取胜更依赖于选手的直觉,而这已经通过AI学会了:通过自我对弈(Self-play)进行高强度训练,预测其他玩家的下一步操作,提高应对陌生环境的表现,帮助友军单位取胜。在经过仅仅两周的实时训练后,AI就达到了目前专业选手的水准。

最终,从对于自己所处的世界全无认识,再经历过大量和自身拷贝的对战后(这意味着它和对手永远是旗鼓相当的),AI的游戏技巧有了一日千里的进步。按照Brockman介绍,OpenAI在此之前已经战胜了现役的Arteezy、SumaiL等多个世界冠军级的《Dota》选手。

当然, OpenAI作为由硅谷大亨Elon Musk投资创立的非营利科研机构,其目的并非局限于游戏,Brockman透露,通过游戏中的训练,OpenAI希望帮助机器人建立系统性学习复杂技能的能力,这有助于帮助AI应对现实世界中的任务,如外科手术。

愿景很伟大,至少Elon Musk本人对这场比赛的结果还是很满意的,他专门发布了一条推特消息,称“OpenAI第一次打败了世界上最好的电竞选手。电竞比象棋、围棋这样的传统棋盘游戏要复杂得多。”还顺便小小嘲讽了一下对手AlphaGo。

不过,AlphaGo的拥有者DeepMind,也早已经将AI研究方向转移到游戏上了,几个月之前,他们选择了《星际争霸2》作为围棋之后的下一个测试对象。8月初,DeepMind开源了《星际争霸2》研究训练平台SC2LE。据《财富》报道,DeepMind的目标是让计算机击败最顶级的人类《星际争霸》玩家。

我们已经进入了一个AI研究的游戏化时代。AI巨头纷纷选择游戏作为研究入口,已经成为AI研究领域的重要风向。《经济学人》评论认为,电子游戏受追捧有几个原因:将游戏作为现实世界的训练场;不同的游戏需要不同的认知技能,游戏可以帮助他们了解如何把智能问题分解成更易处理的小模块;基于以上两种原因,认为游戏可以帮助他们发展出一套合适的人工(甚至自然)智能理论。

甚至电子游戏还可以简化现实AI研究中机器人的维护、调试过程:虚拟机器人没有重量,无需维护,改变规格也只要在键盘上敲几下就足够了。

而在明年,OpenAI的《Dota》选手将更加“名副其实”,开发团队计划在TI8前做出可以参加5V5比赛的AI,并且规则与人类比赛规则相同,可以预料,到时候这场人类与AI的游戏大战会更加精彩和戏剧化。

免责声明:凡本网注明“来源:XXX(非时尚中国网)”的文章及图片,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。 如因作品内容、图片版权和其它问题请邮件联系,我们会及时处理:lwl@youngchina.cn
猜您喜欢
热点MOST POPULAR
  • 朗格SAXONIA萨克森纤薄腕表,18K玫瑰金表壳搭配铜蓝色表盘,尽显优雅风范
    朗格SAXONIA萨克森纤薄腕表,18K玫瑰金表壳搭配铜蓝色表盘,尽显优雅风范
    朗格推出以18K玫瑰金制成的SAXONIA萨克森纤薄腕表,限量发行50枚。实心银表盘饰以蓝色砂金石玻璃,内含微小的铜色颗粒,宛如星..
  • 沉浸北欧雪境!高梵KIDS AW2025大秀打造“绒冬奇遇记”
    沉浸北欧雪境!高梵KIDS AW2025大秀打造“绒冬奇遇记”
    10 月 12 日晚 19:30,上海静安 800 秀场被一片璀璨与热烈所笼罩。以 北欧精灵 绒冬奇遇记 为主题的高梵 KIDS 上海时装周 Kids ..
  • 告别暗黄 即刻光采!霏丝佳“光能弹”精华液惊喜焕新
    告别暗黄 即刻光采!霏丝佳“光能弹”精华液惊喜焕新
    [2025 年 10月 9 日,上海] 在快节奏的都市生活中,不规律作息与频繁熬夜导致许多年轻消费者的肌肤面临暗沉、老化、粗糙等多重..
  • 璀璨新境 感官笔触 AHKAH发布chandelier系列铂金款新作
    璀璨新境 感官笔触 AHKAH发布chandelier系列铂金款新作
    超越感官之境,唤醒内心怦然。国际珠宝品牌AHKAH本季假日系列以desire 心之悸动为主题,倾情推出标志性chandelier系列全新铂金..
  • 3.5亿!周大生用「荧光珐琅+莫奈IP」破珠宝内卷,七夕全域营销引爆新增长
    3.5亿!周大生用「荧光珐琅+莫奈IP」破珠宝内卷,七夕全域营销引爆新增长
    当前,黄金珠宝行业竞争已进入白热化阶段,产品设计趋同、营销方式传统、情感联结薄弱,仍过度依赖材质与保值的传统价值主张,..
  • 中免健康:全球供应链+跨界联动,让“轻滋养”走进全民生活
    中免健康:全球供应链+跨界联动,让“轻滋养”走进全民生活
    在商务部、国家卫生健康委等12部门联合印发的《促进健康消费专项行动方案》指引下,健康消费正在从选择性消费向刚需消费方向转..
  • 维多利亚的秘密多城齐绽,再拓中国市场零售新版图
    维多利亚的秘密多城齐绽,再拓中国市场零售新版图
    宁波店、深圳店、哈尔滨店、苏州店、南昌店相继启幕,以全品类门店深化本土布局全球知名内衣品牌VictoriasSecret(维多利亚的秘..
  • 古驰首次推出冬季运动服饰系列——GUCCI ALTITUDE
    古驰首次推出冬季运动服饰系列——GUCCI ALTITUDE
    在辽阔雪域的映衬下,古驰推出Gucci Altitude系列广告形象大片及全新系列,开启冬季运动服饰探索之旅。作为品牌首个冬季运动服..