新疆都市报 > 科技 > 智能 >

启元星际AI挑战顶级职业选手,我们将进入智能体时代?

发布时间:2020-06-08 17:37来源: 网络整理

启元星际AI挑战顶级职业选手,我们将进入智能体时代?

  2017年5月,在乌镇围棋峰会上,AlphaGo三局连胜世界排名第一的中国棋手柯洁,成为人工智能发展史上的经典一役。

  三年后,中国人工智能平台公司启元世界将摆下另一场擂台,向人工智能领域的更高峰——《星际争霸》发起挑战。

  相比于已经被AlphaGo彻底征服的围棋,《星际争霸》是一块更加难啃的“硬骨头”,即使与AlphaGo师出同门的AlphaStar也尚未彻底征服人类职业选手。

  AlphaStar与人类职业选手的第一次对战放出的是测试比赛录像,并在一盘现场对战中失利。后来AlphaStar为了防止被职业玩家抓住漏洞,匿名参加《星际争霸II》欧洲天梯对战系统,在与大师和宗师级选手的比赛中互有胜负。

  2020年6月21日下午2点,启元“星际指挥官”AI将迎战人类顶级职业选手,《星际争霸I/II》全国冠军黄慧明(TooDming),还将与首位晋级世界锦标赛全球总决赛的中国大陆选手、2018年《星际争霸II》黄金总决赛冠军李培楠(TIME)交手。这将是全国首次现场直播星际AI与人类顶级职业选手的对战。这场启元星际AI顶级职业选手挑战赛也是2020北京智源大会的系列重磅活动之一。

启元星际AI挑战顶级职业选手,我们将进入智能体时代?

  在AlphaGo称霸围棋棋坛之后,DeepMind把重心转移到了《星际争霸》上来。Facebook、腾讯等科技巨头近年来也都全力押注这条赛道。

  作为有史以来最成功的即时战略游戏,《星际争霸》可谓人工智能的“巅峰挑战”。

  相比于回合制的围棋,《星际争霸》是即时对抗类游戏,必须做出毫秒级决策;相比于围棋在361个落子点之内的选择和完全信息可见,《星际争霸》的决策空间高达10的26次方并充满了战争迷雾;相比于《DOTA2》、《王者荣耀》的5对5英雄对战,《星际争霸》涉及200个单位的战役、战术策略博弈和经济、科技发展决策,所以对AI极具挑战性。

  《星际争霸》考验的是AI全方位的综合能力,既要能看得懂游戏态势,又要能深刻理解敌我局面,还要在正确的时间做出正确的决策,根据对方行动随机应变。这要求AI不仅能实时感知、认知环境,还需要适应环境,做出数千步连续决策以求得胜利。

  所以,通过《星际争霸》训练出来的AI更接近各个行业真实的应用场景:环境复杂多变、策略空间巨大、响应时间实时,而AI可以在此类复杂场景中甄别、提取有效信息,在信息不完全情况下进行推理和决策。

  业内把AlphaGo、AlphaStar、“星际指挥官”这一类具备自我学习、自主决策能力的AI叫做智能体(Agent),它是人工智能技术的集大成者,在虚拟世界表现为数字人,在实体世界表现为机器人。

  启元世界自2017年8月创立以来,致力于创造伟大的智能体产品,并把智能体带入每个行业、每个家庭、每个人,提升产业效能和生活体验。公司团队核心成员来自BAT、Netflix、IBM、香港科大、伯克利等国内外知名高科技企业和一流学府,屡获NeurIPS、CVPR等国际竞赛大奖。

  值得一提的是,作为一家创业公司,启元世界仅使用了DeepMind AlphaStar 1%的算力,就已经达到人类顶级高手的水平,并敢于在公平设定下(与人类选手近似的APM操作限制),在线下公开与顶级职业选手进行实时对战。

  这背后是三年时间的自主研发,启元凭借世界一流的算法原创和工程实践能力,通过启元“智能体训练云平台”,实现智能体不断迭代进化。赛事备战冲刺期,启元智能体训练云也部署到了滴滴云,利用其底层计算资源进行智能体训练。

启元星际AI挑战顶级职业选手,我们将进入智能体时代?

  启元AI“星际指挥官”进化之路

  启元“星际指挥官”仅需几千局的小样本做启动,就能让智能体通过模仿高手、超越高手达到人类顶级选手水平。这意味着,在缺乏大数据积累的很多行业,如智能制造、能源优化、网络调度,智能体也有着广阔的落地空间。

  正如DeepMind一样,在《星际争霸》中彻底战胜人类,并不是启元世界的终极目标。《星际争霸》只是启元在虚拟世界训练智能体的一块“试验田”,最终的目的是训练出具备自我学习、自主决策能力的智能体,利用新一代人工智能技术,帮助客户解决博弈、优化、控制等复杂环境下的动态决策问题。