156
商汤《星际争霸2》AI智能体公开首秀,AI大装置成就职业级决策水平
技术文章
发布于2022-06-13 17:50:49
近日,前《星际争霸2》中国冠军,现商汤智慧决策与游戏事业部技术研发负责人周航


近日,前《星际争霸2》中国冠军,现商汤智慧决策与游戏事业部技术研发负责人周航


人机大战,再掀波澜。


在演示的多个对局中,DI-star均表现出了人类最高段位——宗师分段的竞技水平,并与全球一线职业选手水平相当。


周航提到,DI-star仅用五周的训练时间便达到了媲美职业玩家的水准,如此高效的训练成果正是源自商汤在决策AI领域领先的技术实力以及SenseCore商汤AI大装置提供的强大算力支持。


目前DI-star及其背后的决策智能平台OpenDILab已通过GitHub开源,让每位有兴趣的AI研究者或玩家都能够深入其中,探索和实践决策AI技术的开发与应用,构建决策AI创新生态。

  不惧挑战,DI-star高效制胜


《星际争霸2》的空间复杂度高达10的1685次方,远远超出围棋(10的170次方)。这款游戏成为了检验AI决策能力的绝佳舞台。


本次直播中,DI-star在多个对战演示片段中都展示出灵活多变的决策能力,屡次在复杂对局中快速找到最优策略。

DI-star通过精细微操建立前期优势

在训练过程中,DI-star融合了监督学习强化学习等商汤多项前沿技术。


通过监督学习,DI-star让AI反复观摩职业玩家对战的高质量录像,学习人类的打法,快速掌握高水平决策行为。


在监督学习的基础上,DI-star通过强化学习让AI通过自我博弈的方式进行上亿次对局,持续提升全局的决策能力和整体竞技水平。

  商汤AI大装置加持,五周修炼“出师”


作为商汤原创打造的人工智能基础设施,SenseCore商汤AI大装置为DI-star的模型建立、训练和验证提供了强大的算法和算力支持


依托SenseCore商汤AI大装置,DI-star仅用五周便完成了大约一亿局对战,最终达成人类宗师段位水平。

图片

DI-star使用人类不常见战术出奇制胜

此外,SenseCore商汤AI大装置还提供了丰富的工具和技术组件,在强化学习阶段,帮助DI-star快速试错,实验各种全新战法,驱动算法以惊人的速度迭代。


不过尽管AI已经在《星际争霸2》上取得了显著成果,但是对于这款游戏的理解依然尚未超越人类,一个明显的差距是在选用不同种族对战的成绩差异。另外,AI在寻找游戏最优策略方面仍有很大提升空间。


未来,商汤将依托SenseCore商汤AI大装置,持续深化决策AI技术的研发,持续提升多智能体在复杂环境中的相互竞争和协调合作能力。


  商汤带给游戏产业的“AI全家桶”


在技术创新与市场需求的双向促进下,游戏产业正在快速步入AI时代。

基于此,商汤在2021年成立了商汤智慧决策与游戏事业部,促进AI与游戏产业的融合创新与发展。

商汤智慧决策与游戏事业部总经理刘宇表示,“商汤以全面的AI技术能力,围绕游戏研发游戏运营游戏玩法等多个层面,全面赋能游戏产业发展。

针对游戏研发,商汤游戏内容智能生成解决方案可为开发者提供基于AI技术的人体动作捕捉和场景建模,效果自然逼真。商汤游戏美术智能生成解决方案则可以智能生成各类2D、3D游戏角色以及手绘等多种场景风格,帮助开发者快速搭建不同游戏场景、人物造型。


针对游戏运营,商汤创新打造的社区机器人社区管理SaaS服务台,可以提供智能客服、跨群邀请、群任务与群积分成就管理、高价值社区信息挖掘、高价值社区成员挖掘等服务,增进玩家活跃度和忠诚度,提升用户粘性。


针对游戏玩法创新,商汤游戏全域机器人可针对 MOBA、SLG、RTS、FPS、MMO、RAC等不同类型的游戏,提供从智能决策、智能服务、智能运营等游戏内外智能体全套解决方案,让AI具备更全面的多智能体协同作战能力,甚至模拟不同玩家性格,让AI成为人类绝佳的队友或对手。


游戏AI决策智能的不断提升,有望重新定义玩家与AI的关系,带来人机共生的全新游戏体验

而AI技术在游戏内容生成领域的深入应用,也将帮助游戏开发商重塑游戏制作流程,显著提升创作效率。

未来,商汤将以SenseCore商汤AI大装置为基石,通过行业领先的全栈式能力推动AI在游戏领域的多元应用,携手行业伙伴,共同助力游戏产业的创新与发展。