腾讯游戏党受辉:腾讯云蓝鲸平台四大秘笈
在腾讯的定义中,所描述的蓝鲸是依托SOA理念(Service-OrientedArchitecture面向服务架构)和云技术构建的运维模式,以原子服务集成和工具开放构建的方式,解决运维基础服务的无人值守以及运维增值服务的低成本实现。一句话简单概括,蓝鲸让游戏运维能够以低成本进行更高层次的服务。蓝鲸创始人、腾讯游戏运维支撑体系负责人党受辉对蓝鲸体系、功能做了详细分析,解读了蓝鲸的四大秘笈。
GameLook报道/游戏业务是腾讯一直以来的核心业务之一。从2003年腾讯发布首款QQ游戏至今,腾讯游戏已经运营了上千款游戏。无论独家代理还是自主研发,腾讯的端游、页游、手游都在使用“蓝鲸”进行同一的运维管理,效率比之前提升了近十倍。目前,蓝鲸已通过腾讯云逐步对外开放,或成为腾讯云面向游戏行业最有力的运维利器。
在腾讯的定义中,所描述的蓝鲸是依托SOA理念(Service-OrientedArchitecture面向服务架构)和云技术构建的运维模式,以原子服务集成和工具开放构建的方式,解决运维基础服务的无人值守以及运维增值服务的低成本实现。一句话简单概括,蓝鲸让游戏运维能够以低成本进行更高层次的服务。蓝鲸创始人、腾讯游戏运维支撑体系负责人党受辉对蓝鲸体系、功能做了详细分析,解读了蓝鲸的四大秘笈。
运维基础服务——无人值守
假设凌晨4点钟,运维系统某个环节出现故障,根据系统自己的逻辑,用时1分13秒时间查到问题、处理,随后直接重启。早上来上班,运维人员得到一个通知,告知半夜发生了什么事情,我(蓝鲸)帮你处理了。这就是蓝鲸的无人值守功能。
顾名思义,无人值守就是不用运维人员做任何人工操作,系统自身进行处理的功能,这是蓝鲸运维工作的基础服务。如果细分处理业务的性质,一部分是自助化发布变更、开区迁移、信息提取和数值调整,另外一部分则是自动化进行扩容缩容、开区迁移和故障处理。
进一步说,蓝鲸可以帮助运维人员将重复、繁琐且缺乏创新的运维工作打包,并制作成应用工具,在遇到同类情况时可以直接使用工具来代替人工操作,不仅将运维人员从各类重复工作中解放出来,还大大缩短了同类操作的时间花费,提高运维的工作效率。据透露,腾讯旗下《刀剑2》在使用蓝鲸的开区App之后,一次开区操作只需要花费5-7分钟,相比未使用App之前节省了近4个小时,效率提升数十倍。在云时代,无人值守服务还可实现智能滚服,比如到达一定人数后,会自动实现开区功能。针对故障,还会即时故障自愈。
运维增值服务——云时代将占比90%
目前,包括基础运营工具建设、产品运营决策支持、用户游戏体验优化、业务异常定位规避以及游戏运营架构优化等在内的增值服务,在运维工作中已经占据约10%的比例。党受辉称,云时代增值服务会占据更高的比例,未来预计可以提高到90%。
自2008年起,腾讯运维体系即在游戏领域开始沉淀,历经脚本时代、作业时代到云时代,2013年之后在腾讯云的支撑下,构建了云时代的蓝鲸体系。
据党受辉介绍,游戏相互之间架构没有标准,操作没有标准,同一个游戏同一个场景,版本一变可能就变了,所以需要运维不断调整,如果没有工具运维,操作要不断修正。
事实上,运维的脚本和运维的配置的云化,能够最大化保证配置安全。党受辉提到,作业时代起到了规范操作目的,传统意义上一个人管多个业务,自己可以写多个脚本,如果换一个人,就有可能把上一个人运维脚本全部丢掉。基于这些方面,云时代对脚本进行规范化处理,实现了跨系统调度自动化。类似这样的运营增值服务,比例在云时代还将进一步扩容。
云工作台、快速构建、服务集成三位一体
蓝鲸体系是一套落地蓝鲸模式技术解决方案,由蓝鲸平台、运营系统、Iaas构成。关键的蓝鲸平台主要有三个部分,提供一个云工作台、一个快速构建平台,然后是服务集成。
党受辉介绍,蓝鲸平台不仅为游戏运营人员提供了丰富的工具SaaS服务,同时为开发者提供了PaaS服务。蓝鲸PaaS云平台提供了全流程的工具开发,调试和托管服务,降低了工具的开发门槛,普通运维经过简单培训就可以快速制作运营工具,上装到市场。同时,蓝鲸还对接了大量IaaS层和运营系统层的原子操作,在ESB平台内实现灵活调度,提供给PaaS平台使用,这样运维在构建调度自动化工具的时候,就不需要自己对接接口、硬编码调度逻辑了,这就进一步降低了工具开发门槛。
蓝鲸根本上是要武装运维而不是取代,助力运维转型
蓝鲸是腾讯游戏运维从实战中总结、提炼、构想、设计、建设出来的一套体系,设计初衷是武装运维,使其能提供更高维度的服务,而不是取代运维。
“运维在传统领域价值比较低,被替代成本也不高。开发一般来讲跟游戏绑定的,一般不会作为一个公共资源出现,如果两个游戏都要做精细化,让开发同时去做是不大合适的,是重复建设,而运维有能力做这个。蓝鲸要做的,就是运维强化和运维拉升维度。”党受辉这样解释蓝鲸的理念。
从必要性方面讲,党受辉称,游戏行业运维必须转型。现在游戏拼渠道和品质,产品拉回来的每一个流量都要想办法留在这里并沉淀下来。一方面,发布时间必须做得越来越短,或者变更自动扩容,不能等到已经满了,用户进不去了再进行扩容,要更智能化。还有一个故障问题,对于异常辨识、辅助决策,运维掌控着整个环境。此外,还有拉新回流,有多少玩家流失了,哪些玩家可以来得,运维要针对这些信息,提供有建设性的处理反馈。
腾讯开放环境下,蓝鲸将降低运维门槛、提升运维效率。在2015ChinaJoy期间,腾讯云再次展示了自身在游戏云服务领域的领先优势,并表示会继续将腾讯内部多种“秘密武器”开放出来,覆盖开发、测试、运营、支付等环节,助力游戏行业发展。
如若转载,请注明出处:http://www.gamelook.com.cn/2015/08/225656