《游戏数据分析的艺术》之游戏数据分析的流程(上)

今日小编将给大家分享TalkingData高级咨询总监 – 于洋力作《游戏数据分析的艺术》第一章第一节的前三点。以下文章选自《游戏数据分析的艺术》部分内容,如需转载请注明出处

1.3 游戏数据分析的流程

游戏数据分析整体的流程将分为几个阶段,这几个阶段则是反映了不同企业数据分析的水平,从另一个角度,也是在解析作为一名数据分析人员究竟该如何参与到游戏数据分析业务中,与之有关的游戏数据分析师的工作我们将在1.4节重点阐述。

如图1-2所示,对于游戏数据分析系统及数据的利用,我们分为了五个阶段,方法论、数据加工、统计分析,提炼演绎、建议方案。从工程技术、统计分析、数据挖掘以及用户营销几个方面进行了覆盖和研究。

QQ截图20150703170036
图1-2游戏数据分析流程

1.3.1方法论

方法论是数据分析的灵魂,是解决问题的普遍原则,贯穿分析始终的思想指导。这个阶段决定了我们如何埋点数据,如何设计分析指标,如何采集,如何组织数据。

方法论多数是将业务进行了抽象,形成了一套可以解决若干业务问题的思路。就游戏业务来说,从游戏数据分析角度,目前已经存在几套方法论,比如游戏早期市场提及的是PRARA,在进入移动游戏领域,以TalkingData的AARRR模型则提及得最多,这套方法论综合了PRARA、网站分析、社交网络分析等诸多分析的特色,结合移动游戏市场的情况,加以整理并提出的。在后续的章节中,我们会重点介绍AARRR模型。

方法论存在的意义就是要去解决问题,是对于问题、目标、方法和工具的概述。一方面解决业务问题,另一方面则是分析思维的指导。在后续有关游戏数据分析师的描述中,我们强调对分析思想的锻炼及方法的驾驭,学会基于不同角度和领域去看待业务问题,这需要高度的抽象和概括能力。从图1-2我们也可以看到,方法论的确立,决定了我们在游戏数据分析方向上要解决的问题、采取的方法和使用的工具等。

当我们缺少这样的体系支撑时,即使我们确立目标,但是在实践操作时将会变得非常缓慢,效率低下。因为在整个的过程中,我们要完成游戏数据分析的工作,需要开发人员、设计人员和运营人员的参与,当大家无法在统一的思想和方法的指导下,就无法进行有效地任务分配和需求理解,进而导致今天我们看到这种现象:在很多的游戏公司,运营人员与开发人员的沟通中频频会出现各种数据标准理解的不统一,分析功能开发得南辕北辙。这些问题的出现不仅仅是沟通的问题,更是对于游戏数据分析的体系和思想未形成一致的认识造成的。在方法论的阶段有如下的两点是需要重点关注和解决的。

(1)业务需求

方法论是对业务需求的最高层级的抽象,涉及具体业务时,在方法论的指导下,我们需要对业务需求进行拆解,而这个阶段,从数据分析的角度来看,就是该如何进行数据埋点。

数据埋点就是通过客户端或者服务端,通过在某些游戏位置追踪玩家游戏行为而得到的相关数据。这些位置则是未来对特定业务分析的基础数据支撑。比如,我们在进行用户注册分析时,需要在用户注册的相关代码和逻辑位置进行数据采集点的设计,这样当游戏有玩家参与时,我们就可以通过采集到的数据,进行整理,形成可计算的指标。

经过长期的发展后,基本上已经形成了一些特定的数据指标,而这些指标也可以涵盖大部分的业务数据分析。多数时候,我们常常会苦恼于如何进行数据埋点,如何进行基础的数据分析,实际上,我们通过一些行业通用的数据指标白皮书就可以在短时间内明确该如何进行数据的埋点和基础数据统计分析,这方面可以参考TalkingData在2012年发布的《移动游戏运营数据指标白皮书》。

(2)指标体系

当我们形成了基本的数据指标后,我们要形成完整的指标体系,并且要建立在方法论的指导基础之上。在多数情况下,指标具有很强的业务导向性和监测作用。比如在我们进行数据日报的制作过程中,我们就需要按照一定的逻辑组织我们的数据,用户类数据,收益类数据,渠道数据等等。与此同时,在这些指标基础之上,数据分析人员可根据需要,进一步加工和变换指标,从而完成深度分析,比如我们对于新增付费用户的研究,用户生命周期价值的探讨等,就需要在基础数据的指引下,进一步建立新的数据规划和指标拆解。

这部分指标工作看似是最基础的部分,但是最重要。理清了业务需求,我们需要基于目标驱动构建指标体系,在类似AARRR模型的指导下,整体构建并不会有太多的特殊性,但重要的一点是,所构建的指标体系需要能够和业务匹配起来,比如更具业务需要,重点予以关注的指标数据,或者关键业务的评估需要微型的指标体系来实施。这一类是在方法论指导原则下完成的。

在指标体系中,指标重在理解和标准化,如果在构建指标体系阶段,定义的指标标准不够清晰,那么在具体的开发实施阶段,就会产生很多问题,最终造成了类似统计数据不准确等问题。此外,在此阶段定义的指标不是越多越好,所以要加深对于指标的深入理解,借助数据分析来解决问题,而不是罗列数据,在构建的指标体系内,每一个指标都将具备实际的分析价值和能够反映特定的问题,并且当问题得以解决时,我们还可以从该指标或者几个指标的组合中评估效果。

1.3.2数据加工

对数据进行处理使其最终变成信息,这个阶段统称为数据加工,具体要经历如图1-3所示的流程。

QQ截图20150703170500
图1-3游戏数据加工流程

在数据加工阶段,我们重点要去解决的问题有两点。

(1)业务理解

系统最终是需要技术开发的,在选定技术和工具之前,最重要的是要充分理解需求和标准定义。在开发人员完成开发后,如果发现其数据处理的结果并非是分析师或者业务人员所需要的,那么就浪费了很多的时间和资源,因此是否形成一直的指标定义认识,是否明确统一需求,需要分析师、业务人员与开发团队共同商议,形成统一的认识,否则将面临重复开发,需求更改等等一系列的问题。在所有人员在这些问题达成一致后,接下来就要解决的是技术开发问题。

(2)技术开发

确立使用什么技术和架构来完成整体的数据分析平台的建设,这是需要技术人员去评估的,而评估的一个重要参考就是前一个阶段所确立的内容,技术人员对于业务分析需要的理解,决定了未来构建的数据平台的很多因素,比如高安全性、高效性、高可靠性、高可用性、高可扩展性和可管理性,等等。

在数据采集层级,我们需要解决数据的发送机制、采集内容和存储方式等。就目前的移动互联网游戏来说,主要采取在游戏客户端植入统计分析SDK的方式来完成数据的采集,当然,在部分公司中,也采取了游戏服务器端完成数据的采集。两种方式各自具备优势,通过SDK植入游戏客户端的采集方式,在有关游戏用户终端设备的信息,用户会话时间等方面具备优势,而通过服务器端的数据采集,则在游戏内诸如等级分析、关卡任务分析方面具备优势,但是对于游戏用户在客户端设备上一些行为则无法做到采集和分析。比如,如图1-4所示,在移动游戏客户端的错误日志中,多数情况下无法通过服务器端获得的宝贵数据。

QQ截图20150703170617
图1-4游戏客户端错误日志

而这些数据,经过采集后,则是可以快速了解目前产品的问题,比如新增用户很多,但是活跃时间和留存质量很低,分析错误日志则是一个很好的方式。这一点在移动游戏数据分析方面是非常必要的,因为移动游戏环境和场景的多样性,使得我们必须重视解决看似很小的问题。

在数据处理层级要对采集到的原始数据进行抽取、清洗和加载,对杂乱的数据进行标准化、映射、排重以及纠错等操作,最终将数据加载到数据仓库中。在这个阶段需要完成的工作量是非常庞大的,尤其是在移动游戏领域,当用户终端的设备变得更加多样,地域更加分散后,数据的处理工作相比之前的端游和页游,变得更加的重要,依赖程度更高。移动游戏需要更加快速的响应和迭代能力,当我们通过数据发现了游戏在某些设备上存在问题时就要迅速的进行解决,而此时,关键任务在于我们如何发现这些问题并进行分析。如图1-5所示,我们需要依托设备的标准化和纠错去发现不同用户群的设备分布情况。在同样情况下,我们也可以分析比如付费用户更加倾向哪些分辨率的手机,或者使用iPhone5的付费用户的ARPPU是多少,这些分析都要依托于强大的数据处理能力才能够实现。

QQ截图20150703170739

图1-5游戏设备排行信息

在数据计算层级,要进行实时的运算,定义多维数据模型、业务模型,比如基于时间维度、地域维度、用户群维度、区服维度和渠道维度等,按照小时、日计算任务,根据业务要求进行数据运算,并把结果集数据输入到数据库中。

在业务信息层级,则需要将经过采集、处理并计算的数据最后经过接口变成可被查询的信息,如果从开发层面解释,就是庞大的报表系统,即直接面向最终分析师的数据产品。

实际上数据加工阶段的最终目的就是将数据转化为可用的信息。从这点来看,第三阶段的统计分析则是与业务信息阶段是结合非常紧密的,统计分析要基于已经加工好的数据,进一步深入地透过更加多元的数据或者信息分析方法,挖掘特征。

1.3.3统计分析

统计分析包含了统计和分析。统计分析是商业智能的一方面,商业智能应用还包括决策支持系统(DSS)、查询和报告、在线分析处理(OLAP)、预测和数据挖掘,统计分析则是整理数据和分析数据的综合。

此前我们需要收集数据,但是目的都是整理数据且最终要进行分析数据,数据向信息转化的过程。为此需要描述数据的性质和研究数据关系,并通过一定的模型来变换角度解析数据内在的联系,而如果整体系统的开发度更高,则可以就模型本身进行有效性的验证。在部分公司提供的统计分析系统上,我们已经能够看到部分的预测分析,这也是向下个阶段提炼演绎的重要过渡。

对于游戏数据分析师来说,我们需要学习的更多的统计的思想、方法和解题思路。统计分析最关键的就是要分析数据,因为对于经过整理和加工的数据,如何提炼有用的决策信息,一方面是依托于系统的数据采集和整理,另一方面则需要分析师最终进行分析才会发挥价值。分析师的最大要求就是理解每一个方法背后的原则、范围和思想。统计学的思维将我们对于事物的解读能力提升到了一个更高的层次。

在进行一些游戏数据分析时经常使用集中趋势或者离散程度的指标,而这些指标所代表的不只是一个计算方式,更重要的是在最初诞生时,就是为了解决某一类问题而设计的解决办法,这是我们在分析基于计算方法下分析数据所最需要关心的事情,比如在描述统计分析中,我们经常使用集中趋势,它反映的是一组数据所有具有的共同趋势。

统计分析阶段对分析师来说是非常重要的考验,尤其是基本的分析能力。当然,作为一名分析师只具备在挖掘数据特征和分析数据方面的能力还不足以证明分析师的价值,数据分析本身是辅助决策的,因此,能够挖掘提炼和演绎,与业务有效结合,形成结论则是非常重要的。所有的分析师不是为了分析数据而分析数据,崇尚数据,信仰数据,但不要盲目。

以上文章仅为全文部分节选,我们会对文章进行定期更新,小伙伴们可随时关注我们的官方微博微信博客。文中提出的重点阐述会在下期进行分享哦~前方高能,下期见!

《《游戏数据分析的艺术》之游戏数据分析的流程(上)》有1个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注