简明数据科学第九部分:回归模型的相互作用和局限性

作者丨Pradeep Menon

原文丨https://datascientia.blog/2017/08/27/dss-p9-interactions/

译者丨TalkingData 张永超

编者按:

此篇文章结束后,简明数据科学系列算作一个阶段性的结束。虽然数据科学不止这么写内容,但是“温故而知新”,打算回顾一下之前的内容并加以练习,以加深相关概念和内容的理解。什么时候继续进行简明数据科学的内容更新,时间待定。

在之前的文章中,我们讨论了回归模型,费尔南多已经建立了一个多元回归模型,该模型的具体形式如下:

价格 = -55089.98 + 87.34 x 发动机大小 + 60.93 x 马力 + 770.42 x 宽度

该模型通过发动机大小、马力和宽度来预测或者估算汽车的价格。回想之前的内容,多变量回归模型是假定了预测因子是相互独立的,即发动机大小、马力和宽度是不相关的,独立的。但是在实际中,变量之间相互独立的情况很少,如果马力,发动机大小和宽度之间存在关系,该怎么办?这些关系可以模拟吗?

在本篇内容中,将解决这些问题,并解释相互作用的相关概念。

概述

预测因子之间相互独立意味着如果一个预测因子发生了变化,那么目标也会产生影响。这种影响与其他预测因子的存在和变化无关,目标和预测因子之间的关系是相加的、线性的。例如费尔南多的方程式:

价格 = -55089.98 + 87.34 x 发动机大小 + 60.93 x 马力 + 770.42 x 宽度

如果以发动机大小为标准,那么改变一个单位的发动机大小,汽车的价格变化87.34。而这种解释并没有考虑汽车的马力和宽度与发动机大小之间的联系。

难道汽车越来越大,发动机越来越大吗?

根据上述,费尔南多创建了一个全新的模型,其表达形式如下:

价格 = β0 + β1.发动机大小 + β2.马力 + β3.宽度 + β4.(发动机大小.宽度)

第三个预测因子捕获发动机大小和车辆宽度之间的关系,这第三个预测因子被称为交互项。其中 β1.发动机大小 + β3.宽度 称为主要项。发动机大小x宽度为交互项。

上述等式重新组合后,形式为:

价格 = β0 + (β1 + β4. 宽度) 发动机大小 + β2. 马力 + β3. 宽度

现在,如果宽度增加1个单位,β4可以解释为对发动机尺寸的影响。

模型构建

费尔南多根据上述理论重新构建了模型,在统计软件中得到如下的参数:

Markdown

该等式变成:

价格 = 51331.363 – 1099.953 x 发动机大小 + 45.896 x 马力 – 744.953 x 宽度 + 17.257 x 发动机大小:宽度

价格 = 51331.363 – (1099.953 – 17.257 x 宽度)发动机大小 + 45.896 x 马力 – 744.953 x 宽度

让我们来解释这些系数:

  • 发动机的大小、马力和发动机的大小:宽度(交互项)都很重要。
  • 汽车的宽度并不重要。
  • 将发动机尺寸增加1个单位可将价格降低1099.953美元。
  • 马力提高1个单位,价格上涨45.8美元。
  • 交互项很重要,这意味着真正的关系不是叠加的。
  • 将发动机尺寸增加1个单位也会使价格提高(1099.953 – 17.257 x宽度)。
  • 测试数据的调整R平方为0.8358 =>该模型解释了83.5%的变化。

请注意,汽车的宽度并不重要。那么将它包含在模型中是否有意义?这里有一个被称为分层原则的原则:

分层原则:当模型中包含交互时,主要效果也需要包含在模型中。即使个体变量在模型中不显着,也需要包括主效应。

费尔南多现在运行该模型并测试测试数据的模型性能。

Markdown

该模型在测试数据集上表现良好。测试数据的调整R平方为0.8175622 =>该模型解释了位置数据变化的81.75%。

费尔南多现在有一个最佳模型来预测汽车价格并购买汽车。

回归模型的局限性

回归模型是数据科学的主力,是数据科学家工具箱中的一个令人惊叹的工具。当被有效使用时,他们在解决大量现实生活中的数据科学问题方面非常出色。然而,他们确实有其局限性。简要解释回归模型的三个局限性:

非线性关系:线性回归模型假定变量之间是线性的,如果关系不是线性的,那么线性回归模型可能无法按预期执行。

实用提示:使用像日志这样的转换将非线性关系转换为线性关系

多重共线性:共线性是指两个预测变量彼此相关的情况。当有很多预测因子和这些预测因子相互关联时,它被称为多重共线性。如果预测因子彼此相关,则特定预测因子对目标的影响很难被隔离。

实用提示:通过仔细选择预测变量来简化模型。限制选择太多相关的预测变量。或者,使用创建新的不相关变量的主要组件等技术。

异常值的影响:异常值是远离模型预测的值的一个点。如果目标变量中有异常值,模型将被拉伸以适应它们。针对少数离群点进行太多的模型调整。这使得模型倾向于异常值。对于大多数人来说,模型的拟合没有任何好处。

实用提示:删除用于建模的异常点。如果目标中存在太多异常值,则可能需要多个模型。

总结

至此,简明数据科学系列将告一段落,此阶段的主要目的是了解数据科学的基础,以及线性回归模型的从0到1。最后讨论了现行回归模型的局限性,在实际应用的过程中,可能需要进行数据的统计分析来分析数据以及数据之间的关系,如果是线性的,即可直接使用线性回归模型,若非线性,可能要使用其他方法,或者想法设防将非线性转换为线性关系后使用线性回归方法,需要根据实际情况而定。

2018年5月移动游戏Benchmark指标数据

2018年5月移动游戏Benchmark解读:

付费率:2018年5月,Android和iOS平台移动游戏用户的付费率总体环比上月持平,其中,Android平台策略类移动游戏的付费率环比增长1.2%,iOS平台角色扮演类移动游戏的付费率环比下降0.4%;

用户活跃度:2018年5月,移动游戏用户的Dau/Mau处于比较稳定的状态,但活跃率情况总体有所下降,其中,Android平台棋牌类移动游戏的周活跃率环比下降2.6%,月活跃率环比下降11.1%;

用户留存率:2018年5月,Android平台移动游戏用户的一日玩家比例相比上月整体有所微降,其中,卡牌类移动游戏的一日玩家比例环比上月下降0.1%,其次日留存率和7日留存率则分别上升4.2%和1.9%;

使用时长&次数:2018年5月,iOS平台移动游戏用户的日均游戏次数和平均每次游戏时长环比上月有所增长,其中,模拟类移动游戏的日均游戏次数环比增长3.0%,平均每次游戏时长环比增长7.5%。

MarkdownMarkdownMarkdownMarkdownMarkdownMarkdownMarkdownMarkdown

活动回顾|思·变 探索泛娱乐下的新机遇

Markdown现场认真听讲的同学们

8月2日,TalkingData在上海成功举办了《思·变|探索泛娱乐下的新机遇》为主题的线下沙龙。在本次沙龙中,我们诚意邀请到TalkingData 华东区开发者业务高级经理 张亚刚、Tapjoy 中国区总经理 蔡志辉和上海晨之科信息技术有限公司首席运营官 蒋钰,为现场来宾们分享有关泛娱乐方面的营销、运营以及跨界合作等方面经验。现在,我们一起回顾下在本次沙龙中嘉宾们分享了哪些行业干货。

〖一.思·变 探索泛娱乐下的新机遇〗

Markdown

分享人:张亚刚
TalkingData 华东区开发者业务高级经理

在本期沙龙中,张亚刚分享了2018年6月各类别应用月活跃量及活跃率分布情况。通过该图表张亚刚为现场同学解读出通讯社交和视频类应用覆盖了80%以上的互联网人群,此项数据表明沟通和娱乐是刚需。

Markdown

张亚刚还分享了在泛娱乐生态下,泛娱乐流量层和泛娱乐关系网的数据图表。通过图表阐述了,泛娱乐细分领域交融共生,促进生态与文化互相吸收借鉴。

Markdown

在沙龙现场,张亚刚表示移动游戏伴随移动互联网应运而生,给予用户在移动碎片化生活中放松身心的娱乐空间,热血男儿中3/4的游戏网龄至少达到3年,87%曾为游戏付费,接近一半的日均游戏至少1个小时,而且4成以上的愿意在家中、交通工具或公司等场景下玩游戏。

Markdown

1/3的游戏佳人分布在华东地区,说明华东地区不仅盛产美女,也是女性玩家集聚地,相比移动互联网人群,游戏佳人在东北地区的TGI指数超过120,说明东北女人也比较偏好移动游戏;游戏佳人不仅青睐奇迹暖暖的甜美,也喜欢王者荣耀的英姿。

Markdown

57%的游戏佳人曾为移动游戏买单,她们愿意将金钱花费在更厉害、更好看、以及皮肤/英雄等,比较重视游戏内的实力和装扮;43%的游戏佳人还未向移动游戏付费,有一半人以为免费的就挺好,40%的人则认为不如花在真实生活中。

Markdown

游戏佳人的休闲娱乐方式并不仅在于移动游戏,91%的她们还倾向观看影视,相对喜欢犯罪悬疑、综艺节目、偶像爱情、冒险科幻和青春励志等类型影视作品,最近观看较多的节目是综艺和电影;此外,她们对吃喝、阅读和游玩也有着较高的偏好。

Markdown

张亚刚还分享了2017年中国游戏直播用户数同比增长53.1%,预计2021年中国电竞行业收入超过 1.82亿美元;预计2018年中国H5小游戏累计用户数将超过4亿+,预计2018年中国H5小游戏市场收入规模将超过100+亿元,这两组数据。

通过以上两组数据,张亚刚表示电竞和直播是移动游戏粉丝经济的突破口。H5小游戏由于门槛低、玩法轻度,适应人们碎片化的移动互联网生活,而且能够利用平台入口切入人们的游戏需求。H5小游戏的发展也面临着变现和生命周期短等问题,如何将玩法与盈利取得平衡与长线运营是关键。

在沙龙现场张亚刚还分享了多个营销案例。

完整分享内容,点击文末链接,回顾沙龙视频。

二.通过游戏event高效玩转用户获取

Markdown

分享人:蔡志辉
Tapjoy 中国区总经理

本期沙龙现场,蔡志辉通过用户游戏时对积分墙的行为分析,分享了最好的事件/活动是什么、如何深入研究应用/游戏和多事件/活动实验等干货内容。在沙龙现场蔡志辉还分享了,如何通过用户事件和用户付费行为等采买用户的实战案例和独家见解。 完整分享内容,点击文末原文链接,回顾沙龙视频。

三.手游出海掘金带来的思考

Markdown

分享人:蒋钰
上海晨之科信息技术有限公司首席运营官

蒋钰表示巨头垄断市场大头,游戏公司资本退出通道不畅通,钱荒导致小团队生存压力巨大,但从大的发展趋势上来看,游戏本质上是文化创意,优质好玩的内容才是根本的核心竞争力,要回归关注游戏产品的本质。在沙龙现场,蒋钰还分享了宝贵的手游出海建议和实战案例。

TalkingData高铎:解读游戏生命周期曲线模型

第十六届ChinaJoy于8月3日至8月6日在上海新国际博览中心举办,第六届世界移动游戏峰会及展览会(WMGC)与ChinaJoy同地举办。WMGC峰会汇集全球移动游戏领域顶级精英,深入透析移动游戏发展规律,广泛探讨移动游戏前沿话题。TalkingData 副总裁高铎在此次峰会上与现场嘉宾们解读了《游戏生命周期曲线模型》和最新的行业观点。下面与读者们分享TalkingData总结出的四种生命曲线与健康度模型。

MarkdownTalkingData 副总裁高铎

冰与火之歌 解读四类游戏生命周期曲线

“Winter is Coming” 凛冬将至,是美剧《权利的游戏:冰与火之歌》中的经典台词,用它来描述一类游戏或应用的生命周期,再适合不过。“万事皆零落”,每款游戏都将要面对它的“凛冬”,而站在数据的“上帝”视角纵观数百款游戏的生命周期曲线,却能看到它们面对“ 凛冬”的不同态度,它们大致可以分为四个阵营,其一,强运营M型曲线,整体占比42.9%;其二,轻运营M型曲线,整体占比14.3%;其三,人形(丘陵)曲线,整体占比22%;其四,人形(泡沫)曲线,整体占比13.2%。

Markdown

当然,其中还有极少数“异类”曲线,我们在这里暂且不谈。下面首先看看占比42.9%的”正规军“,强运营M型曲线:

Markdown

强运营M型曲线-最大特点在于“持续运营对于其维持游戏生命周期和用户基础起到重要作用”,简单来说,强运营M型游戏在用户流失期,都需要以强运营的方式打一剂“强心针”,但在强心针过后往往将面对下一阶段的“并发症”,经过长时间的流失、激活、流失、激活反复“调理”,才能逐渐进入稳定期。

  • 冲榜期(≤4个月): 游戏上市推广的关键节点,在这个节点中需要加强游戏产品认知度与冲榜节奏。
  • 成长期(≈6个月): 需要精准定位用户人群进行多重曝光与触达,扩大用户基础和知名度。
  • 流失期(≈11个月): 通过产品迭代、后续优化和运营活动、市场推广,稳定存量用户的活跃率和留存率。
  • 稳定期(≥12个月) 挖掘稳定用户和忠诚用户价值,为其提供优质产品体验和客户服务,保证游戏稳健运转,最大化提升游戏产品生命周期。

那么强运营M曲线,从“游戏类型”、”游戏题材”、”美术风格”这三个维度来看,分别在哪些领域的健康度更高呢?(ps:什么是健康度?莫急,会在后面与大家分享)

Markdown

从数据上来看,中重度游戏较为符合强运营M曲线模型规律,角色扮演、武侠和中国风是优势领域,而跑酷游戏、音乐舞蹈题材和欧美动漫风格的游戏,在该领域的健康度较低。接下来我们看看同为M型曲线”宗室“的”轻运营M型曲线:

Markdown

轻运营M型曲线-特点在于“通过适度唤醒能带来新的阶段性上升期,具备一定用户忠诚度”。同为M型曲线,轻运营相比强运营有两大特征,其一,到达游戏活跃顶峰周期相对较短,且没有成长期过度阶段,在上升期阶段能够迅速得到用户体验;其二,有明显的“唤醒期”,在唤醒期游戏往往能够再次进入一个小波峰。

同样轻运营M型曲线我们也进行了四个阶段的归类,分为“上升期”、“流失期”、“唤醒期”、“稳定期”:

  • 上升期(≤7个月) 在上升期游戏的媒体曝光、用户口碑和渠道推广助推游戏快速升温。
  • 流失期(≈11个月) 用户开始对游戏缺乏新鲜感,活跃呈现自然回落趋势,用户群体出现自然流失现象。
  • 唤醒期(≈11个月) 利用版本迭代、资料片更新以及服务体验调优等方式,进行对沉睡玩家、流失玩家的唤醒及新用户触达。
  • 稳定期(≥12个月) 在稳定期维持用户黏性,减少用户流失。

Markdown

从数据上来看,轻度卡牌游戏更贴合M曲线发展,我们看到卡牌游戏类型、棋牌、麻将题材以及简约的美术风格是优势领域,相对健康度更高。在轻运营M曲线里的模拟养成、日韩风游戏的健康度相对较低一些。下面我们来聊聊游戏生命周期最长的人形(丘陵)曲线:

Markdown

人形(丘陵)曲线-最大特点在于“放长线,钓大鱼“,历经长期的市场培育,该类型游戏拥有稳定的用户基础,进而增强游戏变现能力”,从培育期到成长期,再到黄金期,该类型游戏活跃达到顶峰用时≤25个月,这也一反当下“割韭菜”模式的常态。

人形(丘陵)曲线的四个阶段分别为:“培育期”、“成长期”、“黄金期”、“流失期”:

  • 培育期(≤13个月) 凭借少量的市场推广,使游戏影响力稳定攀升。
  • 成长期(≈9个月) 在市场推广或用户口碑的刺激下,游戏用户量加速成长。
  • 黄金期(≈9个月) 游戏活跃持续保持在高位,成为游戏盈利的黄金节点。
  • 流失期(≥16个月) 游戏用户活跃度逐渐降低,呈现自然回落之势,但下滑轨迹相对稳定。

Markdown

从数据上来看,休闲游戏、二次元题材和Q版本的美术风格游戏,更适合“放长线、钓大鱼”,健康度相对更高、而在这个领域射击、写实风格则表现较差。最后,我们来看看同为“人型”的“割韭菜”曲线人型(泡沫)曲线:

Markdown

人形(泡沫)曲线-最大特点在于“割韭菜、一波流”,这条曲线与“热点事件”的发展曲线相似,只不过周期相对更长一些。游戏开发者通过大力度的市场推广,在短短四个月的时间内将产品达到爆发期,但爆发期过后带来的是用户大量流失。影响该曲线形成的因素有很多,比如,迫于营收的压力,过于注重“收割”,忽略玩家体验,或者是热点影视题材的选择,又或者“卖端游IP情怀”等等。

人形(泡沫)曲线的四个阶段分别为:“萌芽期”、“爆发期”、“收割期”、“衰退期”:

  • 萌芽期(≤2个月) 社交网络和媒体平台对游戏进行轻度曝光与预热。
  • 爆发期(≈2个月) 游戏被广泛曝光,安装和激活急剧上升。
  • 收割期(≈6个月) 游戏产品承担短期变现压力,结果导致质量难以得到有效保证,加以产品本身热度迅速下滑,游戏创收时间窗口比较狭窄。
  • 衰退期(≥7个月) 活跃用户基础日渐消退,直到被市场和玩家忘记。

Markdown

在这样的泡沫曲线下,没有优势领域,但是在弱势领域上我们能看到一些问题,就像刚刚提到“端游IP手游化”已经成为当下的一种趋势和常态,借助端游情怀与老IP的影响力,游戏能够快速影响到一批玩家,但这也是一把双刃剑,由于情怀玩家对于游戏品质有更高的要求,他们反而会成为最先“弃坑”的人群。受到金庸、古龙等武侠小说的影响,让我们每个人都有一颗“依剑走江湖”的心,但是这类角色扮演游戏也难逃脱“割韭菜”的归宿。

我们在优势领域与弱势领域中都提到了一个词“健康度”,并且借助这一指标,进行“不同题材”、“不同美术风格”、“不同游戏类型”的TGI评判,那么接下来我们看看何谓游戏健康度?

解读游戏健康度模型

Markdown

对于健康度求和加权这种模型我们就不多做赘述了,简单聊聊模型中的M因子,一款游戏健康度的优劣,并不能单独通过活跃/覆盖/留存/市场(TD活跃指数)等运营数据进行评估,因而我们在模型中加入了“游戏社区活跃度”这个维度,反映了玩家对于该游戏的话题讨论及玩法攻略的探讨热度,同时加入了“网络舆情友好度”的数据、应用商店等渠道的玩家评分及口碑词云数据。通过这四个维度加权处理,生成了相对立体的游戏健康度模型(PS:因子M还有很多方面可以扩展)。

从“四种主流游戏生命周期曲线健康度”中可以看到,强运营M曲线/轻运营M曲线,通过游戏运营和较强市场推广,以及人形丘陵曲线通过用户自然培育和扩散为主的方式,能够获得相对较高的健康度。而以“短平快”为代表的人形泡沫曲线则健康度较低,难于持续发展。

归根结底”善待经典IP ,韭菜多割无益。制作不忘初心,游戏方得始终。”

健康度

MarkdownMarkdownMarkdown

崔晓波出席造就FUTURE,探讨人本数据与智慧城市

近日,TalkingData创始人兼CEO 崔晓波出席了由中国领先剧院式演讲平台——造就发起的“2018青春上海·造就FUTURE”演讲大会,并在会上分享了《智慧城市与人本数据》的主题演讲。

Markdown

TalkingData创始人兼CEO 崔晓波

本次大会邀请了50余位来自国内外的行业领袖共同参与,就 人工智能、生命科学、城市生活、数字娱乐、空间设计、极限探索、新商业和未来人类 八大主题进行了深入的探讨。

一、从实体物质化到数字虚拟化

Markdown

TalkingData创始人兼CEO 崔晓波

截至去年,中国的移动手机数量已接近13亿部,可穿戴设备趋于4千万台,数据的体量和维度呈指数级增长,正在为世界带来颠覆性的改变。由于移动互联网的空前增长,人类行为数据也正在高速发展,崔晓波预测:未来十年,物联网的数据体量增幅将超越移动互联网。因此,看世界的角度也要从实体物质化向数字虚拟化化进行转变。

抽象化、数字化已经广泛应用于城市研究和其他商业研究,例如Google将凤凰城进行了数字化模拟,逼真到需要研究员在屏幕贴上标签去区分现实场景和模拟场景。

崔晓波认为:利用增强学习的方法,对世界进行反馈,是未来所有行业所必经的阶段。

二、智慧城市

崔晓波通过一个案例来解读人本数据如何助力智慧城市的发展,与传统的平面城市研究不同的是,TalkingData将城市人群进行了可视化模拟,通过实时数据赋予人群“动感”,形如脉搏。将人群分为红蓝两色以区分高收入和低收入人群后发现:不同阶层、不同收入的两种人群产生了“时空折叠”的现象——即虽同处一座城市,但很少产生互动交流。

崔晓波指出:这种现象不利于城市的健康发展,会给城市带来各种安全、贫富分化以及相应设施配给等一系列问题。

为了有效解决此类问题,TalkingData采集了包括线下行为、位置、轨迹,线上所有访问习惯等千万份数据进行了深度研究,通过机器学习的方法加入新的维度与思维对人群重新分类定义:比如深宅幸福奶爸、应共享经济而生的快递小哥、代驾等“城市自由工”,经常看演出、关注化妆购物等“买买买的年轻文艺女性”等等,去重新定义在飞速变化的社会中的人群属性,以对在城市生活的所有人群有一个清晰、准确的认知。

通过“城市透镜”的感知计算构建出一个不仅包含静态数据也包含动态数据的立体城市模型,一直是都TalkingData所探索的方向,崔晓波表示:大数据不应该是冷冰冰的,要以人为本,反映人的生活习惯,甚至是个性。

但仅仅反映出人的行为仍远远不够,也要追本溯源地去考虑他们背后的心智,因此TalkingData联合MIT媒体实验室成立了人本数据实验室,通过多年的经验积累去研究人类行为背后的心智,人与环境之间的关联等。

在谈到未来城市规划时,崔晓波提到,一些先进的城市规划与建设已经回到了以人为本的本质中,在地标建筑、交通等建设上市民会高度参与。

三、数据改变企业决策 数据改善人类生活

​数据要取之于民用之于民,而不仅仅组用于助力监管部门的管理。崔晓波回忆,早在TalkingData创立之初,几位创始人在公园里一直思考的问题是:数据究竟能解决什么问题?数据的终极是什么?最后得出:数据会改变企业决策;数据改善人类生活的两大结论。

在人工智能和脑科学相结合成为大数据分析领域的热点的今天,崔晓波表示:从数据的角度来看,判断智能只有一个衡量标准:能否代替人做决策。人工智能结合数据产生的决策价值质量若比人的效率高质量更好,那么它就是人工智能。

在演讲的最后崔晓波提到,大数据与城市相结合的力量是无穷的,但大数据和人工智能无法具备人所有的“正直”属性,因此它可善可恶,现今一些数字资产的拥有着和使用者已经偏离的政治的轨道,导致乱象产生,目前TalkingData最重要的是要做一家正直的大数据公司。

TalkingData一直以来都在着眼于在合法合规的基础上通过人本数据助力企业发展以及智慧城市的建设,崔晓波强调,数字化时代已经来临,TalkingData希望与更多的企业和政府机构合作,探索商业变革和智慧城市的新路径。

从数据化运营到效益数字化,洞察零售业转型的秘密

Markdown

近日,以“From Data to Data:从数据化运营到效益数字化”为主题的TalkingData 2018零售行业数据智能峰会(华东站)在上海顺利举办,与华东区的零售行业同仁一起,洞察大数据时代下的零售业态趋势,分享新零售转型的成功理念、经验与案例。

Markdown会议现场

作为会议主持人,TalkingData零售事业部总经理陈星霖首先分析了零售行业整体发展态势。在当前社会经济形势相对复杂和困难的情况下,企业需要更好地了解他们的用户,提供更个性化的产品和服务,以应对M型社会转型之下的分级消费趋势。除了支撑消费者分级管理,大数据还被越来越多应用到企业战略指引、商业洞察、营销决策、风险管控等多个领域,已经逐步成为企业经营过程中,非常重要的一种新型的生产力。

MarkdownTalkingData零售事业部总经理 陈星霖

正式进入会议议程,TalkingData咨询部总经理刘翔首先带来了“从数据化运营到效益数字化实现”主题的分享。刘翔指出,大数据对零售行业来说已不仅仅是一种新技术,而是一种新的商业模式,是能够颠覆传统模式、为行业带来新生机的一种力量。未来,零售业营销的关键在于如何攻占消费者的心智、满足其内心需求,而不再是比拼商品的性价比。

他通过三个典型案例,介绍了“TalkingData零售行业D2D数字化转型方法论”如何帮助零售企业打造以业务数字化为起点,以效益数字化为结点的数字化运营闭环,从而全面提升数字化能力。

以TalkingData与某全球知名餐饮集团的合作为例,基于D2D方法论,TalkingData帮助该企业建立数字化的会员运营平台,整合和打通1亿+会员、梳理和构建600+标签;助力旗下App的诊断和优化,3个月时间将日活提升了25%;通过目标人群精准圈选实现精细化营销管理,并帮助其财务部门、市场部门、数据分析部门显著提升日常数字化运营效率。

刘翔还提到,除餐饮外,TalkingData目前已与多家服饰、食品、电器、购物中心等领域的头部企业合作,在零售行业数字化转型方面积累了丰富经验与成功案例。

MarkdownTalkingData咨询部总经理 刘翔

会议特别邀请影儿集团CIO罗征先生,从行业实践的角度分享了“‘新’零售体系下大数据生态”。他首先表达了他对“零售”的理解——零售就是一场客户触达的生意,“触”是感知与获得认同,“达”是商品发生转移。而所谓“新零售”与“旧零售”之间的区别,就是利用科技手段,让“触达”在频度、空间和时间上发生方式和性质的改变。

而数据为零售带来了怎样的变化?“旧零售”时代,传统的触点在选择和购买夹断;而“新零售”时代,在技术的帮助下,接触是全时、全方位的,触点前置到需求产生、研究阶段,触点资源也变得无限制、无边界。而数据承载着顾客整个消费、体验生命周期,不只是交易本身。这也让“新”零售模式下竞争的关键在于对流量入口和流量感知的争夺,同时将顾客旧有的采买数据丰富成跨维度的行为数据,这也是影儿集团与TalkingData的合作试图去突破的。

在影儿集团的实践中,从采买数据画像转变成行为数据会员画像的传统方式已不能满足需求,新的数字化运营方式则是通过会员行为画像互动扩大消费场景。罗征还分享了包括与TalkingData合作在内,在建立会员运营框架、设置触发式会员运营模式、整合微生态能力、构建新媒体运营策略、常态化会员运营等数字化运营方面的经验。

Markdown影儿集团CIO 罗征

TalkingData高晓津带来了“TalkingData D2D数据探索”的分享。她首先以三个概念来总结零售业的数字化变革:“人的比特化”——行为更加清晰,人群范围扩大;“货的产消化”——人货交互可见,销售即是生产;“场的无界化”——交易交互无界,虚拟场域概念。那么当我们有了数据、可以用数字化的方式来洞察人的行为之后,我们能够做什么?高晓津从数据类型、效率应用、效益应用以及未来发展这四个方面进行了分析。

在TalkingData的D2D方法论中,重点强调的就是效率与效益的双重提升,她从识别业务特征、品牌选址、销售线索清洗三个方面讲解了数据在提升效率方面的应用;又从Marchtech和Adtech方面讲解了借助数据提升效益的方式和案例。针对未来发展,高晓津认为二方数据将是值得重点探索的方向,能帮助拓展潜客场域边界;而随着技术的进一步发展,情景感知与边缘计算将帮助我们更好的洞察人、增强业务。 MarkdownTalkingData 高晓津

TalkingData李楠分享了“TalkingData D2D数据应用”方面的理念和经验。他首先基于“3A3R”模型,分析了数据驱动下的运营闭环与数据闭环下的业务场景和需求,并介绍了针对各方面需求TalkingData所能提供的数据应用,如面向潜客挖掘和触达需求的TalkingData智能营销云、面向营销效果评估和分析的TalkingData移动广告监测、面向营销全流程管理需求的TalkingData营销闭环平台、面向线下门店选址需求的智选、面向线下客流采集和运营需求的TalkingData客流运营平台、面向线上行为采集和运营需求的TalkingData移动运营平台等等。 MarkdownTalkingData 李楠

最后,由TalkingData解晓恒重点解读了TalkingData近期与腾讯云联合推出的智能商业选址产品——智选。

新消费与数字化浪潮下,布局线下门店并把他们编织成一张有机网络进行用户触点交互和运营转化,成为很多企业的战略诉求。但传统的门店选址方式受数据制约,存在精度差、周期长、成功率低,难以标准化的问题。而智选产品一方面对码人的经验主义驱动的思维模式进行升级,整合基础地理信息,城市商业信息和人行为信息三层数据线索,将单点式的信息化成有化学反应的网络,带来充分的信息对称和量化决策;另一方面,用机器学习的方法进行营业额销售预测,将直接的解决选址的核心问题。

随着选址思路的打开,化繁为简的一键位置推荐、按需定制的深度区位洞察、历史经营数据的深度学习和对预开门店的高精预测等硬核功能都已在TD的选址服务平台上线,真正帮助零售企业获得竞争先机。

据解晓恒介绍,智选服务预期助力某快餐巨头实现选址成本下降50%、初期评估时间缩短90%的业务提效目标。 MarkdownTalkingData 解晓恒

零售业是时下数字化转型最受关注、应用最为广泛的行业之一,也是TalkingData近年重点探索的行业。此次TalkingData 2018零售行业数据智能峰会(华东站)只是开始,TalkingData计划继续深入国内其他零售业核心区域,与更广范围内的零售业同仁共议数字化转型的趋势、模式与未来,用数据驱动零售业的革命性升级。

Markdown

又一年!TalkingData和你相约在ChinaJoy

Markdown

一年一度的ChinaJoy即将拉开帷幕,今年TalkingData在 ChinaJoy 上又有哪些精彩活动呢,跟着这份活动指引,快来找我们玩耍吧!沙龙及展位均有小礼品为大家奉上,数量有限,先到先得!

【主题演讲】解读游戏生命周期曲线模型

时间:8月3日14:15pm-14:30pm

地点:全球游戏产业峰会(上海浦东嘉里大酒店三层上海厅3)

分享嘉宾:TalkingData副总裁 高铎先生

在2017年的ChinaJoy的分论坛上,TalkingData副总裁高铎给现场嘉宾们分享了《2017年中国手游十大趋势》,成为全场关注与传播的焦点。在2018年8月3日ChinaJoy全球游戏产业峰会上,高铎将给游戏开发者们带来极具含金量的“手游生命周期曲线模型”,全面解析手游行业的“冰与火之歌”,让我们翘首以待!

Markdown

【TalkingData展位】W3馆B901

时间:8月3日~5日 9:00~17:00

地点:上海新国际博览中心(龙阳路2345号) 领奖指南:现场完成小任务即可领取精美的伴手礼一份

【线下沙龙】【思·变】探索泛娱乐下的新机遇

Markdown

时间:8月2日(本周四)下午13:30—16:30

地点:(上海徐汇)乐山路33号1号楼1楼(源咖啡)

泛娱乐”圈里有这么一个说法:从2011年的崭露头角,到2013年的遍地开花,到2015年的如火如荼,到2017年的大浪淘沙,我们认为2018年依旧会是泛娱乐产业越来越成熟化的一年。在资本和互联网的助推下,泛娱乐产业将迎来更多的机遇和挑战。

TalkingData结合“泛娱乐”圈内现状,将在上海举办《思·变| 探索泛娱乐下的新机遇》为主题的线下沙龙,届时我们诚意邀请到TalkingData 华东区开发者业务高级经理 张亚刚、Tapjoy 中国区总经理 蔡志辉 、上海晨之科信息技术有限公司首席运营官 蒋钰和武汉斗鱼网络科技有限公司 活动策划总监 鲜明,为现场来宾们分享有关泛娱乐方面的营销、运营以及跨界合作等方面经验。

Markdown

重磅 | iView 发布 3.0 版本,以及开发者社区等 5 款新品

Markdown

7 月 28 日,我们成功地举办了 iView 3.0 暨神秘新品发布会,这可能是前端开源圈第一次举行线下+线上的发布会。现场座无虚席,线上直播也有超过 2 万人观看。

Markdown

iView 3.0到底有哪些重要更新?5款神秘新品又是什么?接下来就为你揭秘……

View 3.0:更轻量的设计,更强大的组件和功能

我们设计了全新的 iView Logo,维持了原先 i 和 v 的造型,并让颜色更立体:

Markdown

3.x 的版本代号依然沿用 iOS 优秀独立游戏的名称,3.0 的版本代号为两周前刚发布的 RPG 游戏 Battleheart。

全民彩蛋计划

Markdown

为庆祝 iView 两周岁生日,以及 3.0 版本的发布,我们在 iView 文档 (https://www.iviewui.com)中放置了三枚彩蛋,它们埋藏在不同的页面里,可能是一段隐藏的代码,或是一段需要破解的密码等等,总之,聪明的你一定会找到并破译它们。当然,找到三枚彩蛋,你并不能继承 iView 作者的遗产!彩蛋可以兑换大量的 IO 币,详见下文开发者社区(https://dev.iviewui.com)。

设计

许多用户选择 iView,很大的原因是认可 iView 的设计,所以在 iView 3.0 里,我们对 UI 进行了进一步的优化。

iView 的 icon 采用开源项目 ionicons 提供的图标,这次也是将 ionicons 图标库从 2.0 升级至 3.0。 3.0 的图标库在命名上更加的规范,只分为 ios ,md, logo 三种,图标也比以前丰富和好看。 3.0 还新增了属性 custom,可以自定义图标。

Markdown

整体的设计风格趋向于简洁、轻量,去掉了冗余的设计,部分颜色做了调整,看起来更加醒目,比如:

Markdown

Markdown

新组件

iView 的组件是全球同类产品里数量最多,功能最丰富的,3.0 更是增加了 5 个全新的组件。

相对时间组件 Timehttps://www.iviewui.com/components/time

锚点组件 Anchorhttps://www.iviewui.com/components/anchor

面板分割组件 Splithttps://www.iviewui.com/components/split

分割线组件 Dividerhttps://www.iviewui.com/components/divider

单元格组件 Cellhttps://www.iviewui.com/components/cell

相对时间组件 Time 用于表示几分钟前、几小时前等相对于此时此刻的时间描述。相比一个固定的日期时间,它更能体现出最近的状态。

Markdown

锚点组件 Anchor 可以快速跳转到页面指定的位置,经常用于导航文章或文档中的目录结构,随着页面的滚动,它可以自动定位当前浏览区域所对应的标题,点击对应的标题,页面也会跳转到对应的位置。

Markdown

面板分割组件 Split 可将一片区域,分割为可以拖拽调整宽度或高度的两部分区域,并支持嵌套使用。

Markdown

分割线组件 Divider,常用于对不同章节的文本段落进行分割,或者对行内文字/链接进行分割,例如表格的操作列。

Markdown

单元格组件 Cell 在手机上比较常见,在 PC 上则常用于固定的侧边菜单项。Cell 可以是一个简单的菜单项,也可以跳转到其它页面,或者跟 徽标 Badge 或 开关 Switch 等组件一起使用。

Markdown

新特性

iView 3.0 有超过 40 项新特性及功能的优化。 首先是全局配置——

https://www.iviewui.com/docs/guide/global),使用 iView 3 时,可以进行全局配置组件的一些属性。目前只支持配置 transfer 和 size 两个属性。组件会优先使用 prop 设置的属性,如果未设置,再使用全局配置。

transfer:所有带浮层的组件,是否将浮层放置在 body 内,默认为不设置,详见各组件默认的 transfer 值。可选值为 true 或 false。

size:所有带有 size 属性的组件的尺寸,默认为不设置,详见各组件默认的 size 值。可选值为 default、small 或 large。

用法如下:

Vue.use(iView, {

transfer: true,
size: 'large'

});

Button 是 iView 最基础,也是最常用的组件。看似再简单不过的一个组件,其实里面有很多学问。 iView 3 废弃了 type=”ghost”,而是新增了布尔选项 ghost,定义按钮为幽灵按钮,幽灵按钮的背景是透明的,常用于有色背景上面。

Markdown

还新增了 3 个用于跳转的 props:to、replace、target:

Markdown

添加 to 属性后,按钮会以 标签的形式渲染,点击可直接跳转,也支持传入一个 vue-router 对象,iView 会做智能判断。如果使用了 vue-router,会以前端路由的形式跳转,否则会用传统的方式跳转。 replace 属性开启后,跳转不会保存历史记录。 target 的行为和 a 标签类似,比如设置在新窗口打开。 支持 跳转 的组件,除了 按钮组件 Button,还有面包屑组件 Breadcrumb、菜单组件 Menu、以及单元格组件 Cell,这些组件都具有 to、replace 和 target 三个属性,体验也完全一致。后续还会支持到更多组件,比如 Dropdown。

Markdown

router 的编程式导航跳转方便的太多,并且会渲染为带有链接属性的 a 标签,在 SEO 上也更友好。

所有支持跳转的组件,都支持了键盘按键(Mac 为 command,Windows 为 ctrl)加鼠标左键在新窗口打开的特性(无论是否设置 target=”_blank”,这种组合行为都会在新窗口打开,与浏览器原生体验完全一致)。

对话框组件 Modal 新增了三个属性:

fullscreen 全屏

draggable 拖拽

mask 是否隐藏遮罩层

开启全屏属性 fullscreen 后,会铺满整个屏幕,并且只有内容区域可滚动。 开启拖拽属性 draggable 后,会默认隐藏遮罩层,此时拖动 Modal 的标题栏就可以移动了,可以支持同时开启多个 Modal 进行拖拽。

表格组件 Table 新增了两个属性

indexMethod

tooltip

当设置列有 type=”index” 时,可以使用 indexMethod 进行自定义序号了。 给某一列设置属性 tooltip=”true” 时,当该列内容过长,一行无法显示时,鼠标经过会以 Tooltip 的形式显示完整内容。

Markdown

其余的更新内容可以到 3.0 更新日志查看。

开发者社区 iView Developer

这是发布会最劲爆的一款产品了。过去的两个多月里,我们一直在投入社区的开发中,目的就是彻底解决开发者的问题,更好地服务开发者。 社区地址:https://dev.iviewui.com/

一对一提问

遇到编程问题,怎样才能有效解决呢?

QQ / 微信群

SegmentFault / Stackoverflow 等技术社区

问同事

每个人都期望加入大群,但都在小群活跃。QQ / 微信群是程序员很活跃的地方,iView 也组建过官方的 QQ 群,累计有 5000 人左右,每天都沉淀了大量的讨论,虽然我不会一一过目,但偶尔也会快速浏览一下。其中一部分问题是文档中已有的,一部分是比较基础的用法,还有一些相对综合的问题。提问的人很多,解答的人缺少,因为群里的人,绝大多数都是和“你”一类的用户,他们加群也是想解决问题来的,但事实上,并没有得到很好和及时的解决。

Stackoverflow 就不说了,这是一个门槛较高的程序员社区,不过对于高级程序员来说,是寻找答案最好的地方。我们来说说国内的技术社区。以 SegmentFault 为例,我们以往也一直鼓励除了 bug 反馈,都到 SF 提问,因为 GitHub 只适合处理 bug 本身的问题,对于如何使用不适合在上面探讨。

至于问同事和朋友嘛,首先你得有一个懂你的领域问题的同事或朋友,而且,对方得有时间和耐心。

为什么得不到有效解决?

其实理由很简单:

“你”问的圈子的人,也都跟“你”一样,是主动提问型的。

专业问题(比如 iView / Vue.js),不是所有人都知道。

能解决你问题的人,一般都是大牛,而大牛都很忙,根本没空理你。

说的很露骨,但却一针见血。

怎样才能解决问题

如果你想问 iView 的问题,那这个世界上谁对 iView 最了解?当然是 iView 作者本人了,那自然也对 Vue.js 的问题了如指掌。如果作者解决不了的,但基本也没什么人能解决,所以,要想彻底解决问题,就是直接向 iView 作者提问。

所以,一对一提问,是 iView Developer 最核心的功能,也是最能解决你痛点的。

Markdown

高级示例

针对 Vue.js 及 iView,精心编写了大量业务中的高级示例,对 iView 官方文档作补充。比如 Table 的服务端分页及服务端排序、过滤;Upload 的手动上传及七牛云的集成。所有示例都有详细说明、源码及演示,并可以收藏。高级示例会不断增加。

高级示例也是 iView Developer 另一重要的板块,里面会陆续更新丰富而针对性的实例,以 iView 和 Vue.js 为主。高级示例具体到某个详细的问题,比如 Table 组件和 Page 组件联合使用并做服务端的分页、排序、过滤。大量的最佳实践和详尽的代码讲解、浏览体验,对于 iView 使用者来说是很好的补充。

Markdown

每周都会更新一些示例,并提示您,并且可以对示例进行收藏。

除此之外,还有独家写作、商城等功能,期待你的探索!

iView Run:随时随地运行 iView 示例

iView Run 是一个集成了 iView 环境的在线运行 iView 示例的工具,左边写代码,右边预览,可以直接编写一个 .vue 文件,它包含了 template、script、style 三部分。 编写好的示例保存后,会生成一个链接,并可以预览,链接可用于提交 bug,或分享示例给他人参考。

地址:https://run.iviewui.com/

Markdown

iView Run(beta)目前仅支持 iView 环境,暂不支持 Less 和部分 ES6 语法,这取决于你的浏览器。未来将逐步支持,并提供示例共享平台,你可以分享或浏览别人分享的优秀示例。 并且 iView 的文档未来也会集成 iView Run,文档中所有的示例未来都可以直接在 iView Run 中运行。

iView Editor:简约而不简单的 markdown 编辑器

因为在 iView Developer 中,我们开发了一个使用起来还不错的 markdown 编辑器,所以把它单独开源出来。 iView Editor 参考 Github 的设计风格,可以在 markdown 和预览之间进行切换,当然,你喜欢实时预览的话,也是支持的。

地址:http://editor.iviewui.com/

GitHub:https://github.com/iview/iview-editor

Markdown

iView Weapp 2.0

我们在一个多月前发布了微信小程序 UI 组件库 iView Weapp,这次发布会我们带来了它的 2.0 版本。 2.0 文档:https://weapp.iviewui.com/ GitHub:https://github.com/TalkingData/iview-weapp

iView Weapp 2.0 新增了 7 个全新的组件: 索引选择器 Index

吸顶容器Sticky

滑动菜单 Swipeout

倒计时 CountDown

分隔符 Divider

折叠面板 Collapse

页底提示 LoadMore

扫描小程序码,立即体验 iView Weapp 2.0:

Markdown

iView Admin 2.0

iView Admin 2.0 也进行了一波大的升级:

基于 Vue Cli 3.0 重构所有代码 重写重要组件 全新权限方案 多级菜单路由 Mock 请求模拟 全局配置 清晰数据流

体验iView Admin 2.0: https://iview.github.io/iview-admin

GitHub:https://github.com/iview/iview-admin

7月28日也是 iView 的两周岁生日,发布会结束后,我们举行了生日会。特别定制的蛋糕太萌了,大家纷纷拍照留念。

Markdown

以上就是本次 iView 3.0 发布会的核心内容,完整的发布会视频之后会在 iView Developer 发布。

简明数据科学 第八部分:回归模型中的定性变量

Markdown

TalkingData 张永超

在之前的文章中,我们讨论了回归模型。费尔南多选择了最好的模型,他建立了一个多元回归模型,该模型的具体形态如下:

价格 = -55089.98 + 87.34 x 发动机大小 + 60.93 x 马力 + 770.42 x 宽度

该模型构建了一个根据发动机的大小、车辆的马力和宽度的函数,来预测或评估车辆的价格。而且该模型中所有的预测因子都是数值型的。

但是,如果有定性变量呢?定性变量是如何用来增强模型?定性变量又改如何解释呢?

这篇文章我们将针对定性变量进行讨论。费尔南多得到了两个类似的定性变量:

  • fuelType:燃油的种类。该值可以是汽油或者柴油;
  • driveWheels:驱动的种类。有三个可能的值,4轮驱动、前轮驱动和后轮驱动,分别表示为4WD、RWD、FWD。

Markdown

费尔南多希望找出这些定性变量对汽车价格的影响。

概述

定性变量是哪些非数值型的变量。适合用于将数据分类,也称为分类变量或者因素。此类变量带有一定的层级,而层级是特定定性变量的特殊值。

燃油种类由两个独特的值,汽油和柴油。这意味着燃料类型有两个因素。

驱动有三个独特的值。四驱、后驱和前驱。这意味着驱动有三个因素。

当回归模型使用定性变量的时候,需要将定性变量转变为虚拟变量,也就是简单的0和1。例如,样本数据中有5辆车的数据,每辆车都有柴油或汽油的燃油类型。

Markdown

燃料类型是一个定性变量。它有两个级别(柴油或天然气)。统计软件创建一个虚拟变量,创建一个名为fuelTypegas的虚拟变量,该变量需要0或1个值。如果燃料类型是汽油,那么虚拟变量是1,否则它是0。

写成数学形式如下:

  • xi = 1 如果燃油类型时汽油
  • xi = 0 如果燃油类型时柴油

接下来看看定性变量在回归模型中的表现,当只有价格和燃油类型的时候,简单回归模型可以提供如下的参数系数:

Markdown

只有一个系数斜率和一个截距,回归模型为定性变量的因子值(在此种情况下为汽油)创建虚拟变量。

如果虚拟变量为0,即汽车的燃油类型是柴油,则 价格= 18348 + 0×(-6925)= $18348;

如果虚拟变量为1,即汽车的燃油类型是汽油,则 价格 = 18348 + 1 x (-6925) = $11423。

处理双因素水平的定性变量的方式是明确的,即构建虚拟变量,其值非0即1。但是当具有多余两个以上级别的变量该如何进行处理呢?例如下例。

驱动方式是一个具有三个因素的定性变量。在这种情况下,回归模型会创建两个虚拟变量,假设样本数据有4辆车:

Markdown

两个虚拟变量会被创建:

driveWheelsfwd:如果驱动方式是前驱,则为1,否则为0

driveWheelsrwd:如果驱动方式是后驱,则为1,否则为0

数学形式如下:

  • 如果驱动方式为前驱,xi1 = 1 ,否则 xi1 = 0
  • 如果驱动方式是后驱,xi2 = 1 ,否则 xi2 = 0

需要注意的是,4驱并不存在于虚拟变量中。

那么他们最终是如何在回归模型中表现出来呢?回归模型对待此类虚拟变量的方式如下:

Markdown

首先,回归模型为价格估算创建了一个基准线,基线中并不包含定性变量对应虚拟变量的均值,此时的结果为截距值,基线方程为4驱方式的平均价格;

对于前驱:车辆的平均价格被估算为 基线 + 前驱系数,即 价格 = 7603 + 1 x 1405 + 0 x 10704 = $9008,意味着,前驱车辆的价格比四驱高出1405美元;

对于后驱:车辆的平均价格被估算为 基线 + 后驱系数,即 价格 = 7603 + 0 x 1405 + 1 x 10704 = $18307,意味着,后驱车辆的价格比四驱高出10704美元。

所有具有两个以上因子值的定性变量和具有双因子值的定性变量处理方式类似。

模型构建

有了对定性变量的处理方式的了解,费尔南多开始将这些定性变量应用在他的模型中,他的原始模型为:

价格 = -55089.98 + 87.34 x 发动机大小 + 60.93 x 马力 + 770.42 x 宽度

他添加了两个定性变量到模型中,燃油类型和驱动方式,于是模型被改写为:

价格 = β0 + β1.发动机大小 + β2.马力 + β3.宽度 + β4.燃油类型 +β5.前驱 + β6.后驱。

于是费尔南多尝试进行了一些训练工作,得到了如下的系数:

Markdown

模型现在为:

价格 = -76404.83 + 57.20 发动机大小 + 23.72 马力 + 1214.42 宽度 – 1381.47 燃油类型 -344.62 前驱 + 2189.16 后驱

这里有定量和定性变量的混合,这些变量是彼此独立的。

从结果中可以看到,调整的R平方为0.8183,意味着模型可以解释训练数据中81.83%的数据异动。但是并不是说所有的定性变量都有意义,在某些情况下定型变量对模型并没有任何意义。

结语 这个模型并不比原始模型好,但是也能够完整的完成工作,我们理解定性变量在回归模型中解释方式,显然,马力、发动机大小和宽度为因子的原始模型更好,但是这些因子是独立处理的。费尔南多思考:

马力、发动机大小和宽度之间有什么联系?

他们之间的联系是否可以模型化?

在下篇文章中将解决这些问题,将解释回归模型交互的作用和局限问题。

相关阅读:

简明数据科学 第一部分:原则与过程

简明数据科学 第二部分:统计学习的关键概念

简明数据科学第三部分:假设检验

简明数据科学 第四部分:简单线性回归模型

简明数据科学 第五部分:多元回归模型

简明数据科学 第六部分:模型选择方法

简明数据科学 第七部分:对数回归模型

Markdown

从数据运营到数据变现,TalkingData证券行业实战分享研讨会在深圳召开

2018年7月11日下午, TalkingData在深圳举行了证券行业数据运营实战研讨会,华南地区证券行业的科技部门与网络金融部门的相关负责人参加了本次研讨会,参会者覆盖了华南地区90%以上的证券公司。此次会议以“数据运营实战分享”为主题,探讨了数据场景变现的整体思路,从业务运营指标建设、数据场景变现、精准营销案例、大数据和人工智能应用等方面,面向证券行业用户介绍行业成熟案例和解决方案。

TalkingData从多年的证券行业实战角度出发,认为证券行业的数据运营要升级现有的思路,从客户视角转向用户视角,从获客发展转向存量经营,从产品关注转向用户关注,从投资通道转向财富管理。通过养数据、看数据、用数据的方式,打通内外部数据和行为数据,实现数据资产的统一视图。通过业务运营指标体系建设,帮助证券公司关注用户转化旅程、提升运营效率、降低运营成本、发现数据变现的机会。建设数字营销闭环缩短用户转化旅程,提升客户活跃度和客户价值。

MarkdownTalkingData高级副总裁 支宝才

TalkingData高级副总裁支宝才出席了本次会议。他在开场演讲中指出,现阶段是证券行业实现业务转型的关键时间点。中国证券行业已经完成了体系、指标的建设,在今天,大家更关注如何通过数据运营获得实际的业务收入。随着客户互联网使用习惯的改变,未来的获客、经营、资产提升、业务收益都将更多地转向移动互联网平台,领先的券商已经把移动互联网变成客户运营的主战场。

Markdown国海证券的数据运营专家 蒋愉

作为第一个重量级嘉宾,国海证券的数据运营专家蒋愉分享了国海证券建设指标体系的历程。通过证券行业指标体系的建立和分析来发现业务问题背后原因,根据数据分析结果制定运营策略,建立数据监测优化的闭环式模型,帮助国海证券实现从短期KPI实现到长期目标达成,再到数字化战略部署的提升。蒋愉表示,国海证券的数据化运营分为三个阶段:即探索、实践和精细化运营,而数据指标体系及平台的搭建是从实践到精细化运营阶段的重要基石,其可以帮助证券公司实现从指标洞察到运营优化提升。

国海证券与TalkingData合作搭建的指标系统投入生产之后,其使用率达到了80%以上,有效地帮助产品、运营各线完成了数字化运营的策略制定到落地实施。蒋愉指出,在推进该平台的使用过程中,国海证券通过OKR指标分解和领导层驱动提升了用户使用指标体系平台的频率,通过数据人员对指标价值的案例梳理和演示让大家进一步理解指标价值和应用方法,并通过收集客户需求及敏捷迭代提升了用户体验。

MarkdownTalkingData证券行业咨询总监 赵博

TalkingData证券行业咨询总监赵博从多年证券行业数据运营实战角度,分享了证券行业数字化运营体系建设的思路和案例,主要覆盖券商互联网转型、数据化运营体系建设思路、数据智能平台三大方面。赵博认为证券行业流量已趋于饱和,大型券商仍在跑马圈地布局年轻人群;中小型券商急于在同质化的服务中寻求自己的差异,投资者教育会是新的流量来源。市场上逐渐出现了产品、功能、内容满足客户所有需求的产品,行业垄断态势逐步显现。通过运营平台的建设完成精准服务、提升客户粘性成为未来主旋律。

赵博提出,指标体系是指导运营的底盘,应从指标体系中挖掘用户动向、探索运营场景,并反馈回指标体系持续监控形成业务闭环。有效的指标体系能够连接前端互联网行为数据和后端商业需求,数据运营是全局概念,是数据、运营、产品、推广等部门的多方协作,是一个全策全力的作战体系。证券公司需要建立数据运营和营销中台、以客户为中心进行数据化运营,具备同互联网企业一致的数据运营能力,将流失预测模型与客户体系分类有机结合,使数据和营销产生联动,让营销结果最大化。 Markdown广发证券大数据总监 王永强博士

华南地区领先的证券公司广发证券出席了本次研讨会。广发证券大数据总监王永强博士以“大数据和人工智能助力证券业务创新”为主题,结合自身互联网巨头和证券行业的从业经验,分享了人工智能和大数据发展趋势和广发证券的实践。 王永强博士指出,人工智能在国外的券商业务中已经有典型的应用场景,并从智能证券业务、智能监管以及数据化运营三方面显示了其巨大的价值和潜力。广发证券通过建立数字化平台和大数据平台,展开不同维度的数据分析和与模型分析,利用用户画像和指标分析来完善客户综合体系评估,实现公司的数字化运营能力的提升。最后王永强博士从损益、诊断、风控等多个方面介绍了广发证券在大数据和人工智能方向的探索。

MarkdownTalkingData高级产品总监 刘彬

在接下来的分享中,TalkingData高级产品总监刘彬指出数字化运营已经成为现今互联网业务或偏向互联网业务的核心方法论。现有交易类APP已无法满足O2O的传播和时效性,证券行业数据体量的消化能力、数字化处理能力都亟待提升, 未来需要从用户概念、场景(情景)感知、营销及归因、分析诊断四大方向着手,通过数据的驱动做到自动化业务的闭环。刘彬表示TalkingData的AE系列产品和数字营销闭环平台是为证券行业数据运营开发设计,可以作为证券行业的数据运营和营销的中台,洞察用户行为,优化产品功能,建立营销场景,分析营销活动的ROI,迭代营销方案,实现数据营销闭环。利用数据和模型进行数据试验,不断尝试、试错、总结、学习,最后完成精细化运营。

MarkdownTalkingData首席布道师 鲍忠铁

会议的主持人TalkingData首席布道师鲍忠铁则在分享中强调了数据增长对于企业的重要意义,他提出了证券行业数据增长的组织建设、工具建设、体系建设、数据增长营销平台建设的方法和建议,并总结了证券行业数据增长的八条经验:

  • 数据增长是个系统工程,必须所有团队参与,领导全力支持;
  • 产品是数据增长的基础,产品优化是数据增长首要任务;
  • 多次数据实验才可以形成标准营销方案,经验需要延续;
  • 电商的五次曝光理论仍然成立,单个用户的营销推送不要超过5次/天;
  • 初次数据实验的成功率在三分之一,转化率为1%是一个可以接受的结果;
  • 场景(事件)营销的转化率最高,业务规则和模型应用同样重要;
  • 指标建设是数据增长的基础工作,指标分析的目的 是from insight to action;
  • 营销中台是数据增长和提高产能的有效工具,建立自我强化的闭环。

研讨会上设置了问答环节,证券行业的同仁积极向演讲嘉宾提出疑问、进行互动,深入讨论了证券行业数据运营中的实际困难和解决方法。TalkingData今后也将继续举办此类活动,分享行业实战经验,与企业共同探索、携手成长。

Markdown