招聘APP哪家强?大数据眼中的金三银四

又是一年春来到,拿了年终奖的你,那颗跳槽的心是否在蠢蠢欲动?在“金三银四”的传统招聘高峰期,各招聘平台APP毫无疑问的迎来了流量爆发。都是谁在用手机APP找工作?各家APP用户又有哪些不同?

TalkingData推出《招聘类APP用户人群洞察报告》,盘点各招聘类应用排名,聚焦不同平台用户差异,描绘出招聘类APP用户典型形象。

传统综合招聘平台在用户规模上仍居于领先

2018年2月,传统综合招聘平台代表—智联招聘、前程无忧51job其APP应用活跃指数以较大领先优势居于招聘类APP前两位。

虽然Boss直聘、猎聘同道、拉勾等平台主打中高端人才招聘、互联网人才招聘等细分定位,但是在用户规模上仍然难以与传统综合平台竞争。

春节后招聘市场进入活跃期

春节假期前,招聘类APP周活跃率保持在一个稳中有降状态。春节假期后,随着“金三银四”人才招聘高峰期的临近,招聘类APP周活跃率进入了一个爆发增长期,用户规模最大的智联招聘、前程无忧51job增长态势尤其明显。

平台定位不同带来APP用户形象差异

作为不同定位平台的代表,智联招聘、猎聘同道、拉勾三个APP的用户因其定位也产生了差异化。拉勾APP用户特征最为明显,主要以一线城市IT从业者为主,日常关心租房买房。而猎聘同道APP用户更加热爱生活,对于家居、汽车、美容、运动等活动更为关心。

招聘平台定位直接影响用户性别分布

智联招聘、猎聘同道、拉勾作为不同类型招聘平台的代表,其定位直接影响了APP用户群体的性别特征。

以互联网类岗位招聘为主的拉勾,其APP用户主要以男性为主,男性占比达65.8%。而成立时间更久、招聘岗位更大众化的智联招聘,其APP用户性别分布要更加均衡,女性用户占比为三个应用中最高。

猎聘同道APP用户更注重生活品质

三个招聘类APP用户中,猎聘同道APP用户更加偏好个护美容、汽车、健康、家居等类型应用,对于个人生活品质要求更高。

拉勾APP用户对于母婴类应用兴趣要远低于其他两个APP用户。比起孩子,拉勾APP用户更关心房产,租房、买房是他们的重心所在。

拉勾APP用户更偏爱重度体验类游戏

休闲时间、网络游戏、角色扮演是最受智联招聘、猎聘同道、拉勾APP用户喜爱的游戏类型。三个APP用户比较而言,拉勾APP用户更加偏好网络游戏、角色扮演等重度体验类游戏,而猎聘同道APP用户更加偏好酷跑竞速类游戏。

智联招聘用户地域分布更广泛

在APP用户地域分布中,拉勾APP用户主要集中在北京、上海、广州、深圳、成都等互联网行业发达的城市,而智联招聘APP用户分布更为广泛,华中、华东、东北等区域都是典型区域。猎聘同道APP用户地域分布特征上更接近智联招聘。

拉勾APP用户更偏好“北漂”

北京、上海、深圳在三个招聘类APP用户城市分布中全部位居前三,堪称是国内跳槽最活跃、工作机会最多的城市。在城市分布中,拉勾APP北京用户占比要远高于其他两个招聘应用,北京仍然是国内互联网人才最大的供应基地。

猎聘与拉勾APP用户北京工作地更为相似

智联招聘APP用户北京工作地在全市范围内均有分布,而猎聘同道、拉勾APP用户北京工作地更多的集中在中关村、上地、望京、国贸等互联网企业密集区域,二者在北京互联网人才招聘业务上的竞争更为直接。

OPPO是招聘类APP用户共同的安卓首选品牌

OPPO在智联招聘、猎聘同道、拉勾三个招聘类APP用户安卓设备品牌占比中都居于第一位,堪称共同首选。在品牌偏好中,猎聘同道APP用户更偏爱华为,而拉勾APP用户更加偏好奇酷、锤子、一加等互联网手机品牌。

附表:泛招聘类APP TOP 20

附表:兼职&职业社交类TOP应用

报告说明

推荐阅读:

还在为长租公寓运营操碎心?大数据助你去分析

愚人节的套路太长,我们选择发奖!

【数驱•新融合】探索OMO模式下的增长点

技术专栏 | Vue 源码分析之 Observer

关于TalkingData

TalkingData(北京腾云天下科技有限公司)成立于2011年,是国内领先的独立第三方移动数据服务平 台。秉承“客户优先、开放坦诚、担当意识、创业精神、创新精神”的企业文化,胸怀“数据改变企业决策, 数据改善人类生活”的愿景。本着“帮助客户转型升级为数据驱动型企业”的使命,践行着“用数据说话”的 原则,逐步成长为中国大数据领域的领军企业。

还在为长租公寓运营操碎心?大数据助你去分析

伴随房地产黄金时代结束、存量市场的到来,许多房企纷纷转向租赁市场。作为购房者,面对诸多购房限制政策及迅猛上涨的住宅价格,买房成为有房有产者之间的游戏,而更多人被挡在了买房的门槛之外而无法“上车”,只能转向租赁市场。

此外,2015年开始,从中央到地方出台了多项鼓励租赁业务发展的政策,让租赁市场从顶层设计上得到了政策红利的支持。于是,租赁市场起风了。

长久以来,租赁市场因为租赁信息不对称、装修不符合需求等等因素,导致传统的租房模式体验已无法满足租房者的需求。尤其在当前消费升级加速、体验消费时代来临,90后新生代消费群体成为租房主力人群的背景下,租赁市场需要品牌化、专业化,更能顺应租房群体需求的经营模式。于是,“长租公寓”迅速蹿红。

目前长租公寓尚未出现垄断性企业,各方市场参与者都在利用各自的资源禀赋优势进行“跑马圈地”,抢占市场份额。然而,同质化竞争、盈利困难等问题困扰着市场参与者们。在硬件产品实力比拼不相上下的情况下,竞争将更聚焦在运营管理和服务管理等内功打造上。

如何修炼内功,以在竞争中取胜? 客户调研是基础,也是关键。在打造长租公寓产品之前,通过长租市场潜在客户调研,进而根据客户研究去定位产品,并指导后期运营。

相比传统的客户调研方式,移动互联网的时代背景下,大数据为我们提供了全新的客户调研及研究方式。

TalkingData作为国内最大的独立第三方移动数据服务平台,为长租公寓的市场参与者运用大数据、从数据视角解读长租公寓品牌客户特征提供了新的解决思路。

以某知名长租公寓客群特征分析为例,TalkingData对该长租公寓的近三个月的APP安装及活跃人群进行了对比分析。

地域分布

首先来看该知名长租公寓客群在全国的分布特征。近3个月,该长租公寓APP活跃人群的城市分布以广东居多,其次是北京及江苏。可见一线城市仍然是长租公寓获得快速布局和发展的主要城市,而广东是该长租公寓品牌的首要市场份额占领城市。

再来深入聚焦北京的各区域分布特征。APP活跃人群在北京排名TOP5的居住地分别在朝阳、海淀、丰台、昌平以及通州,而排名TOP5的工作地分布除前四个区域一致外,还分布在西城。

从提升度曲线的波动分析,APP活跃人群工作地分布在丰台、昌平、通州、大兴、石景山的比例低于该人群在居住地上的分布比例。这就意味着,这五个区域的长租公寓居住人群更多的是向外区域出行就业,其通勤距离和半径超过了其他区域的居住人群。

(提升度:工作地分布比重/居住地分布比重-1)

年龄&性别分布

从性别及年龄特征上看,该长租公寓APP的活跃人群以女性居多,而APP的安装人群则以男性居多。人群的年龄普遍集中在26-35岁,且活跃人群相比安装人群更偏年轻。可见该长租公寓的品牌客户中,女性群体对租房及换房的关注度高于男性群体。

从婚姻状况来分析,活跃人群的未婚比例略高于安装人群,可见单身人群相比以家庭为单位的居住人群在租房需求上更为活跃。

车辆持有情况

从车辆持有情况来看,无车人士的比例高于有车人士,可见在出行方式上,公寓客群较大程度依赖公共交通。在公寓的选址上,交通的便利性和通达性是重要考虑因素。

移动应用偏好

从应用偏好上看,影音、生活、手机工具、网购、社交类应用是人群最喜好的TOP5应用,可见人群相对较为“宅”,追求生活服务的便利性,且有较强的社交需求。

对比活跃人群与安装人群在应用偏好的差异度,活跃人群在教育、健康、母婴及个护美容类应用的偏好上高于安装人群,尤其表现在母婴应用类别上。可以看出,导致租房人群产生租房或换房的需求驱动力来源于家庭结构的变化,以及对教育环境、健康环境的居住诉求。

在教育类的应用偏好上,活跃人群较为关注的是外语、课外辅导、以及专业技能。在运动健身的应用偏好上,人群最为关注运动健身。

在家居类的应用偏好上,人群偏好智能家电,其次是装潢。其中,活跃人群在装潢及家居用品上的应用偏好高于安装人群。可进一步推断活跃人群相对更关注居住的物理空间环境及居家体验,居住的环境舒适度及感官体验是导致租房需求变化的一大因素。

用数字化方式玩转长租公寓运营

通过对该长租公寓品牌客群的特征研究,我们不难发现,通过数据可以洞察租房需求活跃人群的关注点、人群的基本特征属性、对配套设施的需求粘性、因通勤带动人群流动而产生的居住活动半径范围、对公寓硬件设施的要求以及对软性服务体验的需求等等。

 

因此,大数据为我们如何玩转长租公寓提供了一个新的视角,我们可以从“人”的角度出发,运用大数据技术与手段实现长租公寓的数字化运营。

  • 1、产品定位:产品定位围绕长租公寓客群画像,从产品配置、服务配置、定价标准确定经营模式。

  • 2、社群运营:基于客群兴趣关注点组织社群活动,形成线上联动,线下活动可持续的良性运营闭环,打造特色社区品牌,发挥社群在品牌传播中的裂变效应。

  • 3、居住生态圈运营:针对长租公寓客群的生活服务及配套需求,整合线上移动端及线下商业服务资源,打造3-5公里居住生活O2O服务圈,以多样化业态服务,多元化生活配套满足公寓人群的居住偏好需求。

  • 4、社群大数据资产构建:长租公寓APP作为公寓运营的载体,将是长租公寓客户数据采集、客户洞察研究、公寓日常运营以及公寓周边生活服务资源整合的强大入口。社群是长租公寓“外壳”之下影响公寓运营效益、衡量公寓运营成功与否的“内核”。社群的规模及质量也将是长租公寓未来正式走上资产证券化道路之时,投资方除关注基础资产现金流、物业升值潜力等以外另一项信用加持的关键因素。


推荐阅读:

愚人节的套路太长,我们选择发奖!

【数驱•新融合】探索OMO模式下的增长点

技术专栏 | Vue 源码分析之 Observer

【奖】热点观察站 l “复盘”直播答题的52天

锐眼洞察 | 预测性客户分析Part 4——借助聚类和预测分析优化售后服务(翻译)

作者:Ryan Aminollahi

原文:Predictive Customer Analytics — Part 4

译者:TalkingData研发副总裁 阎志涛 

本译文禁止商用,转载请注明来源!

本篇是这个系列文章的最后一个部分,将要说明的重点案例是利用聚类分析对售后问题进行分组,对不同分组进行分析,进而采取针对性的优化或者行动。

如果你读过以前的几篇文章,你知道在故事中,顾客X已经购买了一台笔记本电脑。现在想象一下,他正尝试在家里设置这台电脑。在设置的时候,他发现该电脑无法与无线键盘正常连接。他认为自己搞砸了设置并试图找到解决办法:他浏览产品网站查看是否有任何自助视频可帮助他找出原因,但他并没找到任何有用的信息。然后他打电话给公司,得到了一个自动提示让他提供所有的信息。

他在接下来的15分钟排队等候,最终,他排到了一位客户代表,客户代表再次要求他提供所有信息。正如你可以想象的那样,X变得更加恼火。客户代表在听到他的问题后,通过电话向他提供了一些指示,但X无法理解并按照步骤来操作。他要求提供现场帮助,但客户代表拒绝了他,说他的保修不包含现场服务。X感觉非常沮丧,开始考虑再也不从这家供应商购买任何东西。

这是因低质量服务和支持而感到沮丧的无数顾客中的一个例子。在今天的互联网世界中,更换供应商只需点击一下鼠标即可。企业需要更努力、更聪明地保持现有客户的满意度,并且通过他们的推荐获得新的客户。客户服务流程从为客户提供交互选项开始,从网站自助、电子邮件到电话支持,今天的支持中心运行在全方位的各种渠道上。

一旦客户发起联系,企业就需要为他们提供优质的服务:询问最少的问题并迅速解决问题。

这就要求企业不仅要了解客户,还要了解客户当前问题发生的背景以及与客户交互的整个过程。企业需要让客户感觉到企业真正了解并关心他的问题。

今天的客户服务世界已经开始转向使用交互式语音和聊天机器人的自助服务和自动化的时代。

这些自动化的服务需要智能地预测客户正在经历的事情,并能理解客户问题,提供快速的解决方案。预测性分析肯定会对客户服务领域有所帮助。

预测客户发起联系的目的

让我们思考一下前面做错了什么。假定客户X在销售阶段已经将自己的电话号码提供给了公司,客户支持难道不应该通过他的呼叫ID自动识别他吗?

客户X在笔记本电脑交付给他两天之内打电话,是否意味着这通电话非常有可能与这次购买有关呢?在第一次电话过程中,客户支持针对他的笔记本电脑键盘问题创建了一个问题记录,并且给了他一些建议。

然而,过了两个小时之后他又打电话过来,客户支持能否推测到他的第二个电话非常有可能与第一个问题记录有关系?这个用例的目标是建立一个预测模型,这个预测模型可以预测客户联系企业的可能性原因。知道这个原因可以帮助企业快速将客户对接到能解决相应问题的人那里,从而让问题在第一次交互时得到解决。这个用例中的数据是过去的所有客户和企业之间的交易数据。

这些数据包含销售的交易信息,包括产品、状态以及交付的详细数据。我们将来也会使用客户与企业以往联系的数据。对于每一次联系,我们会使用原因、处理这次联系的客户代表、时长、根本原因、解决方案、状态等数据。这是一个分类问题,因此前面我们使用过的算法就比较适合。让目标分类的数量小于10是非常重要的。

将要使用的算法会被用来产生预测目的模型,我们将会使用销售交易和与以前的联系相关的数据去产生这个模型,并将用模型预测客户联系的目的。行动计划如下:这个分类模型会离线进行构建,当一个客户通过电话或者聊天工具联系企业时,使用呼叫者ID或者用户ID去识别客户,然后使用算法去预测这次呼叫的原因。如果预测呼叫的原因是上一次的购买,则通过IVR回答客户“您好,请问您是因最近购买的笔记本电脑有问题而需要帮助吗”。客户一定会感到非常高兴,因为企业能够猜测他的问题,尽管这不一定是真正的原因。

这恰当地表明了我们理解他并且知道他正在经历什么困难。

寻找不满意的客户

一个企业该如何发现他的客户对于企业的产品或者服务是满意还是不满意呢?

第一, 不满意的客户通常会对调查问卷进行反馈。仔细想一下,因为X先生对服务以及产品感到不满意,他通常更愿意花时间去填写调查问卷和发泄。但是Y女士则未必会如此。

第二, 通常仅仅有10%的客户会对调查进行反馈。那么企业如何能够识别出那些沉默的、想要或者已经转移到其他企业的客户呢?这个用例的目标是构建一个模型,这个模型能够预测企业的所有用户的满意度,不管这个用户是否填写了调查问卷。构建这个模型的数据是从那些真实的已填写调查问卷的客户中得来的。

这份数据包括客户的人口统计学数据以及用户历史行为数据,包括与公司之间的事件和交易数据以及结果。特别需要指出的是,这些数据包括缺陷、退货、客户支持的记录、解决问题的时间以及呼叫服务电话的次数,这些数据构成了特征变量。目标变量是从调查问卷得来的度的分数。比较典型的是这个分数是从0到5或者是从0到10的有一位到两位小数的数字。

如果分数是离散的值,比如1、2、3、4、5,那么我们可以使用Gordon分类来处理。在我们的用例中,我们假定分数值是连续的,因此我们将会使用线性回归算法。利用人口统计学和历史的数据,构建一个可以用来预测客户满意度分数的线性回归方程。这个用例的行动计划是:利用真正回答了调查问卷的客户的数据构建一个预测模型,来预测客户满意度分数。我们需要将调查数据进行规范化,从而去掉可能会影响整体模型的异常值,然后我们将模型应用到所有客户,来发现客户的满意度评分。

然后我们的客户支持团队得到一个最不满意的客户列表,可以去主动联系这些客户,询问他们使用产品的感受和问题或者最终给他们一些折扣。

将问题进行类型分组

客户支持团队每天在处理不同的问题,有些问题会被经常问到并且简单直接,技术工程师甚至可以在客户解释完问题之前就能给出解决方案。另外一些问题则不那么常见并且比较复杂,需要多次的电话沟通以及现场服务才能解决。一个网络连接问题是非常容易诊断的,但是诊断一个笔记本电脑的蓝屏问题则要困难得多。实际上人力资源成本是非常高的,因此企业需要找到优化使用人力资源的方法。

这包含对一些问题提供在线帮助,包括对技术支持团队更严格的培训或者对复杂问题建立新的专家职位。为了帮助企业做这些决策,需要基于相似的属性对问题进行分组。这是这个用例的目标,对于一个问题类型列表,企业需要识别逻辑的问题分组,从而使用它们去开发优化那些消耗最少人力资源的解决方案。

这个用例的数据,是从技术支持团队记录下来的问题库数据中得到的问题统计数据。问题数据按照问题类型做汇总。特征数据是解决问题的平均时间、平均电话的次数、替换率等等。既然我们要创建逻辑分组,我们将要使用K-Means聚类算法或者相关的一些变种算法。通过多次采用不同的K值进行试验来衡量出一个最佳的分组数量。

利用问题统计数据,我们能够将相似的问题进行分组。行动计划如下:当问题类型已经被分组,我们将会分析每个分组去发现分组里边的相似性,比如解决问题花了更长的时间或者非常低的发生率。然后我们就可以得出优化解决方案的计划,例如在我们的网站上提供自帮助、在YouTube提供视频或者对这个问题领域的技术人员做更好的培训。

作为一个企业,我们想要达到客户支持的效率和有效性的最大化。这个用例帮助我们达到这个目标。

问题分组用例

我们如何能够将相似的问题分组到不同的问题类型,然后在组里对它们进行分析来判断是否有任何模式,紧接着采取某些行动去解决效率和有效性问题?

载入数据集

In [1]:

(注:左右滑动即可查看完整代码,下同)

%matplotlib inlinefrom pandas import Series, DataFrame
import pandas as pd
import numpy as np
import os
import matplotlib.pylab as plt
from sklearn.model_selection  import train_test_split
from sklearn.cluster import KMeans
import sklearn.metrics

raw_data = pd.read_csv(“issues.csv”)
raw_data.dtypes

Out [1]:

PROBLEM_TYPE             object
COUNT                     int64
AVG_CALLS_TO_RESOLVE    float64
AVG_RESOLUTION_TIME       int64
REOCCUR_RATE            float64
REPLACEMENT_RATE        float64
dtype: object

这个数据集对于每个唯一的问题类型有一条记录,每个类型包含一些度量值,例如总量,解决问题平均电话次数,解决问题平均时常等等。

raw_data.head()

将数据分到不同的相似聚类组中

现在我们将会使用K-Means聚类去根据属性将数据聚类到不同的组当中。首先,我们需要决定分组的最优的数量,为此,我们采用膝部法来测试确定什么时候这个膝状发生。(参照https://datasciencelab.wordpress.com/2013/12/27/finding-the-k-in-k-means-clustering/)

In [3]:

clust_data = raw_data.drop(“PROBLEM_TYPE”,axis=1)#Finding optimal no. of clusters
from scipy.spatial.distance import cdist
clusters=range(1,10)
meanDistortions=[]

for k in clusters:
model=KMeans(n_clusters=k)
model.fit(clust_data)
prediction=model.predict(clust_data)
meanDistortions.append(sum(np.min(cdist(clust_data, model.cluster_centers_, ‘euclidean’), axis=1)) / clust_data.shape[0])

#plt.cla()
plt.plot(clusters, meanDistortions, ‘bx-‘)
plt.xlabel(‘k’)
plt.ylabel(‘Average distortion’)
plt.title(‘Selecting k with the Elbow Method’)

Out [3]:

<matplotlib.text.Text at 0x27298f49eb8>

观察那些点,我们发现膝状发生在cluster=3的时候,这是聚类的最佳的数量,因此我们在实际操作中将会设置聚类的数量是3。然后我们在原始的数据集上添加聚类的ID。

In [4]:

#Optimal clusters is 3
final_model=KMeans(3)
final_model.fit(clust_data)
prediction=final_model.predict(clust_data)#Join predicted clusters back to raw data
raw_data[“GROUP”] = prediction
print(“Groups Assigned : \n”)
raw_data[[“GROUP”,“PROBLEM_TYPE”]]
Groups Assigned :

对分组进行分析

我们现在可以做一系列的箱型图去看这些不同组在不同的特征变量上的差异。我们从count先开始。

In [5]:

plt.cla()
plt.boxplot([[raw_data[“COUNT”][raw_data.GROUP==0]],
             [raw_data[“COUNT”][raw_data.GROUP==1]] ,
               [raw_data[“COUNT”][raw_data.GROUP==2]] ],
           labels=(‘GROUP 1′,’GROUP 2′,’GROUP 3’))

Out[5]:

{‘boxes’: [<matplotlib.lines.Line2D at 0x27299349ef0>,
<matplotlib.lines.Line2D at 0x27299362390>,
<matplotlib.lines.Line2D at 0x27299375cc0>],
‘caps’: [<matplotlib.lines.Line2D at 0x272993589b0>,
<matplotlib.lines.Line2D at 0x27299358ac8>,
<matplotlib.lines.Line2D at 0x2729936abe0>,
<matplotlib.lines.Line2D at 0x2729936eb38>,
<matplotlib.lines.Line2D at 0x2729937ec50>,
<matplotlib.lines.Line2D at 0x2729937ed68>],
‘fliers’: [<matplotlib.lines.Line2D at 0x2729935db38>,
<matplotlib.lines.Line2D at 0x27299375ba8>,
<matplotlib.lines.Line2D at 0x27299385dd8>],
‘means’: [],
‘medians’: [<matplotlib.lines.Line2D at 0x2729935d320>,
<matplotlib.lines.Line2D at 0x2729936ec50>,
<matplotlib.lines.Line2D at 0x272993855c0>],
‘whiskers’: [<matplotlib.lines.Line2D at 0x27299350940>,
<matplotlib.lines.Line2D at 0x27299350a58>,
<matplotlib.lines.Line2D at 0x27299362b00>,
<matplotlib.lines.Line2D at 0x2729936aac8>,
<matplotlib.lines.Line2D at 0x27299379be0>,
<matplotlib.lines.Line2D at 0x27299379cf8>]}

我们可以看到在不同的分组中问题的数量有明显的区别。
接下来我们看解决问题的平均电话数量。

In [6]:

#Now for Avg. Calls to resolve
plt.cla()
plt.boxplot([[raw_data[“AVG_CALLS_TO_RESOLVE”][raw_data.GROUP==0]],
             [raw_data[“AVG_CALLS_TO_RESOLVE”][raw_data.GROUP==1]] ,
               [raw_data[“AVG_CALLS_TO_RESOLVE”][raw_data.GROUP==2]] ],
           labels=(‘GROUP 1′,’GROUP 2′,’GROUP 3’))

Out[6]:

{‘boxes’: [<matplotlib.lines.Line2D at 0x272993f2ba8>,
<matplotlib.lines.Line2D at 0x27299405da0>,
<matplotlib.lines.Line2D at 0x2729941a710>],
‘caps’: [<matplotlib.lines.Line2D at 0x272993f8cc0>,
<matplotlib.lines.Line2D at 0x272993fdc18>,
<matplotlib.lines.Line2D at 0x2729940fd30>,
<matplotlib.lines.Line2D at 0x2729940fe48>,
<matplotlib.lines.Line2D at 0x27299421f60>,
<matplotlib.lines.Line2D at 0x27299428eb8>],
‘fliers’: [<matplotlib.lines.Line2D at 0x27299405c88>,
<matplotlib.lines.Line2D at 0x27299415eb8>,
<matplotlib.lines.Line2D at 0x2729942ef28>],
‘means’: [],
‘medians’: [<matplotlib.lines.Line2D at 0x272993fdd30>,
<matplotlib.lines.Line2D at 0x272994156a0>,
<matplotlib.lines.Line2D at 0x27299428fd0>],
‘whiskers’: [<matplotlib.lines.Line2D at 0x272993f2a90>,
<matplotlib.lines.Line2D at 0x272993f8ba8>,
<matplotlib.lines.Line2D at 0x2729940acc0>,
<matplotlib.lines.Line2D at 0x2729940add8>,
<matplotlib.lines.Line2D at 0x2729941ae80>,
<matplotlib.lines.Line2D at 0x27299421e48>]}

Group 2基本上不需要任何时间就能解决,这表明问题是非常简单和直接的。企业需要去看看这些问题然后给客户提供一个自服务的路径(产品帮助、在线帮助)而不是浪费客户代表的时间。

In [7]:

plt.cla()
plt.boxplot([[raw_data[“REOCCUR_RATE”][raw_data.GROUP==0]],
             [raw_data[“REOCCUR_RATE”][raw_data.GROUP==1]] ,
               [raw_data[“REOCCUR_RATE”][raw_data.GROUP==2]] ],
           labels=(‘GROUP 1′,’GROUP 2′,’GROUP 3’))

Out[7]:

{‘boxes’: [<matplotlib.lines.Line2D at 0x27299485c88>,
<matplotlib.lines.Line2D at 0x27299499e80>,
<matplotlib.lines.Line2D at 0x272994b07f0>],
‘caps’: [<matplotlib.lines.Line2D at 0x2729948eda0>,
<matplotlib.lines.Line2D at 0x27299494cf8>,
<matplotlib.lines.Line2D at 0x272994a4e10>,
<matplotlib.lines.Line2D at 0x272994a4f28>,
<matplotlib.lines.Line2D at 0x272994bc780>,
<matplotlib.lines.Line2D at 0x272994bcf98>],
‘fliers’: [<matplotlib.lines.Line2D at 0x27299499d68>,
<matplotlib.lines.Line2D at 0x272994a8f98>,
<matplotlib.lines.Line2D at 0x272994c2ef0>],
‘means’: [],
‘medians’: [<matplotlib.lines.Line2D at 0x27299494e10>,
<matplotlib.lines.Line2D at 0x272994a8780>,
<matplotlib.lines.Line2D at 0x272994c20f0>],
‘whiskers’: [<matplotlib.lines.Line2D at 0x27299485b70>,
<matplotlib.lines.Line2D at 0x2729948ec88>,
<matplotlib.lines.Line2D at 0x2729949eda0>,
<matplotlib.lines.Line2D at 0x2729949eeb8>,
<matplotlib.lines.Line2D at 0x272994b0f60>,
<matplotlib.lines.Line2D at 0x272994b6f28>]}

Group 2有非常高的复发率,这些问题需要进行分析去看看产品质量如何改进以防止这些问题再次发生。

In [8]:

plt.cla()
plt.boxplot([[raw_data[“REPLACEMENT_RATE”][raw_data.GROUP==0]],
             [raw_data[“REPLACEMENT_RATE”][raw_data.GROUP==1]] ,
               [raw_data[“REPLACEMENT_RATE”][raw_data.GROUP==2]] ],
           labels=(‘GROUP 1′,’GROUP 2′,’GROUP 3’))

Out[8]:

{‘boxes’: [<matplotlib.lines.Line2D at 0x27299526e10>,
<matplotlib.lines.Line2D at 0x27299538f98>,
<matplotlib.lines.Line2D at 0x2729954e978>],
‘caps’: [<matplotlib.lines.Line2D at 0x2729952ef28>,
<matplotlib.lines.Line2D at 0x27299532e80>,
<matplotlib.lines.Line2D at 0x27299544f98>,
<matplotlib.lines.Line2D at 0x272995497f0>,
<matplotlib.lines.Line2D at 0x2729955a908>,
<matplotlib.lines.Line2D at 0x2729955aa20>],
‘fliers’: [<matplotlib.lines.Line2D at 0x27299538ef0>,
<matplotlib.lines.Line2D at 0x2729954e860>,
<matplotlib.lines.Line2D at 0x2729955fa90>],
‘means’: [],
‘medians’: [<matplotlib.lines.Line2D at 0x27299532f98>,
<matplotlib.lines.Line2D at 0x27299549908>,
<matplotlib.lines.Line2D at 0x2729955f278>],
‘whiskers’: [<matplotlib.lines.Line2D at 0x27299526cf8>,
<matplotlib.lines.Line2D at 0x2729952ee10>,
<matplotlib.lines.Line2D at 0x2729953ff28>,
<matplotlib.lines.Line2D at 0x27299544780>,
<matplotlib.lines.Line2D at 0x27299555898>,
<matplotlib.lines.Line2D at 0x27299555fd0>]}

Group 1具有非常广的替换率,它不能给出任何实际可以操作的模式。

Group 2没有任何的替换,这是非常棒的。现在看到的组级别的一些倾向,我们可以基于这些分析做一些组级别的决策。例如Group 2呼叫了很多次,但是解决基本不需要花时间,因此我们可以对Group 2利用自服务。Group 1则不同,呼叫的次数少,但是花了很多的时间去解决,并且有很高的替换率以及复发率,我们可能需要去看看产品是否有问题或者已修复问题是否还在发生。

这就是我们如何利用聚类和预测分析去将我们的问题进行分组,然后基于组进行分析。

—  本系列文章完结  —

锐眼洞察 | 预测性客户分析Part 3——客户终生价值(翻译)

作者:Ryan Aminollahi

原文:Predictive Customer Analytics — Part 3

译者:TalkingData研发副总裁 阎志涛 

本译文禁止商用,转载请注明来源!

译者注:本文共分四部分,本篇文章为第三部分。

在第二部分,文章介绍了如何用预测分析去获取客户,但由于商业的黄金定律是“从现有客户获取价值的成本比新客户要低的多”,所以就需要了解现有客户的客户终生价值(Customer Lifetime Value,CLV),从而最大化地从现有客户获取足够的收入。

本篇将会介绍如何用线性回归模型,基于老客户历史数据与客户生命周期的关联关系,建立线性回归模型,从而预测新客户的终生价值,进而开展针对性的活动。

客户终生价值

在商业领域所有人都认可一句话:

“我们80%的收入来自于20%的客户。卖给现有客户的成本比寻找一个新的客户低10倍。”

不同的客户为一个企业产生不同水平的销售收入。我们需要识别和培育一些顶级客户从而保证稳定收入。但主要问题是:

  • 过去的收入如何预示未来的收入?
  • 我们过去最好的客户在未来还会是我们最好的客户吗?
  • 这是我们手中的结果吗?

我们想要识别能够给我们带来重要业务的客户并且培育他们,同时确保他们对我们满意。

我们需要一个计算客户终生价值的方法。回到用例,客户刚刚从我们这里购买了一台笔记本电脑。那么,我们期望从他那里得到什么样的未来收入?他刚刚购买了一个笔记本电脑,因此他在接下来的三年可能不会再买,但是等一下,他可能每年都会不定期购买软件版本升级。他可能会根据初始的购买情况,复购比如耗材等等。

当他的孩子们到中学或者高中时,可能需要一个笔记本电脑。当他们进入大学可能需要购买更多的东西。我们需要了解他们的人口统计学和家庭信息才能知道这些生活事件什么时候发生。

一般来说,他可能在感恩节或者圣诞节给他人购买礼物,会送一台笔记本电脑或者其他的,这些就是潜在的年度购买。如果我们能够识别这些事件,我们就能够通过这些重复性购买需求和年度需求估计出他未来总的商业价值。

构建客户周期分类

最早期的基本客户管理流程是,根据他们过去的业务和观察到的未来业务情况,将客户归入不同分类当中,比如青铜客户和黄金客户。然后帮助业务针对性瞄准这些客户。当一个新的或者潜在的客户被识别出来,在业务周期中尽早对其进行分类可帮助企业将更多资源集中在具有重大未来价值的客户上。

根据一个客户(称为X)的人口统计特征,他可能有资格成为黄金客户,因为他会为他和他的家庭购买高端电子产品。另一个客户(称为Y)则可能更关注预算,未来五年可能不会在电子产品上花费太多,因此他将成为一名铜牌客户。鉴于此,我们希望将营销资源专注于X,以产生最大回报。这个用例的目标是建立一个预测模型,将新客户分类为白银、黄金或白金。

鉴于我们专注于新客户,数据集应该是容易从新客户获得的数据集。因此这个数据集就是客户的人口统计学信息,其次是他们的第一次购买信息,如产品、金额、时间、退货、保修等等。训练数据还会有一个客户分类,用于说明老客户属于哪个类别。这是一个经典的分类问题,任何以前的相关算法都可以完成这项工作,如随机森林。

我们将建立一个模型,根据客户属性以及首次购买交易数据预测客户分类,并为每个客户提供他的类别。行动计划是,当客户进行新购买时,我们将使用此算法将他们分类为一个或多个类别。然后,这些分类可以被我们的营销或客户管理团队用来进行差异化的处理,以便在随后的访问中产生更多收入。

我们的客户服务团队还可以借助这个分类来提供高级支持。了解我们最好的收入来源可以帮助培育客户并从客户那里获取更多的收入。

发现响应模式

当客户从我们这里购买了服务或者商品,然后随机切换到另一个企业购买同样的服务或者商品,这对我们是一种伤害。我们希望客户能从我们这里购买更多的产品和服务。因此,我们可以通过优惠券、特殊优惠、促销、套餐、折扣等各种方式与客户保持联系。

所有客户是否都以同样的方式回应这些优惠?不。很有可能X会对圣诞节期间获得的优惠券更感兴趣,以便他为家人购买礼物。

了解客户如何回应我们的优惠有助于将营销资金锁定在最有可能回应的客户身上。这个用例的目标是确定我们的客户响应优惠的不同模式。我们将客户分为不同聚类。然后,确定这些聚类或团体共有的模式,制定营销计划,从而使得每一个集群或者团体都产生更好的收入。用于此用例的数据将是客户人口统计数据以及客户的购买历史记录。

它还包括所提供的优惠的数据,例如提供的优惠活动、优惠针对的产品、提供的折扣、提供优惠的渠道、客户是否检查了优惠以及是否真的使用该优惠?所使用的算法将是K-Means聚类或该算法的任何变种。我们将使用人口统计数据以及优惠相关的数据来构建聚类和群组,然后将其用于我们的分析。

我们会使用客户人口统计数据来建立客户群组。 一旦确定了群组,我们的营销部门可以进一步分析各个群组,了解他们的响应模式以及他们之所以区别于其他分组的因素,它可能是人口统计学因素、购买的产品的因素、季节性因素或其他。 我们对客户行为了解越多,就越能设计相应的产品和优惠,并从客户那里获得更多收入。

预测客户终生价值

客户终生价值是一种货币价值,它表示客户在与企业关系的整个生命周期内提供给企业的收入金额。如果我们提前知道X将在未来五年内带来1万美元的收入,而Y只能产生500美元的收入,那么我们可以在X上花更多的营销资金并收获他的全部潜在预算。使用客户终生价值标记每个客户有助于业务专注于那些能够在未来带来最高收入的客户。

计算客户终生价值时有几种计算方法,但我们只能对与企业有重大购买历史的客户可靠地计算CLV。 但是我们如何才能为最近的客户进行计算呢? 预测分析就在这里提供帮助。这个用例的目标是建立一个回归模型,该模型可以根据他或她最近的购买模式来预测新客户或最近客户的客户终生价值。

随着可用数据越来越多,它将帮助我们更准确地计算CLV。 客户终身价值取决于最近的能够显示购买频率的数据。 因此,我们将创建一个数据集,提供所有老客户的前六个月每个月的购买货币价值, 目标属性是整个生命周期中客户的实际CLV。

根据我们的业务和我们所拥有的历史数据,CLV可以在有限的时间内进行衡量,比如两年左右。 这里使用的算法将是线性回归。 前六个月的数据将成为预测变量,CLV是目标变量。 该分析将提供一个可用于为新客户计算CLV的公式。 通过使用这些数据的子集,我们实际上可以生成这个方程的不同部分,比如只有第一个月,然后是前两个月等。

随着客户生命周期的延长,更多的数据意味着更高的准确性。一旦在我们的系统中捕获到新客户,我们根据第一个月的数据计算CLV,随着越来越多的月份,我们可以通过越来越多的数据来完善CLV。我们的销售人员、服务人员和营销人员可以使用CLV值来识别拥有高CLV的客户,并为他们提供差异化的服务和优惠。

总而言之,本用例显示了如何根据相似的老客户的CLV预测新客户的CLV。

预测CLV的用例

我们将看到如何根据现有客户数据模型来预测新客户的客户终生价值。

我们有这些客户产生的前六个月收入,第一个月到第六个月,他们产生的收入以及客户终生价值。这或许是他们3年产生的总收入,这可以根据客户留在我们业务中的时间来确定。 这即是我们要使用的数据,我们将用它来构建一个线性回归模型,然后用它来预测客户终生价值。

我们首先导入一组Python、Pandas和Skylearn库,然后加载history.csv文件。查看文件以确保所有的数据元素都已被加载为整数,因为这些元素要求它们是整数。在顶部过滤器卡上做一个表头,以确保它们是否都已正确加载。然后,我们进行前六个月的数据和CLV之间的相关性分析。

from pandas import Series, DataFrame
import pandas as pd
import numpy as np
import os
import matplotlib.pylab as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import sklearn.metrics
raw_data = pd.read_csv(“history.csv”)
raw_data.dtypes

CUST_ID int64
MONTH_1 int64
MONTH_2 int64
MONTH_3 int64
MONTH_4 int64
MONTH_5 int64
MONTH_6 int64
CLV int64
dtype: object

raw_data.head()

进行相关性分析

cleaned_data = raw_data.drop(“CUST_ID”,axis=1)

cleaned_data .corr()[‘CLV’]

我们丢弃掉客户ID列,因为我们的模型构建不需要它。可以看出,相关性分析在不同月份显示出非常好的相关性,我们继续前进并建立一个模型。我们首先通过使用Skylearn类库中可提供的训练测试切分能力将数据切分为90:10的比例。我们打印出大小以确保一切看起来都不错。

predictors = cleaned_data.drop(“CLV”,axis=1)
targets = cleaned_data.CLV
pred_train, pred_test, tar_train, tar_test = train_test_split(predictors, targets, test_size=.1)
print( “Predictor — Training : “, pred_train.shape, “Predictor — Testing : “, pred_test.shape)

Predictor - Training : (906Predictor - Testing : (106)

然后,我们建立一个模型,从线性回归模型开始,通过拟合建立一个模型,打印系数和截距。这给了我们实际的方程,即线性回归方程。然后我们可以利用测试数据对预测进行测试。紧接着我们看看回归模型的自动评分,它告诉我们如何创建模型列表。这个结果的准确率达到了91%,非常赞!

#Build model on training data

model = LinearRegression()

model.fit(pred_train,tar_train)

print(“Coefficients: \n”, model.coef_)

print(“Intercept:”, model.intercept_)

#Test on testing data

predictions = model.predict(pred_test)

predictions

sklearn.metrics.r2_score(tar_test, predictions)

Coefficients: 
[ 34.59195048  11.53796271  15.17878598  11.72051702   8.60555913
  5.44443443]
Intercept: -199.535985333

Out[7]:

0.91592106093124581
它显示了91%的准确度,这是预测CLV的一个极好的模型。

现在我如何预测新客户? 假设有一位与我们在一起3个月的新客户。我们拿出他的前三个月的收入,基于它建立所有价值的数组。我们有前3个月的价值,接下来的3个月将是零, 我们用它来打印CLV。

new_data = np.array([100,0,50,0,0,0]).reshape(1, -1)
new_pred=model.predict(new_data)
print(“The CLV for the new customer is : $”,new_pred[0])

The CLV for the new customer is : $ 4018.59836236

这就是我们如何为CLV建立一个线性回归模型,以及用它对我们的新用户进行CLV的预测。

锐眼洞察 | 重塑零售业的3项技术(翻译)

作者:Talitha Loftus  

原文:3 Technologies Reshaping Retail

译者:TalkingData解决方案架构师 韩铭扬

本译文禁止商用,转载请注明来源!

从自动购物车到3D足迹扫描,新的技术继续以意想不到的方式改变零售业。毫无疑问,零售业的瓦解有了新的方向。在过去的一年里,企业在零售领域的运作方式产生了巨大变革。实体店开始越来越多地运用技术来解锁更多的机会并为顾客提供无缝的购物体验。但是,由于突破性创新占有很强的市场份额,零售商需要集中精力创造一条途径,以便整合创新的场内技术来满足顾客的需求。 受华盛顿邮报的一篇“零售业的未来已经到来的5种途径”文章的启发,你将在下文中看到我认为的正在重塑零售业的前三项技术。

自动购物车

电影迷们长期以来着迷于虚拟机器人,但他们通常不太现实… …直到现在。得益于技术的进步,Five Elements Robotics推出了Dash Robotic Shopping Cart——一个允许顾客导入购物清单并通过在商店里操作的自动购物车。

设计时所考虑到的便捷理念,使顾客可以通过Dash上的结账系统使用信用卡、苹果支付或是谷歌钱包支付,省去了排队结账的麻烦。如果你嫌还车麻烦,当你把杂货都从车里拿出来后,Dash会自动找到回商店的路。Dash同时也可通过消费数据来学习顾客购物习惯,并投放定向广告。Five Elements Robotics 的CEO Wendy Roberts称之为零售业的游戏规则改写者:“Dash自动购物车必然将转变我们购物的方式。当这些机器人被投放进商店,我们甚至都无法回想没有它们之前我们是如何购物的”。 像沃尔玛这样的大零售商已经准备好在2018年部署这些自动购物车,这个领域将值得持续关注。

动态场内定价

在网上购物时,你是否发现有些你正要买的商品在几秒的时间内就降价了的经历?好消息是,这般的敏感度正在慢慢步入实体店中。商品的价格不再只依赖于供需关系以及地理位置,动态定价通过对商品的深入分析,以及更重要的,对顾客的分析,来为店铺经理确定最佳的定价。 依据Crealytics:“动态定价是一个运用多种定价方式而非典型的固定定价方式的电子商务和零售策略。随着更多的数据分析,商品或服务的最优价格被重新计算。价格变化的时间间隔取决于业务和商品本身,但可以做到像是每天或是每小时这样频繁。

零售商现在可以通过点击一个按钮,对数千个商店的价格进行大规模的更改。举例来说,如果某家商店有四瓶橙汁,店铺经理可以在下批货到店之前进行提价。或者,如果店里面包存货过多,商家可以通过推出秒杀活动以减少浪费并提高销量。

3D足部扫描

你知道你的鞋的准确尺寸是多少吗?很可能你并不清楚,你只是知道一个码数,通常你把这个数字告诉销售人员,希望他们可以给你拿来一双刚好合适的鞋。在现实中,一个人的两只脚并不是完全相同的大小,甚至可能相差一个码的大小。这就更不用说鞋子制造商,他们就像服装制造商一样,对鞋的大小有着非常不一致的看法。但是,一家瑞典公司Volumental开发的技术,可能使不合脚鞋子的困扰成为过去。

Volumental为零售商提供了一个设计精美的硬件和软件解决方案,使其可以通过3D技术扫描顾客的脚并通过由AI驱动的试衣引擎(Fit Engine)提供鞋类建议。扫描结果之后被送到Volumental平台以捕捉多个数据点,包括长度、高度以及顾客脚掌的宽度。一旦扫描结束,它们就被立即发送到一个连接的平板,便于销售人员为顾客找到最合适的鞋。此外,这个软件还可以检查库存并告知其他门店是否有货。

第一批Volumental足部扫描仪已经在多地部署,包括零售巨头新百伦(New Balance)。“Volumental的产品提供了一种与客户互动的全新方式。它把新百伦独特的试穿故事通过个性化、合适的方式带到了人们的生活中。顾客喜欢它,我们的员工也喜欢它,”新百伦国际零售总监Jonathan Clark说道。

零售商正在运用先进的技术解决方案,为消费者提供快捷个性化的购物体验。验证技术公司SheerID的CEO Jake Weatherly说道:“当我们步入新的一年,我们将看到多渠道零售的持续发展;但是,企业将同时在他们的用户体验和可帮助其更深入了解用户的技术上投入更多。”

聊完技术重新定义实体店的几种途径之后,我们需要知道还有上千种新技术正在应用于解决真正的零售问题。与此同时,自动购物车正在推动自动化体验,而动态定价模型既提高了消费者的价格感知能力,又提升了零售商的盈利能力。对于所有零售商来说,最关键的将是找到合适的技术来解决他们最大的摩擦点,以改善顾客在店内的体验。    

锐眼洞察 | 零售数据的转变:谁能受益?(翻译)

作者:Ramesh Dontha

原文:The Shift in Retail Data: Who Can Benefit?

译者:TalkingData解决方案架构师 李堃

本译文禁止商用,转载请注明来源!

当我们的“数据”回顾我们实践的历史时,我们会发现我们对零售业感激不尽。

零售品牌几十年来一直处于分析的前沿。想想你上一次去实体店的情况。货架上的产品组合?分析的结果。显示器的布局?从扬声器飘来的音乐?你猜对了:分析。多年来,在使用数据改善客户体验方面,没有人比零售品牌做得更好。

然后,我们的零售商朋友遇到了困难:互联网。客户不是去当地的商场或大卖场,而是呆在家里,让他们的手指购物。但聪明的零售商意识到他们的客户不会离开,他们只是不出去。购物习惯的这种转变意味着通过在多个层面上吸引消费者来增加收入的机会 – 当然,这是通过分析来指导的。

建立混合体验
虽然网络的兴起使许多零售商濒临灭绝,但那些坚持下来的企业却将数字和店内数据结合在一起。这种混合的方法使他们能够更好地了解他们的客户,并相应地调整他们的业务。

虽然网上销售对于零售品牌来说很重要,但店内访问仍然是一个圣杯。当顾客浏览时,冲动购买更有可能,并且与店员互动的机会促进了与品牌更大的联系。即使是电子商务巨头亚马逊(Amazon)也已经感受到了亲身体验的力量,计划在未来几个月内开设几家实体店。

与此同时,零售商的电子商务方面提供了关于购物者习惯和活动的大量信息:他们来自哪里(电子邮件,社交媒体等),他们访问了哪些其他网站,无论他们是“搜索者“或”浏览器“等等。这些见解可以帮助零售商不仅优化他们的网站,还可以调整他们的店内体验。
为了增加收入,零售商需要创建一个无缝的品牌邂逅,让客户在线上网,同时吸引他们回到店里。他们怎么能做到这一点?答案在于他们的数据。

建立本地连接
促进混合客户参与的一种方法是接受本地连接,并使用地理定位分析来获得零售商的优势。更成功的零售商不仅经营其母公司的通用旗帜,而且还作为当地社区的成员服务于邻居的特殊需求。

在消费者层面,收集网上购物习惯的数据并不是什么新鲜事。零售商正在发现的是将这些信息映射回当地零售商店的客户群体的方法。他们可以将天气数据,游行或商会活动等当地活动以及客户人口统计数据与销售点数据和交易数据结合起来,从而清楚了解他们的客户想要什么以及如何获取这些数据,战略上。通过使用这些知识来提供送货上门,匹配价格或消除销售税等决策,品牌可以建立一种关系,使顾客一次又一次地回到店里。

本地化在行动
例如,服务于佛罗里达某些地区的零售商可能会跟踪天气数据,发现夏季下午3点到5点之间几乎每天都会下雨。他们可以利用这些信息来策划从店内咖啡店的“下午茶特价”到在收银台附近放置印有徽标的雨伞的策略。
本地化的驱动力,也突出了如何将数据传送到当地管理层手中的必要性。零售品牌需要一个系统来赋予当地管理人员及时的数据支持,从而为他们创造收入的决策。

下一步是什么?
正如零售商在店内和在线上混合分析一样,移动设备和“物联网”的兴起正在使景观更加复杂化,为客户体验提供额外的数据来源,而这些数据来源必须被理解并利用。当消费者看到他的智能手表上的一个警报,说他的当地衣服上周刚刚在网上看到的那件外套的尺寸是多少?而当他去商店时,零售商也可以提供“我们付你的销售税”和投入一个配套的帽子等奖励。

幸运的是,零售商数十年来使用分析的经验为应对这些挑战和其他挑战提供了完美的基础,并为其业务网络探索新的收入来源。

锐眼洞察 | ​金融科技的5大新年计划(翻译)

作者:LHoFT

原文:5 New Years Resolutions for Fintech

译者:TalkingData解决方案架构师 韩铭扬

本译文禁止商用,转载请注明作者与来源!

 

金融科技在我们的生活中无所不在,这同时意味着它在我们的年终总结中应占有一个特殊的位置。当2017年即将结束时,我们可以回顾一下今年有哪些方面进展顺利、哪些方面需要改进,以及金融科技行业如何能在2018年有个积极的开端。

在2017年,我们在金融科技领域内看到了一些提升,即创业公司和金融机构对变革的需求意识逐渐强化。我们同时还看到,所有的参与者都有更强的合作、承担风险、以及采用创新技术的意愿。毫无疑问,2018年将继续带来巨大的变化,但为了实现这些变化, 我们的决心也需同在。

我们为金融科技制定了五个新年计划,并请不同的专家基于他们的观点进行权衡。加入我们,让我们一起实现这些计划的条约, 保持金融科技的积极势头,并在2018年将那些好的想法和理念付诸于实践。

1. 更加以客户为中心

当下,比以往任何时候都更能体现出来,任何不能使顾客完全满意的企业都将无法生存。金融科技市场很大,而消费者才是坐在驾驶位的人。这对金融科技公司来说意味着什么呢?这意味着每一项决定都应该考虑到客户的想法。

“2018年将不再存在以客户为中心的问题”Temenos首席增长官Duena Blomstrom表示。“无论大银行或是小银行都明白,争夺客户芳心的竞争将会是非常激烈,如果希望维持这种关系,就必须提供真正令人愉悦甚至上瘾的体验。

以客户为中心的文化有助于创建流畅的消费体验,这也正是N26和Transferwise如此成功的原因。金融科技初创企业和银行都应该通过公开数据交换和定性反馈来持续监控客户的期望,并将这些发现融入他们的产品中。客户对金融服务的高期望将继续为新的产品功能铺平道路,并推动传统金融机构实现更好的客户体验。

2. 更加多元化

福布斯在2017年十月的头条文章中说得很对:“金融科技有99个问题,多元化正是其中之一。”金融领域一定会从不断增长的多元观点中受益。并不是每个人都以同样的方式使用产品或是服务,这意味着与不同的团队一起工作将有助于促进包容和创新,最终增强组织的文化和产品。

FarmDrive合伙人Mary Joseph表示:“作为一个个体,为我职业生涯和成长带来最大收益就是与那些在性别认同、能力、阶级、种族、纪律、甚至是音乐品味等各方面与我不同的同事合作”。“在金融科技领域,我们针对金融挑战制定了创新的解决方案,通常是为那些被排除在正规金融机构之外的边缘群体。包括用户群的成员在内,有个多元化的思想者群体,增强了我们开发高质量产品的能力,从而增加了金融包容性。”

根据一篇来自CFSI的博客所言,在科技领域仅有3%的CEO是女性,不到1%是黑人,以及不到1%是西班牙裔。在金融领域,仅有4%的跨国银行是由女性CEO所领导的。在2018年,应当让这些数字更加平衡,以促进一个更健康、更具代表性的金融科技生态系统。

3. 更加注重合作

合作,对于任何行业来说都很关键,但对于金融科技来说尤为重要,后者通过与传统银行直接竞争得到其PR地位。在最初的金融科技大爆发之后,显然反对者能做到的变得十分有限。对金融机构的批评和消费者对他们的需求提高是启动变革的关键步骤,但合作是通往前进的道路。

“合作是未来金融服务的关键”来自Luxembourg金融科技院的CEO Nasir Zubairi说道。

“作为Luxembourg的金融技术创新中心,我们将金融机构、政府、国家项目、企业合作伙伴、大学、技术学院、国内及国际初创企业、思想领袖、科技传道者、投资者等聚集在一起,并与之建立联系。这是一个全盘路径。”

想象一下,如果金融科技的领头人、银行、政策制定者和其他专家可以无障碍地合作,那么产品创新和可扩展性将有无限可能。我们挑战金融科技组织使其扩大视野,在实验室或当地生态系统之外开展工作。

“金融服务的瓦解实际上是通过敏捷的初创公司和成熟公司的成功合作来实现的。对于一家资源有限的初创公司而言,找到一家合适的合作伙伴是一项挑战,但幸运的是在Luxembourg有许多优秀的牵线人,像是LHoFT、LuxFutureLab、I’Atelier Fintech Boost. 今天,Tetrao的人工智能已经对用户的客户体验产生了影响,如果没有我们的合作伙伴,这些将是不可企及的”,最近法国巴黎银行国际黑客马拉松的获奖者Tetrao的CEO Christian Gillot说道。

4. 更具创造力

在金融领域,敏捷性或许是初创公司最大的优势。把它与创造力结合起来,你就得到了一份严肃创新并具备竞争优势的秘诀。当然,还有很多其他方面需要考虑,像是合适的资源和团队,但创造力对于构建一个优秀、可扩展和直观的产品的重要性不可低估。

11:FS的CEO兼金融科技内幕播客(FinTech Insider Podcast)的主持人David Brear说道:“初创公司不仅要在沟通上发挥教育作用,而且还要有娱乐性。”

“他们必须进入到成熟公司不能触及的地方,不断地突破预期。聪明的企业需要认识到现在B2B正在使用B2C渠道来触达他们的顾客。他们正在创造一大批忠实的读者、听众和观众,他们从自己的创作中获得了真正的价值。”

5. 以更加开放的心态对待变化

认识到改变的必要性和真正接受它是两件截然不同的事,而金融可以仍需要更多的后者。这一点尤其适用于长久以来一直抵制变革的传统银行。

“银行应该为未来一两年的客户创造新的体验,而不仅仅是重新粉刷当前的服务,”ETRONIKA的联合创始人Kęstutis Gardžiulis说道。

“只有在传统银行建立全新的敏捷反应团队—像是专注于新的科技机遇的特殊任务小组—才能帮助他们在现有组织中生存下去”。应该允许他们去大胆想象、去经历失败并保持对创新的渴望。准备着往前迈三步走在那些开辟者的更前面”。

这份计划也适用于那些将被迫遵守2018年即将出台的新立法的初创企业,包括GDPR和MiFID II。所有玩家都必须做好适应这些的准备,开辟自己的道路,并接受伴随这一新领域而来的挑战。

锐眼洞察 | 导致用户放弃移动购物的因素和解决方案(翻译)

本文包括以下两篇文章:

文章①:‘Emotional ambivalence’ leads to mobile shopping cart abandonment

作者:Sasha Fedorenko

文章②:37 Cart Abandonment Rate Statistics

作者:Baymard Institute

译者:TalkingData架构师 曾晓春

本译文禁止商用,转载请注明作者与来源!

 

“犹豫”导致移动购物的放弃行为

尽管在线移动应用程序的浏览量仍然在增长,但移动购物的放弃比例却很高,而这一切都是因为一种叫做“情绪模糊”的现象。

由于害怕错失一件好的商品但又出于对隐私的担心,人们经常会把东西放入购物车但不结算就离开。美国60%的在线购物者表示,他们放弃订单仅仅是因为价格太高。大约37%的人表示他们这样做是因为他们被要求“创建一个账户”。可以查阅Baymard的研究结果,我们调研了37个包含放弃率统计数据的研究,计算得出了在线购物的平均放弃率。

但这并不都是坏消息。犹豫情绪在消费者在付款阶段被放大,导致用户放弃了购物。然而,如果犹豫不决的顾客在购物中对选择过程感到满意,他们放弃的可能性就不大。

零售业务平台Amplience的首席营销官Dave Brewis评论说:“虽然零售商认识到移动能够为销售带来助力,但许多商家未能吸引消费者最终购买。缺乏产品信息以及担心在其他地方会有更好的商品,导致消费者比在PC端更有可能放弃购物车中的商品。”

之前一个关注结算有效性问题的研究表明,通过更好的结帐设计,一个普通的移动网站可以使转化率提高35%。这个对支付流程的研究在美国和欧洲的一些大型电子商务网站经过了测试,比如沃尔玛、亚马逊、Wayfair、Crate & Barrel、ASOS等。

Brewis认为:“零售商正在犯的一个重要错误就是简单的把内容从桌面端塞进移动端。一个解决方案是使用移动端友好的界面,向消费者展示他们所购买的产品的全貌,并让零售商充分获得全渠道体验带来的好处。商品图像可以成为零售商在线竞争力中的重要 部分”。

Brewis还说:“剑桥大学和联合利华最近的一项研究发现,广泛用于商品展示的传统包装照片缺乏互动基础,未能向移动客户传达基本的重要信息,而移动端友好的界面很好的解决了这个问题,从而将客户从桌面端吸引到移动端。一种互动性体验将使消费者更加忠诚,而且更有可能消费。“

37个购物放弃率的统计

在线购物的平均放弃率为69.23

对37个包含放弃购物统计数据研究进行计算后,得出了这个平均值。

放弃率统计:

  • | 78.00% | Listrak | 2016 | retrieved Jan 9, 2017|
  • | 75.50% | Adobe | 2016 | retrieved Jan 9, 2017|
  • | 68.80% | Barilliance | 2016 | retrieved Jan 9, 2017|
  • | 74.52% | SaleCycle | 2016 | retrieved Sep 21, 2016|
  • | 71.39% | Barilliance | 2015 | retrieved Jan 14, 2016|
  • | 68.95% | IBM | 2015 | retrieved Dec 7, 2015|
  • | 75.00% | Listrak | 2015 | retrieved May 8, 2015|
  • | 75.60% | SaleCycle | 2015 | retrieved May 8, 2015|
  • | 68.38% | IBM | 2014 | retrieved Dec 2, 2014|
  • | 72.00% | Listrak | 2014 | retrieved Sep 26, 2014|
  • | 69.20% | Vibetrace | 2013 | retrieved Mar 25, 2014|
  • | 62.30% | Fireclick | 2014 | retrieved Mar 12, 2014|
  • | 74.00% | Barilliance | 2013 | retrieved Mar 12, 2014|
  • | 67.41% | IBM / Coremetrics | 2013 | retrieved Dec 6, 2013|
  • | 78.00% | AbandonAid | 2013 | retrieved Dec 6, 2013|
  • | 60.32% | Triggered Messaging | 2013 | retrieved Jul 28, 2013|
  • | 75.00% | Listrak | 2013 | retrieved Jul 3, 2013|
  • | 67.00% | Comscore | 2012 | retrieved Jul 3, 2013|
  • | 74.23% | SaleCycle | 2013 | retrieved Apr 26, 2013|
  • | 80.30% | Rejoiner | 2012 | retrieved Feb 14, 2013|
  • | 61.85% | IBM / Coremetrics | 2012 | retrieved Dec 20, 2012|
  • | 74.76% | Fireclick / DigitalRiver | 2012 | retrieved Nov 2, 2012|
  • | 76.00% | Listrak | 2012 | retrieved Jul 17, 2012|
  • | 72.31% | Fireclick / DigitalRiver | 2011 | retrieved Feb 25, 2012|
  • | 62.31% | IBM / Coremetrics | 2011 | retrieved Feb 25, 2012|
  • | 72.00% | SeeWhy | 2011 | retrieved Feb 25, 2012|
  • | 71.00% | SeeWhy | 2010 | retrieved Feb 25, 2012|
  • | 55.00% | Forrester Research | 2010 | retrieved Feb 25, 2012|
  • | 63.68% | IBM / Coremetrics | 2010 | retrieved Feb 25, 2012|
  • | 69.38% | Fireclick / DigitalRiver | 2010 | retrieved Feb 25, 2012|
  • | 62.14% | MarketLive | 2009 | retrieved Feb 25, 2012|
  • | 71.00% | Forrester Research | 2009 | retrieved Feb 25, 2012|
  • | 63.19% | IBM / Coremetrics | 2009 | retrieved Feb 25, 2012|
  • | 68.00% | SeeWhy | 2009 | retrieved Feb 25, 2012|
  • | 62.01% | IBM / Coremetrics | 2008 | retrieved Feb 25, 2012|
  • | 61.36% | IBM / Coremetrics | 2007 | retrieved Feb 25, 2012|
  • | 59.80% | MarketingSherpa | 2006 | retrieved Feb 25, 2012|

平均值:放弃率69.23%

最后更新时间:2017年1月9日

用户为什么放弃

现在,对于电子商务行业来说,用户浏览电子商务网站的原因导致了大部分放弃购物的结果——很多用户只是逛逛、比价、收藏商品、探索礼品选择等等。这些在很大程度上不可避免的导致了对购物和结算的放弃。

事实上,我们最近对放弃原因进行的定量研究发现,在过去3个月内,58.6%的美国在线购物者放弃了购买,因为“我只是在浏览/不准备购买”。甚至在开始结算流程之前,大多数人都会放弃。但是,如果我们对“正在浏览”这个市场进行细分,而了解放弃的其他原因,我们得到了以下分布:

  • 额外费用太高(邮费、税费、服务费)60%
  • 网站要求我创建账户 37%
  • 结算流程太长/太复杂 28%
  • 不能提前看到/计算出整体订单价格 23%
  • 网站出现错误/崩溃 20%
  • 不信任将信用卡信息提交给网站 19%
  • 物流太慢 18%
  • 对退货政策不满意 11%
  • 付款方式不够多 8%
  • 信用卡拒付 4%

与“只是浏览”部分不同,上面列出的大部分问题可以被解决。事实上,其中的很多问题都可以通过调整设计来解决。我们对结算流程进行了最新的研究,让我们来看看134个例子中的一个:

  • 28%的美国在线购物者在上个季度放弃了订单,仅仅是因为“结算流程太长/太复杂”。
  • 我们的大规模结算可用性测试表明,理想的结算流程可以缩短到12-14个表单元素(如果只计算表单域,则为7-8个)。
  • 然而,我们的结算基准数据库显示,美国平均结算流程默认情况下向用户显示23.48个表单元素。(如果只计算表单域,则为14.88)

换句话说,由于“太长/太复杂的结帐过程”,四分之一的购物者在上一季度放弃了购物。但是对于大多数结算流程来说,默认结算流程可以减少20-60%的表单元素数量。这只是结算可用性问题记录的134个原因中的一个。

通过结算流程优化可以回收260亿美元

如果我们只关注结算可用性问题,Baymard Institute过去7年的大规模结算测试中已经证明,这个问题是可以解决的。通过更好的结算设计,大型电子商务网站平均可以将转化率提高35.26%。这个关于结算流程的研究在美国和欧洲的一些大的电子商务网站经过了测试,比如沃尔玛、亚马逊、Wayfair、Crate & Barrel、ASOS等。

美国和欧盟的电子商务销售总额为7380亿美元(资料来源:eMarketer,2015年),将订单转化率提高35.26%可以带来的价值是从损失的订单中挽回2,600亿美元,这只需要通过更好的结帐流程和设计就能实现。

如今,要达到这样的收益并不容易。但是,通过对世界500强公司的结算优化项目进行审查,我们发现大幅度提高收益仍然是可能的。并且,其潜力是巨大的:对50个领先电子商务网站的结账流程研究显示,这些网站平均有39个结账项目可以改善。

锐眼洞察 | AR如何将E-Commerce变成A-Commerce(翻译)

作者:Gaston Viau

原文:The End of the e-Commerce is Around the Corner

译者:TalkingData首席架构师 黄洋成(YC)

本译文禁止商用,转载请注明来源与译者!

毫无异议AR是技术领域的next big thing。我这么说不是因为我是“黑镜”剧集粉丝,而是因为每周都会有新的AR应用发布;那些看起来像未来派的梦幻的场景正一步步变成现实.

在过去的两年里,AR正逐渐从Pokeman GO里街角不起眼的技术小子,变成了技术巨头们都要来咬一口的激烈战场

在软件框架方面,今年早些时候Apple通过发布ARKit将这个领域大大推进了一步,而Google也随后很快跟进发布了ARCore;而在硬件领域,相关公司争先恐后的发布了最新的AR眼镜

AR在技术领域引发了很大的反响,而各行各业也在尝试不同发方法通过应用AR来促进他们的业务。然而在AR落地的各个行业里,电子商务可能是会对我们生产颠覆性影响的那个行业。

从E-Commerce到A-Commerce

尽管过去二十年来,网络购物已经以惊人的速度增长,但实体店依然如此重要。这主要是因为网上商店仍然不能让用户体验到真实接触到产品的感觉。这就是为什么经常看到客户在一个渠道开始购物,但最终通过另一个渠道完成购买。

消费者需要对自己的购买决策有信心,单纯的照片、尺寸描述或规格说明不能代替在客户真实环境中实时试用产品所产生的亲密感。AR将真实的感觉带入购物场景,使在线购物者熟悉将要购买的产品,而不仅仅是电子商务体验中的照片。

准确的全渠道零售方法是在所有媒介中创造无缝的客户体验;AR通过在线购物流程中的引入切实存在的感觉,帮助弥合这些体验的差距。这是关于AR的一个简单但仍令人难以置信的现实:通过融合两个世界(线上和线下),它彻底改变了电子商务行业。

接下来让我们欢迎即将取代电子商务(E-Commerce)术语:增强现实商务( Augmented-Commerce terminology)。通过AR,零售商现在可以提供更具交互性和更个性的体验,而这将永远改变我们购物的方式。

当然,实体店铺还不会消失;但可以肯定的是,我们正在即将看到那一天的到来。

下边是四个近期发布的A-Commerce的案例:

1. IKEA Place

随着最近发布的iOS 11和苹果的ARKit,宜家已经发布了AR应用程序,以帮助客户看到家具在自己家中的样子。

用户可以轻松地通过滑动来浏览其最流行的款式,或按产品类型(比如“婴儿与儿童”,或“椅子和书桌”)筛选。该应用程序可以免费从App Store下载

1_5JkX8yw3wAk_FFVZwyPkeA

2. 亚马逊

继宜家之后,亚马逊最近推出了一项新的AR功能,让用户在订购之前测试任何给定的产品在家中或工作区的外观。

这个称为AR View的功能可以通过点击亚马逊应用程序中的摄像头图标来激活,并可以从数以千计的产品中进行选择,支持的产品类别包括家庭装饰、厨房用具和家具等。

1_I2YRXNJWULV1SsxyNhabsw

3.丝芙兰

在其iOS应用程序的最新更新中,Sephora包含了一项功能,可以让用户体验虚拟化妆。该功能会扫描你的脸部,找出嘴唇和眼睛的位置,让你尝试不同的妆。

目前,用户只能体验不同的唇色、眼影和假睫毛。 该应用程序还提供了“虚拟教程”,展示如何化妆,并将效果叠加在用户的脸上.

1_I4Car1_kAvD_UGatHQOgAg

4. 雷朋

寻找完美的太阳镜可能是一个非常痛苦的事,毕竟你不是布拉德·皮特或安吉丽娜·朱莉。 雷朋的新应用程序可以让您尝试这个品牌的所有不同的太阳镜,让您不用离开家,也不必在镜子前站几个小时。

感谢先进的面部贴图技术,“虚拟尝试”应用程序能让您创建自己的虚拟模型,并可以从多个角度看带上眼镜的自己。该应用程序同时支持桌面和移动系统。

1_By75DzY-BZjQQewj5my5wQ

锐眼洞察 | 制定有效数据营销规划的五个关键步骤(翻译)

作者:Trey Causey

原文:Five Key Steps for Effective Data Planning

译者:TalkingData移动观象台研发总监 曾晓春

本译文禁止商用,转载请注明来源与译者!

从无人驾驶汽车到聊天应用到物联网设备,每一项技术都是由数据驱动的。不管你的职业或职位是什么,你每天都会遇到某种形式的数据。然而,数据可操作性和数据质量比数据量更重要。

虽然大多数营销人员知道数据驱动决策的重要性,但他们往往不知道从何处着手。根据Experian的报告,利用数据来了解顾客的态度和需求是营销人员的首要任务。同时,这也是他们面临的最大挑战。

毫无疑问,品牌的每个策略都应该以客户为中心、以数据为导向。通过谨慎的数据规划,营销人员可以将其丰富的数据转化为有意义的策略,以便执行更好的决策和建立持久的客户关系。

以下五个步骤可以帮助你制定恰当的数据计划:

1. 列出所有基于观点的决策

建立一个目前所做决策的列表,这些决策主要基于自身观点而不是依据数据。你可以按职位和部门为列表分类,以便后续更容易管理。在接下来的几周里,与团队一起讨论这个列表,不断地为它添加新的项目。

完成这项任务的最简单方法之一就是浏览每周的日常任务。把每次你要在不使用数据的情况下做出的决策添加到清单中。然后,请团队做同样的工作,并将所有决策输入汇总到一个列表中。

这里有些例子:

  1. 上次的展示广告活动是否能带来积极的投资回报?
  2. 我们应该在哪些领域雇佣更多的销售专业人员?
  3. 十月份的销售活动应该展示哪些产品?

2. 根据它们的重要性排名做出决定

不是所有的决策都同样重要。确定清单上每个决定所涉及的金额,这将帮助你发现它们对组织的价值,并相应地对它们进行优先级排序。此外,请记住在分析这些决策时要考虑所有相关成本(劳动力、技术、机会成本)。举个例子,我们看看上面的第一个决策,“上次的展示广告活动是否能带来积极的投资回报?”,我们会从以下几个方面考虑:

  1. 媒体费用(例如:40,000美元)
  2. 创意开发成本(例如:2,500美元)
  3. 员工时间成本(例如:1,500美元)
  4. 已完成交易的机会成本(例如:80,000美元)

在上述情况下,决策成本约为123,700美元。

不需要太确切的数字。使用粗略的估计来合理地了解决定的重要性。

3. 列出每个决策所需的所有数据源

找出三到五个对你的组织来说最有价值的决策,并列出解决这些问题所需的所有数据源。确定这些数据源是否可以从组织内部获取。

与团队进行头脑风暴至关重要,这样每个人都会围绕如何解决问题和如何回答问题提出自己的想法。

有时,现有的数据并不能直接供分析使用,需要构建新的流程来转换它们。有些数据源可能需要与其他团队甚至是其他公司协调获取。如果无法找到所需的数据源,还可以从相关的代理数据源中查找。

这一步将帮助你发现决策所需但不可访问的数据点。

4. 确定需要补充的数据缺口

下一步是定位为制定决策所需补充的数据缺口,并确定如果没有这些数据是否可以继续。评估你是否可以联系第三方数据供应商寻求解决方案,或进行有根据的猜测以继续分析。

例如,在分析我们的展示广告活动时,可能很容易在活动之前、期间和之后获得交易数据。但是,如果您的控制组缺少数据点,则会对分析结果的可信度产生负面影响。如果你事先知道这一点,最好先暂停分析,直到找到一种方法来获取这些数据,或者在开始下一次媒体宣传活动时使用更好的数据收集计划。

5. 创建2018年数据计划

一旦确定了需要数据驱动的关键决策以及需要补充的数据缺口,就必须创建一个高效执行的计划框架。

确保能够正确获得以下信息:

  1. 获取数据的数据源和关键联系人;
  2. 所需数据的日期范围;
  3. 确切的所需数据字段。最好是要求更多的信息以避免延迟和迭代;
  4. 数据缺口和补充缺口所需的信息(供应商、成本等);
  5. 从获取数据、数据分析到呈现分析结果的每一步的团队成员分工;
  6. 数据收集、分析和报告的详细时间表。

结束语

数据最强大的方面是能够最大限度地减少决策过程中的猜测。随着目前数据分析和报告平台的爆炸式增长,你不需要成为数据科学家也可以玩转数据。能够利用数据来规划和为策略排序的营销人员,能够直接提升工作表现,有效地管理资源并对公司营收产生积极的影响。