:::: MENU ::::

TalkingData's Blog

现在开始,用数据说话。

Posts Categorized / Data

cialis erfaring cialis i norge hva er kamagra cialis efeitos secundarios cialis bula viagra effekt viagra norge viagra på nett viagra nettbutikk viagra infarmed levitra comprimidos cialis uten resept cialis pris levitra eller cialis kamagra gel comprar viagra farmacia
  • May 24 / 2018
  • 0
Data

重磅!TalkingData-2018Q1移动游戏行业报告

一、行业状况

游戏时间碎片化,娱乐场景更多元

移动游戏作为线上休闲娱乐的一种方式,其随时随地能够适用较多人群的特性,受到大部分用户的青睐,无论是居家、乘车或者身处公司等场景,人们往往会利用闲暇的碎片化时间进行游戏,调查显示超过30%的玩家每天至少花费2小时打游戏。

2017年-移动游戏用户游戏场景分布   数据来源:TalkingData

2017年-移动游戏用户日均游戏时长分布  数据来源:TalkingData

研发运营精细化,洞悉玩家促发展

移动游戏行业参与者对游戏研发和运营拥有充分的经验积累,在研发上仍将工作重心放在核心玩法和互动体验上面,在洞察玩家时普遍以数据指标和玩家评论作为重要分析依据,用户优先和精细化发展策略帮助参与者紧跟市场步伐,洞悉玩家偏好。

2017年-移动游戏行业参与者游戏研发关注点  数据来源:TalkingData

2017年-移动游戏行业参与者洞察玩家方式  数据来源:TalkingData

端游IP骤升温,游戏厂商挖红利

随着移动游戏行业加快对端游IP的移植速度,大量端游IP开始通过改编或者重制等形式进入移动游戏市场,而持有较多端游IP资源的腾讯、网易等厂商则凭借技术、运营等积累,不断加码端游IP在移动游戏市场的投入并取得成效。

2015-2017年-主流畅销游戏IP类型分布情况  数据来源:TalkingData
2015-2017年-端游IP所属厂商分布情况
数据来源:TalkingData

新作冲榜愈艰难,卡牌游戏持降温

老游戏凭借稳定的玩家基础和良好的运营支撑,将生命周期进一步延长,截至2017年12月,主流老游戏的平均运营时间接近30个月,这也间接增加了新上线游戏冲击榜单的压力,尤其是竞争较激烈的角色扮演类市场,而卡牌游戏的热度则继续退减。

2015-2017年-主流老游戏运营周期概况  数据来源:TalkingData

2015-2017年-主流畅销新游戏市场分布情况  数据来源:TalkingData

精品游戏大厂造,头部游戏聚玩家

游戏精品化带来的直接影响是用户向头部作品集聚,马太效应下,优质游戏的用户基础会更稳固,游戏的各项运营指标也会优异;与此类似,一线厂商凭借广泛的市场布局和高额的研发投入,能够让旗下游戏满足并沉淀多元兴趣偏好的用户。

2016-2017年-头部(TOP10)游戏用户覆盖率分布情况  数据来源:TalkingData

2016-2017年-腾讯&网易游戏用户覆盖率分布情况  数据来源:TalkingData

二、人群洞察

热血汉子用户

注1:热血汉子用户人群,是指相对偏好动作射击、体育竞技等移动游戏的男性用户群体。下同。

手游忠实老玩家,娱乐时光宅家中

移动游戏伴随移动互联网应运而生,给予用户在移动碎片化生活中放松身心的娱乐空间,热血男儿中3/4的游戏网龄至少达到3年,87%曾为游戏付费,接近一半的日均游戏至少1个小时,而且4成以上的愿意在家中、交通工具或公司等场景下玩游戏。

热血汉子用户-移动游戏网龄及付费概况  数据来源:TalkingData

热血汉子用户-移动游戏时长及场景概况  数据来源:TalkingData

亲朋好友常开黑,游戏达人志趣同

热血男儿的亲朋好友同样是游戏达人,能够通吃“农药”和“吃鸡”,大约7成的人都会玩“农药”和“吃鸡”,享受这两款游戏所带来的欢愉;大约96%的热血男儿最近一个月会玩至少1款游戏,而近期经常玩的游戏则包括《王者荣耀》、《绝地求生》等。

热血汉子用户-亲朋好友玩“农药”或者“吃鸡”游戏概况  数据来源:TalkingData

热血汉子用户-最近所玩游戏概况  数据来源:TalkingData

注2:“吃鸡”玩家:指统计周期内安装过《荒野行动》、《穿越火线:枪战王者》、《小米枪战》、《终结者2:审判日》等具有“逃杀”玩法的游戏的用户人群。

注3:“农药”玩家:指统计周期内安装过《王者荣耀》游戏的用户人群。

堪当游戏多面手,高额付费剁手忙

在安装偏好方面,热血汉子安装游戏的款数整体较高,仅安装1-2款的TGI指数不足90,安装3款以上的TGI指数则均超过120,说明热血汉子游戏偏好比较广泛;在付费偏好方面,热血汉子在100元以上的TGI指数则均超过130,说明付费意愿比较强烈。

热血汉子用户-移动游戏安装偏好分布  数据来源:TalkingData

热血汉子用户-移动游戏付费偏好分布  数据来源:TalkingData

游戏佳人用户

注4:游戏佳人人群,是指相对偏好恋爱养成、模拟经营等主要面向女性玩家的移动游戏用户群体。下同。

东北女人更爱玩,奇迹暖暖受追捧

1/3的游戏佳人分布在华东地区,说明华东地区不仅盛产美女,也是女性玩家集聚地,相比移动互联网人群,游戏佳人在东北地区的TGI指数超过120,说明东北女人也比较偏好移动游戏;游戏佳人不仅青睐奇迹暖暖的甜美,也喜欢王者荣耀的英姿。

游戏佳人用户-区域分布  数据来源:TalkingData

游戏佳人用户-移动游戏TOP20   数据来源:TalkingData

花费金钱求美好,真实世界亦重要

57%的游戏佳人曾为移动游戏买单,她们愿意将金钱花费在更厉害、更好看、以及皮肤/英雄等,比较重视游戏内的实力和装扮;43%的游戏佳人还未向移动游戏付费,有一半人以为免费的就挺好,40%的人则认为不如花在真实生活中。

游戏佳人用户-有付费行为概况  数据来源:TalkingData

游戏佳人爱包包,购物天性买买买

游戏佳人整体比较偏好餐饮、医疗、零售卖场等消费,注重吃穿以及健康,相比移动互联网人群,游戏佳人在箱包的TGI指数超过200,说明她们对箱包情有独钟;在生活消费的移动应用上,她们偏好手机淘宝、支付宝、美团、拼多多和京东等App。

游戏佳人用户-消费偏好概况  数据来源:TalkingData

游戏佳人用户-生活消费相关应用TOP20  数据来源:TalkingData

寓教于乐用户  

注5:寓教于乐人群,是指通过移动游戏等益智启蒙应用,帮助家中孩童快乐成长的用户群体。

游戏娱乐常相伴,动漫Q版惹人爱

寓教于乐人群享有充分的游戏和娱乐机会,他们通过游戏的方式促进孩童智力的发展,儿童益智游戏的TGI指数达到289,说明游戏发挥着教育作用;在游戏风格上,寓教于乐人群相对偏好中国动漫、像素风格和Q版画风,可爱风格更能俘获童心。

寓教于乐用户-游戏类型偏好  数据来源:TalkingData

寓教于乐用户-游戏风格偏好  数据来源:TalkingData

热门新游戏

“呱儿”已失宠,旅行是真爱

2018年初,《旅行青蛙》风靡中国,被玩家视为“儿子”的小青蛙开始引爆朋友圈,从其百度指数和覆盖率变化趋势看,玩家养蛙的热度并没有长久维持下去,相比让“呱儿子”外出旅行,人们更在意本身的旅行,超过1/3的用户都会安装旅行应用。

《旅行青蛙》-用户趋势  数据来源:TalkingData

《旅行青蛙》-用户旅行偏好  数据来源:TalkingData

恋爱超次元,生活有格调

作为一款面向女性用户的恋爱经营游戏,《恋与制作人》在上线之后俘获了许多女性玩家的芳心,游戏热度尽管相比上线初期有所减少但仍维持相对稳定的表现,用户在游戏之余还较为偏好阅读、健康美容、教育、图片摄影和娱乐票务等应用。

《恋与制作人》-用户趋势  数据来源:TalkingData

《恋与制作人》-用户媒介偏好  数据来源:TalkingData

浴血杀场展雄风,竞技游戏燃基情

“吃鸡”游戏掀起的战斗热潮开始推向全球,正版IP光环的《绝地求生:刺激战场》持续吸引玩家,大约75%的男性玩家在“吃鸡”这场战斗中大展雄风,角色扮演、动作竞技、策略、冒险解谜、射击等富有激情的游戏同样吸引他们浴血其中。

《绝地求生:刺激战场》-用户趋势  数据来源:TalkingData

《绝地求生:刺激战场》-用户性别结构和游戏偏好  数据来源:TalkingData

三、行业趋势

贴近年轻人文化潮流,营销方式需创新

在移动互联网主导的新媒体时代下,年轻人的活力和思维得到极大释放,他们倾向通过感性和自由的方式表达个性自我,追求自由自在、刺激/乐趣、新潮/酷、定制化、激情等精神诉求,“打王者”、“吃鸡”、“刷短视频”、“斗图”等成为一种流行文化。目前来看,年轻人群自我表达的需求还没有完全被满足,移动游戏作为现代休闲娱乐方式之一,能够利用设备、技术、内容等的创新,迎合年轻人碎片化的互动娱乐需求,移动游戏产品如果想要更广泛触动年轻人群,需要改善在创新创意方面的策略。

年轻人群观念倾向  数据来源:TalkingData

触动玩家游戏情怀,经典归根游戏本源

几乎在每一位玩家心目中,一段关于游戏的记忆都会令人难以忘怀,那些陪伴成长或青春的游戏往往演变成为经典,例如“马里奥”、“奇迹”、“魔兽”、“梦幻”、“QQ飞车”等对玩家情怀的投射并没有停歇过。从PC时代到移动时代,移动互联网赋予经典更多互动性和创新空间,许多玩家不仅没有消失对于经典作品的认同感,而且欣然接受游戏厂商所重新打造的移动游戏作品,因此,回归游戏本源的初心将能够让“情怀”不仅仅是情怀。

玩家“入坑”的主要因素  数据来源:TalkingData

《QQ飞车》-用户覆盖变化趋势  数据来源:TalkingData

小程序游戏新机遇,产品轻量不轻松

微信等社交平台的小游戏,将在2018年成为一个新风口,依托天然导量的超级入口,充满想象空间的小游戏市场吸引很多开发者跃跃欲试。小游戏由于门槛低、玩法轻度,适应人们碎片化的移动互联网生活,而且能够利用社交平台的人际关系网络增进互动性。所以,小游戏市场存在着大机会。但是,目前小游戏的发展也面临着变现等问题,尽管某些小游戏已经在商业化上迈出第一步,但是如何取得玩法与盈利的平衡,以及处理与平台的利益分配关系,将使得小游戏战场变得风云诡谲。

微信平台小游戏数量趋势  数据来源:TalkingData

微信平台小游戏(示例)

瞄准出海新商机,按需服务成常态

越来越多中国移动游戏开发者参与到拓展全球市场的行列,推出动作、角色扮演、策略等类型符合海外用户需求的产品,未来中国移动游戏将更加普遍借助Apple App Store和Google Play Store等生态系统,将产品和服务推向南美、欧洲、非洲、中东、北美和大洋洲等更多市场。

中国移动游戏出海类型分布  数据来源:TalkingData

中国移动游戏出海用户分布
  • May 22 / 2018
  • 0
Data

万字长文,细数零售业中的那些数据挖掘问题(下)

引言

本文是 TalkingData 首席数据科学家张夏天翻译自 Highly Scalable Blog 的一篇文章,介绍了零售业中的数据挖掘问题。

本文内容包括零售业中的多个常见问题,如响应建模、推荐系统、需求预测、价格差异、促销活动规划、类目管理、财务影响等。

其中涉及的资源分配优化问题、个性化推荐、定向广告等业务问题,上下两篇完整阅读大约需要两个半小时。

本次发布下篇,上篇请查看——

《万字长文,细数零售业中的那些数据挖掘问题(上)》

问题 4: 价格差异

问题定义

零售商向客户提供一组产品时,针对每个用户都制定不同的价格来最大化整体的收入。另外,该问题可以重新定义为提供定向折扣从而在基线价格上改变价格。

应用

价格差异被广泛的应用在零售业并且存在非常多种显性和隐性的形式:

优惠券,店铺级价格分区,和折扣都是价格差异的例子。

价格区分与通过数量折扣来提升销售是相关的。

动态定价能用价格差异的原则和模型来增量的调整价格。

尽管我们在问题的定义中暗示了是细粒度的个体定价方式,但是这是非常极端的情况更多常见的方法是对大的客户分群设置不同的价格。

解决方案

价格区分是最基础的经济和营销问题 [SM11],因此

此处 G 是利润,Q 是销售数量,P 是单位价格,V 是可变的单位成本(大致相当于零售商拿到的批发价格),而是固定成本如管理成本。公式(4.1)中的价格和销量是互相依赖的,因为随着价格的提高需求会下降,反之亦然。价格和销量的关系通常可以用一个线性函数来逼近,这一函数具有一个一般被称为需求弹性的系数:

换言之, 需求弹性是需求量的百分比变化与价格的百分比变化的比率。公式(4.1)和(4.2)可以可视化如下:

需求曲线是一条由需求弹性和零售商利润定义的斜线,数值上等价于(Po-V) · Q0,此处 P0 是由零售商设定的单位产品价格。一方面,当价格接近可变成本时利润趋近于 0,虽然销售量很高。

另一方面,高价格将导致销售量下降,结果利润也会变得很小。这基本上意味着价格服从于一个数值优化问题,并且零售商可以用统计技术来估计需求弹性并找到使得公式(4.1)最大化的最优价格。

这一方法,即所谓计量价格优化的实用性是比较有限的 [SM11] 因为又公式(4.1)表达的模型过于简化了市场行为并丢弃了在竞争市场中一些重要的影响价格-数量关系的因素。例如,价格大幅度下降可能会引发竞争对手降低整个行业价格的对称反应,所以所有的市场参与者最终都会处于一个销售量和利润都较低的状况。

尽管计量价格优化有很多局限性,但公式(4.1-4.2)揭示了价格差异的本质。对于任意一个价格, 无论它有多优化,这一价格都是一种折衷。因为一些客户会因为这一价格太贵而放弃购买,尽管他们可能愿意以更低的在 P0 和 V 之间的价格(依然对两种利润是正向贡献)购买该产品。

此外,一些客户可以容忍高于 P0 的价格,尽管他们产生的销售量会相对较小。在这两种情况下,零售商无法获取位于需求曲线和可变成本线围成的三角区域之中的额外利润。

价格差异是一种自然的方法来克服单一常规价格的限制,通过根据客户的付款意愿将客户分群并向不同的客户群体提供不同的价格。考虑一个这种策略的特殊情况,在前一图表的常规价格外补充了一个较高的溢价(注意与单一价格策略相比利润区域如何增加):

这一考虑带来了零售商如何把相同的产品以不同的价格卖给不同的客户这一挑战性问题。一般而言,这需要在具有不同付费意愿的客户之间设置区隔以使得高付费意愿的客户不能以为低付费意愿客群设定的价格来付费。零售商可以使用如下几种区隔机制:

  • 店铺区域:连锁零售商店一般都位于不同的社区内,这些社区具有不同的平均家庭收入、平均家庭规模、最近竞争商店距离等人口属性和竞争性因素。这就自然对客户的价格敏感性以及寻找替代供应商的能力或者意愿做了区分。这使得零售商可以在店铺的级别上在不同区域设置不同的价格。

  • 包装大小:诸如软饮料或化妆品之类的快速消费品(FMCG)具有较高的周转率,消费者自然可以选择是频繁购买少量产品或者储存大量的产品。这种权衡也受到诸如家庭规模等人口因素的影响。这一机制通过购买大型或小型包装的意愿来创建区隔,并为不同包装尺寸设置不同的单位边际价格。买一送一(BOGO)优惠也与此机制有关。

  • 促销活动:客户可以根据他们是否愿意等待较低价格还是以正常价格立即购买来区分。此种客户分群方式被广泛应用于服饰领域,在该领域季节性促销是主要的营销机制之一。

  • 优惠券:许多客户不会愿意以常规价格来购买某一产品,但是当有折扣价时却会考虑购买。因此零售商可以从折扣中获得额外的客户,尽管他们贡献的毛利率相较于那些以正常价格购买的产品的客户较低。另一方面,向太过广泛的受众提供折扣可能是有害的,因为那些愿意以正常价格购买的客户也会使用折扣(当没有折扣的时候)。前面章节中讨论过的响应建模技术有助于解决这一问题。然而有一种 19 世纪就存在的传统解决方案——优惠券。优惠券代表需要付出一定努力才能赚取或兑换的价格折扣(例如,客户必须在报纸上找到它,剪下来并在商店出示),这就通过花费时间和精力获得折扣的意愿区分了客户。

  • 销售渠道:不同的销售渠道自然代表不同的区隔,因为客户对购买渠道的选择与他们的支付意愿密切相关。例如,与在杂货店购买相同葡萄酒的顾客相比,酒类商店顾客的价格敏感性一直较低 [CU13]。

尽管这些技术已经应用很久了,但是要建立一个完整的折扣优化模型是非常挑战的。并且,据我们所知,所有现有的模型都有这样或者那样的局限性。在本节剩下的部分我们考虑两个价格差异模型,这两个模型是根据美国超市(特别是 Safeway 在芝加哥子公司的数据)的数据设计并在这些数据上做过验证的。

基于数量和地点的差异

文献 [KJ05] 提出了这一模型,该模型的目标是联合优化基于包装大小的数量折扣和店铺级别的区域价格。这一模型与我们在需求预测章节中讨论的模型非常相似,只是该模型引入了更多的包装大小和折扣参数。

让我们考虑这样一种情况,一个零售商运营多个店铺,销售的某种产品也有几种品牌,产品的规格也有几种,例如可口可乐和百事可乐分别有 2 听装、4 听装和 6 听装。目标是优化每种包装的单位产品价格,这里假设单位产品价格是可以根据产品规格和店铺来调整。我们从标准的多元逻辑特模型(multinomial logit – MNL)开始,这一模型在前一节需求预测中讨论过。

它表示顾客在时间 t 在商店 s 购买产品 j 的概率,J 是产品的数量(所有品牌的所有规格加上)。时间以相对较长的时间间隔(如周)进行测量。参数变量 x 可以使用以下回归模型进行估计:

此处 zj 是产品规格,Pjts 是价格,djts 是折扣力度(单位美元),ruts 整合了诸如最近竞争商店等竞争性因素,而 fjts 则整合了环境变化因素如天气。因此, 回归参数 αk 基本上对应着客户对品牌、规格的偏好、对价格的敏感性、对折扣的响应度、对竞争者的偏好、对变化因素的敏感性,以及折扣对价格敏感性的影响等等。

文献 [KJ05] 认为促销案例中的价格敏感性回归模型应该比以上仅用一个回归量来表达价格敏感性更复杂,因为客户会有囤积产品的情况,这就使得过去的促销会提高其对当前产品价格的敏感性。这一方面可以通过将相应的回归器分解为两个部分来建模,如下所示:

以上公式中 α3 是平均敏感度而第二项则表示记忆效应。其中 W 是表示历史深度,即过去的周数,p0 表示常规价格,而 p 是实际的折后价格。类似的,也有观点认为对促销的敏感性也与最近的促销有关:

此处 wj 是最近的促销活动过去的周数。促销敏感性对 wj 依赖基于以下假设,两次促销之间的周期越长,则对促销的响应度越高。

公式(4.3)允许我们预测销售量,所以价格优化问题能够根据公式(4.1)分时间周期来定义:

以上公式中 cjt 表示批发价格,而 Qjt 表示预测的销售量。此处的优化约束条件是为了避免由市场竞争或者客户行为等主要因素的变化引起的剧烈的价格变化和偏移。

文献 [KJ05] 提出了这一特殊的约束条件,这一约束要求优化后的产品份额加权平均价格(表示产品的市场份额)不会超过优化前的份额加权平局价格(表示原始价格)。这一优化问题(4.4)可以在店铺水平上得到求解,这意味着在规格和地点上都可以做差异化,或者仅在连锁店级别上来差异化数量折扣。

个性化折扣和优惠券

尽管上面的模型在店铺层面做价格差异也隐含了客户层次上的价格差异,但是这一模型不是为单个客户的折扣优化来设计的。接下来我们考虑文献 [JT13] 提出的另一种模型,这一模型是为了专门优化个性化折扣和优惠券的。这一模型的主要优势是它不仅是优化折扣的粒度,同时也尝试为指定用户提供折扣的最优时间和折扣的最优有效期。这些时间属性上的优化思想来自于以下假设:一个客户购买的概率不是随时间恒定的,而是会随着时间变化的,因此对每一个用户而言都存在最优的折扣时间窗口。

这一模型的主要缺陷是其只能对特定品牌如厂商促销来进行优化,而不能用于品类管理。你为了对折扣的时间属性建模,假设对产品的折扣力度为 d,我们将客户 u 在时间 t 购买产品的概率分解为购买产品的概率和客户在在时刻 t 购买的概率乘积:

对给定产品的购买概率密度函数能够用公式(4.3)中用过的 MNL 的模型来估计。在时刻时购买的概率密度函数在文献 [JT13] 中由厄兰分布来建模:

此处参数变量 yu 可以用回归模型来估计,该回归模型与公式(4.3)中用来估计参数变量的类似,会用一个回归量来描述折扣力度,因此之后可以对其进行优化。

上面定义的购买概率使得我们能够对给定客户的销售量 Qu 作为折扣力度(以美元为单位)、折扣起始时间、和折扣周期的函数来建模:

以上推导可以使得我们导出如下毛利率优化问题:

这里 m 是在正常价格下的毛利率。以上公式中的第一项对应着收入,收入由三个方面组成(促销前的收入、促销期间的收入和促销后的收入);第二项对应着营销活动的成本。下图描述了这一优化问题:

顶部的第一个图显示了客户 u 购买的概率密度函数曲线,此图中对于给定产品在正常价格时的销量对应着 S0 区域。一个固定的永久折扣增加的销量对应的区域为 S1,因此总收入和促销成本(如中间的图所示)是与 S0 和 S1 成正比的。

时间优化的促折销使得收入与 S0+S2 成正比, 其成本与 S02+S2(如底部的图所示)。固定折扣促销和时间优化的促销之间的这种差异表明在概率密度函数具有某些数量性质时存在利用时间优化来改善毛利率的潜力。

问题 5:促销活动规划

问题定义

零售商向客户提供一组产品时,针对每个用户都制定不同的价格来最大化整体的收入。另外,该问题可以重新定义为提供定向折扣从而在基线价格上改变价格。

零售商准备一次促销活动,即对某个或者一组特定商品进行有时限的折扣。对促销活动的规划需要估计到下列有关的值:

  1. 哪些产品的库存需要避免在活动结束前缺货?

  2. 什么样的价格会最大化收入?价格可以考虑是一个恒定值或者是一个从活动开始到结束不同时间段的函数。

我们将考虑库存水平是预先确定的,零售商试图计算最优价格这种情况。这是时尚零售商在处理季节性清仓和款式翻新 [JH14, CA12] 中遇到的典型问题。这一问题可以以不同的方式来定义,如将需求预测和价格优化作为独立的问题来处理,也可以同时优化库存水平和价格,总之其目的是最大化收入。

应用

促销活动的规划在零售中有如下的应用:

  • 清仓和季节性促销是时尚零售业中的主要应用。

  • 某些商业模式如快闪零售(也被称为弹出零售)只有促销活动一种销售方式。

  • 快消品和易腐品的零售商可以使用促销活动策划来调整销售节奏与产品保质期同步 。

解决方案

动态需求预测和价格优化是经济学中所研究的基础问题,被称为收入管理。收入管理的理论在书籍如 [TA05] 中有很好的阐释和系统化的介绍。在服务业中的预定服务,如机票、体育场座位、酒店房间、租车等等场景中可以找到收入管理自动化的最先进和最有效率的例子。要理解这些技术可以如何在零售领域中使用,我们来考察由 RueLaLa(一个时尚零售商)提出来的方法论。

我们假设一个零售商计划对 N 个产品或者产品组(产品组中的产品价格相同,如不同口味的酸奶,或者不同花色的 T 恤)进行打折。设 P 为价格集合,该集合包含每个产品可以设定的价格。在实践中,P 通常是根据业务规则组成的比较小集合。例如,价格下限可以根据零售商的盈利水平定义为 29.90, 价格调整幅度根据心理价格可以设定为 5 美元,则 P=$29.9,$34.9,$39.9,$44.9,$49.9。

假设促销活动中的所有产品或者产品组都有某些共同点,例如同属于相同的类目“女鞋”或者“平安夜食品”,因此对一个产品的需求潜在的依赖于其他可替代产品的价格。

通过引入变量 S,其等于所有参与促销活动的竞争产品(产品组)的价格之和,而对某一产品估计的期望需求则为数学期望 E{Q | i,pj,S},此处 Q 是表示需求量的随机变量,i=1,2,……,N 是产品的索引,而 j =1,2,……,|P| 是单个产品或产品组的价格。既然 Q 与产品价格 S 和都相关,这就隐含地包含了产品价格与可替代产品的评价价格的比值对需求和其弹性都是有影响的。

现在我们可以在假设 S 为固定的并对所有可能的 S 求解这一优化问题 [JH14]:

当产品 i 的价格为 pj 时,二值变量 δi,j∈0,1 为 1,否则为 0。上述优化问题中的目标函数可以自然地表达为促销活动的收入。第一项约束保证每个产品的价格都在 P 之中(原文可能有问题),而第二项约束保证所有产品的价格之和为 S。其他关于库存水平的约束也可以加入到优化问题中来。

以上的优化问题需对需求 E{Q | i,pj,S} 做估计,这可以用前面章节中做需求预测和价格分群的技术来解决。然而,需要非常注意到缺货(而且是可取的)是促销活动中非常典型的情况,因此对很多产品的需求预测建模所要用到的历史数据都是被截断的。

正如 [JH14] 中所建议的那样,可以通过使用在此前促销期间没有缺货的产品的数据为不同产品类别构建画像来解决此问题,并使用这些画像来调整相应类别的需求曲线。

问题 6: 类目管理

问题定义

零售商根据类目销售产品。一个类目表示一组相对内聚的产品,这些产品有很多共同点(如”甜点”、“女式牛仔”等),所以客户有可能在他们的首选产品因某些原因缺货时愿意用另一产品来替代。

产品缺货的主要原因有永久性的品种减少(如因为有限的货架空间)和暂时的性的售罄。类目管理的目标是利用替代效用用优化方法计算出一个产品子集,这一子集在满足物理约束如可用的货架空间的情况下可以最大化毛利率。

应用

品类管理是一项相对专业化的工作,但是当目标是优化一个产品类目的整体收益而不是一个单一产品的收益时,它也会涉及到在促销优化问题中存在的替代效应问题。零售商一般情况下对类目的整体收益的关心程度远胜于对单个产品的优化,因此在本节中讨论的方法可以被用在很多不同的应用中以实现最优解决方案。本节研究的模型可以直接应用于以下类目管理方式:

  • 仓库的产品库存水平优化。一个特别重要的应用是对易腐产品的库存管理,这需要考虑到保质期和过去产品造成的潜在损失。

  • 优化货架的布局来调整相关产品的份额。

  • 类目规划(在类目中加入或者移除哪些产品)

解决方案

从计量经济学的角度来看,类目管理问题是由收益递减规律引起的。或者更具体地说,收入和成本与类目的规模关系是不同的,总的趋势是消费者购买能力在某个时候达到饱和,同时由于店铺面积和其他运营成本的增加,成本持续增长:

这一趋势引出了类目优化问题。这是一个非常具有挑战性的问题,因为它需要对整个类目中所有产品之间的相互依赖关系建模。然而,尽管面临这些挑战,在 [KOK07] 中已经提出了一种切实可行的类目优化模型,并在荷兰的连锁超市 Albert Heijn 中应用。在研究这一方法之前,我们先引入下列符号:

  • N={1,2,……,J} – 零售商给用户提供的一个类目下面的最大产品集合,即所有品类。

  • fi∈{0,1,2,……} – 产品 j 的库存水平。零售商通过选择 f 为 0(产品不出现在品类中)或者非 0 来优化品类。

  • F0 – 统一库存单位度量下的库存总容量。这里有个假设是所有产品的库存水平之和不能超过 F0。库存总容量可以由仓库或者店铺的可用货架空间所约束。

  • Nh ⊂ N – 店铺 h 的品类,是总品类的子集。

  • dj 表示产品 j 的原始需求率(当所有 N 品类都展示给客户时有多少顾客会选择该产品)

  • Dj – 观察到的产品的需求率(每天因为原始意愿或者替代效应而实际选择产品 j 的数量)。对给定产品观察到的需求与原始需求和其他产品的可获得性(替代效应)有关系,其可以被视为函数:

Dj({f1,……,fJ},{d1,……,dJ})

使用上述符号,品类优化问题可以形式化如下:

其中毛利率 Gj 是给定产品和其对应的观测需求的函数。这一函数很大程度上与零售商的商业模式有关,所以我们下面介绍一些通用的函数模板,基于这些模板可以根据实际的使用情况来定制毛利率函数:

公式(6.2)将观测需求乘以毛利率 m,这是对毛利润最简单的建模方式。该公式隐含假设了补货及时而没有缺货的情况。杂货这样的快消品正是属于这种情况,但是在其他领域如服饰则必须如公式(6.3)那样考虑缺货的情况。销售易腐货物的零售商还要考虑货损,公式(6.4)通过引入单位损失变量 L 来对此进行建模。

为讨论方便,后面我们假设所有产品的补货都是及时的,所以缺货是不可能或者是可忽略的。因此我们可以将 j∈{0,1} 作为二值变量来表示产品是否在类目中。更复杂的处理缺货的模型可以在 [KOK07] 中找到。

要解决(6.1)中的优化问题,我们需要定义观测需求函数。在无缺货假设下,需求函数可按照下面公式来建模:

其中 αk-j 是产品 k 被产品 j 替换的概率。上述公式是比较自明的:第一项是原始需求,而第二项是所有被从类目中移除的产品的累计替代需求。

公式(6.5)需要估计替代概率 αk-j 和原始需求率 dj。为了做这些估计,我们假设下列变量是已知的(我们已经在本文的前面章节讨论过需求预测):

  • Qjh,j∈Nh – 每个客户在店铺对产品的需求。假设 Kh 是一天内进过店铺 h 的客户数量, 则 Dj = Kh * Qjh。

  • Q0jh,j∈Nh – 每个客户在店铺 h 具有全品类产品时的需求(假设商店的品类是全的)。因为品类齐全所以不存在替代效应,因此 Q0jh 就是原始需求。

估计替代率 αk-j 是比较困难的事情因为产品集合 J 中有多达不同 J2的替代率。不过,[KOK07] 找到了下述客户行为的简化模型,在实践中这一模型有足够的精度并仅需要用一个而不是 J2 个变量:如果产品 k 买不到,客户会选择其第二选择产品来替代的概率为 δ,这一概率对一个类目下的所有产品都是一样的,则客户不买任何东西的概率为(1- δ)。这一模型引出了如下替代率的简单公式:

为了估计 δ, 我们将给定店铺的总需求定义为Qjh(可由历史数据来估计)之和,

另一方面,该值也可以根据公式(6.5)估计如下:

现在 δ 可以通过最小化总需求的实际值和预测值之间的差异来估计:

求解优化问题(6.1)的下一步是计算公式(6.5)中使用的原始需求率。我们首先注意到店铺 h 对 N 中所有产品的总需求可以按如下方式计算:

其中 Vh 是每天到访店铺 h 的客户总数。在公式(6.10)中,所有 Q0jh 之和乘以 Vh 表示在给定全品类时的的总需求。然而的值时针对拥有全品类的店铺估计得的,其值时与给定店铺相关(如地点,店铺面积等等)而没有被建模的。这可以通过公式(6.7)估计的类目需求和从公式(6.8)预测的需求比值来补偿调整。

在一个品类有限的店铺,总需求是以下两个部分的和:对给定店铺品类中存在的商品的需求和对中其他产品的需求。两部分的比率可以由表示如下:

自然的,Th * rh 表示对品类中存在的产品的需求分额,而(1- Th * rh)则表示对不在品类中的产品的需求份额。最后,我们对单一产品的需求可以当作是总需求的一部份来计算:

所有公式(6.12)和(6.9)中的系数都可以根据数据来估计,因此我们可以把所有公式展开到原始优化问题(6.1)中,则这个问题可以使用 [KOK07] 提出的数值方法来求解。

公式(6.1)将为每个产品都产生一个假定的最有库存水平 fj。这些库存水平值可以用来调整库存和优化货架布局。值得注意的是该模型使得零售商可以做假设分析来评估对品类和库存水平的改变会如何影响毛利率。

例如,零售商可以画出毛利率根据给定产品或者产品组的库存水平变化的函数曲线。这些曲线对易腐产品尤其具有描述性,因为毛利率是凸函数,当库存水平为 0 时函数值为 0,而当库存水平过高时毛利率因为产品过期造成的损失也会为 0,毛利率的最优值是在两种极端情况之间。

问题 7:财务影响

如果缺乏上述被讨论的优化方法的财务表现方面的数据,我们对这些方法和对应的数据问题的概述将是不完整的。尽管这些数据是不难获取的,但对此我们仍然需要谨慎对待,因为财务表现与零售商的商业模型机密相关,并且事实上我们无法隔离其他环境因素如市场增长或者竞争对手的行动对优化问题的影响。

除此之外,这些数字可能因很多因素而有很大的差异,所以本文中我们的目标只是提供一些基准,使得读者可以对优化的潜在幅度有所了解。以下列表收集了一些关于这些优化方法对财务影响的实例:

响应模型广泛用于整个营销过程,从零售到推广活动 [EP13]。经常有报道称,与随机投放相比,响应模型可以将推广活动的收益率提高 20-30%,而提升模型可以带来 15% 左右的实质性提升或在其他方法都不起作用的困难的情况下实现盈利 [PS08]。

在 RueLaLa 的实践中对 [JH14] 中提出的营销活动优化进行了全面评估,得出的一般结论是,综合优化模型比之前使用的启发式算法能提高约 10% 的收入。 [CA12] 中提出的并经 Zara 验证过的事件优化模型声称可提供 5.8% 的收入增长。

类目管理框架已在 Albert Heijn 进行了验证,以优化 37 个商店中 25 个子类别的分类。发现在这 25×37 = 1295 个情况中,使用传统方法有 701 个不理想,在使用了新的类目管理方法进行优化后可以提高约 6.2% 的毛利率。

最后,值得注意的是,大多数这里讨论的优化方法不会显著的影响零售商的成本,因此收入的提升大概率的直接带来净利润的提升。

结论

在前面的章节中我们概述了一些零售相关的计量经济学问题,给出了其应用和用例,并且阐述了可以应用到这些问题上的数据分析方法和优化模型。在最后的一节中,我们将把上述这些模型联系起来以提供一个全景式的总结。

由点到面

本文的主要目的是描绘完全依赖于数据挖掘和数值优化的决策自动化框架。因此,将这个框架可视化为一个消费数据并产生可执行动作和决策的管道是合理的。

首先,我们可以将数据探索和知识发现流程放入一个单独的层级中,该层级主要使用无监督学习算法,并且主要依靠人为因素来评估数据挖掘结果,例如客户群或者是购买产品的频繁项集。

虽然这些过程在实践中非常重要,但它们很难集成到自动优化过程中来,因为模式的发掘通常依赖于手工流程而且通常相比于增量式优化它对战略决策更有用。不过这一层的输出可以配置到下游的过程中,例如,新发现的客户群可用于定义新的倾向模型或引入并优化专属折扣。

接下来的两层分别与建模和优化有关。广义而言,建模层的基本目标是提供一个全面的消费者模型,定量描述他或她的价格敏感性,对活动和折扣的响应倾向,用一种产品替代另一种产品的意愿,对推荐的接受度,等等。

但是在实践中建立这样一个全面的模型是非常困难的,所以我们使用多种专用模型来处理不同的问题。然而,需要指出的是,这种想象中的消费者模型涉及到所有类型的优化问题,因此获取有关客户行为各个方面的全面数据至关重要。

优化层的主要挑战是多目标的联合优化。联合优化对计算来说是一个严重的挑战,而且最重要的是联合优化受到底层预测模型能力的限制,所以几乎所有的优化技术都只能处理一个或两个目标。

我们把这些层都放到下图中。组件之间存在许多可能的依赖关系和相互作用,因此我们仅展示了一个与响应建模相关的样例程流,以免图变得过于混乱。

定价的重要性

在这些不同的问题和目标中,我们需要非常重视定价决策以及所有于定价有着直接或间接关系的的优化问题。让我们用一个经典例子来说明定价决策的重要性。会议一下企业利润的基本公式:

G = Q · (P – V)- C

其中 Q 是销售量,P 是价格,V 是可变成本,而 C 表示固定成本。假设一个服装零售商每月以 40 美元的单价销售 10 万件服装,假设每件服装的批发价是 25 美元而固定成本为一个月 50 万美元。我们可以计算销售量、价格、可变成本和固定成本在变化百分之一的情况下是如何影响利润的:

在这个例子中,我们可以看到定价对利润的影响比其他变量大得多。尽管这是一个过于简单和任意的例子,这一模式在众多不同行业的不同企业中存在。这使我们得到如下结论:零售商应特别关注与定价(折扣、个性化价格、动态定价等)有关的优化方法以及支持这些方法的数据挖掘流程。

我们也注意到全渠道零售可以给自动定价优化带来新的机会。既然价格差异是最有力的定价技术之一,则定价优化的理想环境是为每一个客户提供显示或隐式(折扣)的个性化价格,而且所有的价格是可以动态调整的。数字渠道恰好提供了这些条件,其中每个客户都有自己独立和动态的对零售商的视图。

隐含维度的重要性

如我们已经提到的,许多零售业中的优化问题与用户的行为模型是内在相关的。在个人客户层面建立这种模型的能力是数据挖掘技术带来的最重要的好处之一,也是一对一营销的关键推动力。

客户建模的最复杂的例子可以在推荐系统中找到,这些系统通常使用隐式维度的概念来捕捉客户和产品的心理特征。这一概念非常的重要,它可能远远超出推荐系统的范围,但据我们所知,它并没有如期望的那样在其他应用中被广泛应用。这使我们得出这样一个结论,即整体的优化系统可以将推荐领域的最先进的技术应用到那些不常见的应用中而受益。

展望

在零售业中实现完全的自动化决策是极具雄心的。甚至可以说,在实践中想要衡量这些优化方法的表现几乎是不可能的,因为观察到的收益提升可能与市场趋势,竞争对手的行动,顾客品味的变化以及其他因素相关。

这个问题在经济学教科书中被称为内生性问题,这对于数据驱动优化技术的研发者和用户来说都是一个巨大的挑战,而且即使看起来成功的案例也会受到该问题的挑战而显得其结果没那么可靠。

尽管如此,在过去的十年中,主要的零售商一直在寻求将数据挖掘与数值优化技术结合在一起的技术的整体解决方案。这种先进的系统将是企业数据管理演进的下一个阶段,它将遵循对数据仓库的共识并大量采用数据学科学方法。

— 全文终 —

  • May 22 / 2018
  • 0
Data

万字长文,细数零售业中的那些数据挖掘问题(值得收藏)

引言

本文是TalkingData 首席数据科学家张夏天翻译自Highly Scalable Blog 的一篇文章,介绍了零售业中的数据挖掘问题。

本文内容包括零售业中的多个常见问题,如响应建模、推荐系统、需求预测、价格差异、促销活动规划、类目管理、财务影响等。

其中涉及的资源分配优化问题、个性化推荐、定向广告等业务问题,上下两篇完整阅读大约需要两个半小时。

本次发布上篇,下篇敬请关注。

原文作者为 Ilya Katsov

零售是数据科学和数据挖掘重要的商业应用领域之一。零售领域有着丰富的数据和大量的优化问题,如优化价格、折扣、推荐、以及库存水平等可以用数据分析优化的问题。

全渠道零售,即在所有线上和线下渠道整合营销、客户关系管理,以及库存管理的崛起产生了大量的关联数据,大大增强了数据驱动型决策的重要性和能力。

尽管已经有许多关于数据挖掘在营销和客户关系管理方面的书,如[BE11, AS14, PR13 etc.],但绝大多数书的结构更像是数据科学家手册,专注在算法和方法论,并且假设人的决策是处于将分析结果到业务执行上的中心位置。

在这篇文章中我们试图采用更加严谨的方法和系统化的视角来探讨基于数据分析的经济学模型和目标函数如何使得决策更加自动化。在这篇文章里, 我们将描述一个假想的收入管理平台,这一平台基于零售商的数据并控制零售策略的很多方面,如价格、营销和仓储。

我们专注在将经济学框架和数据挖掘方法的组合有以下两个主要的原因:

  • 我们可以从经济学教科书上找到上百个与零售有关的经济学模型,因为关于市场、折扣、竞争等问题在上个世纪得到了深入的研究。然而,许多模型都是高度参数化的(即严格的由带有有限参数的公式所定义)并且不能足够灵活而精确地对现实世界的问题建模。

    但数据挖掘提供了很多非参数建模技术,可以帮助创建灵活而实用的模型。在最近十年里,也有许多成功的平衡抽象模型和机器学习技术的文章和案例研究已经发表。

  • 快速的数据循环使得在现代零售业中可以使用相对简单的模型做出更加准确的预测,因为小规模增量式的预测一般而言要比大决策更加容易。

    例如,因为对于一个新的颠覆性产品在消费者心中的感知价值是未知的,要计算它的最优价格是很困难的。但是根据需求和库存水平实时调整促销价格则是相对容易的。有一些成功的商业解决方案对价格优化就几乎丢弃了经济学模型,简单的根据销售闭环的反馈情况来决定价格的上升和下降[JL11]。

以上两点意味着在零售业自动化决策和动态优化具有很高的潜力,因此我们专注于研究这个领域。本文很大篇幅用于综述零售业者和研究人员发表的成果,这些成果都是他们在综合应用抽象经济学模型和数据挖掘方法构建实际的决策和优化系统中产生的。

特别的,本文主要受到3 个案例研究的启发,分别出自Albert Heijn [KOK07],荷兰最大的连锁超市,Zara [CA12],一家国际服装零售商,以及RueLaLa [JH14],一家创新在线时尚零售商。我们同样综合了来自Amazon、Netflix、LinkedIn 和许多独立研究者和商业项目的结果。同时,我们避免使用那些缺乏实践支持的学术结果。

我们的研究主要着眼于与收入管理相关的优化问题,包括营销和定价等问题。更加特殊的数据挖掘应用,如供应链优化和欺诈检测, 数据挖掘过程实现的细节(如模型质量的验证)则不在这我们研究的范畴内。

本文剩余部分组织如下:

  • 我们首先引入一个简单的框架将零售商的行为,利润和数据联系在一起。此框架将作为更统一的方式来描述分析问题。
  • 本文的主体部分探讨了一系列与零售业相关的优化问题。我们将在不同章节逐个介绍这些问题。每个章节会简要描述问题,并提供一组业务案例和应用,以及详细介绍如何将问题分解成经济学模型和数据挖掘任务,使得可以通过数值优化方法来解决业务问题。
  • 然后,我们会有一个章节专门讨论这些方法在实际应用中的可期的经济收益。 
  • 最后,总结部分会对这些问题之间的依赖关系进行讨论,从而阐明一般的原则和关键点。

优化框架

本文介绍了6 个主要与营销和定价相关的优化问题,这些问题都能够应用数据挖掘技术来解决。尽管这些问题非常不同,但我们尝试建立了一般性的框架来帮助设计求解所需的优化和数据挖掘任务。

该框架的基本思想是用一个经济指标,例如毛利率作为优化目标,并将这一目标作为零售商行为(如营销活动或者分类调整)的函数。

同时计量经济学目标也是数据的一个函数,即计量经济模型应该被零售商的特性参数化,从而在其输出中产生一个数值,如毛利率。

例如,某零售商在计划一个邮件营销活动。可行的行动空间可被定义为一组对于每个客户发送/不发送决策集合,而活动的毛利率则决定于营销动作(有些人会接受激励而另一些人不会)以及给定客户的期望收入和邮件成本。这一方法可以更形式化的由如下公式表达:

此公式里G是可用于分析的数据,是零售业者行为和决策空间,是计量经济模型函数,其参数是d和A,而A 是最优策略。这一框架由文献[JK98]整理提出。

模型G 的设计十分依赖于问题本身。在大部分情况下,对毛利率建模和优化都是合理的。但是,有些情况下其他的目标也是有可能的,就如下一章探讨的响应建模。同时需要注意的是优化问题(1)也跟时间有关系,因为环境会随着如新产品的上架、竞争对手的行动等因素变化,零售业者自己的行为也会产生影响。

数据挖掘在这一优化问题中的角色是非常重要的,因为计量模型G 通常都比较复杂且必须基于数据通过回归等数据挖掘技术学习确定。

在某些情况下因为复杂性太高(如用户的行为很难精确预测)或者因为无法将现有数据做外推(如对于完全新的服务),模型是无法完全确定的。这时,可以用A/B 测试和问卷调查来获得额外的数据来改进模型的精度。

问题1: 响应建模

问题描述

在广告或者特价优惠活动中,需要决定将一些资源投放给一些客户。而这些资源都是有成本的,如邮寄印制商品的目录的资金成本,或者一些负面效应(如使得用户取消邮通知订阅)。

同时, 这些资源将会影响用户的决策,如促使他们更多地消费或者购买更高价值的产品。其目标是找到一组最靠谱的候选客户,对他们投入资源后能够使得业绩最大化。

投入的资源可以是同质的(如所有参加的客户都得到同样的激励)也可以是个性化的。在后一种情况下,零售业者将对每个不同的客户提供不同的激励如不同产品的优惠券来最大化总体的收益目标。

应用

响应建模被广泛的应用在营销和客户关系管理上:

  • 确定特定的折扣、优惠券和特价,需要识别出客户对这些激励的反应。
  • 有这对性的邮件促销、活动和赠品(如4S 店提供的免费太阳眼镜)通常需要识别出最优价值的客户来降低营销费用。
  • 客户挽留计划需要识别出那些可能会离开但可以通过激励来改变主意的客户。例如,电商可以向那些放弃购物车或者离开搜索会话的客户发送特价优惠。
  • 在线目录和搜索结果可以根据客户对某些商品的的喜好来重新调整。
  • 响应建模帮助优化了电邮促销来避免不必要的垃圾邮件,这些垃圾邮件可能会让客户取消邮件订阅。

求解

基于以上的讨论,我们现在可以认识到这个问题就是资源分配的优化问题,而优化问题由一个目标函数驱动。一个最基本的方法是根据每个客户的响应概率和期望净价值来对促销活动的整体利润建模。

这里Pr(R│u;I) 是给定客户u 对激励I 的响应概率,g(u|R)) 是这个客户响应的激励的净价值,而c 则是激励的成本。公式中第一项是响应从响应用户获得的净收益,而第二项则是对应在没有响应的客户上的期望损失。目标是通过找到一组最有可能响应活动并能贡献高利润的客户子集来最大化G。因为公式(1.1) 可以约简如下:

这里E{g|u;I} 表示对给定客户在假定他会接受激励的情况下的毛利率的数学期望,而客户的选择标准则要符合以下条件:

同时,最优的客户子集U 可以定义为最大化毛利率的子集:

我们也可以以随机分配激励为基准的净值最大化。为此,我们假设参与该次营销活动的客户数固定为|U|。首先,我们将公式(1.2) 展开,显示的包括对于随机选取的|U| 个客户的营销活动的期望毛利率。

此处E{g|I} 是所有客户上的平均净价值。这一平均净价值是常数,因此在 |U| 确定的情况下在目标函数中可以被略去。因此,公式(1.2)在固定的情况下同样可以得到(1.3):

然而,文献[VL02] 提出这一模型存在一定的缺陷,因为该模型偏向于易于接受激励的客户,而没有考虑那些有没有激烈都会贡献同样利润的的客户。为解决这一缺陷,我们需要根据以下四种情况来计算客户集合U 的毛利率:

  • G1 – 根据公式(1.2)选择 U 并向中所有客户发送激励
  • G2 – 随机选择 U 并向 U 中所有客户发送激励
  • G3 – 根据公式(1.2)选择 U 但是不发送任何激励
  • G4 – 随机选择 U 但是不发送任何激励

公式(1.2)是最大化之差即相较于随机投放的提升度。另一种方法是优化,这一目标函数不仅仅度量相较于随机投放的提升度同时还考虑去除掉在同样的客户集合上不做任何激励的提升度。在此情况下,公式(1.2)变为如下形式:

此处最后一项对应的是未被激励的客户的期望净价值。这一方法被称为差分响应分析或者提升度建模由文献[BE09] 提出。

值得注意的是,公式(1.2)和(1.4)都不是通过最大化营销费用来优化的。考虑如下情况,每个响应的用户可以贡献100 美元的净利润,而激励费用为1 美元。如果一个客户组有100 万客户,其中有0.5% 的潜在响应者,则花费最大的营销活动是对每个客户都做触达则最终将损失50 万美元(总的响应者贡献的50 万美元净价值减去活动费用100 万美元)。

公式(1.4)对于各种类型的价格折扣特别重要(优惠券、临时价格折扣、特价)。考虑如下问题:“一个零售商应该向每天都买苹果的人提供苹果优惠券吗?” 根据公式(1.2),回答是肯定的。因为这个人很有可能会使用优惠券。

然而,更可能的是这个客户用更低的价格购买了同样数量的苹果,根本上这会降低零售商的利润。公式(1.4)考虑了默认的客户行为从而消除了这一问题。我们在下一节将继续讨论价格区分问题因为这一是个复杂的问题远超了公式(1.4)范畴。

公式(1.2)和(1.4)中净收入的数学期望能够基于过去客户对激励是否接受的历史数据用分类或者回归模型来确定。这一问题可能是非常有挑战性的,特别是当需要评估的激励与过往出现过的都存在某种程度上的差异。

在这种情况下,全规模的活动上线之前需要在一个客户测试组上进行测试。另外,对于零售业者而言毛利率并非唯一的关键指标。在公式(1.2)和(1.4)中使用的毛利率度量关心的是第一次付款后即时的汇报,从客户关系管理的角度看这是非常简单的视角。

零售业者还会关心其他不同的度量,度量上的多元性是如此巨大以至于有一门专门研究这个问题的经济学分支- 倾向性建模[SG09, LE13] – 这一学科发展了不同的模型来预测用户未来的行为。最重要的倾向性模型包括:

  • 生命价值预测。生命价值模型是估计一个客户在其生命周期内可以贡献的收入或者利润总额。这一指标对于那些目标为获取新客的营销活动而言是很重要的。
  • 钱包份额预测。钱包份额模型用来估计用户对于某些类型商品,如杂货或者服饰,在某一零售商及其在各竞争对手那花钱的比例。这一度量能够揭示哪些客户具有贡献高收入的潜力,因为这一模型能够用在忠诚计划和提升使用的营销活动中。
  • 类型扩展倾向。该模型估计首次购买某一类型的商品后,从休闲产品转换到奢侈品的可能性。这一模型能够帮助设计目的是获得使用扩展的活动。
  • 流失倾向。这一模型估计客户从给定零售商流失并转换到竞争对手的可能性。如果客户具有较高的流失倾向则可以定向进行挽留活动。例如,一个零售商可以识别出那些放弃了在线购物车或者退出了搜索会话但是提供一定折扣或者赠品后会改变主意的客户。
  • 购物习惯改变倾向。每个客户的购物习惯最终确定了其对一个零售商的价值,即客户的购买频率、购买什么产品、购买什么类型的产品等等。这些习惯通常是稳定的,一旦零售商改变一个客户的分层,这个分层将会持续。

因此,零售业者通常对找到那些对改变习惯比较开放的客户感兴趣, 如那些从一个城市迁移到另一个城市的人群, 从学校毕业的学生,​​ 刚刚结婚的人群等等。一个典型的例子是预测客户是否在怀孕早期[DG12] 因为新生命的诞生会显着的改变客户的购物行为。

以上模型都能够嵌入类似公式(1.4)的公式来代替毛利率目标。我们在后面的小节中将针对讨价格差异化的情况下对折扣的响应倾向建模的情况仔细探讨倾向性建模。关于倾向性建模的更多细节可以参考[FX06] 和[SG09] 两本书。

这一框架也能够扩展到在多个可能的激励方案中选择最优的方案。例如,一个零售商可以估计对于两个激烈方案A 和B(例如巧克力冰激淋和香草冰激淋)的期望表现然后对于给定的用户可以根据以下标准[WE07]来选择最优的选项:

最后,值得注意的是响应建模是与客户分群紧密耦合的:

  • 响应建模能够用来检验通过聚类行程的客户分群的可行性。一个分群应该对特定的营销计划有持续的响应。
  • 倾向性模型是基于客户数据训练得到的回归和分类模型。客户分群可以参考对于主要回归量的分析结果。另一方面,从聚类结果中也可以发现合理的倾向性模型。

问题2:推荐

问题说明

一组激励中的每一项激励对应着一个产品或者其他目录项目。展示这些激励并不直接与费用成本相关,但是只有有限数量的激励能够展示给用户。从这个角度来说,每个激励的展示都会占用一定的屏幕空间或者客户的注意力,所以给客户提供的某个激励的负面激励能够被机会成本的损失来度量。

在这样的目标下就需要将激励的子集对于每个客户而言都是个性化的(如网站上的推荐)从而最大化群体的购买表现。

应用

该问题最典型的应用有推荐系统, 个性化搜索结果, 和定向广告。此外还有一些其他重要的应用:

  • 厂商赞助折扣可以归为这类问题,因为零售商对激励的成本不关心(由厂商覆盖这部分成本), 他们仅关心有效的定向。厂商赞助的活动被广泛的应用在很多零售细分领域,如杂货店或者百货商店,因为这些厂商市场份额的提升有很重的依赖。
  • 交叉销售的营销能也够从推荐模型中获益,因为一些推荐技术能够揭示出客户画像中的隐含维度,如生活方式。这些能力对于跨类之间的推荐是特别有用的,可以基于客户服饰方面的消费行为向客户推荐家居或者厨具。
  • 推荐系统可以将用户的购买和浏览历史概括为心心理学画像,因此乏味的着装品味或者运动型的生活方式能够量化测量。同样的技术也可以根据竞争者销售产品的来对竞争者画像,就像根据客户购买来对客户画像。
  • 一些推荐算法能够基于文本描述来区分产品的心理维度,如生活方式等。所以商家可以利用它们来评估产品描述,也可以用来获得关于产品定位的适当措辞的建议。

特别需要注意的是尽管推荐通常被认为是线上服务特有的,但其所产生的基本原则和技术对于零售业的许多方面也是非常重要的。因为这些技术致力于揭示客户对产品兴趣的隐含关系。而这是零售商最基本的任务。

解决方案

推荐系统在过去20年是非常受关注的研究领域,[JZ10, RR10] 两本书提供了对几十种在各种论文,演讲和白皮书中提出的推荐算法和技术的系统化视角。

某种程度上,推荐技术的高度多样性在于一些实现推荐时遇到的挑战,如客户评分的稀疏性,计算的可扩展性,以及缺乏新物品和客户的信息。

显然,我们无法在本节中综述哪怕一下部分方法和算法,而且在此处探讨这些也没有太多的意义,因为这样的综述俯拾皆是。相反我们将关注于驱动设计推荐系统的目标和效用函数而基本上忽略这一问题的算法和技术侧的细节。

从计量经济学的观点来看,推荐系统问题与电商和全渠道商业在很多零售领域的兴起带来销售品类的快速扩张是紧密相关。大的平类增加了很多非畅销产品,每一个产品的销售量和贡献的收入都是很少的,但是这个“长尾”的总体贡献是非常显着的。

传统推荐技术如推广最畅销的商品不能有效利用非畅销商品的潜力,这就需要更巧妙的推荐方法在数百万他或者她从未探索过的产品中对其进行引导。

因为我们主要关注模型对客户在产品上的偏好的描述,我们将从根据效用函数的复杂性从简单到负责来介绍使用最广的推荐技术。我们将依据如下图所示的推荐技术层次分类图。这个层次分类综合了推荐系统的常用分类,但也不是完全一致:

单一目标

让我们从单一目标推荐任务的基本定义开始,这一定义被广泛的应用在推荐系统的文献之中。零售商向用户群体U={u_1,…,u_m } 销售物品J={j_1,…,j_n }。评分函数R:J×U 表示一个用户对一个物品的观点从负面(“不喜欢”)到正面(“喜欢”),通常使用数字来表示。

一些用户和物品对的评分值可以基于用户的评分或者通过分析购买历史,网站访问记录来估计。推荐任务则可以被定义为对给定用户-物品对(u,j) 评分值 ̃r_(u,j) 的预测。

有两种方法可以解决评级预测问题:通过查找与特定用户过去喜欢的项目相似的项目来独立估计每个用户的评分; 也可以通过对来自与给定用户类似的用户的评分进行平均来估计评分。这两种方法分别被称为内容过滤和协作过滤。

内容过滤

内容过滤的主要思想是基于对用户过往对于产品的偏好,行为和购买。尽管不可以对内容过滤做不同的解释, 我们选择将其作为分类问题[PZ07] 来强调数据挖掘的应用:

  • 每个用户可以被视作一个对物品预测评分的回归模型。一个特殊的例子是可以用二分类将物品分为两个类别- “喜欢”和“不喜欢”。
  • 一个用户的画像就是上面介绍的回归模型的一个实例。这一模型使用该用户的已知评分(显示评分,购买历史等等)来训练。
  • 给指定用户的推荐物品列表是通过对所有目录物品采用该用户对应的回归模型预测评分然后选择那些估计评分最高的物品子集来获得的。

尽管以上的过程似乎是是比较直接的,但是实际上确实非常挑战的。因为用户和物品是根本不同的实体,而且要找到一种可以直接将物品转换成回归模型可以使用的用户偏好这种微妙的东西。

最主要的问题是存货属性诸如品牌、物品名,或者价格对于衡量物品对用户的效用是根本不够的。尽管一些客户能够被满足忠于某品牌或价格取件的特征,但是需要更多微妙而有信息的维度如生活方式或者品味来描述观察到的模式和共性。

这些隐式的维度对于如电影、书籍、音乐,甚至是如服饰这样的有形物品都是非常重要的。零售商可以用如下的方法基于标准的分类技术来对带有隐含维度的物品打标签[GH02]:

  • 例如,服装可以用诸如时髦、保守、运动等标签来标识。 
  • 标准产品属性(如文本描述)旨在向客户提供特定的营销信息,因此它们隐含地包含了一些无形的属性。因此,人工评分项目的物品子集可以用于构建将从产品属性映射到隐含维度的分类模型。例如,可以使用贝叶斯分类方法来估计描述在隐含属性值出现时词出现的条件概率Pr(词项描述| 隐含属性值)。
  • 物品然后可以通过计算后验概率Pr(隐式属性值| 项目描述)来自动分类没有人工评分的商品。

一般化的来看,内容过滤和物品建模实际是信息检索任务,所以许多的为恩本挖掘和搜索技术(例如,[MA08] 的综述所提到的)可以被用来构建推荐系统。我们在此略过这些细节,因为从计量经济的角度来看这些都不是最重要的部分。

协同过滤. 前面部分提到的隐含维度的问题具有重要意义,此问题可以引导我们了解推荐技术的第二个系列。这个问题源于根本无法严格的对人的口味和倾向建模。

协同过滤是一种自然的,也许是唯一不需要对系统进行很多人工工作的解决方案- 推荐决策中对”人的因素”的需求通过其他用户的反馈来满足。

最基本的协同过滤模型[RE04, BR98] 直接由用户之间的相似度度量来定义:

此处r_u,j 为用户u 对j 物品的评分,U 是所有用户的集合或者启发式选取的给定用户的邻近用户,λ 是规范化系数,sim(u,v) 是两个用户之间的相似度度量, 而¯r_u 是戈丁用户的平均评分:

假设J_u 是一组用户评分过的物品。公式(2.1) 使用的平均用户评分概念来建模用户比其他用户在打分倾向上是偏高还是偏低,因为他们有的要求高有的要求低。虽然不是绝对必要,这一修正在实践是上非常重要并在最开始实现协同过滤时就被广泛应用了。

一般用余弦距离或者皮尔森相关系数来计算评分向量 J_u 和 J_v 之间的相似度。此外,文献 [ER98, SU09] 介绍了很多对于此基本相似度度量进行调整的多种方法来改进使用中的性能。

模型(2.1)存在一些显著的缺陷,首先这一模型的计算复杂性(与物品和用户数量成正比)很高,其次用户的评分是非常稀疏的。评分的稀疏性是指每个用户都只会对很小一部分物品进行评分,所以在计算向量 J_u 和向量 J_v 的相似度时经常会出现没有重合的元素,这会降低推荐的质量。

例如,众所周知 Amazon[SA01] 和 Netflix[YK08] 的评分矩阵中的评分缺失率达到 99%。为了克服这一限制,基于用户的模型(2.1)在通常被概念上非常相似的基于物品的模型 [SA01, YK08] 所取代:

其中物品之间的相似度度量是基于那些在两个物品上都有评分的用户的基准评分 ¯r_(u,j) 来计算的。基准评分同时考虑了用户偏差(用户的平均评分值相较于整体评分的偏差)以及物品偏差(物品的平均评分相较于整体评分的偏差)。

值得注意的是,有一简单的方法来实现公式(2.2),此方法通过寻找频繁项集(被频繁一起购买的物品)并基于在频繁项集的同现来计算相似度。这一方法因其简单被视为“穷人的推荐引擎”[RE03]。

模型(2.1)和(2.2)属于所谓最近邻模型,这些模型通过分析相似的用户或者物品的邻居来估计他们的评分。这一系列的算法也包括很多变种的技术 [SU09] 通过使用跟紧凑的概率模型或者其他近似方法来取代计算开销昂贵的检查邻居的方法。

尽管最近邻模型是一种被诸如亚马逊等领先的零售商验证过的推荐技术。但在根本上这些技术还是在根本上具有在内容过滤中就有的隐含维度所带来的问题。前面考虑的用户之间和物品之间的相似度度量对于揭示用户和无偏之间的复杂关系,其能力是有限的。

这与信息检索里面的同义搜索和多义搜索棉面临的问题是类似的,要揭示搜索者的实际意图,并将其意图翻译成文本和查询之间的相似度是非常挑战的事情。

为了解决这一问题,一种被称为隐含语义分析的的技术被提出来 [DR90]。该方法被提出来 10 年后被用来设计推荐系统 [SA00],并开创了一类新隐含因子模型。

隐含因子模型主要的思想能够被描述如下:评分函数 R 能够被表达成 m×n 矩阵(m 是用户数,n 是产品数), 其中的元素是评分值。这可以被当作一个线性空间问题。

推荐任务则可以被重新定义为用其他评分向量的组合来计算用户评分向量。实际上,公式(2.1)自然的就是一种权重由相似度函数定义的评分制的线性组合。然而,问题是评分矩阵缺失评分而稀疏,因偏见和随机因素通常带有噪音,而且基于物品维度则限制了揭示用户品味的能力,而品味通常是与一组物品相关而不是与单个物品相关。

换句话说, 被散落在巨大的低密度矩阵中并混有一定程度噪音的信号智能通过研究隐含模式才能显示出来。隐含因子模型的思想是用低维度的基来近似一个高维线性空间。这有助于达成以下目标:

  • 较少的维度能够帮助把信号的能量集中,则每个基向量对评分估计的贡献都是显著的。它通过丢弃简单的不适应这些较小的基啊的波动来减少噪声。
  • 基本的计算过程可以被设计来产生有着最少依赖的基向量,从而有效的揭示用户品味的主要倾向,这些倾向每个对应一个基向量。例如,Netflix 用这一方法来预测电影评分 [YK08, YK09] 时, 系统产生的维度清晰的对应着诸如喜剧,男女等坐标轴。

集合中的每个点沿着 R_1 和 R_2 维度都有着很大的坐标值并显示出数据的复杂而不规则的结构。然而,在另一个坐标系 B 中则揭示了数据可以被维度 B_1 有效描述,而维度 B_2 则并不重要,这暗示了这是一个一维的隐含因子模型。

某种程度上,隐含因子模型能够与离散余弦变换 (DCT) 相比较,离散余弦变换被用在图像压缩算法诸如 JPEG 中来用少量的谐波来近似图片。

以上的思考链引导我们到如下的隐含因子的形式化模型。首先选择维数b≪n,m 并将每个用户和物品都当作该维度空间中的一个向量。我们将用户u 的向量标识为p_u∈R^b, 物品j 的向量标识为q_j∈R^b。这些向量是基于评分举证计算R 得到的,计算过程中通过某种办法让向量b 的个分量都对应到上面所述的一个隐含维度。

因此,用户和物品都可以在同样的主题下进行编码,同时评分可以通过计算两个向量的内积,即将向量的维度两两对应相乘然后求和得到:

有许多不同的方法来计算用户和物品的隐含因子向量p_u 和q_j。最直接的方法就是用奇异值分解(SVD) 对评分矩阵R 进行分解。然而,基于计算稳定性和复杂性的考虑,在实践中一般使用迭代的梯度瞎讲优化方法[YK09]。

下图展示了卷积(2.1)和(2.3)之间的区别。左边对于给定物品的稀疏的评分向量与稀疏度相似的给定用户做卷积得到评分估计。而在右边,评分是通过计算两个降维后且能量密度很好的向量的卷积得到的。

多目标

以上讨论的推荐方法本质上都是由一个单一目标驱动,这一目标是提供最好的语义匹配或者预测偏好评分。然而,推荐精度并不是推荐系统设计的唯一考虑,零售商可能有兴趣对综合多个有冲突的目标在一起给用户提供推荐。

例如,食品杂货商可能有兴趣提升具有较短货架期的易腐食物的销量,时尚商店可能希望推广赞助品牌或当季款,更多的零售商可以从推荐较高利润率的产品或考虑产品库存水平避免以避免缺货来获得更好收益。

文献[JW10] 提出了多目标推荐系统并在LinkedIn[RP12] 中做了大规模验证。在LinkedIn 的例子中, 其主要的目标是给候选人推荐语义上匹配的工作机会,其次是显示找工作的行为。[RP12] 描述了该方法,将推荐任务定义为如下的优化问题:

此处:

  • ¯r 是由底层推荐系统基于语义匹配和相关性产生的原生推荐向量,¯r 中的第j 个元素表示的是第j 个产品的相关性分值(或排序)。
  • ¯f 是二级特征值向量,¯f 中的第个元素对应的是第j 个产品在次要目标上对应的分值。例如,这一向量可以产品的毛利率。
  • R(·) 是组合排序函数其综合了¯r 和¯f 形成一个新的物品排序平衡了两个目标。
  • g(·) 表示度量推荐系统性能的整体效用函数。
  • E{⋅} 对所有推荐效果的平均。
  • (·)_(1…K) 表示的是前K 个具有最高分数的元素,这里K 是给用户推荐的物品数。例如,如果¯r 中包括在册的所有n 个产品的推荐分,则¯r_(1..K) 对应的是K 个最值得推荐的产品。
  • dist(·) 是度量两个推荐向量之间的差异的距离函数,而c 是这一差异的限制阈值。根据[RP12], 一个合理而实际的距离度量是两个分值向量直方图的平方误差和。

上述优化问题的主要事项是是增加混合了次要目标的相关度分值的综合推荐的效用,但是对原声的相关性推荐结果和综合推荐结果的差异做惩罚来保证不会为了最求次要目标而完全牺牲相关性。

函数R(·) 的设计需要包括可调整的参数来调节两个目标的权重并决定哪个是主要的优化目标。这一方法可以直接的扩展到多于两个目标的情况。

我们能够使用大量的例子来展示上述优化模型是可以适配到实际的问题中去的。首先,考虑零售商要将收入目标整合到推荐分值里的情况。

整体的效用函数可以被期望毛利率定义,设m(p)∈[0,1] 为物品p 的规范化毛利率,而被购买的概率则由排序位置的倒数表示(即在推荐列表里排序越低的的物品,其转化概率越低)。

此处是概率规范化常数。综合排序函数可以被定义为如下:

其中β 是一个控制相关性和选取高毛利率产品之间的权衡的参数。这一参数决定了优化问题(2.4)的主要目标。

根据次要目标重新排序的另一个例子是促销特色商品,如打折产品或易腐货物。效用函数可以指定为特选产品在有K 个推荐项的推荐列表中的平均个数。

此处F(·) 是特选标志当物品是特选时为1,不是则为0。综合排序函数组合了相关性分值和特选标志,通过参数β 来权衡哪个是主要的优化目标。

以上的排序函数能够直接扩展到整合多个分离的特征,每个特征对最终排序分值的贡献尤其对应的权衡参数(所有参数需要联合起来优化):

关于问题(2.4)的数值优化算法的细节可以在[RP12] 中找到。

问题3: 需求预测

问题定义

零售商为客户提供一组产品。对给定产品的需求依赖于许多因素,包括产品本身的特性如价格或品牌,同类产品竞争对手的价格, 促销活动,甚至是天气。该问题的目标是整合这些因素来构建需求模型并且允许进行假设分析以预测对价格变化的响应,品类的扩充和减少,计算最佳库存水平,并分配货架空间单位。

应用

在本节中我们将讨论需求预测核心问题。这一问题可以被考虑为一个建造模块,该模块要求对影响需求的行为或者库存水平的限制建模:

  • 价格优化,促销活动计划, 以及定向折扣。
  • 品类管理和计划。
  • 库存水平优化。
  • 需求预测模型通常应用在市场营销活动设计中,因为这些模型能够解释需求回归量的影响。例如,一个需求预测模型可以揭示某一产品的价格敏感性(当价格变化时需求有多少变化)与包装大小和和销售区域的人口特性紧密相关,这就暗示了可以在不同的商店使用不同的价格并对不同包装的产品设定不同的单位毛利率。

我们将在后面的章节中把需求预测模型用在价格优化和品类计划问题上。

解决方案

需求预测可以被认为是一个相对简单的数据挖掘问题,只需要建立一个回归模型并用历史数据进行评估。然而,设计回归模型则不是那么简单的事情,因为需求受到很多有着复杂依赖关系的因素的影响。

在本节中,我们将研究文献[KOK07] 为Albert Heijn(一家荷兰的连锁超市)构建并验证的回归模型。这一模型基于早期的营销研究如[BG92],以及时尚零售商如RueLaLa[JH14] 和Zara[CA12] 的实践,这些实践中应用了相似的模型。

然而,重要的是要理解不同的优化问题需要不同的需求预测模型并且几乎不可能构建通用的需求模型来整合各种不同的需求影响因子。

我们从以下对一给定产品的需求模型开始:

此处:

  • V 是在给定时间窗口内顾客到访商店的数量,例如一天。
  • Pr(purchase | visit) 是客户在逛商店期间购买任意商品的概率。
  • Pr(j | purchase) 是当客户发生购买时在所有可选项中选择产品的概率。
  • E{Q | j;purchase} 是当客户选择了产品并购买时购买数量(单位数量)的数学期望。

公式(3.1)中的所有因素都可以用店铺的历史交易数据来估计。需求通常与日期(周几、节假日等)和店铺(大小、邻近区域的人口统计情况等等)相关,所以我们引入下标t 和h 来分别表示日期和店铺,而估计的需求就是这些参数的函数。

另外,商店属性,如大小、位置和平均消费者的收入可以纳入模型作为回归。根据[KOK07],商店访客的数量可以建模如下:

此处Tt 是天气温度,Wt 是天气舒适度指数(湿度、阴晴等),Bti 和Eti 分别是表示一天是星期几和公共假期的0/1 哑变量,H 是公共假期的天数,而α是回归系数。

购买事件是一个二值变量(购买/没有购买),所以我们可以用一个标准的建模方法- 将购买概率用一个Sigmoid 函数来表达并从数据估计指数参数:

则x 的回归模是:

此处Ajht 是哑变量,产品j 在促销时值为1 否则为0,Nh 是所有产品的数量,而β4 对应的是促销产品占整体销售产品中的百分比。

Pr(j | purchase) 的估计则更为棘手一些。客户选择建模在本质上是计量经济问题,是一个特别的经济学研究分支——选择建模理论。选择建模理论证明了多项logit 模型(MNL)是有效的方法来对多个选项中选择的概率进行建模。

此处会i 迭代遍历所有产品,yj 是一个参数变量。类似于购买事件的概率,我们对参数yj 建立了一个回归模型:

此处系数Γn+1 和数Γn+2 由所有产品共享,Rjht 和R 分别是单个产品的价格和产品的平均价格,而Ajht 和A 是促销哑变量和平均促销率,如上面对购买可能性回归模型描述的那样。

最后,单位产品的平均销售数量可以建模如下:

通过将上述模型代入根表达式(3.1),可以得到完全特别的需求预测模型。这一模型可以根据零售商的业务用例来调整,这些跳帧个可以通过增加更多的解释性变量如营销事件来完成。

  • May 18 / 2018
  • 0
Data

技术专栏 | 深度学习与智能手机,那些被人工智能所改变的……

深度学习旨在升级智能手机的大脑

在大多数的广告行业当中,人们喜欢巨幅的宣传海报、带有耀眼光泽的宣传品以及各种前沿高科技的东西。当听见虚拟现实技术让曾经的摇滚明星以全息图的形式出现在舞台上时,所有人不禁心头一震,其中包括那些代理商们。

每个人都想方设法在新科技冲击的浪潮中,寻找爆点,以赚取名利。但目前人们的耳朵里已经听到太多的技术名词了,反而成了某种累赘,失去了诱惑力,比如深度学习的东西。

深度学习是机器学习的一个子集,目的是教会计算机在声音、图像和其他数据中找到某种规律或者模式。虽然乍看起来这并不能让普通人甚至那些营销人员兴奋起来,但事实是,世界上的科技巨头们:Facebooks、Apples、Googles、Netflixes、Microsofts、百度等等,都为此投入了大量的资金。例如,据报道,谷歌在2014年花费超过5亿美元收购了深度学习公司DeepMind。再例如百度是中国科技巨头,在硅谷和北京都开设了深度学习和以人工智能为中心的研发中心。而苹果公司也在大力聘请深度学习方面的专家。

为什么深度学习会如此火热?因为深度学习技术可以让你使用你的指纹解锁手机,它使Facebook和政府机构能够在图片中识别你的脸,这有助于Siri和Alexa了解你到底在说什么,广告商正在试验使用深度学习来计算有多少路人会抬头观看广告牌,自动驾驶汽车也正在使用深度学习来避免路障和行人等。

随着技术能力的发展,深度学习很快将会做的更多。未来学家们已经在考虑新的(有时是反乌托邦式的)它可以用于营销策略的方式,应用程序开发者们也越来越多地开始通过深度学习来增强图像和进行图像识别了。

至少在20世纪90年代以来,深度学习已经就作为一个学术研究领域而存在。但是由于其需要强大的计算和数据处理能力,鉴于当时的硬件限制,导致了创新的局限性。

随着硬件和软件技术的不断发展,到2010年初,学术界和一些企业开始尝试通过深度学习进行更多的实验。然后就像互联网一样,猫图像识别改变了一切。 2012年,Jeff Dean和Andrew Ng带领的Google研究团队将16,000个计算机处理器连接到一个神经网络自学成识别大量静止图像数据库中的猫的图像。

“结构化数据难以聚类,成本昂贵,但它是监督学习(最常见的机器学习)的基石,”位于洛杉矶的人工智能公司GumGum的计算机视觉技术主管Cambron Carter说。“Ng,Dean等人设法训练一个网络,从原始的YouTube缩略图中识别出猫,脸和人性化的结构,“

在谷歌取得突破之后,Facebook、IBM和微软等公司的团队都取得了进一步的发展,使得深度学习更便宜,更容易融入消费者的科技产品和服务中。

例如,百度2016年发布的研究报告使用人脸识别而不是门票来参加活动,Alexa的语音数据为亚马逊打开了一个丰富的新数据缓存。营销和广告公司已经在使用深度学习技术来推断Instagram图片和YouTube视频等数据。

深度学习军备竞赛

然而,深度学习的广泛应用并不容易,即使是上市的Google、Facebook和微软等公司也很关心如何将深度学习深入到他们目前的产品以及他们未来规划的研发中。

但是,大多数情况下,只能从公开的研究论文、会议演讲等方面获取一些零碎的知识,能够为未来深度学习的应用提供一些思路。例如自动驾驶汽车、虚拟现实、帮助盲人浏览世界、文字翻译、场景讲述等等。

Nvidia是一家硬件公司,其图形处理单元(GPU)由于深度学习的兴起而销售旺盛,在其网站上列出了用于识别图像中使用的字体的Adobe DeepFont,到国家中心适用于超级计算应用,可实时检测数百万英里外的引力波。

从根本上来说,深度学习可以让电脑做它们已经在做的事情,并且会更好。巧妙执行的深度学习算法意味着系统可以识别哪些车在Instagram照片中最常出现,或追踪观众观看电视广告多久才会感到厌倦。

由于机器学习专家群体相对较小,大型科技公司一直对其深度学习研究一反常态。鼓励百度,Facebook和微软等公司的研究人员发表论文;即使是超级诡秘的苹果公司也出版了自己的机器学习杂志。

苹果和其他供应商正在尽全力帮助软件开发者将深度学习功能集成到应用程序中。例如,微软提供免费的Cognitive Toolkit,据微软称,该工具包旨在通过让用户创建、训练和评估自己的神经网络来帮助创建企业级AI。该工具套件已经加速了一家中国公司AdDoc的野外空间数据分析,AdDoc技术可快速检测糖尿病并发症的发病情况。

智能手机=AI超级计算机?

摄影记忆,即时艺术作品,即时翻译,逼真的虚拟现实等等都会到你的口袋里。

在新的iOS 10/11中,神经网络人工智能在拍摄每张照片的十分之一秒内执行110亿次计算,以找出他们是谁,甚至是他们的心情。iOS10+的新照片应用程序只是越来越多的手持式人工智能的最新例子。 Aipoly发布的一款应用,可以识别物体并大声说出名字,以便让失明的人看到。只要将相机指向需要翻译的文字,Google翻译就可以将其翻译成你自己能看得懂的文字。而越来越多的应用程序嵌入了人工智能,让你的智能手机更加的智能化、人性化。

移动设备的发展也正在向着更加智能化发展,即将发布的某款手机,直接使用了人工智能芯片,让整台设备成了一个微型、但是快速的人工智能平台。可想而知,在不久的将来,人人都手持着一台人工智能计算机,时刻都在进行着人工智能活动。而更加智能化的应用程序正在改变着人类生活的各个方面。

我们将迈入一个全新的智能化时代,也将面临更加严峻的安全考验。让我们拭目以待。

  • May 15 / 2018
  • 0
Data, News

新零售:“无法阻挡”还是“无能为力”?

​提到新零售,你的第一印象是什么?

早上吃饭,煎饼果子可以手机支付了;

中午休息,外卖来得越来越快了;

加班的晚上,发现去年刚装的无人货架,今年因为销售量太低而拆掉了;

回家的路上,一窝蜂建起的无人便利店落满灰了;

躺沙发上刷刷手机,猜你喜欢,似乎已经比伴侣更合心意了;

不知什么时候开始,亲人租赁也成为一种产品了;

人造节日越来越多了,双11也开始走向线下了;

当年神仙打架散下来的补贴,算算也还得差不多了。

互联网公司、咨询公司、甚至传统软件公司都在谈新零售和数字化转型,模式之纷繁,链条之广袤,史无前例——似乎不谈谈流量变现,不说说几个O,不把人从业务环节中消灭,不烧烧钱看个热闹,都不好意思说自己是零售从业者了。

粉丝经济也好,O2O也好,无人也好,补贴也好,都只是零售行业中似新而不算新的手段,并不构成新商业模式——沃尔玛在二十世纪七十年代就推出了电话订货,门店送货。然而今天卷土重来的这场零售变革似乎并未转瞬即逝。眼前的“新零售”,它究竟“新”在何处?能带来什么样的企业价值?如何为企业赋能?未来潜力在哪里?今天我们一起通过真实案例,来看看这场热闹背后,到底是“无法阻挡”,还是“无能为力”。

这一轮新零售的契机在于数字化基础设施能力大幅提升

其“新”体现于人的比特化、货的产销化、场的无界化

在零售行业,企业和消费者求变的渴望存在已久。企业有营销预算,逐渐不知道花在哪里才有回报;消费者要求更高,不像上一辈那样认为消费能满足温饱就好。然而真正让这一轮零售变革无法阻挡的,是技术的发展,是数字化基础设施能力的大幅提升。

随着数据采集方式的丰富,数据的维度也愈发饱满起来。从前我们只能对发生交易的顾客进行分析,而现在已经能通过线上埋点、线下WIFI探针、物联网技术、移动支付、位置服务对交易前各个“场”在不同阶段的交互行为进行分析,形成POS前洞察。表面形式上的花样翻新治标不治本,真正的变革是建立在行为的数字化及数据资产的积累基础之上的。企业可以通过设置场景、增强与既有顾客和潜在顾客的互动来丰富数据资产。互动越多,就越有可能产生更深度的交流,留下更多“痕迹”,让企业为顾客提供更贴心的服务。

新零售的“新”,归根结底依然围绕三个核心元素——人、货、场,具体体现为人的比特化、货的产销化、场的无界化

1、人的比特化——行为更加清晰,人群范围扩大

比特化就是通过数字化,以最小的单元,对人的特征及行为进行记录和传载。

从前企业只能对自有会员的交易数据进行分析,如今在RFM+模型和CLV+模型中,我们加入交互行为和场的数据,让既有顾客行为更加清晰,将顾客人群的范围扩大。当我们说高价值顾客的时候,会多思考一层——以哪个渠道?是购买金额最高的顾客?是利润最高的顾客?还是传播力最强的平民KOL?同样是新客户期,到底是有活跃到访但没有发生购买的顾客,还是根本没有到访行为的顾客?此外,通过一三方数据相结合的数据挖掘,我们能够客观洞察顾客在品牌外的价值主张,投其所好,并且在第三方池触及潜在顾客群。

了解顾客后的下一步是什么?杀熟吗?当然不是。对顾客的运营要坚持利他原则,一切从顾客的角度出发。

在与某零售企业合作中,我们结合一三方数据,探索注册未购买顾客和活跃顾客的APP行为习惯偏好、品类偏好、客单价分布、购买时间分布,设计恰当的推广品类,利用品牌自身线下流量规模与第三方置换异业权益。在这场活动中,品牌摆脱了传统的积分换购和特殊折扣等影响毛利的减法行为,而采用降维打法巧妙避开价格战,顾客以远低于市面上的价格获得心仪的权益,创造商家与顾客共同获益的双赢生态模式,首次活动便创造20%的销售增量,经过迭代之后更是创造了200%的销售增量。

2、货的产销化——人货交互可见,销售即是生产

顾客付款之前的行为是可洞察的,最早从线上开始——通过线上埋点,品牌能够分析出哪些顾客加了购物车但是没有购买,浏览了A商品的顾客又看了哪些其它商品。随着物联网的不断发展,线下的人货交互行为洞察,也成为可能。人货交互的可见让货品的设计、生产及陈列不再由品牌自己决定,而是让顾客也能够参与其中,产销者的概念由此而生。

image.png

90后乃至00后新生代的一人经济、共享经济、KOL经济、情绪态度消费、去中心化消费,对产品设计、生产、互动触点、传播方式产生了摧枯拉朽般的颠覆。这一代消费者已经不再满足于坐等“货”被品牌生产出来——从江小白的用户生成内容到肯德基的点歌服务,无不体现了消费者对影响产品和服务的热情。

3场的无界化——交易交互无界,虚拟场域概念

场的无界化的第一层意义是,OMO 融合带来了触点争夺的白热化。有人说OMO是线上线下导流,事实上OMO不是企业在自己的主场导流,而是到顾客的战场去——毕竟坐在自家花园里靠品牌影响力等顾客上门的日子已经过去了。交易交互的场已经无界,今天是王者,明天可能是吃鸡,今天是游戏,明天可能是短视频;目前,许多消费者在本地生活圈服务平台的年消费,甚至比第三方电商加起来还多。哪里有流量,哪里都可以做生意。去年九月份的时候,四个星期之内,市场上出现了七款吃鸡游戏,从王者荣耀7000万的日活里面,生生撬出了4000万的活跃用户。如果有客观的数据支撑你看准这样一个流量去经营,就能实现一轮收割。

流量场不断快速更换的局面已经超出了单纯依赖经验的判断已经无法应对不断快速切换的流量场。这迫使企业要借助数据,用更客观敏捷的方式判断,跟上节奏,捕捉管理适合自己的触点。

image.png

场的无界化的另一层含义是,场域概念的虚拟化。如今的实体店,是门店,是展室,也是仓库。企业可以利用虚拟现实技术创造虚拟场,或以前置仓覆盖消费者所在的生活圈服务。两者都需要考虑坪效设计品类,例如生鲜类值得前置,但洗衣液也许就要多加考虑。

新零售对企业的价值——通过业务标签化、流程自动化、分析模型化、应用场景化实现效率和收益的平衡和共进。

传统企业往往紧盯投资回报率或直接收入,而在目前的商业条件下,零售企业可以通过数据实现的商业价值更广,包括效率和收益两个维度。

image.png

1、效率的提升

提到新零售对效率的提升,也许你的第一个反应是“无人”。无人技术的发展是人工智能的一大步,但为了无人而无人,和把顾客在线上线下间无意义驱赶的O2O一样,只是新零售的伪创新。新零售对效率的提升应该体现在企业的整个运行链路当中,通过业务标签化、流程自动化和分析模型化,减少跳入跳出时间和重复工作量,最终实现决策数字化。数据资产的建设、数字化平台的建设、数字化决策能力的建设,都是效率提升的基础。

在与某服装企业的合作中,我们在私有化DMP平台中进行数据资产积累,根据属性、行为、既有标签构建一、二、三方标签,并在基础标签之上,构建自定义标签、算法标签、聚合标签,实现业务标签化;之后将标签部署在平台上,并与营销投放平台全面打通,在一个生态中完成人群筛选调用、投放、数据回流、追踪的全链路,实现一站式营销流程自动化。在每次营销活动之后,该企业根据回流数据分析结果、顾客价值及生命周期变化,判断人群标签有效性,固化成自定义标签,后续即可一键调用,避免重复工作量。标签式人群筛选及放大,颠覆了以往数据库捞人的模式,节约营运时间75%以上,提高企业敏捷应对能力。

在零售选址方面,企业可以通过实时客流热力,直观了解城市主商区、次级商区、辐射商区覆盖域;在客流热力基础上叠加自有门店、竞品门店、增益品牌信息,寻找空缺覆盖片区;结合对目标选址行政区、目标营业时段的选择,采用5C选址方法做多因素综合评分;在优选片区中选定精确店址并继续深化选址研究,利用步行等时圈更科学划定局部商圈,快速获得多址终选的决策依据。

image.png

值得强调的是,如今的数据分析对象早已不仅仅局限于数字,还包括图像、语音、文本、社交关系等。我们紧抓这一浪潮,与某舆情公司合作,尝试分析多个历史网红产品的双微传播路径,聚焦核心传播节点和脉络,设定自由度和凝固度阈值,在发酵期以矢量定位网红食品新词,并追踪其后续声量,帮助企业发现网红食品,及时量产。该分析创造了新的业务细分产品,将过去的人为搜索和预测自动化,大大提高网红食品识别的时间和财务效率,及时捕捉市场热情。

2、收益的提升

分析对收益的提升往往建立在效率提升的基础之上,通过应用场景化实现,体现于会员结构优化、销售增长和成本下降。

某零售企业利用其会员线下POI数据、APP数据和WIFI数据,打造定制化标签,在未购买咖啡的会员当中筛选出潜在咖啡客进行分群、分时、分文案投放,总体响应率比盲投提高约120%。同时,通过分析识别长距离通勤人群等响应率为历史响应率3.5倍的超高质量咖啡潜客群,日后可以作为种子进一步通过在第三方人群池进行放大、LBS或微生态拉新,实现低成本咖啡新客规模化获取。响应率提升带来的销售增长和营销成本的节约可以反哺,为顾客带来更好的产品。

image.png

传播行为数据的可获取性,让零售企业可以通过最小可行化产品(MVP)测试,对权益、渠道、媒介、人群参数等进行效果回收迭代,减少时间及财务浪费。迭代不仅仅是为了找到对的方向,还包括找到该绕开的错误。国内当前注册在案的网红120万个,去年下半年,企业就已经可以以小时为单位来数字化展现网红的效果;人工智能已经能够自动化生成千人千面的素材——人跟品牌之间的交互节奏极快,规模极大,成本极低,因此与其让运营方、设计师绞尽脑汁猜几百万用户怎么想,不如让几百万人来投票。新办法层出不穷,今天最有效的方式是“裂变红包”,明天可能就是“邀请得券”,所谓方法论不是一两个金点子,而是一套敏捷的发现、验证、推广新技巧的机制,在找准现金牛的同时,也做好弯道超车的准备。

在线下营销活动期间,某品牌业利用DID双重差分模型分析活动中的显著指标,设定核心KPI,为导购行为提供科学指导;利用随机森林聚类和分类模型判断影响人群是否购买及购买金额的因子变量,指导后续人群筛选。此举颠覆了以往对管理经验和传统认知的过度依赖,大幅提高决策客观性,缩短人群及店铺筛选时间,降低人员培训成本。

3、新零售的赋能——自动化洞察降低数据科学门槛

目前,大量零售企业依然缺乏针对数据科学技术的整合方式,错失了人群、商品、价格、竞争环境、周边环境、交通状况、店面属性等元素中蕴藏的大量尚未被完全解读的商业机会。

image.png

数据科学平台为零售企业赋予基础数据科学能力,让其能够首先在数据目录中将散乱的数据整理出结构和组合,之后在数据工厂中按照场景或项目目标,对数据进行处理、建模,输出数据集至数据目录或建模结果,在数据报表中实现可视化,最后在数据仓库沉淀。

4、新零售的未来潜能

新零售是“无法阻挡”的。其在“人”和“场”方面的能力已经形成,并将随着数据采集硬件的发展、数据捕捉与应用场景的丰富而逐渐增强。随着这一代消费者生活方式的改变,在“货”方面将涌现出更多类型的实物、虚拟物和服务作为产品出售;生产速度和个性化程度,都将超越当前的初级柔性供应链,在生产端3D打印技术的升级中实现突破。

此外,在人员赋能方面,目前数据科学的自动化仍然处于组件单一自动化的早期阶段。特征工程之前的步骤,依然主要由人工完成,尚未形成“策略库”。特征工程、模型选型、评估的单一组件自动化可以实现。后期迭代优化部分,能自动化实现模型的选择和调参,但建模部分依然需要大量人工干预。打破这一壁垒之后,自动化数据科学将真正实现大数据的赋能——降低工具门槛、人才门槛和预算门槛。更多小品牌也能受益于大数据和人工智能手段,大型企业和中小企业间的基建差距将缩小,中小企业将有更多机会跑出,竞争也将更为激烈。

新零售中的大数据和人工智能,作为底层建筑或者基础设施在升级改造产业,也有其“无能为力”之处。在定位其价值时,管理者应该接受其带来的洞察有其概率性和量化的不确定性,是决策的辅助者而非替代者。

看似普适的理论往往价值有限,只有那些敢于下水,拿到分析洞察之后拥抱实验文化的挖掘者,才会切实尝到数据带来的甜头。新零售也不是互联网企业的专属,所有的传统行业,都值得用互联网思维再思考一次,否则就会像大润发董事黄明端所言——“我赢了所有竞争对手,却输给了时代”。

TalkingData集合数据、产品和咨询的全域服务,拥有多年零售龙头企业合作实施落地经验,愿以企业价值为终极目标,携手企业以效率数字化为起点,提升横纵向生态聚合、业务经营能力、平台支撑能力与商业运营模式,以效益数字化为节点,全面提升数字化能力,稳固提高产出价值。

  • May 14 / 2018
  • 0
Data

精挑细选丨10 本商业决策者必读的人工智能书籍(值得收藏)

人工智能不是简单明了的小学数学,但也不是晦涩难懂的火箭科学。作为商业决策者,对人工智能的理解不仅可以让你更好地优化现有的产品、服务和流程,还可以为公司的未来发展产生新的想法。

Screen_Shot_2018-04-14_at_4.20_.59_PM_.png上图这10本书能够帮助商业决策者进一步地从方法论、当前最新发展、行业案例、执行指南、安全因素以及未来探索等各个方面去更好地了解人工智能应用,进而奠定知识的基础。

1. 《执行指南:如何在你的企业里发现和实施人工智能应用》

英文名: 《The Executive Guide to Artificial Intelligence: How to identify and implement applications for AI in your organization》
作者: Andrew Burgess
出版时间: 2017

s-l500.jpg

作为一名经验丰富的管理顾问,Andrew 根据他的专业见解解释了为什么现在是应用 AI 的最好时机,以及公司该如何将自动化的思维转变为行动的方法。

该书书谈到了该如何解决在从原型到实际应用的整个生命周期中遇到的问题,比如该怎样预防故障的发生。在本书的最后,作者还列举了几个人工智能的使用案例以及关于人工智能未来的探讨。

2. 《有情机器:未来时代的人工智能》

英文名: 《The Sentient Machine: The Coming Age of Artificial Intelligence》
作者: Amir Husain
出版时间: 2017

35011553.jpg

该书有三个部分:关于人工智能的基本介绍、当今世界的人工智能以及其未来。作者 Amir 是一位成功的拥有连续创业经验和创新者,他对各行各业的理解使他能够在书中对从人工智能在物联网到金融市场等不同领域进行深度的探讨。在本书最后,Amir 还讨论了一些由人工智能引起的社会问题,例如自动化和人类工作机会均衡等等。

3. 《人工智能:你今天必须知道的关于我们未来的101件事》

英文名: 《Artificial Intelligence: 101 Things You Must Know Today About Our Future》
作者: Lasse Rouhiainen
出版时间: 2018

51zbxN2lBpL.jpg

本书简要介绍了人工智能及其重要性,然后列举了人工智能在金融、医疗保健、教育和政府等各个领域的应用。作为国际上新兴技术领域的意见领袖,本书作者 Lasse 还阐明了如何在从市场调研、客服、会计和人力资源等业务流程中应用人工智能。除了理论上的观点之外,本书还提供了应用人工智能的几个例子,例如聊天机器人、自动驾驶汽车和机器人以及企业如何使用它们来创造价值。

4. 《人工智能:一种现代的方法》

英文名: Artificial Intelligence: A Modern Approach
作者: Stuart Russell, Peter Norvig
出版时间: 2015

0132071487.jpg

Stuart 和 Peter 被誉为是当代最着名的计算机科学家,他们在本书中提出了一个非常有深度的看待人工智能问题和解决问题的方法论。本书首先解释了什么是智能代理(Intelligent Agent)这个概念,然后介绍了在计算机科学领域解决问题、辩知和推理的方法。之后本书还对人工智能系统如何自主进行计划、学习、交流、感知和行动进行了深度讨论,从而使读者对在应用人工智能的问题上有了更系统的理解。

5. 《未来产业》

英文名: 《The Industries of the Future》
作者: Alec Ross
出版时间: 2017

41uPd3ojbRL._SX327_BO1,204,203,200__.jpg

这本书是前美国国务卿高级顾问 Alec Ross 的前瞻性代表作之一,本书的开始讨论了当前机器人和类人机器(基因密码)的发展,然后接着讨论了包括货币、市场和信任机制在内的所有事物的代码化。作者强调了信息时代的代码和数据的重要性,这些见解对于商业领导者该如何正确地利用公司内外的工具和资源至关重要。

6. 《针对商业的人工智能和机器学习:用数据驱动价值的指南》

英文名: 《Artificial Intelligence and Machine Learning for Business: A No-Nonsense Guide to Data-Driven Technologies》
作者: Steven Finlay
出版时间: 2017

35270840.jpg

本书首先以预测模型为代表,介绍了人工智能和机器学习及其典型使用方法,然后解释了为什么机器学习很有价值以及如何用它来做出商业决策。作为一名具有20多年机器学习解决方案和实战经验的数据科学家,Steven 还在书中介绍了决策树、神经网络和深度学习及其他人工智能相关知识。

7. 《预测机器:人工智能的简单经济学》

英文名: 《Prediction Machines: The Simple Economics of Artificial Intelligence》
作者: Ajay Agrawal,‎ Joshua Gans,‎ Avi Goldfarb
出版时间: 2018

717PN6JWRuL.jpg

《预测机器:人工智能的简单经济学》是由三位战略管理和市场营销教授 Ajay,Joshua 和 Avi 联合撰写的一本具有深度预见性的书。该书重申了智能机器预测的力量和数据的重要性,接着还讨论了如何通过使用人工智能来优化商业决策、工作流程和管理运营。此外,本书最后还浅谈了在人工智能转型过程中一些值得关注的的社会风险和所带来的潜在影响等问题。

8. 《每个人都需要知道的人工智能那些事》

英文名: 《Artificial Intelligence: What Everyone Needs to Know》
作者: Jerry Kaplan
出版时间: 2016

51CmiM9moHL._SX332_BO1,204,203,200__.jpg

Jerry 是一位连续创业者和人工智能专家,他在这本书中将商业和科技无缝地结合在一起。本书首先介绍了人工智能的历史、最新进展以及人工智能的哲学,接着讨论了一些人工智能与法律之间有争议的话题。除了人工智能对商业的影响之外,Jerry 还谈到了其对未来人力劳动、社会公平可能产生的影响。

9. 《领导力的未来:自动化,机器人和人工智能的兴起》

英文名: 《The Future of Leadership: Rise of Automation, Robotics and Artificial Intelligence》
作者: Brigette Tasha Hyacinth
出版时间: 2017

511H4xIinML.jpg

这本人工智能书有三个部分:1. 自动化、机器人和人工智能的兴起; 2. 当今社会的领导力; 3. 未来的领导力。作为领导力和管理咨询领域的专家,Brigette 首先讨论了自动化对企业效率的提高及其对就业市场的影响,随着人工智能越来越聪明,本书也讨论了它是否会取代部分领导者的问题。最后,Brigette 指出,虽然人工智能可以取代某些类型的工作,但人工智能缺乏情商的缺陷会限制它只能取代部分人类的工作。

10.《“反扩张”:人工智能和新一代人如何创造未来经济》

英文名: Unscaled: How AI and a New Generation of Upstarts Are Creating the Economy of the Future
作者: Hemant Taneja
出版时间: 2018

513lQTcvXzL._SX321_BO1,204,203,200__.jpg

这本书的标题是“反扩张”,这一新术语的含义是未来科技会使中小企业具有强大的影响力和潜力,它违背了传统观念下人们对做生意的一致看法——越大越好。作为一名经验丰富的风险投资家,Hemant 解释了在能源、健康医疗、教育、金融、新媒体和新零售等各个行业中企业“不扩张”却效益大增的现象。除了对不同行业案列的介绍之外,本书还讨论了如政策、公司战略和个人选择等各种因素对实施人工智能转型带来的影响。

正如吴恩达所说的“AI是新电力”,那么如何有效和安全地使用这种“新电力”仍然是早期实施人工智能的一个问题。这些书可以帮助商业决策者理解人工智能,并以适当的方式使用它。本文虽然只是简单的介绍了这几本书,但希望读者可以从中获益并在之后去详细的汲取这些书中的精华。

  • May 11 / 2018
  • 0
Data

锐眼洞察丨在数字时代,有形数据仍然重要吗?(翻译)

原文:https://www.smartdatacollective.com/digital-age-tangible-visible-data-matters/

译者:TalkingData 曾晓春

本译文禁止商用,转载请注明来源!

创业公司和大型企业可能都希望将每项新技术全部应用在数字化转型当中,但以可靠的方式去结合数字化和有形数据才是唯一的出路。

对于那些在数字时代之前就已经成立的公司来说,最大的挑战之一可能是数字改革以及成功进行完整的数字化转型。而今,与客户的联系比以往更加紧密,而数字设备可以充当虚拟助手去帮助这一点。

此外,有一些思想活络的创业型公司,正在努力地争取关注度。为了保持竞争力,公司必须去适应数字世界。当谈到数字化转型时,现在正是最好的时机,不过在这条路上充满了挑战和障碍。

数字化转型需要什么

在供应链、工作流程的大为变化以及公司与客户的交互沟通上来说,现在的组织,如果想跟上不断变化的消费者需求,进行数字化转型是势在必行的,如果公司不做好准备并去接受技术变革,其产品或服务可能会被时代所抛弃。

随着人工智能、机器学习、云计算等层出不穷的理念和技术,企业必须以更快的速度去接受,从而满足当前客户的期望,如今的消费者期望与品牌之间的互动能产生立竿见影的效果,因为他们已经习惯于那些触手可及的信息,而这正是如今公司通过数字化改造所能达到的目标。

有形信息仍然重要

尽管对数字交互的需求不断加大,但在许多情况下,有形可见的数据仍然是最重要的,同样,技术采纳方面的差距也起到了一定的作用。例如,QR码(二维码)已经成为了司空见惯的事情,不过一些消费者不太可能去拿出智能手机扫描QR码来获取信息,而更喜欢用传统的方式阅读可见的标识或访问相关网站。

在其他情况下,监管问题阻碍了组织向数字化的过度,例如,扫描QR码甚至访问网站以获取必要且紧急的信息是不切实际的,法规规定这些信息在紧急出口和紧急除颤器(心脏除颤器又称电复律机)旁要显示清晰,并显示在显著位置(形式为金属铭牌或其他标牌)在重型设备或机器上。

引领数字转型成功

如果你准备好迎接数字世界,并且想带领公司走向未来,那么需要牢记三个重要的考虑因素:

1、有正确的目标

许多企业所面临的严重问题是没有明确的数字化转型目标,如果没有明确的目标和完善的计划,许多技术实施可能会不足或者更糟,最终以彻底失败而结束。这并不总是因为技术不起作用,而往往是因为公司试图去实施最新技术(即“新闪亮物体”综合征)即使它与客户的需求无关。根据Tech Pro Research的研究,只有20%的受访者表示他们已经制定了全面的数字化转型战略。

有一点是肯定的:在数字化转型的过程中会遇到各种挑战,因此,不仅需要有A计划,如果A计划不能平移,还需要B计划。获得所有关键利益相关者的支持也是必要的——每个部门负责人、每个董事会成员等等。所有利益相关者都应该清楚地了解这些技术如何影响和惠及他们各自的利益以及公司的利益。

从一开始就要有明确的目标,而不是去部署各种技术,寄希望于其中的某一个会起到作用。

2、全面看待

数字化转型项目失败的另一个原因是转型团队往往不能全面地看待整个业务,数字化转型影响着公司从上到下的每一个部门,数字化并不意味着单单将少数存储服务器切换到云端或更新的前端技术上。

数字化转型不仅是一个部分的事情。数字化转型项目想要成功,必须整合移动端、云、社交、人工智能、分析、物联网等方面。不仅如此,还必须让所有员工参与进来,提供必要的培训并做好准备迎接变化。你不能局部的做这件事,因为技术演进的日益加速——这也正是你开始考虑数字化转型的原因之一。

还需要把注意力从运营角度转移到分析新技术如何提供商业价值的角度,每个员工都像利益相关者一样,受到这种变化的影响加入并投资于转型中。

3、设定现实的期望

不要高估利用数据所提供的效果,因为仅仅现在拥有更好的数据及分析,并不能一夜之间改变整个公司。相反,要以数据为重点,去逐步进行变化并及时采取相关策略。变化过快会让员工和客户都感到困惑。

数字化转型不适合胆怯者,但是企业必须拥抱数字化转型才能在现代市场中保持竞争力。将可见的有形数据去作为数字化转型的补充,不仅可以保持合规性,还能帮助企业更顺利的进入数字化未来。

  • May 10 / 2018
  • 0
Data

从问题了解Jetty类加载机制

1、问题导出

由于机器的原因,将服务从一台机器迁移到另外的机器上,在迁移后,接受邮件请求,并将其发送出去的邮件基础服务 messages 不可使用了。现象就是服务仍旧可以接受请求,但不能异步的将邮件正常的发送出去,并报有以下错误。

image.png

针对以上错误,经过分析并查找原因,最终确定为是由于迁移后的jetty容器使用的是容器自带的 javax.mail.glassfish-1.4.1.v201005082020.jar,Jetty 容器优先加载容器中 lib 下的 javax.mail.internet. MimeMessage,而该类下,没有相应的方法,并且 WEB-INF/lib 下的 jar 包中类不能覆盖容器下 jar 包的类。

2、问题分析

image.png

那么有相应的方法,为什么还会报这样的错误:java.lang.NoSuchMethodError: javax.mail.internet.MimeMessage.setFrom(Ljava/lang/String;)V?最终怀疑是容器的问题,于是查看了所使用的 jetty 容器。

当前版本使用的 jetty 容器,比原来版本容器的 lib 下多个 jar 包:javax.mail.glassfish-1.4.1.v201005082020.jar,将该 jar 包下载下来,发现该包里面包含有相同的类,如下图所示:

image.png

MimeMessage 类,也确实有 setFrom 方法,但是没有参数是 String 的 setFrom 方法。

image.png

这说明 jetty 容器优先使用了容器中 lib 下的 jar,而非 WEB-INF/lib下的 jar,那么为什么优先使用 jetty 容器中 lib 下的 jar 包,而非 WEB-INF/lib 下的 jar 呢?

3、Jetty中lib下jar先于WEB-INF/lib下的jar加载

Jetty,Tomcat 等 web 容器通常都会对 ClassLoader 做扩展,因为一个正常的容器至少要保证其内部运行的多个 webapp 之间:私有的类库不受影响,并且公有的类库可以共享。这正好发挥 ClassLoader 的层级划分优势。Jetty 中有一个 org.eclipse.jetty.webapp.WebAppClassLoader,负责加载一个 webapp context 中的应用类,WebAppClassLoader 以系统类加载器作为 parent,用于加载系统类。不过servlet 规范使得 web 容器的 ClassLoader 比正常的 ClassLoader 委托模型稍稍复杂。下面我们先看一下关于 servlet 容器的 JSR 规范。

JSR 规范

Jetty 是 servlet 容器,这里查了一下 JSR315 servlet 3 中对 web application class loader 的要求:

Web Application Class Loader:

The class loader that a container uses to load a servlet in a WAR must allow the developer to load any resources contained in library JARs within the WAR following normal Java SE semantics using getResource. As described in the Java EE license agreement, servlet containers that are not part of a Java EE product should not allow the application to override Java SE platform classes, such as those in the java.* and javax.* namespaces.

不允许应用去覆盖 JAVA SE 的系统类

That Java SE does not allow to be modified. The container should not allow applications to override or access the container’s implementation classes.

不允许应用覆盖或存取容器的实现类

It is recommended also that the application class loader be implemented so that classes and resources packaged within the WAR are loaded in preference to classes and resources residing in container-wide library JARs. An implementation MUST also guarantee that for every web application deployed in a container, a call to Thread.currentThread.getContextClassLoader() MUST return a ClassLoader instance that implements the contract specified in this section.

每个应用调用 getContextClassLoader()返回的都应该是实现了本规范中定义的 class loader。

Furthermore, the ClassLoader instance MUST be a separate instance for each deployed web application.

每个应用的 class loader 必须要是独立的实例。

The container is required to set the thread context ClassLoader as described above before making any callbacks (including listener callbacks) into the web application, and set it back to the original ClassLoader, once the callback returns.

源码阅读

通过对 JSR 规范的理解,下面我们来阅读一下 Jetty 容器的代码实现,了解一下关于 JSR 规范的部分实现:

1、  系统类

Jetty 中以类的 package 路径名来区分,当类的 package 路径名位包含于以下路径时,会被认为是系统类。WebAppContext 中配置如下:

image.png

因此,我们可以通过 org.eclipse.jetty.webapp.WebAppContext.setSystemClasses(String Array) 或者 org.eclipse.jetty.webapp.WebAppContext.addSystemClass(String) 来设置系统类。 系统类是对多应用都可见。

2、  Server类

Server 类不对任何应用可见,Jetty 同样是用 package 路径名来区分哪些是 Server 类。WebAppContext 中配置如下:

image.png

我们可以通过, org.eclipse.jetty.webapp.WebAppContext.setServerClasses(String Array) 或 org.eclipse.jetty.webapp.WebAppContext.addServerClass(String) 方法设置 Server 类。 注意,Server 类是对所有应用都不可见的,但是 WEB-INF/lib 下的类可以替换 Server 类。

3、自定义 WebApp ClassLoader

当默认的 WebAppClassLoader 不能满足需求时,可以自定义 WebApp ClassLoader,不过 Jetty 建议自定义的 ClassLoader 要扩展于默认的 WebAppClassLoader 实现。这里我们来看一下 WebAppClassLoader:

WebAppClassLoader的构造器:

image.png

WebAppClassLoader 还是按照正常的范式设置 parent ClassLoader,如果当前线程上下文中设定了 ClassLoader 就以当前线程上下文类加载器为父 ClassLoader,否则使用 WebAppClassLoader 的加载器,如果还没有,就采用系统类加载器。详细的加载过程请看 WebAppClassLoader的loadClass() 方法:

image.png

通过阅读源码,我们了解到,当在容器中启动一个服务的时候,容器的 jar 包和 class 文件加载顺序是:

  1. 优先加载 JDK 和 JRE 所需的 jar 包和 class 文件
  2. 加载容器所需的 jar 包和 class 文件
  3. 加载项目路径 /WEB-INF/class 下的文件
  4. 加载项目路径 /WEB-INF/lib 下的 jar 文件

注意:同一个文件夹下,jar包是按顺序从上到下依次加载

这里列举了启动一个 tomcat 服务的时候,jar 包和 class 文件的加载顺序:

  1. $java_home/lib 目录下的 java 核心 api
  2. $java_home/lib/ext 目录下的 java 扩展 jar 包
  3. java -classpath/-Djava.class.path 所指的目录下的类与 jar 包
  4. $CATALINA_HOME/common 目录下按照文件夹的顺序从上往下依次加载
  5. $CATALINA_HOME/server 目录下按照文件夹的顺序从上往下依次加载
  6. $CATALINA_BASE/shared 目录下按照文件夹的顺序从上往下依次加载
  7. 我们的项目路径 /WEB-INF/classes 下的 class 文件
  8. 我们的项目路径 /WEB-INF/lib下的 jar 文件

4总结

通过以上分析,对于该问题的最终的解释就是:jetty 容器中 lib 下的 jar 包先于 WEB-INF中lib 下 jar 包加载,而且 WEB-INF/lib下的 jar包中类不能覆盖容器下 jar 包的类。

  • May 09 / 2018
  • 0
Data

献给对“弊”圈一无所知的你

口气略大,萌喵镇楼~~

对广告监测无所不知的精英男女们,一起看个热闹、巩固下知识点。

初入移动广告行业的广告主们,get本文你将获得行业生存的新型能力。

移动广告作弊圈(简称弊圈)的4种作弊技术:模拟器劫持刷机墙真人群刷,因受到大量作弊者粉丝喜爱,被称为弊圈“四大天王”。虽然就败坏的道德而言,彼此平等。但就作弊技术而言,千差万别、各有千秋。也因此,弊圈的“四大天王”,存在着一条“我看你的作弊技术很Low”相互diss的鄙视链。

在以往与弊圈相关的文里,我们对推广中的作弊技术做过简单介绍。但从未提及“弊”圈不和,相互瞧不起这些事儿。现在,带一众混迹移动广告行业的广告主,深入弊圈,观摩“四大天王”大型互鄙现场。

现场直播

 

模拟器 弊圈昵称:模王

本模王座下拥有众多品种模拟器,其易容技能十分了得。可零成本随意变换机型、系统版本。在搭配我最近新收的可修改机器IP的小弟(软件),使我的粉丝团——模丝们用起来广告作弊效果更佳!凭借着无水分作弊技术涵养,本模王完全有资格在弊圈内说“我不针对谁,我是说在座的各位都是辣鸡”这句话。

特殊技能:百变造型,搭配随心。IP地址,说换就换。
良心指数:❤

刷机墙 弊圈昵称:保密

楼上真是好大的口气, 量大钱少才是作弊之道。模拟器连对待广告主该有的真诚都没有,我可是诚意十足、态度端正,全部真机刷量。什么微信阅读、CPC、CPA……各种指标信手拈来。只要我愿意,不管多少流量都不在话下。 如果心情好,说不定我还会给广告主多刷几天留存。刷机墙,才是广告作弊骗取钱财的必备工具,哈哈哈哈!

特殊技能:量大钱少,真机服务。
良心指数:❤❤

劫持 弊圈昵称:主持(主动劫持)

选择一条对的路,比成倍付出努力要重要的多。本主持深谙此道,只要怀揣觊觎之心,就可赚的盆丰钵满。每当有从手机浏览器或pc端下载软件到手机,主动出击提示用户有安装风险,让用户从手机厂商的应用市场去下载。不费一兵一卒,直接获益之法你们和我多学学。

特殊技能:伺机而动,不放过劫持流量任何机会。
良心指数:无

真人群刷 弊圈昵称:老实人

只有广告主想不到的,没有我们做不到的。您是刷点击、激活还是注册、留存,组合指标我们也是可以的。一旦接到您的流量订单,我们就通过兼职网站、qq群等召集一票大学生、社会闲散人员。用勤劳的双手,真实的手机完成您的流量需求。

真人群刷,不仅稳定了社会治安,说不定在做单的时候发现广告主产品实用,就转化成真用户了呢。

特殊技能:量大钱少,真机服务。
良心指数:❤❤

直播结束

 

相信移动广告行业的少男少女们,通过对弊圈diss现场直播的观看,对作弊技术有了进一步的认知。刷机墙,略微有些技术含量;劫持,不参假的流氓行为;刷机墙,购买后用来刷量的真实机器;真人群刷,真人、真机、假量。

如果广告主们在推广时,遇上了“四大天王”并又很不幸的遭受到来自“四大天王”的组合拳。那么,广告主们很难不会面临推广费打水漂、营销指标增长全部为假量的人间惨剧。

如何让推广费在“四大天王”的夹击中幸免于难,就成为了本篇最重要的中心话题。TalkingData Ad Tracking的五大防作弊体系和分包统计功能,可识别各种作弊技术,轻松应对“四大天王”每一次作弊,帮助广告主量化推广效果和优化投放策略。移动广告行业的少男少女们,我们现在就一起了解下TalkingData Ad Tracking的这两部分功能吧~

五大防作弊体系

1. 防刷量SDK

TalkingData Ad Tracking通过SDK集成的作弊防护模块,进行数据通道加密确保传输安全;收到激活请求时,服务器端将拦截伪造激活数据,提升整体数据传输安全系数。并且加入行为识别技术,通过终端位置变化、传感器数据建立的模型,识别出哪些是问题设备;

2. TDID身份验证

拥有唯一身份的TDID作为验证,至少3次的数据清洗、排重、过滤、确保数据精准。实时反馈异常数据,通过Cookie排重、IP段排重、点击有效期限制、异常数据;

3. 转化时差

“转化时差”也是激活作弊的一种典型,移动广告行为点击、下载、激活等步骤,每个步骤都有对应的时间,设置异常时差范围,在分析点击和激活的时差后,校验时差设定范围,将激活转化过快的设备归为异常;

4.IP段防护

通过点击激活IP进行分析,从大量的作弊日志中发现某个时间段内,点击或激活的IP过于集中,将提供基于异常IP段防护策略设定峰值,超过峰值范围将被归为异常数据进行处理;

5. 持续ROI

ROI考量是衡量渠道质量的有效手段,持续考量用户后续转化,促进用户付费转化才是推广的最终目的。用户激活后,TalkingData Ad Tracking将为永久追踪其后续留存、付费转化情况,以监测广告真实效果。

分包统计

1.双维度数据统计

在所有安卓激活及效果点击的数据,系统将基于分包ID和媒体点击进行双维度归因。通过Ad Tracking的报表,应用开发者可了解每个渠道包的用户转化,以及使用Ad Tracking监测链接分包推广的点击监测,了解用户点击带来的转化数据;

2.分包数据统一管理

应用开发者无需再在Ad Tracking系统中生成渠道ID,系统将自动记录所有的渠道包ID。

  • May 08 / 2018
  • 0
Data

证券行业移动App行为数据研究的商业价值

证券行业的客户金融交易渠道正在转向移动互联网,客户证券投资和财富管理服务将主要发生在移动App,其将成为客户的主要入口和金融产品主要发布场所。

证券企业如果想赢得未来市场、赢得客户,取得在金融市场的领先优势,就必须了解客户对金融产品的需求,重视客户的交易行为和互动行为数据。

利用数据提升客户体验,提升移动互联网端的数据和业务运营能力,具有同互联网企业一样的技术能力和迭代速度。重视用户的移动端行为数据将成为证券行业未来在市场成败的一个关键。

证券行业过去主要分析交易数据、资产数据、产品数据、人口属性数据。典型数据应用有数据库营销中的关联分析和交叉销售。交易数据对营销具有较大的商业价值,特别是老客户经营。例如某些产品的客户复购率较高,利用交易数据可以进行多次营销,降低营销成本。

行为数据相对于交易数据具有不确定性大的特点,行为数据更关注客户的兴趣偏好,更适合用于了解客户体验和用户潜在金融需求。利用App行为数据进行营销,具有范围广、预测性强等优点,缺点主要在于其营销的业务转化率不太稳定。考虑到潜在的目标人群基数较大,即使是较低的转化率,其转化的目标客户也会很多。

曾经在一个案例中,利用资讯推送来影响客户进行投资,转化率接近40%,大大超出了预期。一般行为数据营销的转化率低于10%,集中在1%-5%之间。如果低于1%的转化率,这个基于行为数据建立的营销方案将会被放弃。

行为数据的场景应用是建立在场景化标签之上的,基于App内部行为的场景应用来源于具体业务目标,例如证券App中的绑卡入金、购买理财、股票交易、基金买卖,贵金属购买、关注收藏等。

No.1 行为数据分析有助于加速产品迭代和提升客户体验

App行为数据包含浏览、点击、评论、交易等几类,可以通过App的按钮和事件埋点进行提取。经过异常值处理和数据去噪音之后,就可以进行分析和应用。移动互联网企业BAT等巨头,其产品和用户体验的竞争力就是来源于行为数据的分析和应用。

过去证券行业人员可以通过线下的营业网点来接触客户,利用同客户面对面的交流,了解客户的金融产品需求和用户体验。现在客户几乎不再去营业场所,或者去证券营业部的客户年龄都较大。光大银行曾做过统计,经常到营业网点办理业务的客户,平均年龄为52岁,说明年轻客户基本上很少去网点办理业务。

而年轻客户正是证券行业主要的客群,未来将会成为证券企业的主要收入来源。证券企业如果想了解客户的金融需求和用户体验,其主要的方式就变成了分析App的行为数据,这也说明了研究分析App行为数据的重要性。

在互联网企业中,App运营团队有一个重要的职责就是每天分析App的行为数据,主要是因为行为数据代表了客户对产品的喜好。基于对App行为数据的分析,互联网企业的产品经理可以及时调整产品,进行产品迭代,快速满足客户对移动产品的需求。互联网企业产品迭代完全基于App行为数据的分析结果。

客户在App的点击行为和浏览数据,辅以时间维度分析和漏斗分析,可以真实反应客户体验情况。互联网企业的运营部门参考这个数据可以分析客户喜欢哪些产品、广告、活动等,反之亦然。利用行为数据分析,运营部门可以实时了解客户体验情况,及时调整运营活动和产品布局,围绕客户需求来提升客户体验。移动互联网时代,客户体验比产品本身更加重要。

证券行业一直想学习和掌握互联网企业的竞争优势,特别是在产品迭代和用户体验提升两个方面。行为数据分析为证券行业产品迭代和体验提升提供了技术支持。证券企业完全可以深度分析App行为数据,利用行为数据分析结果来进行产品迭代和用户体验提升。

例如,证券行业可以通过分析App的点击热力图,来了解客户喜欢哪些功能,客户很少点击的功能就可以及时下架。参考AB 测试的数据来分析客户更加喜欢哪些功能,基于客户点击喜好进行App的功能迭代和用户体验提升。证券行业还可以依据客户DAU、留存时间、打开次数等行为数据,了解客户对App的体验反馈,留存时间增加和打开次数增多反映了用户对App的喜爱程度的增加。实时反馈的行为数据可以及时让证券行业了解体验情况并及时进行产品迭代。

证券移动App的行为数据具有直观、实时、客观等特点。基于行为数据的分析对于了解客户体验和产品偏好具有重要意义,是证券行业产品迭代和用户体验提升的基础数据,证券行业必须重视对其的研究和应用。

No.2行为数据研究有助于提升券商互联网运营能力

互联网行业有一句经典的话,三分产品七分运营,好的产品不是设计出来的而是运营出来的。互联网运营的基础就是行为数据的分析,运营团队借助行为数据的分析实现运营能力的提升。

证券企业希望学习互联网企业的数据运营能力,其主要体现在对数据的分析和应用能力,包括基于数据的产品运营、渠道运营、用户运营、活动运营等。这些运营能力是建立在数据分析和应用基础之上的,其中行为数据应用能力是其重要组成部分。

产品运营的核心工作就是产品优化,包括UI/UE与产品框架,以及内容建设、产品维护、用户维护、活动策划等。用户需求不断变化,需要对产品进行持续的迭代完善才能满足用户需求,没有运营则无法时刻洞察用户需求变化;运营是让产品持续产生产品价值和商业价值。行为数据是产品进行优化的基础,基于行为数据中的点击数据和浏览数据,运营团队可以了解客户对UI和产品的喜好、对内容的关注、对活动的反馈,依据行为数据分析进行产品迭代和优化,行为数据是产品运营的重要参考。

渠道运营是指利用资源和流量为产品带来新增用户,包括免费、付费、换量、人脉积攒、产品的吸引力、圈内人的推荐、策划活动、内容营销、用户口碑等手段。互联网线上渠道发展比较野蛮,鱼龙混杂。特别是移动App推广市场,不但流量贵,而且充斥虚假流量。参考《TalkingData发布的2017年移动互联网行业发展报告》,在某些高峰时段,一些渠道的虚假流量超过了50%,也就是说至少有一半的点击和下载是无效的,广告推广费用是浪费的。曾经在某一个特殊时间段,TalkingData移动广告监测平台Ad Tracking在一天时间内统计到24亿次点击,其中90%的点击是恶意刷量。

券商利用App的行为数据可以有效分析出哪些渠道效果好、真实流量比例高,哪些渠道效果差、虚假流量明显。通过对行为数据的分析,还可以判断出哪些是真正的客户,哪些是一次性客户,哪些是羊毛党客户,哪些是有效客户。通过App渠道分析数据,券商可以降低广告投放费用,提升线上获客质量,提升广告获客的ROI。行为数据是渠道运营的重要参考指标,通过App渠道数据的分析,可以提升券商在移动互联网渠道的运营能力。

用户运营指以用户为中心,遵循用户的生命周期价值点和用户产品需求设置运营活动与规则,制定运营战略与运营目标,严格控制实施过程与结果,以达到预期所设置的运营目标与任务。用户运营最直接的价值,就是提升用户金融产品的复购率、提升单客价值、激活休眠客户、挽留流失客户、发现潜在客户等。证券行业面临较大的挑战,包括休眠客户比例过高、客户单客价值不高、流失客户明显等等问题,都可以通过行为数据分析找到解决办法。

例如,通过客户点击和关注的数据,了解客户资讯需求,主动推送相关资讯,激活休眠客户。利用点击和浏览行为数据趋势分析,及时了解客户流失倾向,结合客户产品喜好和兴趣爱好,定制激励方案,挽回流失客户。行为数据可以直观反映出客户兴趣和喜好,为用户运营提供方案支持,具有非常大的参考价值。

券商如果希望在产品运营、渠道运营、用户运营等方面具有与互联网企业同样的技术和运营能力,就需要重视行为数据的分析和应用。

No.3行为数据应用是券商业务智能化发展的基础

证券行业智能化发展是必然趋势,一方面是智能化应用的技术条件已具备,例如数据处理能力、模型算法能力、专业人才储备;一方面是券商所面临的经营成本高、效率低、客户服务覆盖率低等问题,都可以通过智能化应用来解决。

证券行业智能化应用的广义涵义,是借助工具平台和智能应用来解决具体的业务问题。这些业务问题,可能是个人投顾无法直接服务全体客户;可能是传统电话客户服务成本高、效率低,客户体验不好;可能是内部流程效率较低,无法满足客户变化的金融需求;也可能是投研和投顾人员缺少可以服务客户资讯平台等。

证券行业智能化应用狭义的应用领域,包含智能投顾(机器人理财)、智能客服、智能资讯推荐、智能投研数据平台、智能数据应用平台等。其主要解决的还是效率问题,本质还是券商服务的自动化和智能化,可以提升客户体验和降低服务成本。

证券行业智能化应用的一个前提是海量数据,包含交易数据和行为数据。但是这些数据不是原始数据,而是经过业务专家标注的、具有业务价值的数据,可能是标签数据、归类数据和分析结果数据。

行为数据对于智能应用具有较大的商业价值,例如在智能客服中,客户的行为数据代表其产品和风险偏好,智能客服可以基于这些处理过的行为数据,为客户打上标签。基于行为数据进行客户分群或分层,智能客服将参考这些行为数据定制客户服务内容,直接有效地为客户提供金融产品服务。借助于行为数据标签,智能客服将会缩短服务路径,直接切入客户喜好,提升客户体验,提高服务效率。

例如,如果行为数据揭示客户倾向于港股交易,智能客服在服务时就可以侧重于港股资讯。如果客户有融资融券倾向,智能客服就可以提供相关介绍和激励措施。如果行为数据揭示客户倾向投资能源板块,智能客服就可以提供更多的能源资讯,为客户投资提供参考。

智能投顾的原理是参考客户投资风险偏好和投资兴趣,为客户定制投资组合,在一定风险可控的前提下,获得一定的最优收益。行为数据可以支撑智能投顾中客户的投资偏好洞察,通过对客户点击、浏览、关注等行为数据的分析,券商可以了解客户的投资兴趣偏好。

例如客户点击股票所属的板块、关注的交易板块、浏览的资讯,这些行为都可以在一定程度上反映客户的投资兴趣,经过一定分析和加工之后,可以作为标签类数据输入到智能投顾平台,作为智能投顾推荐投资组合的参考信息,有助于提升智能投顾的客户体验和客户购买转化率。

券商移动App行为数据具有intention属性,代表了客户内心的需要,也可以认为是客户理性行为和感性行为的综合,其中感性成分更高一些。中国的投资客户,大部分体现为理性投资客户,但是在进行证券交易时往往体现的是感性一面。因此研究行为数据有利于了解客户心理行为,也就是客户感性行为。行为数据经过加工处理之后,可以表现为标签数据,结合业务场景和交易数据,帮助券商更加客观了解客户金融需求。

券商可以针对客户的兴趣爱好,提供相应的智能资讯和投研报告,协助客户作出更加客观的投资决策。行为数据结合相应的资讯,可以缩短客户决策周期,提升客户交易积极性,有助于提升客户交易额和交易频度。例如,通过行为数据的分析,推送客户关注股票板块的资讯,通过不同组客户测试,发现收到资讯的客户其交易下单率高于非收到资讯客户30%,而收到相应板块资讯的客户其交易下单率高于非收到相关资讯客户50%。

总之,对移动App行为数据的分析和应用可以帮助券商加速产品迭代和提升客户体验,建设与互联网企业同样领先的运营能力,并为券商智能化应用提供具有较高商业价值的数据,推动券商智能化应用的发展。

相关阅读:

搭建三级标签体系,提效证券App运营

三大方面、两个案例,解析用行为数据提升证券App用户体验

咨询专栏 | 券商App行为数据驱动核心业务优化

页面:1234567...20
随时欢迎您 联系我们