:::: MENU ::::

TalkingData's Blog

现在开始,用数据说话。

Blog

  • Apr 25 / 2018
  • 0
Data, News

TalkingData发布“透明化”Ad Tracking合作伙伴平台

TalkingData发布“透明化”Ad Tracking合作伙伴平台

基于TalkingData Ad Tracking移动广告监测平台数据,2017年,移动效果广告点击总量相比2016年增长超过17倍;移动效果广告推广激活总量同比增长41.9%,点击量增速远超激活,利用虚假点击刷量情况依然不容忽视。

过去一年,TalkingData Ad Tracking一直致力于打击黑产刷量,陆续曝光了一批刷量渠道以及相关作弊手段,并上线发布相关反作弊产品模块。《制衡刷量“四大术”,TalkingData Ad Tracking上线高级版作弊防护功能》

在统计相关刷量数据时,TalkingData Ad Tracking团队发现了大量监测短链套用现象,导致媒体、广告主、代理商之间出现了明显分歧。为了保证渠道合作伙伴的权益,更准确的量化渠道价值,2018年4月,TalkingData发布了“透明化”Ad Tracking合作伙伴平台,针对性解决监测短链套用问题,赋能于合作伙伴,打造公开透明的广告监测生态。

TalkingData Ad Tracking合作伙伴平台

合作伙伴可以通过平台监控渠道下所有推广活动,并进行审核操作,一旦发现套用情况,可将其立即拒绝,Ad Tracking系统将即刻停止接收推广活动数据,避免出现渠道数据统计偏差;

TalkingData发布“透明化”Ad Tracking合作伙伴平台

Ad Tracking合作伙伴平台Demo产品图

在解决监测短链套用问题的同时,TalkingData Ad Tracking合作伙伴平台还向广大合作伙伴提供了流量基本数据查看权限,合作伙伴可以直接通过平台了解推广活动广告流量及转化数据,避免了繁复的授权过程,缩减人力成本

TalkingData Ad Tracking将秉持以“客户优先”的企业价值观,持续加强产品功能,与各大广告平台保持牢固的合作伙伴关系,继续优化数据挖掘算法,与广告主、媒体、广告网络、代理商等携手打造更加透明的广告生态,推动行业向更加良性的方向发展。

即日起,已入驻TalkingData Ad Tracking的合作伙伴即可申请开通平台账户,开通方式:

  • 合作伙伴技术沟通群(优先)
  • 24小时值班电话:4008701230
  • TalkingData 技术支持群:203585475
  • Apr 25 / 2018
  • 0
Data, Enterprise, News

TalkingData马骥出席QCon,分享前端黑科技

TalkingData研发副总裁马骥近日出席QCon全球软件开发大会北京站,并在会上做了以《2018,你不知道的前端黑科技》为主题的演讲。

QCon全球软件开发大会由极客邦科技与InfoQ中国主办,致力于分享和交流新技术在行业应用中的最新实践,助力企业技术选型、业务升级与顺利转型。本次北京站大会规模再创新高,汇聚来自300余家企业的2500余名技术人,其中80%以上的参会者为资深技术人;担任出品人及演讲嘉宾的技术专家超过200名,90%的专家拥有10年以上从业经验,多来自国内外行业领军企业和创新技术公司。

TalkingData马骥出席QCon,分享前端黑科技

QCon北京2018

在Web技术发展的近20年来,有高潮也有低谷。当遇到瓶颈时,必须要用创新的思路及想法去解决,才能形成突破。在大会次日的“技术创新与前沿应用专场”中,TalkingData研发副总裁马骥以《2018,你不知道的前端黑科技》为主题,分享TalkingData近几年在大数据Web开发中一些创新和突破,包括绘制百万行的数据表格、位置大数据地图矢量绘制、Web端数据科学实践及Web端并行计算框架设计。

TalkingData马骥出席QCon,分享前端黑科技

TalkingData研发副总裁 马骥

平滑流畅的绘制百万行数据表格

马骥表示,根据产品需求,要求以表格形式绘制百万条超大体量POI数据显示。首先遇到的瓶颈是DOM渲染,当数据量达到一万两万、甚至十几万的时候,表格非常卡顿,且CPU占用率极高。

通过排查,发现问题在于所使用的VUE框架下getter和setter所做的数据双向绑定。当所绑定的数据集非常大时,性能就会出现问题。

TalkingData马骥出席QCon,分享前端黑科技

最后改为使用Object.preventExtensions、Object.seal、Object.freeze(扩展对象、密封对象、冻结对象),解决了性能问题,实现了百万行表格的平滑展现,良好承载了对地图和表格之间很重的检索需求。最终效果是,当击右侧一行数据,对应的地图POI点可以高亮显示;反之,点击地图上POI点要显示在数据表格里对应的数据,交互体验超出预期。

Web端数据科学实践

1、自动化配色

马骥认为,自动化是web端很好的数据科学场景。在TalkingData去年开源的地图可视化组件InMap中,对通过自动化提升效率做了重点尝试。据分析,很多数据分析师要花30%的工作量去调整数据可视化的样式,比如调整地图的配色上,这对非设计专业的人来说非常痛苦。如果能提供自动化的配色方案,则会能在很大程度上降低这一成本。

TalkingData马骥出席QCon,分享前端黑科技

在TalkingData的实践中,要先对数据形态进行判断,用四分位以及平均数初步判断数据形态的分布和趋势,用大数据评估是指数型还是线型。然后用色谱通过获取面积等分点模型获取设置区间,最后通过自定义自动化完成自动配色。

2、异常数据检测

大数据永远都会有异常,而数据能否使用,需要进行检测,最基础的就是数据类型的检测。

马骥分享,TalkingData通过统计学模型——四分位的法则去做相对比较宽松的验证,比如四分位、上四分位和下四分位之间的三倍。

TalkingData马骥出席QCon,分享前端黑科技

针对其中最为复杂的异常位置数据检测,马骥带领的团队查询相关论文,将Python版本翻译成JavaScript版本实现,原理是计算两点一线的距离,当距离越大时则密度越低,当距离越小则密度越大,这样就可以将异常点计算出来。

Web端并行计算架构设计

马骥认为,web端的密集型计算是可视化的挑战,其瓶颈在于JavaScript本身,因为JavaScript是一个单线程语言,这就导致一方面CPU的利用率偏低,另一方面密集计算执行需要等待。

在TalkingData InMap的架构实践中,通过增加前端能力,通过前后端协同提升整体性能,进而将服务器端的很多能力转移到客户端去实现,使客户端也具有计算能力,实现业务逻辑和计算能力逐渐上移。

TalkingData马骥出席QCon,分享前端黑科技

InMap架构图

  • Apr 25 / 2018
  • 0
Data, Enterprise, News

投资人群洞察报告

背景

  • 金融行业告别野蛮增长,进入存量客户的精细化运营时代
  • 精细化运营的目标之一是扩大资产规模,转向财富管理
  • 如何服务不同投资偏好的人群,TalkingData用数据分析给出建议

报告部分总结

  • 70后、90后热爱奢侈品的人群更有可能成为基金投资人群。与奢侈品平台进行异业合作可能成为首选。
  • 基金投资以及炒股人群中有杠杆交易行为的基金投资人群,更可能转化为财富管理客户。
  • 银行的大量理财客户同证券客户有较大重叠,先从此部分人群开始运营,收效比较显著。

研究目的:为什么要撰写本篇报告?

  • 在存量客户经营时代,线上业务如何服务财富管理人群,抓住互联网转型第二波浪潮?
  • TalkingData创新金融部从“投资人群”的洞察报告入手,专项分析投资人群中的“手机银行人群”、“基金理财人群”、“财富管理类人群”等人群,结合行业数据和TalkingData数据,为财富管理人群洞察和营销提供建议。

投资人群洞察报告

1.1 炒股人群理财属性

除了占比最高的证券投资属性以外,炒股人群偏爱的投资理财方式是货币基金,紧随其后的有财富管理,手机银行,借贷,直销保险等等。通过证券投资人群的前三名我们将在后面分析炒股人群分别与“手机银行人群”、“货币基金人群”、“财富管理人群”等人群的差异。

投资人群洞察报告

数据来源:TalkingData

1.2 投资人群分层模型

我们将金融行业中的理财金字塔概念放在本章用于解释报告的逻辑,但是因为分析的主题为人群而不是具体的投资产品,所以分层的依据为客群数量多少以及相对应的客户净值的高低。

  • 金字塔底层人群基数大但客户净值低,整体服务成本高,建议提供线上服务。
  • 金字塔顶层人群基数少但客户净值高,单个客户收益高,建议提供线下服务。
  • 针对每一个层次提供基于特殊的人群属性向上增销、转化、定位的建议。

投资人群洞察报告

2.1 手机银行客户分析

人群定义:该人群画像具有诸如有手机银行理财行为,或是手机上没有安装任何券商资讯、证券交易等APP的行为特点。

80后是炒股散户主力军

在使用了手机银行但是没有炒股偏好的人群中我们发现,90后、70后的比率更高,与后面的基金购买人群相似。且中年人群(46岁以上)在手机银行上的行为比炒股更频繁。券商需要思考如何将90后拉回来、如何保留住70后,银行则要思考如何为80后提供更好的投资服务。

投资人群洞察报告

数据来源:TalkingData

2.2 游戏无法填补我被割韭菜的忧伤

通过深度的游戏标签属性,我们可以发现,理财偏好为手机银行端且没有炒股相关APP的人群的更爱玩游戏,其中每天会有至少一次游戏行为的用户超过20%;而相比之下此类用户在炒股人群中仅占7.73%。高频游戏人群在手机银行人群中的比率为炒股人群中的近三倍。

手机银行理财人群的游戏付费意愿更高,有更多人在游戏中花费超过5000元。炒股人群不太热爱玩游戏,但针对手机银行理财人群,游戏化运营可能是一个不错的尝试。

投资人群洞察报告

数据来源:TalkingData

2.3 我与韭菜之间可能只差一个APP

通过分析炒股人群以及手机银行理财人群可以发现,炒股人群中几乎所有人都会关注财经资讯,而在银行理财人群中则只有不到5%的占比。但是两种人群都爱阅读科技资讯类读物。此外,炒股人群更多关注财富管理产品。券商与其在大流量平台买流量,不如在财经资讯类渠道投放广告,说不定会有惊喜。科技资讯和阅读可以作为一种服务,为银行客群提供更好用户体验。

投资人群洞察报告

数据来源:TalkingData

3.1 炒股人群洞察

人群定义:该人群画像为下载了诸如“东方财富网”、“同花顺”、“雪球”等股票资讯软件的移动端活跃人群,并经过过滤刷量、数据去重等数据处理后的“炒股偏好人群”。

KYC – 炒股人群性别分布

炒股人群中男性占比最大,超过74%的炒股人群为男性,超过全量数据的51%,将近四分之一。

券商移动APP的设计风格可以重点考虑男性客户需求,运营活动的话术需要简单明了,小清新风格不适合券商炒股人群。

券商的财经资讯在选择上需要偏向男性投资者需求,考虑增加政治、军事、科技、宏观经济等分析报告。

投资人群洞察报告

数据来源:TalkingData

3.2 KYC – 炒股人群年龄分布

炒股人群呈现年轻化,其中19-35岁的人群占比超过68%,相比在总人群中26%的占比超过一半还多。

券商APP的功能设计需要围绕年轻人群需求,不求界面复杂,但求简单明了,突出投资和交易特色。

年轻人重视客户体验、对活动响应率高,券商APP的色彩年轻化和深化活动运营有可能是个不错的尝试。

投资人群洞察报告

数据来自:TalkingData请点击此处输入图片描述

3.3 百度指数 – 炒股相关需求图谱

成功定位到炒股人群后。 如何精准触达这一群体?

通过在2018年2月的百度指数中搜索炒股人群以及其相关度,我们发现,搜索“炒股”的人群可能是爱奇艺、优酷的用户。喜欢玩GTA5(侠盗猎车5),常逛bilibili,也经常会去斗鱼或者虎牙观看直播。

这些行为在移动端也有一样的表现呢? 我们将在后面通过TalkingData的数据库进行验证。

投资人群洞察报告

数据来自:百度指数官网、TalkingData

3.4 进击的二次元

根据百度指数的数据,炒股人群中,使用b站的人数比率大大超过了总人群的使用比率,为垂直视频领域中占比最高的网站。

比起爱奇艺,炒股人群更偏爱使用优酷作为主要的视频观看媒介,印证了百度趋势的相关度。

营销上,结合TalkingData在金融广告投放方面的经验,建议在优酷上可以进行以品牌曝光为主的投放。

投资人群洞察报告

数据来源:TalkingData

3.5 老铁,火箭走一波!

炒股人群中,不管是使用斗鱼还是虎牙直播的用户明显比率更高。印证了百度趋势的相关度。

尽管虎牙以及斗鱼是知名的游戏弹幕直播平台,但在虎牙以及斗鱼上直播分享理财知识的也大有人在。其他品牌已经在进行流量渗透了,你呢?

投资人群洞察报告

数据来源:TalkingData

3.6 成不了富翁,我们还有GTA5

在游戏偏好中我们发现,炒股人群中喜爱动作射击类游戏(亦如GTA5)的人群占比远远不及总人群。为什么呢?

进一步研究我们发现,GTA5内置炒股系统(线上为BAWSAQ,单机为LCN)。许多搜索“炒股”关键词的人其实是在搜索GTA5游戏中的股票,这也就解释了为什么关键字“炒股”与“GTA5”关联度高,但是炒股人群对动作射击类游戏偏好较低。

3.7 投资是一种信仰,从天天德州开始

相较于总人群,炒股人群的游戏属性较弱,比较偏爱扑克棋牌、经营、策略类游戏。与投资、经营有关的游戏更受炒股人群的喜爱。比如天天德州。

可以结合三方数据找出有投资、经营类游戏行为的人群,进行定向投放或者异业合作。

投资人群洞察报告

数据来源:TalkingData

3.8 入的了贵宾厅,出得了地铁站,骑得了小黄车

炒股人群有明显的商旅特征,包括更显著的酒店、公交出行以及航空出行类应用偏好。共享单车的使用比率也略高于总人群。券商无法像银行信用卡一样通过商旅权益吸引客户,但是因为券商的展业代理人一般会银行网点驻场,那么选择商旅权益较好的信用卡的银行网点驻场在开户获客上或许会更高效。

投资人群洞察报告

数据来源:TalkingData

3.9 上班艰苦阻挡不了我对股票的热情

炒股人群设备活跃时段是比较典型的上班族活跃曲线,白天的活跃时段波段比较平稳,在下午的一点到五点会有比较小幅度的缩减。

早晨活跃时段开始于早上六点,在十点左右达到峰值。晚上的峰值在八点左右,在晚上十点左右开始出现下降,凌晨五点左右到达一天最低谷。可以结合券商公众号的运营团队,将公众号发布的时间设定为 早上十点或晚上八点为图文触达最佳时机。

投资人群洞察报告

数据来源:TalkingData

通过以上炒股人群的行为特征,我们可以大致描绘出炒股人群的一天。

投资人群洞察报告

4 . 基金人群

基金理财人群定义:在TalkingData数据中有“基金理财”标签的人群,该类人群画像具有下载了诸如“财富通”、“陆金所”等基金理财相关APP,或是证券交易用户,或有其他基金理财性质行为特点。

4.1 70后、90后更乐意购买基金

基金人群与炒股人群高度相关(基金理财人群中大部分都是炒股人群,或者说大部分是从炒股人群中转型的)。我们尝试去找出“货币基金人群”和“炒股人群”的差别,为“如何将炒股人群”转化为“基金购买人群”的课题提供数据驱动决策的指导。

我们发现基金人群在19-25岁、36-55岁的维度占比更高。可以总结出,80后更偏爱个人决策炒股,90后、70后更偏向将资金交给基金。

投资人群洞察报告

数据来源:TalkingData

4.2 买过最奢侈的东西就是基金了

通过下图我们可以发现,相较于炒股人群,基金人群在消费定位上更偏好奢侈品以及高端品牌。可以总结出,基金人群平均净值比平均炒股人群高,或者说炒股人群中净值高且有奢侈品消费行为的人群更容易转化为基金客户。通过与奢侈品平台进行异业合作既能为品牌提升声誉,投放的TGI可能也会更高。

投资人群洞察报告

数据来源:TalkingData

4.3基金人群更偏爱BATJ承载的产品

在内容分享类APP中,知乎在两种人群的使用比率都较高。此外,垂直类视频网站中,基金人群更偏爱咪咕影院,炒股人群更偏爱bilibili。货币基金APP中,炒股人群偏好使用陆金所浏览或者购买基金,而基金人群中排名第一的基金类APP为京东金融。炒股人群的资讯阅读偏好比较偏冷门的澎湃,而基金人群喜爱偏大众的QQ阅读。用知乎承载金融大牛的报告输出,说不定会比闷头写投研更高效。

投资人群洞察报告

数据来源:TalkingData

财富管理人群定义:在TalkingData数据中有财富管理偏好标签的人群,该人群画像具有下载了诸如“蚂蚁聚宝”等相关APP、并且经常活动区域为CBD等商务区域的特征。

5 . 财富管理人群

5.1 我是八零后,我为我的股票账户代言

财富管理人群中年龄分布与基金理财人群比较类似,相比基金人群,70后、90后的占比更高,80后的占比更低。

80后生活负担和压力较大,更多的人期望通过股票投资来获取更高的收入,其投资偏好比较激进,偏爱高风险高收益。

80后处于财富积累加速上升的通道,券商需要适当引导80后的投资理念,从长期收益和资产配置角度来进行理财规划。

投资人群洞察报告

数据来源:TalkingData

5.2 杠杆加起来,黄金屯起来

总体分析,财富管理人群与炒股人群的金融理财偏好相当,但是数据分析发现偏向财富管理的人群有更高的借贷属性,甚至在贵金属投资中的占比是炒股人群的6-7倍。

在风险更高的期货以及外汇上,两类人群偏好同样较低。可以总结出,财富管理类人群更加偏好中等风险投资,特别是自带杠杆的贵金属投资。结合贵金属交易频度可以从客户行为数据找出潜在的财富管理类用户。

投资人群洞察报告

数据来源:TalkingData

5.3 财富管理人群周末消费地与深圳市民对比

通过财富管理人群与深圳普通市民的周末消费地点的线下POI热力图对比,我们可以发现,财富管理人群主要出现在南山欢乐颂、清华大学园以及布吉附近。与我们假设的“CBD等商务区域”偏好相差甚远。

与一般市民聚集于罗湖相比,大部分财富管理人群周末都聚集在南山(科技园区所在地),以及郊区的高端住宅区。可以总结出,其实有财富管理偏好的人群周末比较宅,更喜欢与家人共度休闲时光。

投资人群洞察报告

财富管理人群2018年1-2月深圳周末消费地点(4点-6点)

投资人群洞察报告

深圳市民2018年1-2月深圳周末消费地点(4点-6点)

投资人群洞察报告

深度人群洞察咨询,请联系——

400-870-1230

support@tendcloud.com

  • Apr 20 / 2018
  • 0
Data, Enterprise, Events

热点观察站丨初探网约车江湖的头号玩家

图片来源于网络

江湖笑,恩怨了,人过招,笑藏刀

红尘笑,笑寂寥,心太高,到不了

江湖笑周华健 – 雨人

在“唠嗑”前,借助这首《江湖笑》来描述当下的网约车市场再适合不过。继美团打车登陆上海、高德推出顺风车、嘀嗒出行再开九城,易到宣布调整公司业务模式,提升优惠力度,各网约车平台摩拳擦掌,如今在线旅游平台携程也将开始自营网约车。沉寂许久的网约车江湖,再次掀起掀起腥风血雨,刀光剑影、江湖从此不再太平。

网约车互联网热度趋势曲线

数据来源:百度指数

数据来源:百度指数

基于百度搜索“网约车”关键词趋势曲线,我们可以很明显的看到从2月节后,各大势力逐渐杀入市场带来的关注增量,在2018年4月4日达到半年以来的最高峰。随着事件的升级和关注度增加,媒体结合网约车的报道相继猛增,同时介于江湖再次掀起波澜,价格战马甲车制度管制等话题愈演愈烈,也让“网约车”媒体指数在近期达到了顶峰。

谁是网约车江湖里的头号玩家?

在此番江湖纷争中,“门众”(司机)的争夺再次成为众矢之的,各门派则需绞尽脑汁,以各种赏金或机制招募“门众”。据悉,美团打车祭出的“促销组合拳”包括:上线前3个月,对快车司机“零抽成”,之后收取8%的佣金(其他平台一般抽成20%);快车乘客也有实惠,前三单每单可减14元;出租车驾驶员推荐一名同行加入并完成两单,可获一次性奖励20元,乘客每单能减免3元。

与此同时,“滴滴出行”则一连几天给乘客发短信送“福利”:先送18元打车券,再送3张10元立减券;双休日叫响“越打越便宜”的口号,乘客前4程依次可减8-11元;从周二起连续三天,直接抛出了“0元打车享不停”。

不过和小说中的江湖门派有所不同的是,此“门众”可在各大门派中游走,随时可寻求高佣金、高福利的门派。从而,“门众”则成为这条利益链中的头号玩家。欢迎来到本期的《热点观察站》,我们今天暂且搁下江湖门派的恩怨情仇,借助TalkingData营销云,初探网约车江湖中的“头号玩家”——司机,看看他们究竟是一个怎样的群体。

网约车“女侠” 为何仅占比17.55%?

图片来源于网络

数据来源:TalkingData

网约车女司机占比仅为17.55%,究其原因可以从三点进行解读,其一,安全性,毕竟“拉活”在外,无法保证顾客的素质与乘车目的,顾虑自身安全是女性成为网约车司机的关键因素;其二,车内整洁,相比男性、女性对车内整洁有着更高的要求,对于“外人”给车内带来的异物或污渍等有一定的排斥性;其三,社会上对女性司机有一定的驾驶偏见。

不过根据某网约车平台的评价体系数据呈现,乘客对女司机评价最多的三个词语为:车内整洁服务态度好驾驶平稳“女性相对来说比较细心,对自己的车容车貌和服务态度都有要求,也懂得控制情绪,这也许是获得高分的原因。”(来源于媒体对女性网约车司机的采访描述)。

数据来源:TalkingData

从年龄层上来看,19-35岁互联网人群为网约车司机的主力军,同时也不乏36-45岁的老司机。

网约车司机为何会偏爱中高端手机?

数据来源:TalkingData

数据来源:TalkingData

影响“抢单”的因素不仅取决与个人的意识和手速,手机的流畅性与移动网速也至关重要,所以手机对于网约车司机有着更深层次的使用价值。在运营商分布与联网方式方面,中国移动占比56.04%、中国联通占比21.86%、中国电信占比20.85%;联网方式75.77%为4G网络,高出2017年移动互联网人群6.47个百分点,这也侧面印证移动网络是网约车司机们的刚需,同时4G的资费的优惠政策,也是4G网络大规模普及的原因之一。

2000-3999元中高端机型是网约车司机们的首选,整体占比47.54%,高出2017年移动互联网人群3.94个百分点(详见TalkingData-2017年移动互联网行业发展报告)。在这个价位的手机中“屏幕尺寸”、“硬件性能”相对更能满足他们的需求。从手机品牌上来看,网约车司机们更青睐OPPO,其次是vivo华为

哪类应用更能触达到网约车司机?

数据来源:TalkingData

通过数据,我们可以看到网约车司机在“出行”、“汽车服务”应用品类上有较强的覆盖率和TGI偏好,汽车服务更多在于”查违章”、“汽车保养”类应用,这与其人群特征有着较强的关联。同时不难发现,他们对于房产医疗餐饮金融理财也有着较强的兴趣偏好。其中,餐饮以O2O外卖为主,房产则更偏向于租房细分品类。

加班热点工作区&夜生活区域热力图

数据来源:TalkingData

与其说是北京网约车司机凌晨(22时-次日6时)热力图,倒不如说是“北京加班热点区域”和“北京夜生活区域热力图”。工作区主要集中在国贸东直门望京上地中关村等区域,夜生活区域主要集中在后海三里屯等地,而在夜间相关交通枢纽及机场、火车站也是热门区域。

我们通过“人群属性”、“设备属性”、“媒介偏好”、“线下热力图”四个维度,进行网约车司机人群画像初步探索,如果你还想了解“同时采用多款打车设备的司机占比”、“网约车司机手机机型TOP榜单”、“不同时间段应用偏好”等更详细的数据维度——

请了解TalkingData营销云产品。

  • Apr 19 / 2018
  • 0
Data, Enterprise

技术专栏丨Carbondata研究与阶段性压测


一、CarbonData简介

Apache CarbonData 是一种有索引的列存储格式。它非常适合于做即席 OLAP 查询。因为独特的 MDK 索引设计,能达到的极好的剪枝效果。相比于 parquet 等其他的列存储格式,性能有极大的提升。
Apache CarbonData 是由华为贡献给 apache 社区,目前已经是 apache 顶级项目。CarbonData 目前应用于华为的多个解决方案中,用于分析运营商的海量的信令面、用户面、控制面的详单数据。详单数据数据量达到数千亿,每条记录都是多维度的。CarbonData 用于这些海量数据的实时聚合分析。
除了华为之外,在美团、滴滴、hulu 等公司的生产环境中也得到了使用。目前 CarbonData 项目 intel、ebay、VMWare、美团、Talend等公司也有人积极参与贡献。比如 CarbonData 的 flink connector、spark streaming connector 等功能都是由华为之外的其他人贡献的。
 

二、CarbonData架构

2.1. CarbonData文件格式
CarbonData 文件格式如下:
 
一个 HDFS block 中会分为多个 blocklet。Blocklet 是文件内的列存数据块,是最小的 IO 读取单元。Column chunk 是 Blocklet 内的列数据。Page 是 Column chunk 内的数据页,是最小的解码单元。
File header 中存放元数据信息,包括 version 和 schema。
Footer 中存放 Blocklet offset、索引、统计信息。统计信息包括 blocklet的 min 和 max, page 的 min 和 max。索引存放的是 blocklet 的 startkey 和 endkey。
下图更为详细:
 
2.2. MDK索引原理
 
CarbonData 索引叫做 MDK 索引,即 Multi Dimension Key。如上图所示,year,Quarter,month,territory,country 这五个是 dimension,quantity 和 sales 是度量。维度进行字典编码,并对进行排序。然后存放到 blocklet 中。
存放于 blocklet 时,会同时把刚才提到的 startkey 和 endkey 存放好。如下图所示:
 
 
2.3. 索引查找过程
CarbonData 有两级索引。第一级索引是 block index ,存放于 spark driver 中。是一个 global B+ 树。使用这个索引避免扫描不必要的文件,可以减少95%的扫描量。
第二级索引是 blocklet 索引,用于过滤掉不必要的 blocklet。
一个完整的过滤如下图所示:
 
以我们的测试结果为例,我们的 action 表是18.55亿条记录,我们的 profile 表是415万条记录。做一个复杂的查询,做3个join和3个 group by。CarbonData 需要扫描的数据量仅为53.1 MB,而 parquet 需要扫描的数据量则为 5.5G。而且 action 表数据量翻了3倍,CarbonData 需要扫描的数据量仍然为 53M。所以说,数据量越大,CarbonData 相比 parquet 的性能优越性越大。
 
CarbonData:
Parquet:
2.4. CarbonData其他优化
CarbonData 还有些其他优化,这里只简单列举。延迟解码、向量化处理、预聚合表、partition 表(比 hive/spark 中的 partition 功能要强大很多,可以理解为索引,这里不详细讲解)、compaction、bucket、segment(我理解 segment 对优化意义不大,partition 更强大)等等。
2.5. CarbonData中对我们有用的新功能
Streaming Ingestion
目前支持 spark structured streaming,可以支持流式处理完数据后流式写入到 CarbonData 表中,这个功能是对我们有用的,需要后续研究。
Update &delete
CarbonData 目前支持 update 和 dalete。对我们也是有意义的。经过测试,update 可以运行,但是结果不对。可能需要跟社区讨论。

三、我们的性能测试结果

环境:
用了3台 40C128G,磁盘的 iops 在2000多。
不过我没用全部,总共用了 91vcore 264 GB。
第一次性能测试:
Action 表6亿多,profile 表200多万。从 ES 中通过代码导入到 CarbonData 中。
测试例子:
按学历统计近半年事件“event7”的触发次数。
且触发此事件的访客的性别需要为男,最近所在城市为“北京”;
且触发此事件的访客最近一个月访问了“com.android.dazhihui.view.screen.NewInitScreen10”活动页面(至少有1次访问时长超过10s);
且触发此事件的访客最近一周触发了“event7”事件(至多触发100次 label 为“label8”)
该语句翻译为了3个 join 和3个 group by。
需要8s左右,scan 数据量为 53M。
第二次性能测试:
Action 表18.55亿,profile 表415万。从 ES 中通过代码导入到 CarbonData 中。
语句同测试一。
该语句翻译为了3个 join 和3个 group by。
还是需要8s左右,scan 数据量仍然为 53M。
第三次性能测试:
在第二次性能测试基础上,同时并发6个同样的查询。
每个查询在8s-14s之间,性能稳定。
相比 ES 的存储,CarbonData 只使用约8.X%的存储。

四、Streaming ingest

把es的数据导出为 parquet,然后使用 structured streaming 流式写入到 CarbonData 中。经过调试,最终能调试通过。使用1个 executor 2C6G 进行性能测试。1S能够写入10万条记录到 CarbonData中。性能还是不错的。
同时,CarbonData 也支持 spark streaming ingest。
五、Update
CarbonData 有 update 的能力。但是 CarbonData 的目标是 OLAP/small scan/full scan。不适合于做 OLTP。
所以 profile 功能不能直接部署于CarbonData.目前想到的办法是 profile 功能放到 kudu 中。然后从 kudu 中周期性加载到 CarbonData 中。这个功能后续还需要继续研究。

六、兼容性

CarbonData 是基于 spark。CarbonData 1.3 可以兼容 spark 2.1 和 spark 2.2。
只要大数据发行版支持 spark 2.1 和 spark 2.2,就可以兼容 CarbonData.
1)与 CDH 兼容性
CDH 版本和 spark 是松耦合的。CDH 出的 spark 2 parcel 包可以用于多个 CDH 版本。
同时,CDH 还可以支持 apache spark 作为他的 gateway。
所以 CDH 与 CarbonData 是兼容的。
2)与华为兼容性
华为 fusioninsight 本身就包含 CarbonData。
所以华为与 CarbonData 是兼容的。
3)与星环兼容性
星环中包括两个 spark。Inceptor 是他们的定制 spark。
Discover 是完全开源的 spark。
我们 的CarbonData 可以运行于 discover spark 之上。

七、后续工作

后续还要增加工作:
action 表记录数达到百亿级别,继续进行性能测试。
目前我觉得应该还有性能优化的空间。
  • Apr 18 / 2018
  • 0
Data, Enterprise, Events, News

新零售:不是新概念的新趋势 | 博鳌亚洲论坛见闻录②

近日,博鳌亚洲论坛2018年年会在海南博鳌举办。大会以“开放创新的亚洲 · 繁荣发展的世界”为主题,汇聚来自50个国家的2000余名商业领袖,习近平主席也出席10日的大会开幕式并发表重要演讲。

TalkingData高级副总裁支宝才作为代表参加了此次博鳌亚洲论坛,并重点关注互联网、数字经济、新零售、新金融等话题。在上一篇文章(《遇见凯文•凯利 | 博鳌亚洲论坛见闻录①》)中阐述了人工智能(AI)的知识和观点。在本文中,他将再次结合自己的见解,和大家一起分享关于新零售领域的观点。

“创新”是本次博鳌论坛的主题之一(另一个主题是开放,中心思想是利益共同体——Share Future)。大会分论坛的议题安排也是两类,一半是未来的亚洲、全球化后半场、一带一路、宗教文化等宏观话题;一半是技术创新和产业相关的话题,例如未来的技术革命、人工智能、未来的互联网、共享经济等。

新零售(主题是:新概念还是新趋势)与新金融(主题是:改变还是被改变)是为数不多的“传统”行业主题,这也与TalkingData重点关注的行业不谋而合。

新零售论坛安排在会议第三天,邀请网红KOL吴伯凡先生主持,国美董事长何阳青、大龙网创始人冯剑峰、凯德总裁Lim Ming Yan、波士顿咨询全球主席Hans Burkner、花点时间创始人朱月怡、跨国电商平台大龙网CEO易青作为嘉宾。

博鳌亚洲论坛新零售主题圆桌会议   图片来源:博鳌亚洲论坛

虽然这个分论坛时间并不长,但传统零售、新电商和跨境电商、第三方行业专家同场交流,跨界的思维碰撞还是给了我很多启发。本文不赘述具体发言内容,而是会结合TalkingData为零售企业服务过程中的一些经验,针对三个问题分享一下我的思考。

(一)新零售到底“新”在哪里?

新零售其实并不是一个“新”概念,前些年电商崛起的时候,行业也在普遍讨论“新零售”,那时的“新零售”的内涵是从线下到线上,那么现在的“新零售”到底“新”在哪里呢?

我认为“新”在以下三个方面:

  • 新关系传统线下商家与消费者关系的转变,将传统一次性消费的买卖关系转变成持续性客户关系。利用技术手段,实现客户从“无记名”消费到“记名”消费,从关注单次交易的达成到关注客户的交互渠道、消费频次和综合消费体验。
  • 新技术现在新零售的另外一个特点是大量应用新技术,如大数据、人工智能、机器人和自动化、IoT和新支付手段等,在持续为行业升级赋能。
  • 新模式通过线上和线下的融合(OMO)重新定义人、货、场的关系,将带来更多的零售差异化业务模式创新。
亚马逊无人零售店:Amazon Go  图片来源:Amazon

(二)为什么会有新零售?

零售行业是国内发展最快、市场开放程度最高、也是竞争最激烈的行业之一。电子商务对传统零售行业的冲击仍在继续,行业格局初定,那么为什么又会有“新零售”的发生?以及新零售为什么会发生在中国?

我认为有三个方面的原因:

  • 普遍移动互联网化的消费者:跨越年龄、性别和区域的社交平台、电商平台、支付平台的习惯性用户——也就是“新的消费者”,是本次新零售能够发生的基础。
  • 基础设施的成熟与新技术的驱动:前面提到的新技术既是新零售的特点,也是触发新零售升级的驱动要素,同时生产环节、物流配送、支付体系、通讯网络、基础设施等方面的成熟也是新零售发生的前提条件。
  • 进击的“巨人”和传统企业的反抗:本次新零售的发生,国外亚马逊等示范效应,国内阿里、腾讯和京东等电商和互联网巨头的推动是主要动因,同时传统零售行业巨头以及品牌商希望加强线上能力、摆脱不利竞争局面的需求也是驱动因素。
电商和互联网巨头冲击下的“新零售”  图片来源:TalkingData整理

(三)新零售会带来哪些影响?

新零售的本质还是一次行业升级,但是在资本、技术和行业巨头的多重因素推动下,还是会对行业带来非常深远的影响。

主要体现在如下几个方面:

  • 行业洗牌和格局重构:本次新零售将带来产业格局的改变,一方面大量资本涌入,行业并购和重组频繁发生,新零售在一定程度上就是互联网巨头圈地和传统零售商突围的游戏,可以预见也将产生创新型行业新星,零售行业格局在短时间内将被重构。
  • 零售行业边界的拓展:新零售自身的跨界融合和新技术应用的特点,将在一定程度上拓展零售行业的边界,零售行业与互联网行业、零售行业与科技产业、零售行业与其他相关产业如生产和物流等的边界将趋向模糊,出现更多的融合。
  • 零售价值链创新:新零售将在一定程度上重新定义行业价值链,包括行业竞争合作关系,以及与客户的关系。例如在本次论坛上,国美董事长何阳青提出的“从传统家电销售安装,进入到售后服务领域(如帮助客户进行家电的定期保养)并关注售后客户大数据”就是很好的例证。

(四)零售企业应该怎么做?

新零售看似方兴未艾,其实来势汹汹。在服务零售行业上积累了丰富经验后,TalkingData提出了D2D方法论,(具体可参考文章:《TalkingData D2D:从“数字化”到“数字化” –以数据的智能驱动零售行业的数字化转型》)针对性帮助零售企业提升数字化运营能力,更好的把握新零售的产业升级的发展机遇。

  • Apr 17 / 2018
  • 0
Enterprise

搭建三级标签体系,提效证券App运营

3A3R数字运营指标体系介绍

3A3R模型是Awareness、Acquisition、Activation、Retention、Revenue、Refer这六个单词的缩写,分别对应用户生命周期中的5个重要环节,是移动App在基础运营体系建设广受认可的方法论。证券行业的3A3R运营指标体系由国泰君安发布,细化了3A3R指标体系在证券行业的应用,适合证券行业移动运营使用:

1、Awareness,用户感知

反映应用产品本身及移动化服务的定位、市场知名度、美誉度、规模的考量标准,其目的是扩大对目标客群的影响:如品牌宣传、媒体曝光和营销活动等。

2、Acquisition,用户获取

反映了从市场上获取用户并促使其注册及转化的情况,需要运营者不断提升流量转化做大用户群:如通过合适的渠道付费引流,或从尽可能多的跨界合作汇总获得新的用户群体。

3、Activation,用户活跃

用户活跃类指标反映了每日登录应用的用户数量和应用本身对用户的价值。在目前的市场环境下,相比自然增长,很多用户是通过终端预装、广告推广等不同形式被动进入应用的,如何促进这些用户从获取走向活跃,是运营者面临的第一个问题。

4、Retention,用户留存

用户在保持了一定活跃度后,流失的可能性也会增大,这个时候要通过用户留存来观察其对应用的使用情况。通常,保留一个老客户的成本要远远低于获取一个新客户的成本。为了保持用户持久的活跃,需要通过日留存率、周留存率、月留存率等指标来监控应用的用户流失情况,并采取相应的手段在用户流失之前,激励这些用户继续使用应用。

5、Revenue,收入

获取收入,是移动App运营最重要、核心的指标,是衡量所有运营行为最终导向的考量标准。移动App获取收入的定义有很多,主要有三种模式:付费应用及应用内付费、以及广告。付费应用及应用内付费在游戏行业应用较多,电商和广告的变现模式是较为常见的收入来源,而应用内付费目前在游戏行业应用比较多。无论是以上哪一种,收入都直接或间接来自用户。所以,前面所提的提高活跃度、提高留存率等用户体验指标,对获取收入来说是必需的基础。

6、Refer,传播

社交化媒体的兴起,使互联网运营增加了传播方面的考量标准,依靠创意内容,基于社交网络的扩散甚至病毒式传播,已经成为低成本获取用户的有效途径。从自传播到再次获取新用户,应用运营能够自生形成螺旋式上升的轨道。在互联网金融领域,一部分优秀的移动App已经在社交化媒体营销上赢得了不少潜在用户群体的好感度。

3A3R数字运营指标体系与用户生命周期的关联可参照图1。从对用户的洞察、建立企业品牌认知开始,到客户贡献收到,再到将客户发展成主动为产品传播的价值客户,贯穿了从交互行为走向交易行为的过程。

图1

App行为数据的标签体系建立

对运营人员而言,标签是将用户的交互、交易数据“翻译”成人本画像的语言,基于标签实现用户及客群洞察和全生命周期的分群、分层管理,实现精准营销和运营,面对用户多样化、行为习惯碎片化造成的“不可测”、“千人千面的不确定性”,利用合理可用、不断迭代的用户标签体系来进行运营和营销,是最有效的破解法则。

然而,目前在绝大多数金融类移动App的实际运营场景中,对用户交互行为相关数据的利用并不充分。金融App中相对成熟的是交易数据及交易类标签,但仅有交易行为的数据标签,并不能代表用户的全部潜力,需结合其在交易之前的阶段,衡量其在App上的活跃度,建立行为标签,进行产品推荐和精准触达,从而将其转化到生命周期的下一阶段。

例如,在交易数据指导下的用户标签一般是围绕“开户”、“入金”等资产性质的特征建立,对用户的营销也都围绕提升其入金额度或交易频次,营销抓手固定但相对单一。加入用户的交互行为标签后,则能够对其停留页面、活动喜好、学习特征等层面进行把握,用户画像贴近其投资理财习惯。

在证券行业建立标签体系的过程中,标签梳理的过程极为关键,需要从交互、交易两大层面出发,对用户行为的相关属性先进行界定,再进行拆解,最终落实于具体的平台系统中去。

例如,运营人员为某大型券商建设线上交互行为属性标签时,将标签按颗粒度划分为一级标签、二级标签,根据具体业务需求继续细化至三级标签,便于为日后业务提供灵活支持,减少后续自定义标签的难度。下表为App建设行为属性标签时的一些通用维度的示例,由于二级标签内容非常多,本次研究就仅仅列举三个作为参考。

而对于券商本身CRM系统中既有的基础标签,也应按相应颗粒度统一纳入体系,一些通用维度示例如下,本次研究就仅仅列举三个作为参考。

融入行为数据的标签体系的建立,解决了对用户是否能全方位地定位、分群分层级管理和营销的难题。体系建立完善后,应落实于具体的用户运营平台,最大化提升运营人员在进行客户管理时定位人群的效率。

依托运营平台,运营人员基于业务需求出发,在系统中点选相应维度的一级、二级、三级标签,定义好时间,即可生成相应的用户人群名单及画像,运营平台还应对接券商App的推送系统,生成名单后支持一键发送,迅速完成营销行为。

基础标签体系和平台的完善,有助于运营人员将“场景化营销”落到实处。基于证券App中的绑卡入金、购买理财、证券交易、基金买卖、贵金属购买等都是客户最典型的交易场景,分析这些业务在App中的交易路径(交易步骤),在接近交易路径的前几步,根据时间、频次、结果等选取基础标签,构建场景化标签,促进营销转化。

1、一个月内下载App后未绑定交易账户群体

希望促进“一个月内下载App后未绑定交易账户群体”的转化,可通过定位“首启时间”、“是否注册”、“是否交易”等标签定位和搜寻人群,之后对其开展转化营销行动,或移交数据分析人员继续分析其未开户原因。

2、有交易意愿但未入市群体

运营人员可根据交互标签“最近一月”、“查询XX板块”、“添加自选股”、“未交易”等标签,探索存在交易意愿但未入市群体,调研其未入市原因,是资讯不够?还是功能使用不够顺畅?还是资金缺少?针对原因对其开展投资教育和相关资讯的补助推送,解决用户问题,提升转化效率。

3、点击关注融资融券但是没有申请群体

运营人员可根据交互标签的组合,“最近一月”、“点击融资融券”、“点击次数超过3次”、“未申请”等标签,将具有融资融券客户倾向用户筛选出来,依据客户的风险等级提供相应的融资融券服务,利用人工客户进行推荐的方式转化率比较高。

标签体系的升级阶段,是融合第三方数据和标签特征,为其增加外部特征的描述,诸如航旅、娱乐、资讯、生活、电商等标签。运营人员可以通过外部数据和标签的辅助,了解用户在现实生活中所处的形象和生命阶段,建立起对用户更为丰富的认知,为其实现更精准的资产增值服务。

综上所述,完整的App用户标签体系的建立,一般会经历交易标签—交互和交易标签—三方标签的建设阶段。其中,实现交互数据和交易数据打通,为用户建立行为标签,拓展场景化营销,是挖掘App价值的关键一步。

基于行为数据标签的营销案例

用户在移动App上的交互行为充分体现了其在交易特征之外的场景下,能够有效洞察其对功能和营销活动的喜好。企业过去的营销主要依托交易数据,典型的做法有数据库营销中的关联分析和交叉销售。

交易数据对营销具有巨大价值,但企业在这方面的探索已经趋于成熟,对交易客户的把控仅限于“交易成功与否”的边界判断。而行为数据则更关注客户对某些特定行为发生的次数和趋势,这部分数据的稳定性不如交易数据,但同客户的偏好、兴趣、未来趋势有较大的正相关度,经过标签化之后,可以用于有效营销。即便是较低的转化率,基于其庞大的基数,经过反复尝试,可以取得令人满意的效果;不成交、不活跃的数据,也可以积累下来用于二次营销。

基于用户股票偏好的营销案例

在进行券商App的运营时,运营人员收集股票用户在一段时间内对股票板块的偏好,选取一定时间单位内对某些板块存在反复点击、查阅行为的用户群体,为其在标签系统中标记板块偏好类标签,如基建、券商、一带一路等,用于分类营销;结合市场及大盘,为这些客户群体推送其关注的板块变动情况及新闻资讯。将该类运营策略的关注重点和实际流程图表化后如图2。

图2

之后,可以结合该类用户群体的历史资产峰值、现值资产、交易状况确定其资产属性,确认其在流失预测模型中是否属于高价值群体、易流失群体,继续判断是否对其采用更加精准的营销方式。

在实际运营的多次尝试中发现,收到推送讯息一周后,打开并阅读推送的目标用户群体中,在一周之内交易过推送板块关联股票的相关用户,产生入金、交易行为的平均比例,比无标签的沉默用户群体提升效率高出30%以上。

基于行为数据标签的场景化营销,需要将重点凡在营销逻辑的建立、效果分析、方案迭代优化上,通过多次营销尝试找到性价比最高的行为标签建立方式,确定频次、时间段、结果等参数,并逐步建立起稳定的运营方案和运营计划,其中一些固定运营方案可以固化在一周的某一天,甚至某个具体时段。

运营、营销达成效果的关键在于不断尝试,优化场景化标签中各个数据维度和数值,同时在效果达到预期的方案中迭代,最终形成有效的运营及营销模式。

– End –

  • Apr 16 / 2018
  • 0
Enterprise

看用户质量评估功能,如何手撕假量渠道!

当新产品问世或面临存量困境的产品想要获取新用户时,广告主不管如何抉择,渠道推广都将成为必选之路。当渠道无法满足广告主对量的要求时,制造假量成为轻松获得推广费的捷径。

在现实推广中,消耗广告主资本的不仅有渠道,其他团伙也会分羹一杯。通过观察,我们把这些分食行为,通过3个关键词进行了简单归纳:

  • 指标

作为广告主方推广人员,为了在规定时间内完成老板的巨额流量要求,会不得已为完成KPI,找假量多、价格低的劣质渠道充数。虽然获得了上万的激活,可真实的用户却屈指可数。

  • 易容

在金庸巨作《天龙八部》中,阿朱精通易容术,她三戏鸠摩智,最后易容替父赴死。以一人分饰多角,也适用于渠道作弊。戏路特别宽的渠道,使用刷机工厂和模拟器,每给广告主带来一次流量,就刷机变更身份,再来一波流量。虽然推广期间渠道数据超好的,但推广期过后,广告主发现生活不仅有眼前的苟且,还有百思不得其解。

  • 快闪

常有新闻报道,某地举行了另观众错愕不已的快闪活动。实际上,爱玩快闪的何止快闪组织者,还有羊毛党啊。羊毛党属性就是“团队作战,获利就走” 。广告主把挖空心思制定的注册送话费活动,通过PR大肆宣传后,收到感召不止有正常用户还有居心叵测的羊毛党。当返现到账后,羊毛党一刻都不会多待儿,快速踏向薅另一个产品的征程。

通过对以上3个关键词的理解,不难发现看似掌握着主动权的金主粑粑-广告主,面对“指标”、“易容”、“快闪”等,这些防不胜防的作弊行为,实则柔弱、可怜、又无助。那么,如何通过有效手段评估新增用户质量并监测出哪些渠道存在作弊行为?现在,TalkingData用数据说话,助力广告主撕开假量渠道面具!

TalkingData App Analytics的用户质量评估功能,可识别出模拟器、真机刷量工厂等刷量手段,帮助开发者更了解每个渠道的用户质量情况。下面,我们具体了解一下TalkingData App Analytics的用户质量评估功能:

用户质量评估–新增用户质量评估概览

概览页展示应用整体异常用户及可疑用户占比和趋势,帮助用户了解新用户总量和可疑用户占比;

数据来源:demo演示

用户质量评估–分渠道质量对比

根据各渠道指标数据报表,广告主可详细了解每个渠道带来的新用户的质与量;

数据来源:demo演示

用户质量评估–分渠道详情

分渠道详情页面清晰展示该渠道的新用户占比组成,以及所选时段内该渠道的各类用户比例趋势;

数据来源:demo演示

用户质量评估–分渠道留存对比

留存比例模块展示了不同类型用户的+1/7/30日留存,留存作为用户评估的常用指标,所以一些异常渠道也会刻意伪造好的留存率。所以不一定留存率高的渠道质量一定好,需综合评估。

数据来源:demo演示

  • Apr 11 / 2018
  • 0
Enterprise

遇见凯文•凯利 | 博鳌亚洲论坛见闻录①

近日,博鳌亚洲论坛2018年年会在海南博鳌举办。大会以“开放创新的亚洲 · 繁荣发展的世界”为主题,汇聚来自50个国家的2000余名商业领袖,习近平主席也出席10日的大会开幕式并发表重要演讲。

TalkingData高级副总裁支宝才作为代表参加了此次博鳌亚洲论坛,并重点关注互联网、数字经济、新零售、新金融等话题。本文中,他将结合自己的见解,分享参会期间了解到的具有启发性的知识和观点。

 

博鳌次日,“数字经济:智慧的价值”分论坛中,《连线》杂志创始主编凯文·凯利、甲骨文OOW创始人&CEO韦尼克等互联网界大佬对数字经济的前景预测、所面临挑战等主题进行了探讨。

也许是因为凯文·凯利在中国太红,大会为他临时安排了个人演讲。这个演讲的主题当然是未来,并延续了他的一贯风格——围绕关键词展开,不是很注重逻辑(大家看过他的书就会知道)。演讲中,他分享了数字经济未来的五个重要趋势,分析了这些趋势的主要特征,并对未来做了预测。

下面是凯文·凯利分享的主要内容。我的记述可能不是很完整,同时夹带了私货、谈了一些我个人的理解,请大家体谅。

凯文·凯利(Kevin Kelly,很多人更喜欢称他为“KK”),《连线》(Wired)杂志创始主编,并著有《失控》、《必然》、《科技想要什么》等畅销书。

凯文·凯利被看作是“网络文化”(Cyberculture)的发言人和观察者,也有人认为他是未来学家和“预言家”。

凯文·凯利(未来学家需要一脸哲学家的胡子和优秀的演讲技能)

 

趋势一:人工智能(AI)

  • AI是要做到当前人类做不到的事情(Alien Intelligence,这个词很有意思)。例如生菜机器人(Lettuce Bot),可以识别每棵生菜的特征和需求,然后决定如何针对性护理和培育,这对人类农民来说是无论如何都做不到的。

据说生菜机器人长这样,这是一个比较低调的Robot(图片来源:https://modernfarmer.com/2013/05/lettuce-bot-roomba-for-weeds)

 

  • 未来追求效率的工作都会交给机器人,人类将更多从事对效率要求不高的工作“Efficiency is for robots, humans are for inefficiency” 。
  • 未来更有前景的AI应用是人和AI的结合,比如在医疗、军事等领域,AI辅助医生进行诊断,在战场上AI辅助士兵进行决策。KK用Centaurs(半人马)这个词来形容未来AI和人的结合。

酷炫的半人马(作者:Bob Greyvenstein,来源:https://bobgreyvenstein.deviantart.com/art/Centaur-566727068)

 

  • 无处不在,又隐匿无形。未来AI会融入到我们的生活,比如现在的Google home,很多设施和设备可能外表没什么变化,但实际已经智能化了。

 

趋势二:互动(Interaction

  • 未来的互联网将从信息互联网,演化到体验互联网(“from the internet of information to internet of experience”)。这个概念虽然已经不新鲜了,但是的确应该从这样一个视角去看互联网。
  • 关于VR/AR/MR,他认为未来混合现实是大趋势,也更加实用,也就是presence MR。
  • 未来社交媒体会VR化。这个大家应该很容易想象,我们带上VR眼镜,远隔万里也可以坐下来面对面开会,《星际迷航》中早就实现了。

《星际迷航》中的全息VR(来源:https://www.fxguide.com/featured/star-trek-beyond-inside-the-vfx-of-the-enterprise)

  • 可穿戴的MRI(核磁共振)。未来会出现可以读取大脑信息的设备,通过读取大脑的指令,将你大脑中想象的信息图像化。

 

  • KK专门提到了汽车是未来的“新办公室(new office)”,可见汽车一定是继手机之后最重要的移动终端。

 

趋势三:分享(Connection

  • Connection everything,未来是所有信息的共享,IoT是云中之云。这个已经谈的很多了,大家可能感觉没什么新意,不过IoT应该是未来新共享经济的基础,而不是过去的互联网。

 

  • 未来会出现全球化的平台与协作(“platform and collaboration”)。KK说很快就将有100万人实时连接协作的全球平台出现。
  • 技术对共享经济的支持。KK认为未来区块链非常重要,是分享和连接的重要技术基础;此外还有VR技术,让人们远程交互没有障碍。

趋势四:接入(Access

  • 能够访问是未来数字经济的特征,而不是拥有。这个趋势现在已经非常明显,云服务就是很好的例证。

 

  • 未来的关键词:实时接入(instant access)、快速交付(rapid delivery)、即时制造(immediate manufacture)、去中心化(dematerialization)、持续升级(constant upgrades)。

 

  • 个人将变成口袋空空的“游民(Nomads)”。现在我们出门只需带个手机,而未来连手机这样的个人设备都不再需要,环境会直接对人进行认证、识别和交互。你可以在任何地方接入并获得所需,每个交互界面都是你个人的界面。

电影《头号玩家》(来源:IMDB)

 

趋势五:跟踪(Tracking

  • Screens watch you。这个提法我们现在国内也在说,从原来的读取界面到现在的交互界面,未来则会是跟踪界面,将更多利用传感器和AI等技术手段。
  • 可穿戴设备等普及使信息跟踪更加容易。
  • 对个人数据的持续量化(Quantified self)。特别在健康领域,个人信息会被全面采集和记录,并实现在卫生健康服务的互动。

Quantified Self(来源:https://blog.adafruit.com/2016/07/03/gyroscope-the-quantified-self-health-dashboard)

 

  • 每个人都是一个密码,一切都可被跟踪并将会被跟踪(“anything can be tracked and will be tracked”)。

 

最后他还谈到了技术带来的新问题,总结就是:新技术带来新问题,而新问题又需要新技术来解决(“New technologies create new problems, new problems demand new technologies”

 

作者

支宝才(Daniel Zhi),TalkingData高级副总裁,全面负责咨询业务以及相关团队。在加入TalkingData之前,支宝才曾任德勤管理咨询合伙人,还曾供职于IBM GBS、毕博等顶级咨询公司,拥有超过17年的咨询行业从业经验。

  • Apr 10 / 2018
  • 0
Data, Enterprise

移动App行为数据的用户运营和产品优化

受到互联网券商应用的冲击,传统券商的获客方式也在不断向线上转变,竞争不断加剧。但是目前,流量红利在逐步消失,且券商行业特有的获客成本高、用户转化节点多、转化周期长的特点,促使券商行业需要跳出粗放式的获客及运营模式,以数据精细化方式指导运营及改善产品功能,驱动用户增长。

一方面,通过数据精细化的方式提升获客质量,从成本、留存、业务转化多维度评估获客渠道质量,合理分配预算,达到ROI最大化;另一方面,通过对用户的精细化运营,提升用户的留存活跃,不断优化产品功能,提升用户的业务转化,保证活跃用户的增长大于流失,在促进活跃用户的稳步增长的同时不断提升用户的生命周期,实现用户生命周期价值的最大化。

一、移动App用户运营关注指标介绍

移动金融应用的崛起,让所有金融企业开始关注移动金融App运营情况,如何量化评价移动金融App的运营好坏,是金融企业需要解决的首要问题。目前市场上缺乏对移动金融App较为权威的运营标准,PC互联网的PV(Page View,页面浏览量或点击量)、UV(Unique Visitor,页面独立访问量)等指标不完全适合用于评价金融类App运营情况。国泰君安提出的证券行业3A3R指标,则从商业角度出发,详细地介绍了App运营的业务指标。

从金融App的特性和业务角度,可以用以下指标来衡量驱动App的运营。

1、用户增长指标

用户增长指标主要用来衡量新增用户增长的数量及占比情况。

新增用户:新增加的App使用设备,用以衡量产品的获客能力和市场营销效果。新用户对金融企业意义重大,用户是金融行业的金矿,代表着金融企业的未来,赢得用户就会赢得市场、赢得未来,因此将其定义为移动金融App需要重点关注的指标。

新增用户占比:一段时间内新增用户占该时段活跃用户的比例,新增用户占比的公式是(时段新增用户/时段活跃用户)*100%,主要用以衡量产品的增长能力及用户结构健康度。

新增用户占比太低,会导致新增用户与流失用户相抵消甚至低于流失用户,导致活跃用户难以增长或者下滑;新增用户占比太高,用户构成结构可能不太理想,新增用户可能是基于活动短期增加,没有稳定的沉淀,流失风险大。

新增用户类相关指标在证券行业App内的参考值,可参照下表:

 

2、用户活跃指标

用户活跃指标主要用来衡量用户在App上的活跃程度。

  • DAU(Daily Active User):当日启动应用的使用设备数。
  • MAU(Monthly Active User):统计时点最近一月的活跃访客数。
  • DAU/MAU比值:当日日活跃访客与当日月活跃访客比值,是衡量用户粘度的重要指标。DAU/MAU比值太低,说明用户粘性较差,新增用户流失比较严重,一般证券行业DAU/MAU的比值在30%-45%之间属于正常水平。同时,如果市场营销力度较小,用户增量规模小,或者以自然增长为主,则该标准要适当提高。
  • 日/月活跃率:当日/月的活跃用户占上线至今累计用户的比例,日/月活跃率=(当日/月活跃用户/累计用户总数)*100%。目前证券行业日活跃率标准在15%-25%之间,月活跃率在40%-50%之间。
  • 活跃留存用户:前一段时间活跃且该段时间依然活跃用户,目前证券行业App日活跃用户留存率标准大概在80%-90%之间。
  • 每日流失用户:当日活跃用户连续一段时间没有使用过App,视为当日的一个流失用户。
  • 每日回流用户:当日活跃访客中(排除新增用户)在之前的一段时间没有启动过App的用户数。

用户活跃类指标在证券行业App内的参考值,可参照下表:

 

3、用户属性指标

用户属性指标一定程度上反映了用户画像,即用户所在的年龄、阶层、兴趣爱好等群体特征。

  • 用户年龄构成:不同年龄层用户的构成。目前移动证券用户年轻化趋势日益明显,年轻用户逐渐成为股票交易用户的主要人群,年轻用户占比合理在一定程度上反映了产品的良性发展趋势。同时,不同年龄段用户对内容的喜好以及购买产品方面的偏好都会有一定差异,运营中可以依据用户的年龄特性来采取针对性的策略。
  • 资产状况:依据用户的资产分布划分不同的人群,做针对性的服务和产品推送。
  • 产品偏好:依据用户的点击浏览行为,按照不同用户对内容/产品/服务的喜好进行精准分群,制定对应的运营策略。
  • 转化阶段:从游客(可粗略定义为启动未绑定手机号码),到用户(绑定手机号码未开户)、开户未入金客户、入金未交易客户、交易客户等。

 

二、移动App产品优化重点关注领域

移动App在产品优化上的重点关注领域一般有三类:如何提升活跃度、如何优化交易路径提升留存、如何加粗转化漏斗。

 

1、提升活跃度

产品功能上线后,首先要衡量的一个指标应该是用户的参与度。比如导航模块新添加了一个功能后,运营人员应当关注,一段时间内使用该功能的用户有多少?每日参与用户占活跃用户的比例有多高?与其他相近曝光的功能相对是否足够受欢迎?

 

此外,除了访问用户占比,还要观察一段时间内用户重复访问该功能的频次,如果用户重复使用率很高,证明该功能对用户非常必要,就可以通过运营手段加大推广,以便触达到更多的用户;如果大部分用户使用了几次就放弃,就应该考虑下功能是否该保留,用户放弃的原因在哪里,后续该如何迭代改进。

 

2、降低流失率

App产品上线一个好功能,是能够有效增强用户粘性的,最直观的表现就是对产品留存的正向作用。为了验证新功能,在正式上线前,可以通过灰度测试的方法,找一个用户增量较大的渠道,使新增用户随机获取新旧两个版本的App,从而观察一段时间后二者留存率的变化,来评估新功能对留存的作用是否正向,之后再考虑修改或全面上线。

 

3、加粗业务转化漏斗

新功能上线后,除了通过分析用户使用行为及留存情况外,还可以通过对业务转化的影响来衡量产品价值。

例如,某券商上线了一个股票分析工具功能,由于曝光不足,且功能使用复杂,上线数日后,只有一小部分用户在频繁使用,不确定该功能是否有价值;之后通过移动运营平台的用户分群功能,将产品上线后一个月内使用过该产品超过十次的老用户做为一个群组,分别纵向与该组用户上一个月的行为做对比,以及横向与没使用过该功能的其他活跃用户做对比,发现使用了该功能的用户点击个股行情、股票交易等行为数据有明显提高。之后通过运营活动将产品推送给更多用户,并且通过强化引导的方式降低用户使用难度,在接下来的一个月内行情交易的使用整体提高了5%。

三、基于移动App行为数据的产品优化案例

在基于移动App行为数据、通过转化漏斗优化用户注册流程方面,有许多实际案例。如,某券商App上线后,发现用户注册率很低,通过事件埋点,分析注册流程后发现,由于注册流程极度繁琐,转化路径长,各个节点用户漏损严重,导致最终的注册转化率很低,如图3-1。

 

为了验证是否可以通过简化注册流程来提升用户的注册率,按照不同的注册流程发布了两个版本的App,并在一个渠道发布进行A/B测试。

通过测试发现,简化了用户注册流程的版本,由于去除了用户漏损比较明显的几个环节,最终注册转化率提升了75%以上,如图3-2。

借助精细化用户分群运营策略,也可以有效提升用户转化。基于券商App用户的特点,为达到提升留存的目的,可以从精细化用户群体运营策略的方向以及数据化驱动产品改进等角度出发,找出提升用户留存转化的关键点。

如,某券商通过其用户运营平台的用户分群功能,将5月份的新增用户按照业务转化程度分成了5个人群,分别为:

1.游客(未绑定手机号码);

2.用户;

3.开户未入金客户;

4.开户且入金客户;

5.有交易行为客户。

通过筛选五个分群用户的某月留存,发现用户留存率与用户转化程度有非常强的关联性,尤其是首启第一周的转化至关重要。因此,按照用户分群的方式,针对几个群体的用户,分别制订首启第一周的差异化运营转化策略,达到了良好效果。

页面:1234567...47
随时欢迎您 联系我们