简明数据科学 第五部分:多元回归模型

Markdown

作者:张永超

上一节中,我们讨论了费尔南多的故事,一个数据科学家想买一辆车,于是他构造了一个车辆的价格和发动机大小的简单的回归模型来预测。

Markdown

费尔南多创建的回归模型预测了基于发动机大小的车辆价格。仅使用一个自变量来预测因变量的模型。

该简单的线性回归模型可以被表示为:

price = β0 + β1 x engine size

Markdown

按照最终的模型结果,车辆的价格可以被简单预估为:

price = -6870.1 + 156.9 x engine size

该模型从两方便进行评估:

  • 健壮性 – 使用假设检验
  • 准确度 – 使用确定系数例如R平方检验
  • 回想一下,R平方的度量解释了模型预测值与真实值之间的平均方差分数,位于[0,1]之间,越高的分值表示该模型能够更好的解释方差。而费尔南多的模型最终的到的R平方为0.7503,也就是在训练集上得到75.3%的分值,预示着该模型可以解释超过75%的变化。

然而,费尔南多想要更好的结果。

他考虑到: 如果我可以用更多的数据来送给模型?它会提高准确性吗? 于是,费尔南多决定通过给模型提供更多的输入数据,即更多的自变量来增强模型。他现在进入了多变量回归模型的世界。

基本概念 线性回归模型提供了一个监督学习的简单方法,其简单但是有效。

回想一下,线性意味着如下的含义:数据点几乎排列在一条直线或者近乎直线的附近,并一直延伸。线性表明,自变量和因变量之间的关系可以用直线来表示。

直线的方程式是y = mx + c,其中一维是y轴,另一维是x轴,可以在二维平面上绘制出来:

Markdown

如果将这种关系进行泛化,则得到:

y = f(x)

其意思是:将y定义为x的函数。例如将自变量定义为独立变量的函数。

如果因变量需要用一个以上的自变量来表示呢?广义函数变为:

y = f(x, z)

即将y定义为一些函数或者组合多个参数的函数。

此时便是三维的了,包含x轴、y轴、z轴,绘制出来类似下图:

Markdown

现在,我们有多个维度,我们需要将y定义为组合x和z的函数。

对于简单线性回归模型来说,直线表示y是x的函数,现在我们有一个额外的维度z,如果将z附加二维平面会发生什么呢?它会变成一个平面。

Markdown

该平面是将y表示为x和z的函数。推断线性回归方程,可以表示为:

  • y = m1.x + m2.z+ c
  • y是因变量,即需要评估和预测的变量
  • x是第一个自变量,即可控的变量,也是第一个输入
  • m1是x的斜率,决定了线x的倾斜角度
  • z是第二个自变量,即可控的变量,是第二个输入
  • m2是z的斜率,决定了线z的倾斜角度
  • c是截距,当x和z为0时确定y值的常数 这是多元线性回归模型的起源,有多个输入变量用于估计目标,具有两个输入变量的模型可以表示为:

y = β0 + β1.x1 + β2.x2 + β3.x3

多变量回归模型的广义方程可以是:

y = β0 + β1.x1 + β2.x2 +….. + βn.xn

模型构建

现在熟悉多元线性回归模型的概念,让我们回到费尔南多。

费尔南多向他的朋友伸出更多的数据,他要求他提供有关汽车其他特性的更多数据。

Markdown

以下是他已有的数据点:

  • make: 车辆品牌
  • fuelType:所使用的动力燃料
  • nDoor:车门数量
  • engineSize:发动机大小(马力)
  • price:最终的价格
  • 他有拿到了一些新的数据点:
  • horsePower:马力
  • peakRPM:最大功率输出时的转速
  • length:车辆长度
  • width:车辆宽度
  • height:车辆高度 费尔南多现在想建立一个模型,根据附加数据点预测价格。

他制定的多元回归模型是: 根据engineSize、horsePower、peakRPM、length、width和height估算价格。

定义的函数形如:price = f(engine size, horse power, peak RPM, length, width, height)

代入多元线性方程为:price = β0 + β1. engine size + β2.horse power + β3. peak RPM + β4.length+ β5.width + β6.height

费尔南多将这些数据输入到软件统计包中,来计算和预测相关的参数,最终得到如下的结果:

Markdown

多元线性回归模型为价格估算提供以下等式:

price = -85090 + 102.85 engineSize + 43.79 horse power + 1.52 peak RPM – 37.91 length + 908.12 width + 364.33 height

模型解读

多变量模型的解释提供了每个独立变量对因变量(目标)的影响。

上述等式提供了对价格平均值的估计。每个系数的解释与所有其他预测因子保持不变。

Engine Size:如果发动机尺寸增加一个单位,则平均价格将增加102.85美元。 Horse Power: 如果马力增加一个单位,平均价格增加43.79美元。 Peak RPM:如果Peak RPM增加一个单位,平均价格增加1.52美元。 Length:如果长度增加一个单位,则平均价格下降37.91美元(长度具有-ve系数)。 Width:如果宽度增加一个单位,平均价格增加908.12美元。 Height:如果高度增加一个单位,则平均价格增加364.33美元 模型评估 该模型已建成。它被解释。所有的系数都很重要吗?哪些更重要?模型解释多少变化?

Markdown

回想关于t-stat,p值和决定系数的定义的讨论。这些概念也适用于多元回归模型。该模型的评估如下: coefficients:所有系数都大于零。这意味着所有变量对平均价格都有影响。

t-value: 除长度外,所有系数的t-value均显着高于零。对于长度来说,t-stat是-0.70。这意味着汽车的长度可能不会影响平均价格。

p-value: 除长度之外,其他变量的p值的概率非常低。长度的p值是0.4854。这意味着观察到的t-stat偶然的概率是48.54%。这个数字相当高。

回想一下关于R平方如何帮助解释模型变化的讨论。当更多变量添加到模型中时,R平方不会减小,它只会增加。但是,必须有一个平衡。经过调整的R平方努力保持这种平衡。调整后的R平方是R平方的修改版本,它已根据模型中预测变量的数量进行了调整。调整的R平方补偿变量的增加,并且只有在新术语增强模型时才增加。

调整后的R-squared:R平方值是0.811。这意味着该模型可以解释训练数据中81.1%的变化。这比以前的型号(75.03%)要好。 结语 费尔南多现在有更好的模型。但是,他感到困惑。他知道汽车的长度不会影响价格。

他想知道: 如何选择模型构建的最佳变量集?有什么方法可以选择最佳的变量子集吗?

下一节,我们将讨论变量选择方法。

相关阅读:

相关阅读:

简明数据科学 第一部分:原则与过程

简明数据科学 第二部分:统计学习的关键概念

简明数据科学 第三部分:假设检验

简明数据科学 第四部分:简单线性回归模型

重磅丨2018世界杯热点报告

作者:TalkingData

刚刚结束的俄罗斯世界杯为全世界球迷带来了四年一度的足球狂欢。与往届世界杯相比,移动直播应用的参与为球迷观看比赛提供了新的平台,而看球时点一份外卖则成为了很多球迷夜宵的新选择。在《2018世界杯热点报告》中,TalkingData与美团、网易新闻合作,盘点本届世界杯对于移动应用的影响,描绘移动直播平台观赛人群画像,梳理世界杯下的球迷生活变化。

Markdown

世界杯开赛刺激移动直播应用用户增长

作为2018俄罗斯世界杯中国地区转播版权方,央视旗下两款直播应用——央视影音、CCTV5在世界杯开赛后迎来用户数迅猛增长,CCTV5应用周覆盖指数连续两周增速超过50%,而新媒体版权方咪咕视频应用周覆盖指数增速同样超过10%。

在开赛两周后,世界杯直播应用周覆盖指数告别快速增长,用户规模趋于稳定。

Markdown

广告虽然略显洗脑但是有用

本届世界杯的一大热点话题是移动应用也玩起了洗脑广告无限轰炸的套路,知乎、马蜂窝旅行、Boss直聘都在世界杯转播中进行了广告投放。虽然广告内容引发吐槽,但是大规模的广告投放对于应用用户增长仍然起了正面作用,三款应用周覆盖指数整体保持正增长态势。

Markdown

冷门迭出引爆关注,日本队自带流量

德国、西班牙两队分别爆冷输给韩国、俄罗斯的对决是半决赛前最受关注的比赛,两场比赛战报在网易新闻客户端中浏览量最高。日本队虽然止步十六强,但其击败哥伦比亚的比赛位居赛事关注度第三,而出局后整洁的更衣室又引发网友大讨论,关于日本队更衣室的讨论在世界杯新闻内容中热度最高。

Markdown

85后、90后男性是世界杯观赛人群主力

在俄罗斯世界杯移动端观赛人群中,26-35岁男性是占比最高的群体。足球仍然是男人的浪漫,世界杯观赛球迷人群中男性占比是女性人群的2.5倍。年龄分布中,26-35岁人群占比为49.9%,构成了观赛人群的主体。

Markdown

OPPO、vivo是世界杯观赛人群最常用安卓品牌

在世界杯观赛人群安卓设备品牌分布中,OPPO、vivo、华为居于前三位,OPPO、vivo品牌占比合计超过48%。安卓设备价格分布中,100-1999元是最受世界杯观赛人群欢迎的设备价位。

Markdown

德国队三十年老球迷占比最高

在阿根廷、巴西、德国等强队观赛人群中,英格兰队、巴西队最受女球迷青睐,法国队最受“钢铁直男”球迷欢迎。在各年龄段偏好中,19岁以下年轻球迷更喜欢西班牙、英格兰,而46岁以上老球迷更偏爱德国、巴西这两支传统豪强球队,86年的桑巴军团、90年的德意志战车是老球迷们永远的美好回忆。

Markdown

英格兰、法国比赛观众消费娱乐更为活跃

除视频、通讯社交外,游戏、金融理财、餐饮等类别应用在英格兰、法国比赛观众中覆盖率要高于其他球队。而在线下消费中,英格兰、法国比赛观赛人群在各消费类别中的活跃度也要明显高于其他球队观赛人群。

Markdown

搜索热度:看球、彩票、世界杯等关键词搜索量大涨700%+,毛豆、啤酒搜索量上涨超过40%,酒吧成为最热看球场所

Markdown

在家看球:比赛时段内送往住宅楼的外卖订单较平日上涨18%,男生最爱点炸鸡、烤串,女生则偏爱小龙虾、卤味

Markdown

梅西、内马尔等超级球星比赛的场次,夜间外卖较平日上涨17%

Markdown

酒吧看球:酒吧订单较平日上涨15%,清吧最受消费者欢迎,订单较平日增加18%

Markdown

出行+消费:世界杯期间,夜间周末出行订单较平日上涨18%,去往酒吧、KTV等娱乐场所的订单上涨14%

Markdown

 

TalkingData&链塔智库联合发布《2018中国区块链移动应用发展研究报告》

7月10日,智库BlockData与数据智能服务平台TalkingData联合发布《2018中国区块链移动应用发展研究报告》,展现2018中国区块链APP应用全景。

据悉,《2018中国区块链移动应用发展研究报告》(以下简称《报告》)调查覆盖中国7亿活跃移动互联网用户,从超过12万款热门应用中选取区块链App,从区块链App应用方向、项目类型、人群画像等多个维度展现中国区块链移动应用发展现状及创业生态,并对典型区块链APP进行重点分析。

Markdown

区块链企业高度集中北上广深杭

《报告》显示,从地区分布来看,区块链企业主要集中在北上广深杭,从行业分布来看,金融服务及企业服务是主力军。近几个月来,区块链企业融资增多,增速超过 P2P 金融及移动支付等 Fintech 技术。

根据技术发展情况,我国区块链应用主要场景包括:金融领域,企业服务,社交,文娱传媒,硬件,物联网,医疗健康,公益慈善,交通运输,人工智能,电商,房地产,教育,农业,工业,能源等领域。

《报告》强调,基于区块链技术的DApp尚处于早期探索状态,目前没有大规模实际应用价值的DApp出现,区块链相关App还是市场上的主力军。

和加密货币相关的App更受关注

链塔数据库收录了90款区块链相关App,根据苹果商店的分类划分,新闻类App最多共计38家,占比42%;财务类App共有17家,占比19%;参考类App有10个,占比11%;实用工具类App有12个,占比14%;工具类App共计6个,占比7%;其余合计占比7%。大部分的App还是和新闻和财务相关,说明这两个领域比较热门,符合行业状况。

Markdown

在部分新闻类App中,火球财经和金色财经的季度用户规模均超过20K,币头条的季度用户规模超过了10K。从使用率(活跃用户规模/安装用户规模)来看,贝壳头条最高为10.33%,说明下载贝壳头条的用户使用频率较高,而其他App的使用率大概在4%。

Markdown

其他类别的App中,OKEx的季度用户规模最大,超过了70K,但使用率不高,说明用户下载后并不是使用得很频繁。MyToken和OKCoin的季度用户规模超过30K。这三个App都是和加密货币交易相关,说明用户对此类App感兴趣。

区块链App人群以男性为主

区块链App使用人群中,男性人群占比超过70%,男性占比要比移动互联网用户中男性比例高17.7%。

Markdown

区块链App使用人群中,26-45岁人群占比合计超过70%,构成区块链App使用的主力;46岁以上人群占比要低于移动互联网同龄用户,中老年人群对于区块链应用的兴趣要低于青壮年人群。

区块链App人群更关心车子房子票子

相比于移动互联网用户整体,区块链App人群的应用兴趣更多的集中在汽车、房产、金融理财、家居等领域,对于物质条件的追求更为直接。

Markdown

而在网购、影音、生活等类别应用上,区块链App人群的兴趣要低于移动互联网用户,手机游戏是区块链应用人群最喜欢的娱乐方式。

区块链App人群偏好金融、运动类消费场所

与移动互联网用户相比,区块链App人群更加偏好金融、运动健康类线下消费场所,对于资产管理、个人健康管理更为热心。

Markdown

区块链App人群在经济发达地区集中度更高

在地域分布中,区块链App人群主要集中在广东、浙江、江苏、山东等东南沿海经济发达地区。在城市分布中,北京、深圳、上海、广州这四个一线城市包揽了前四位置。

区块链App人群在北京的工作地更多的集中在中关村、上地、望京、国贸、金融街等互联网、金融公司密集区域。而在上海的工作地分布区域更为广泛,并没有明显的区域聚集中心。

Markdown

Markdown

区块链App人群更偏好中高档价位手机

Markdown

相比于移动互联网用户,区块链App人群所使用的安卓设备中2000元以上价位占比更高,2000-3999价位占比要高出11.3%。区块链App人群更加偏好中高档价位手机。

在区块链App人群安卓设备品牌占比中,OPPO、VIVO、华为包揽了前三位。三者相加占比已超总体50%,市场集中度相对较高。

Markdown

需要完整版《2018中国区块链移动应用发展研究报告》的用户,可以关注链塔智库(公众号ID:liantazhiku)或网站,均可免费阅读完整版报告全文。

TalkingData合伙人&高级副总裁蒋奇:大数据如何为社会赋能?| 2018商业新生态峰会

2018年,商业创新迈进了新的阶段,在业务飞速发展的同时,风口大热背后的认知沉淀与实践积累也随之而来。7月10日,36氪与《零售老板内参》联合举办的2018商业新生态峰会在北京举行。本届峰会以“质”为主题,希望在时代浪潮下的新商业企业可以看清商业本质,并最终完成新商业的革新与升级。

Markdown

TalkingData合伙人&高级副总裁 蒋奇

美国管理学家、统计学家爱德华·戴明曾说过“除了上帝,任何人都必须用数据说话”,互联网时代在给人们带来了各类便捷服务的同时,也使得大量的数据源源不断地产生,那么如何分析、挖掘与计算这些大数据为企业赋能、助力城市发展?TalkingData合伙人&高级副总裁蒋奇在大会上发表了以“智慧城市和人本数据”为主题的演讲,为大家介绍了TalkingData的数据探索之路。

一、数据能力提升的两大要素

在谈到数据的重生时,蒋奇认为,就如同武侠小说中主人公功力大增,靠的是大量功力传入和武功秘籍这两个基本要素一样,数据的能力提升也需要几个条件:首先要有更大量、更全面的数据。

截至2017年底,中国约有智能手机13亿部、可穿戴设备4千万台、物联网设备30亿台,整个数据量为350EB。到2019年中,人和物联网设备的比例将会达到1:200。

当设备量级增长带来了数据量级指数级增长后,就将进入下一阶段——将实体物质化转变为数字虚拟化。虽然大量数据是前提,但简单的数据堆砌是无用的,仍需进行很多尝试。

蒋奇表示,TalkingData从创业到现在,从专注互联网行业到进入零售等垂直行业,一直在帮助企业做运营和业务的虚拟化。例如TalkingData与腾讯云合作推出的数据智能应用——智选,将海量数据与机器学习有机整合,满足零售业实体门店的智能选址、商圈经营等场景,并对周边商圈的人群类型、消费能力进行详细分析。

而做这些事情的目的是什么?商业的转型升级,也必须构建在城市基础之上,由对人群不断深入的认知所驱动。面对城市中川流不息的人群,他们来自哪里、要做什么、又有怎样的诉求?如果能够通过高度真实的虚拟化场景来洞察整个城市、洞察城市人群,相信无论对城市治理还是商业经营,都会带来显著效果。

Markdown

TalkingData智选

二、通过大数据打造“智慧城市”

蒋奇表示,除金融、零售等行业之外,TalkingData也一直眼于“智慧城市”的打造。通过大数据的手段对城市人群进行深度剖析,了解其需求与痛点,通过真实的、可透视的虚拟化场景,将城市展现在政府管理者或企业主面前,助力城市治理与企业经营。

因此,TalkingData不断地探索数据在智慧城市中的应用。蒋奇通过一个案例,来解读以人为本的数据,在人群洞察、构建智慧城市中的意义。

以往,对人群的分析和定义通常是基于非常单一的属性,给人群打标签是比较主流的模式。但中国经济发展如此迅猛,每时每刻都在诞生新鲜事物,每个人的思想与触媒习惯都在发生剧烈的变化。蒋奇认为,再用三年前的标签策略去判断人群属性在当今是不可行的。

因此蒋奇认为,在洞察人群时,需要新的维度与思维。TalkingData在此方面做了创新尝试,例如整合人群的线下位置分布、线上行为特征等多种数据,去重新定义在飞速变化的社会中的人群属性,以对在城市生活的所有人群有一个清晰、准确的认知。

比如将喜好购物和美妆、经常去线下文艺演出场所观看表演的人群等,定义为“比较文艺的买买买人群”;因共享经济应运而生的代驾、司机等,具有很强的流动性以及一定的消费能力与就业能力,可以定义为“城市自由人”;还有偏好娱乐、网购,消费能力不是很强、但消费意愿极强的“新鲜人”人群等。

以这样的视角来定义和描述人群此前从未有过,TalkingData目前专门建立了一个团队在做此类研究。

Markdown

TalkingData还打造了基于数据城市仿真的一套整体系统——“城市透镜”,能够多维度地洞察城市,对世界进行可视化呈现,最后把这些观察和需求,与基于AI 的动态学习模型相结合,在虚拟世界和现实世界转换中,增强对世界的感知和认知能力。

Markdown

统计魔方

​人口统计对城市治理有基础性的指导意义。以往的人口统计中,只需要了解一个家庭的人数、性别、年龄;而现在,还需要了解家庭的收入结构、购物倾向、旅游倾向、对政府治理的建议等等,来辅助国家的经济运行。

由于现今城市人口流动性很大,导致传统的人口统计模式很难精准,影响政策、施政目标的落地,因此TalkingData也与国家统计局设立了联合实验室,结合移动大数据的,探索更为准确、动态、及时、多维度的全新人口统计方式。此外,基于在人口统计方面的经验,TalkingData还专门推出了的移动大数据人口统计应用——“统计魔方”。

蒋奇认为,这些研究不能纯粹以商业化为目的。而“开放”也是2018年TalkingData战略布局的核心关键词之一,TalkingData希望将这些前沿性研究的成果,以非功利的方式开放给所有的企业和政府机构,给未来提升政府治理、智慧城市和商业变革带来助力。

券商转型互联网财富管理的三大核心方向

前言

2018年已经过半,随着券商佣金费率不断降低,国内去杠杆、美联储加息等多种因素导致的市场行情不佳、IPO业务及承销业务的持续低迷,券商经纪业务从传统通道服务向财富管理模式转型,俨然成为国内券商的当务之急。此外,当今互联网高速发展,大数据、人工智能等概念纷至沓来。金融科技又将如何助力券商转型互联网财富管理? 这一议题也引发了越来越多的券商行业从业者的思考。
TalkingData 依据自有数据,结合服务多家券商的咨询经验,形成此次报告,结合金融科技的应用,分别从用户、产品、服务三大方向,为券商转型互联网财富管理提供相关建议和新的启发。

互联网财富管理规模究竟有多大?转型空间还有多少?

据波士顿咨询公司发布的2018年全球数字财富管理报告显示,截至2017年底中国的互联网财富管理规模已达到6千亿美元。与五年前的百亿级美元管理规模相比,年化增速已超过50%。同时,截至2017年中国个人持有的可投资资产总额高达188万亿人民币,可投资资产超过1000万的高净值人数更是高达187万人。
在互联网行业飞速发展的今天,高速增长的个人财富带动了大量的线上金融资产配置需求,这无疑给互联网财富管理市场的发展创造了巨大空间。

目前互联网财富管理的竞争格局如何?

随着互联网财富管理市场规模的迅猛发展,市场上逐渐显现出如下四类主流互联网财富管理的竞争格局。其从客户、产品、服务三个方面显现出的特点也不尽相同。
注:点击可查看高清大图,下同
Markdown

券商开展互联网财富管理转型的现状

  1. 主流券商互联网化已趋于完善
随着2014年国金证券推出“佣金宝”,证券互联网元年的正式开启,券商先后经历了2015年的互联网导流、2016年的移动APP打造、2017年的智能化浪潮阶段,目前移动APP已成为券商零售业务新模式和互联网财富管理的重要载体。
TalkingData基于数据角度对目前券商APP活跃度进行评估,发现互联网化起步较早的券商,趋于完善的产品功能和运营,较优的APP活跃度都意味着这些券商的互联网化趋于完善。线下交易的线上化,为其逐步积累了大量的线上投资客户,同时也是为其互联网化财富管理的转型之路打下了坚实基础。
Markdown
  1. 转型之路的战略布局已开始
其实财富管理转型话题一直在券商行业引发诸多讨论和思考,不少主流券商也早已在不同方面对财富管理转型进行了战略布局。例如在内部架构方面,华泰证券重新构建了零售及财富管理、机构客户服务两大业务体系;国金证券撤销原经纪业务管理总部,成立了经纪业务执行委员会;广发证券新设立了私人银行部等。客户分层方面,中信证券对交易型和财富型这两类客户的服务各有侧重点,而国金证券也区分了普通投资者和专业投资者。投顾服务方面,华泰证券的财富管理体系以投资顾问为核心,投资顾问占从业人员的比例高达 25.43%,行业排名第一。
  1. 转型之路仍是机遇与挑战并存
尽管券商的互联网化逐渐趋于完善,也已开始财富管理转型的战略布局,但对比目前拥有一定市场规模的主流互联网财富管理机构,券商其自身还是存在如下优劣势。
Markdown

数据时代券商转型互联网财富管理的三大核心方向

结合券商转型互联网财富管理上自身的优劣势,其需要基于移动APP,着眼于客户、产品、服务三大核心方向,利用大数据科技手段,以服务客户为中心,给予客户投资前、中、后三阶段的完整投资生命周期体验,协助投资人实现全方位专业资产配置的财富管理需求。
  1. 客户方向

  • 客户认知重塑:打造全方位综合型财富管理品牌
现阶段证券公司主营业务收入仍是以代理买卖证券业务及证券承销与保荐业务收入为主, 客户认知上比较固化,投资者对券商的普遍认知还仍以股票交易为主,并非财富管理或理财。因此,券商需在财富管理市场中定位其核心竞争力,重塑客户的品牌认知,从而打造全方位综合型的财富管理品牌。
  • 客户需求洞察:通过KYC描绘精准、多维的客户投资画像
客户需求洞察,做到企业比客户更懂客户,向来是提升业务运营的坚实基础, 同样也是提供针对性综合服务最有力的切入点。
TalkingData建议从客户的资产量、交易行为和用户特征三大方面着手,建立多维度交叉立体的KYC数据体系。全方面了解客户特征,洞察客户投资需求。例如TalkingData AE5.0用户洞察功能可以协助传统券商实现数字化KYC,目前其已有效协助国泰君安证券、民生银行等多家金融机构,成功构建KYC数据分析平台,利用数字化手段勾勒出投资客户画像,为企业后续精细化运营打下坚固的基础。
Markdown
  • 客户需求洞察:利用大数据科技精准定位高净值客户群体
TalkingData 可以按照客户需求,通过地理聚集原理,建立数据模型,利用机器学习加工某个特定区域的高净值人群设备,再将这些设备通过TDID等信息打通数据,以最终实现帮助客户精准定位到高净值客户群体。
Markdown
  1. 产品方向

金融产品多元化:打造全品类资产配置并通过KYP定位产品优势
  1. 提供风险收益比更高的固定收益产品:专业的客户资产配置中,固定收益类产品所占比例通常较大。且以固定收益类产品作为与客户交流的起点,更容易得到客户的认同和接受。
  2. 包装创新金融产品:金融市场不断发展,监管环境不断变化,也应面向市场不断推出新的金融产品。包装成功的创新金融产品也是抢占市场流量的有效方式之一。
  3. 打造综合资产配置概念:摆脱传统券商单纯炒股的资产保值理念,结合更多不同理财型资产类别,实现多元专业的金融资产配置。
  4. 通过动态竞品分析软件实现KYP(Know Your Product),动态跟踪市场上金融产品全面数据信息并进行分层排序,从而迅速掌握市场金融产品情况,实现更精准专业的资产配置,利于调整产品运营的策略,完善自身金融产品多元化。

三. 服务方向

提供差异化服务:线上线下联动,搭建以客户为中心的专业服务体系
  1. 发力投资者教育
Markdown
  1. 建立投后管理服务
传统的投后管理多以客户发出指令或提出服务需求、理财顾问被动响应的模式为主。
而做出差异化投后服务,可变被动为主动。 利用“智能客服” 去主动触达客户,解决客户日常基本咨询问题甚至投资收益跟踪提醒,释放出更多人力,以提供定制化资产配置、法务及税收等方面的咨询服务。
TalkingData AE5.0营销活动管理是国内首个将营销闭环整合至移动分析平台的行业产品,其不仅能追踪并分析营销活动效果,同样在投资者教育和投后管理服务方面也可以起到相似的作用。协助券商客户追踪并分析投资者内容教育方面的转化,评估投后管理服务的推送点击情况及客户满意度,进而不断帮助业务人员优化财富管理的服务体系。
Markdown
“智选”是TalkingData与腾讯云联合,依托于各自强大人本数据和地理信息数据,结合经典模型和预测算法,对特定区域周边的人群进行整合分析的数据智能平台。券商可以借助智选平台,整合各线下营业网点周边的客群特征、客群需求、客群流量等,进而调整网点经营和营销方面的策略,以达成提升线下网点服务质量的最终目的。
Markdown
更多财富管理转型咨询,请联系——
400-870-1230
support@tendcloud.com
Markdown

多种措施并进,TalkingData有效保障数据安全与合规

数据安全和合规性是企业运营的重要基础。

公安部网络安全保卫局郭启全总工曾在公开场合表示,国家对网络安全等级保护制度提出了新的要求,等级保护制度已进入2.0时代。

TalkingData非常重视数据合规及数据安全。在近日举办的TalkingData 2018产品及战略发布会上,TalkingData创始人兼CEO崔晓波在演讲中强调了对数据安全的关注以及努力,并将“开放、连接、安全、智能”作为TalkingData的战略方向与差异化优势。

Markdown

目前,TalkingData按照国内法规、甚至GDPR的要求,将数据安全作为全局考量,纳入所有业务和产品的设计与落地中,并在数据保护技术方面持续进行大量探索和实践,包括与MIT麻省理工学院合作研发创新性的技术框架OPAL(Open Algorithms)。

Markdown

6月27日,公安部制定并发布了《网络安全等级保护条例(征求意见稿)》,将网络安全保护等级分为五个等级,贯彻落实《中华人民共和国网络安全法》,深入推进实施国家网络安全等级保护制度。

TalkingData已在日前开展了信息安全等级保护备案工作,以尽快明确自身安全保护等级,从而更好的按照该条例的规定承担相应的安全保护义务。

此外,为了更好的保护数据安全,企业也应将国家要求与业务需求相结合,发现系统内、外部存在的安全风险和脆弱性,提高信息系统的信息安全防护能力,降低系统被各种攻击的风险。

为此,TalkingData早在2014年就通过了ISO27001:2013信息安全管理体系认证,并于2017年获得了CMMI(level 3)的认证,这标志着TalkingData的数据安全管理过程更加规范,并在数据安全、设备安全、信息系统安全、人员安全管理等方面均达到了国际化的较高水平。

CMMI(Capability Maturity Model Integration), 由美国国防部与卡内基-梅隆大学软件工程研究中心以及美国国防工业协会共同研发,是对于企业软件能力成熟度集成模型的国际化权威认证。历经复杂的准备与认证过程,TalkingData已在2017年5月5日获得了CMMI(level 3)的认证。获得此项认证,说明TalkingData已将软件管理和工程两方面的过程文档化、标准化,并综合成标准软件,使信息处理合规化;同时也说明TalkingData在软件工程管理和开发改进能力以及信息处理方面达到了国际化领先水平,有能力为合作伙伴提供值得信赖的软件开发与维护服务。

Markdown

ISO/IEC27001:2013是国际化通行的信息安全领域的管理体系标准。通过此项认证,意味着企业已经建立了一套科学有效的管理体系,可以有效保护信息资源,保护信息化过程健康、有序、可持续发展。TalkingData已于2014年11月17日首次获得此项认证,并于2017年11月15日再次获得了此项认证,这意味着TalkingData有能力向客户提供值得信赖的服务,同时有能力向信息主体与有关主管部门作出企业信息安全的保证。

Markdown

TalkingData认为,数据安全与合规性既是企业运营的底线,也是影响未来健康发展的重要指标,TalkingData会继续将数据安全与合规性作为关键工作给予重视与投入。

Markdown

【邀请函】TalkingData & 德勤中国 数据安全峰会将在北京举办

Markdown

随着大数据时代的到来,数据已经成为与物质资产和人力资本同样重要的基础生产要素。大数据正在重塑世界新格局,被誉为是“21世纪的钻石矿”,更是国家基础性战略资源。在大数据时代,机遇与挑战并存,越来越多的数据共享开放,交叉使用。针对关键信息基础设施缺乏保护、敏感数据泄露严重、智能终端危险化、信息访问权限混乱、个人敏感信息滥用等问题,急需通过加强网络空间安全保障、做好关键信息基础设施保护、强化数据加密、加固智能终端、保护个人敏感信息等手段,保障大数据背景下的数据安全。

国家高度重视大数据安全,将其作为国家发展战略予以推动。2016年11月,第十二届全国人民代表大会常务委员会通过了《中华人民共和国网络安全法》,鼓励开发网络数据安全保护和利用技术。2016年12月,国家互联网信息办公室发布了《国家网络空间安全战略》,提出实施国家大数据战略、建立大数据安全管理制度、支持大数据信息技术创新和应用要求。在欧洲,从2016年4月14日,欧洲议会投票通过了商讨四年的《一般数据保护法案》(GDPR),该法案于2018年5月25日正式生效。GDPR的通过意味着欧盟对个人信息保护及其监管达到了前所未有的高度,堪称史上最严格的数据保护法案,并对中国企业造成深远影响。

TalkingData和德勤始终保持着对数据信息安全、数据保护相关法律法规的高度关注,专注于为企业提供全面而深入的服务。为交流经验,凝聚共识,TalkingData和德勤中国将于2018年7月31日在北京举办“TalkingData & 德勤数据安全峰会”。届时我们将邀请来自知名机构、独角兽企业高管及精英共聚一堂,深度对话大数据环境下的数据信息安全。

在此,我们诚邀您出席本次活动,聚焦网络安全法规、数据安全实践、企业发展策略等关键议题。期待您拨冗莅临!

峰会详情

主办单位

  • TalkingData
  • 德勤中国

日期

  • 2018年7月31日(星期二)

时间

  • 13:30 – 17:00

地点

德勤北京办公室(北京市东城区东长安街1号东方广场W2座3层)

峰会议程

Markdown

报名及垂询

请扫描下方的二维码报名参与

Markdown

如您有任何垂询,请联系

马涛

TalkingData

电话:+86 136 0125 3356

邮箱:tao.ma@tendcloud.com

周立彦

德勤中国

电话:+86 (10) 8512 5909

邮箱:liyzhou@deloitte.com.cn

北卡州立大学与中国人民大学签署校级合作协议

2018年7月3日上午,北卡罗来纳州立大学与中国人民大学正式签署校级合作协议,致力于专业数据人才的教育项目共建。

北卡罗来纳州立大学拥有深厚的统计分析人才教育积淀,同时也是分析软件SAS的诞生地,在专业数据人才的培养上,除了传统的理论学习,更加注重数据的实战训练。其首创的数据分析硕士项目(Master of Science in Analytics,简称MSA)被2014年《哈佛商业评论》评为全美“大数据”专业榜首,常年居于北美专业硕士就业率和毕业生平均薪资排名前列。

中国人民大学在统计学学科底蕴深厚,位列高校前茅,其为迎接大数据时代挑战而成立的统计与大数据研究院致力于构建世界一流的统计与数据学科,在学科前沿原创性研究与高水平学科交叉人才的培养上更具前瞻意识。

本次合作双方旨在推动数据人才教育,通过引入领先的专业数据人才学位项目,结合TDU提供的数据实训平台与数据实战行业指导等内容,共同推动国内专业数据人才的培养进程。

Markdown

Markdown

推广期,如何准确衡量渠道的质与量?

对于开发者而言,渠道推广是获客的重要一步。为了统计不同渠道的推广效果,渠道分析是开发者的必然选择。

Markdown

渠道虽然有免费和付费之分,但在推广期都会消耗开发者成本。由细分领域组成的免费长尾渠道,虽流量不可小觑,但耗费大量发包时间。而涉及到分层或买量的头部渠道,却是资本和时间双重成本的叠加。虽然开发者付出了时间与金钱,但并不意味着,此举就是有用功。

开发者无论接入第三方数据分析服务还是自行跑码统计,通过有效指标评估投放渠道质量,是优化渠道、控制成本的有效手段。作为是国内领先的第三方数据智能服务商,TalkingData App Analytics的渠道分析功能,可帮助开发者收集、处理、分析,形成客观的渠道数据报表。使开发者掌握各渠道表现,敏捷优化/改善推广方案,持续发现流量洼地降低成本。

Markdown

渠道分析功能图

如何使用渠道分析功能

App 开发时,集成TalkingData App Analytics SDK即可获得渠道分析功能,帮助开发者实时了解各渠道从用户获取再到参与留存、效果转化等诸多环节的数据表现。

Markdown

TalkingData App Analytics

渠道分析功能特点

1.全平台兼容

支持全部开发平台,无需开发者集成多个SDK,不增加包体负担,全渠道数据一览无余;

Markdown

2.数据客观性

①TalkingData是国内领先的第三方数据智能服务商,各渠道实时数据更客观;

②针对渠道带来用户生产的数据,拉长考察时间区间,更有利于对渠道质量甄别;


渠道分析demo演示

3.多维度节约成本

①无需开发成本,集成即用。数据服务稳定,免去开发者维护成本;

②推广渠道质与量双层优化,降低开发者发包时间、推广成本;

TalkingData App Analytics的渠道分析功能,使开发者以数据为依据,抛开个人喜好,把推广重点关注在真优质渠道,而不是局限于有声量的头部渠道和免费的长尾渠道。让开发者结合渠道数据有针对的调整和优化推广策略,助力开发者推广期准确衡量渠道质与量。

Markdown

TalkingData发布2018年最新战略布局,探索发展新路径

Markdown

今天,TalkingData在北京举办了以“始于初心,重塑未来”为主题的产品及战略发布会,正式宣布了2018年最新战略布局,以“开放、连接、安全、智能”为核心,着力探索中国大数据行业的发展新路径。

Markdown

TalkingData创始人兼CEO 崔晓波

在国家战略政策利好下,大数据的理念普及已完成,更大的困难在于如何真正从数据中形成智能,提升商业决策与人类生活,这也是所有大数据企业共同面临的挑战。TalkingData创始人兼CEO崔晓波在发布会上强调,数据的核心不是拥有而是连接,TalkingData将突破传统的数据源公司、数据软件公司、咨询公司模式,探索创新发展路径,以“数据智能服务商”为定位,基于开放连接的理念构建整合数据产业链各方资源的平台生态,这样才能集产业之力,真正实现“数据改变企业决策、数据改善人类生活”——TalkingData自成立以来一直坚守的初心和愿景。

为此,TalkingData从战略层面对平台能力进行了全面升级,以SmartDP数据智能平台和SDMK数据智能市场作为双核心驱动,在安全合规的前提下,一方面接入各渠道数据源,打破各企业间的数据孤岛;另一方面基于强大的平台能力,为各方开放提供面向业务场景的数据智能应用与服务。

Markdown

SDMK数据智能市场

安全合规是TalkingData非常重视的基础。目前,TalkingData按照国内法规、甚至GDPR的要求,将数据安全作为全局考量,纳入所有业务和产品的设计与落地中,并在数据保护技术方面持续进行大量探索和实践。

崔晓波表示,“开放、连接、安全、智能”将成为TalkingData继续领跑行业的差异化优势与竞争力。

零售、营销、金融和智慧城市是TalkingData重点聚焦的数据智能应用领域。此次发布会上,TalkingData同时公开了针对这四大领域的重量级产品。

TalkingData特别邀请到腾讯云大数据应用产品总经理聂晶,正式介绍了TalkingData联手腾讯云发布的面向线下品牌商的数据智能产品——智选。智选有机整合了海量数据与机器学习技术,旨在解决实体门店的选址、商圈经营等场景问题,为智慧零售及多元化线下产业提供帮助。

Markdown

腾讯云大数据应用产品总经理 聂晶

此外,杭州决对信息科技有限公司CEO冯江也受邀在此次发布会介绍了旗下大数据风控、资产交易咨询、零售信贷业务咨询等产品,分享如何与TalkingData联手运用金融科技解决行业数字化转型所面临的痛点,助力行业链条发展。

Markdown

杭州决对信息科技有限公司CEO 冯江

基于与国家统计局在人口统计方面长期合作所积累的经验,TalkingData此次正式推出了以准确、动态、及时、多维度为优势的移动大数据人口统计应用——“统计魔方”。同时,以TalkingData Brand Growth品牌广告价值分析平台为代表的TalkingData营销领域产品和数据服务,也在此次发布会上宣布了重要升级。

Markdown

统计魔方

这是TalkingData成立以来的首次战略发布会,也凸显了此次全新战略布局的里程碑意义。TalkingData希望更多与合作伙伴携起手来,共建开放连接的数据产业生态,让大数据真正对人类有所裨益

关于TalkingData

TalkingData 成立于2011年,是国内领先的第三方数据智能服务商。借助以SmartDP为核心的数据智能应用生态为企业赋能,帮助企业逐步实现以数据为驱动力的数字化转型。

Markdown