:::: MENU ::::

TalkingData's Blog

现在开始,用数据说话。

TalkingData CEO崔晓波深度专访:真正懂大数据的公司不说大数据

  • Feb 13 / 2014
  • 0
Ideas

TalkingData CEO崔晓波深度专访:真正懂大数据的公司不说大数据

编者按:本文是CSDN对TalkingData CEO崔晓波先生的独家专访,转载请保留出处http://www.csdn.net/article/2014-01-23/2818242/1

 

摘要:1.免费只适合2C,不适合2B;2.在存储领域,摩尔定律已失效。3.有巨头找过TD,但TD只想把壁垒垒高;4.在融资1000万美元之前,曾两次融资遭拒;5.创业第一年不加班,这是场持久战,不能一开始就拖垮团队。

 “友盟被阿里收购了,如果有巨头考虑收购TalkingData,你会同意吗?”“你可以把如果两个字去掉,因为你能想到的巨头都找我们谈过了,但是数据分析这个行业,如果壁垒垒得够高,后来者很难超越,我们一开始就决定继续往上做。”崔晓波如是说。

崔晓波是TalkingData创始人兼CEO,公司去年年底刚从北极光创投获得了1000万美元的投资。下面是对崔晓波(如下简称崔)的专访全文:

leocui

图:崔晓波

病毒少年的大学生涯

CSDN:可否说说您自己曾经的计算机经历?

崔:我1993年到1997年都在南开大学信管专业。1993年那会儿,计算机还处于286、386、586的时代,大家都喜欢研究操作系统,包括当时的OS2、DOS系统,而与操作系统结合紧密的就是病毒,所以那时候也一直在研究病毒,比如第一代大麻病毒、小球病毒、变性病毒等。

大一的时候就开始研究学校机房的管理员如何保护计算机,喜欢写一些病毒植入学校机房,某天他们发现有人进入了内部系统,还会留下“CXB”几个字,于是开始调查,最后发现是大一一个叫崔晓波的新生,他在这方面有特殊爱好,于是找到我加入管理团队。也就是在那个时候开始研究加解密,认识了王江民、求伯君、吴晓军。当时大家基本上都在做汉字系统、操作系统,跟他们在算法上交流比较多。

自己还发现了操作系统中的一些漏洞。比如微软的系统里面的一些逻辑问题,可能导致系统产生死循环,有次有台机器坏了怎么也无法修补,永远死在Starting MS Dos那个地方,很多老师学生都怀疑是硬件出问题了,但我觉得是系统逻辑上有问题,所以自己又把微软操作系统源码返回去看了一遍,发现系统读硬盘分区表可能会产生死循环,因为是链表结构,如果分区表坏了,循环图过不去就成了死循环,我为了验证猜想就做了一个病毒程序植入系统,把分区表拿出来来看看,发现果然是链表损坏。

后来江民做了一个逻辑锁,破KV300,或者KV3000应用的时候,如果发现你是盗版,它就会给你加个逻辑锁,把你的机器锁住,实际上就是用了这个原理。因为当时跟江民交流比较多,东西大家共享也无所谓。

身心俱疲后曾欲重返甲骨文

CSDN:您是从甲骨文出来的,在毕业后到去甲骨文的这段时间里,您都在忙什么?

崔:毕业之后直接去了晓军电脑,后来他正好也在北京的一个国企里面,因为大家比较熟悉,再加上自己当时觉得国企可以解决户口和住房,所以也跟着过去了。在那里待了两年多,到了1999年就出来做网站,当时做了几个网站,比如中国彩票网、51CP、融资网、棉花系统的交易系统。

大概到2001年,互联网泡沫破灭,2002年1月进入BEA。大的外企他们的销售流程比较成体系,研发也有专业的流程,所以想进去感受一下。

刚开始做售前,负责对大客户的沟通,包括移动电信银联的沟通,中间几年开始做解决方案,比如高铁客票,电信3G支撑系统,最后被调到研发,所以是从前做到后。在那里待了8年,第七年的时候BEA被Oracle用85亿美金收购,接着进入甲骨文的ANC部门,支撑大的合作伙伴,比如华为、普华永道、东软,做技术总监做了一年多出来。

从甲骨文出来之后去了一家创业公司上班,那是一家做邮件推送的公司,产品形态类似于黑莓,但因为方向和当时的创始人看法不一样所以就出来了。2010离开那家公司,中间歇了半年,因为当时在创业公司加班很厉害,一周睡不了几个晚上,邮件服务是个强运营的服务,尤其是做邮件推送,版本迭代升级,大部分都在晚上做,长期疲劳休息不好,有一段时间都差点重返甲骨文,当时都拿了甲骨文offer,但从甲骨文出来的同事说都出来了就别回去了,再加上休息了一段时间以后,心态身体都恢复差不多了,觉得能再折腾一段时间,所以就想再试试。

TalkingData的变迁:社交挖掘——推荐——数据分析

CSDN:TalkingData最开始是做什么的?

崔:从2011年6月开始筹划TalkingData,最开始想做社交网络数据挖掘工具,跟新浪微博也有过合作,包括情感分析、娱情分析等等,后来TalkingData跟新浪运营团队交流少,他们心气也比较高,认为微数据很多水平的方向他们可以自己搞定,给创业团队应该做一些垂直服务,比如礼品、招聘、旅游,但我觉得那个市场太小,所以很快就放弃了那个方向,虽然拿到社交数据的成本低,但大的环境不好,所以就决定做回移动。

CSDN:怎么就进入了数据分析这个行业?

崔:因为自己接触分布式系统和数据挖掘比较多,在上一家创业公司里也看清楚了趋势,移动互联网肯定是个方向;大数据肯定是个方向,但单纯做工具的意义不大。所以后来开始给应用商店做服务,比如91、机锋、因为它们本身对分布式的理解和投入的资源不够,所以就帮他们做排名和推荐算法,包括一些基于机器学习的推送。比如和机锋合作的云推送,都是基于算法做的,效果还不错,花了四个月的时间把机锋的应用推荐转换率最多提高了10倍,后来同步推也使用我们的推荐引擎,但那时候做得有点早,很多应用商店和应用也都刚起步,没有自己的盈利模式,作为技术提供方,就更没有盈利模式。

所以当时很多朋友建议往更多基础的方向去做,比如做数据的统计分析,因为当时移动开发者的需求也就只到这个程度,我也觉得这个方向还不错,于是开始在2011年研发移动统计分析平台。第一个版本从2012年4月正式上线,到目前为止覆盖独立智能设备4.5亿,覆盖2万多款应用,是现在算最大的第三方移动数据服务平台,因为友盟被收购了,Flurry还没有真正进入国内。

免费只适合2C,不适合2B

CSDN
:TalkingData现在的商业模式是什么?

崔:在数据分析上经历了三个阶段。最开始是做通用的分析工具,比如留存率分析、活跃度分析,类似于国外的Flurry,那时候Flurry如日中天,MixPanel刚转型到移动,Apsalar也刚刚出来,国外做类似产品的大概有20多款商品,但只有Flurry是免费的,包括国内的友盟也是走这样的路子——免费+广告的模式,但当时我们没太想明白这种模式,所以也没做,加上当时定位就是纯数据相关的服务,没有想过要进入一个特定的业务,所以就没有走F2P路线。

其实大家都以为免费好,可能对于普通用户来讲,免费是好,但是对于企业用户,如果你免费了,人家会怀疑你的实力、动机,以及生命力,反倒起反作用。我们的垂直服务,包括游戏、电商、金融等服务全是收费的,其实企业的核心诉求还是服务质量和安全性,比如跟平安、招行的合作,如果免费,人家会认为你一家创业公司能撑多久?一些游戏的开发者很多都很有钱,宝开、触控、乐逗不在乎你的钱,如果你免费,人家会怀疑你是要用我的数据吗?所以免费逻辑在这时候并不成立。

数据对很多开发商的意义不同,在电商那里可能是第一敏感,到游戏哪里,可能就不是了,比如移动游戏,很多生命周期都比较短,可能只有一两年,他们在意的是怎么在有限的时间里利用好数据,从而带来更多利益,而不是免费。

很多人建议,你现在有移动游戏的几乎所有数据,不仅是活跃度、安装量、还有收入,你们应该做发行平台,很快你们就能成为大的游戏分发商;有的人也建议,你们是最大的移动广告监测平台,差不多有80%的开发商有合作,包括Inmobi,既然有这么多的广告监测数据,就应该做DSP平台,很快就能变大;也有人说,你有那么多的金融客户,就应该做互联网金融。反正有很多人告诉你很多可能性。

但从创业开始就想的比较清楚,不会做任何具体业务,只提供数据服务,这份工作本身是个慢活,但需要中立性,一旦进入一个业务,你可能就失去了中立性,所以TalkingData只做数据挖掘、分析。

另一方面,如果把移动互联网看成一个数据源,有开发者愿意提供数据,有大客户愿意花钱交换这些数据,TalkingData则提供数据交易平台,这在国外有很多例子。

你见过Google或亚马逊说大数据吗?

CSDN:你们做数据分析的怎么看待大数据?大家都在说,但其实大家都不懂。

崔:第一点,大数据也不是一个新鲜概念,只是大家把许久未解决的问题解决了,然后用新的概念包装了一次。真正做大数据的公司都不谈大数据,比如Google、亚马逊,它们对大数据采集分析处理的能力远远超过同类公司。

第二点,在存储领域,摩尔定律已经失效了,存储成本的上升高于摩尔定律。以前大家处理数据都是这样的,只要有数据就存下来,以后再去想怎么分析处理,怎么用于商业,但现在这种方式已经失效了,因为现在存储和处理数据的成本已经远远高于业务能带来的边际收益。大数据给大家带来的第一个问题是数据变现问题,否则业务可能都支撑不住。

第三点,现在很多人都在提3V、4V,但我就关注一个V,Value,就是数据真正的价值在哪里?TalkingData从创立以来一直特别注意这点,为什么通用的服务很快就不再推了,因为那些数据没有用,通用的数据,实际上是比较不规则的、无效的、没有价值的,对你来说就意味着成本。当时我们收集了很多数据,试图建立一些模型给伙伴提高转化率,但发现这个信息太弱了。去年和Flurry几个创始人聊过这个问题,他们成本很高,每年会花3100万美金在统计手机上,但并不带来收益,这点他们自己也表示后悔。

CSDN:你觉得针对移动互联网,数据分为哪几类?TalkingData主攻哪一类?

崔:如果纯针对移动互联网,那么数据类型有三大类:

第一个类是基础信息,比如设备信息。用了什么设备?芯片是什么?用了什么运营商的服务?这些信息有用吗?有用,因为很多设备商运营商会购买报告,但是我们没有走这条路,因为在中国卖数据报告是不可行的,至少没有成功的先例,而且容易走偏。

第二种类型的数据就是与应用相关的数据,包括客户用了哪些应用?程度有多深?因为和很多应用商店合作,所以我们会交换到很多这种数据,这些数据很有价值,很多投行也会来问我们,那些上市公司应用情况到底是什么样的?在Android的排名到底是不是真的?其实我们都有,但是不会说,说的意义不大,在这样的复杂的环境里面,没必要说。

第三种是客户行为数据,反应客户的消费倾向性、交易行为、喜好、位置信息,这些数据蕴含巨大价值,但这些数据价值的挖掘需要找到一种可行的方式,所以现在我们在金融领域大量尝试这种方法。金融实际是数据的大客户,现在所有银行都想推出一些基于风控系统的新型信息系统。

CSDN:移动应用的发展,你们应该看得很清楚,能否与开发者分享一下?

崔:移动应用发展很快,去年前年就是工具、游戏,到2013年,各种应用已开始与人的生活息息相关。从使用设备的情况来看,人现在使用移动设备时长一般在8个小时左右。从互联网人群渗透率来看,去年活跃的是3.2亿,其中有3亿是游戏人群,每年还在以很高的量增长。

CSDN:TalkingData未来是否也会对可穿戴或者物联网的数据进行分析?

崔:移动是多维度的,有了传感器、陀螺仪、气压计,数据类型也更丰富,所以现在也做一些客厅、汽车、可穿戴比如健康类数据的研究,客厅市场比想象的来得还快,现在有客户会提需求,比如判断他精准投放广告时,人是否处在家庭里面。

 

不考虑被收购,只想把壁垒垒高,把公司做大

CSDN:你怎么看待你们与Flurry和友盟的差异?

崔:我觉得做公司分几步。第一步证明你的团队和产品OK,TalkingData走到了这一步;第二是找准你的商业模式;第三才是规模化。这个不能倒过来,如果反着走可能会很危险,Flurry现在就面临这个问题,它在找准自己的核心商业模式之前迅速规模化了,成本非常高。

TalkingData创业以来就很注意这方面,所以通用的很快就不推了,后来之所以推垂直系统,因为那些是偏交易的、偏行为的,很多能直接反映人的倾向性,搜集的是蕴含价值的数据,那些数据值得去投资。至于友盟,因为现在被收购了,它已经失去了中立性。

CSDN:友盟被收购了,假如以后有公司想收购你们,你们会考虑吗?或者自己想过上市吗?

崔:你可以把“假如”两个字去掉。半年前,几个巨头也找过我们谈收购,但数据本身就是需要中立的,一旦被任何巨头战略投资或者收购,你的业务就没意义了。我们更愿意做的是把壁垒垒高,一旦垒高,别人要追上你实际上非常难。TalkingData正好踩对了点,赶上移动游戏、金融飞速发展的阶段,后来再出来一个这样的平台很困难。

另外我们本身一直很注意收支平衡,在这方面压力不大,所以大家还是更愿意往上做,把壁垒垒高,继续做大。

CSDN:去年北极光投了你们1000万美金,能否谈谈融资经历?

 

崔:第一年我们找投资人,说我们跟91、机锋都有合作,投资人不信,他们觉得TalkingData不可能做起来,所以最开始的资金都是几个创始人投进去的。第二年又去找投资人,说我们会做垂直领域,会做游戏、金融、电商,当时也没人看好。到这次融资的时候,他们把TalkingData之前的BP翻出来看,发现我们的业务规划和做法和之前预计的也相差不远,所以这次才信了。

这轮就比较简单,5月开始启动融资,当时有8家公司在跟我们,最终选择北极光是因为他们追踪我们时间比较长,相互之间了解最深,北极光在投融资领域都是很有实力的,并且他们对自己投资的公司都非常支持,吴峰对这方面也很了解。

创业第一年不加班

CSDN:能否说说你们的研发团队?

崔:研发团队现在就两拨人,一拨是从毕业到甲骨文,再出来,跟了我十几年的人;另一拨至少也跟了五六年,大家在分布式运算、数据挖掘方面积累也比较多,也相互很了解,所以磨合成本和沟通成本很低,基本上都就事论事,氛围很好。我们在技术上几乎没走什么弯路,并且自己对规划看得很重,从一开始就想好了,到那一步要怎么扩展怎么走,比较谨慎。

CSDN:能否说说你们的算法团队

崔:算法团队现在有5个人,做算法很小的圈子,人力资源紧张。算法团队的张夏天,在领域里还是比较有名的人,他是北邮数学系毕业的,后来去IBM一直研究推荐系统,后来又去了腾讯研究广告。我们尽量人尽其用,不必要的项目就舍弃,把人力物力用在刀刃上。

CSDN:你对TalkingData开发团队在节奏和质量上有什么要求?

崔:我们一直注重是控制节奏,可能很多人不信,我们创业第一年极少加班,即便加也是遇到了紧急事务需要处理。我那时候天天给研发总监说,不要加班,周六周日千万不要来公司,创业很长,不能把团队拖垮了,悠着点走。几个创始人也是这样的想法,比较强调效率。有的创业公司一开始就把人拖垮了。当时我们在雍和宫一个孵化器里面,很多创业公司恨不得天天加班,最后他们都相继倒闭,只剩下TalkingData一家。创业持续性很重要,耐力很重要。

CSDN:组建团队过程中有什么比较有意思的事情发生吗?

崔:因为大家都认识,反而太顺了比较乏味,倒是我们的名字和域名来历比较有意思。

当时看了一本书,著名统计学家写的,大概意思翻译过来就是,除了上帝,所有人都要看数据,所以就用了TalkingData,但那时候我们用的不是.com域名,而是.net,但是大多数人都习惯用.com,而那个域名指向的是美国一家专为银行做设备的公司。

所以我们找到那家公司,托中间机构买他们的域名,他们很生气,我们说我们是创业团队,域名很重要,后来他们说,干脆你们直接把我们公司也买了吧,当然他们很不错,我们买不起,中间谈了一年多,最后和对方做成了朋友,以一个比较低的价格买下来了,所以天下还是有好人。

创业公司都应按“线”去看而不是按“点”来看

CSDN
:成功不可复制,但失败可以避免,你觉得创业公司怎么避免走弯路?

崔:其实我现阶段算不上成功,也比较讨厌成功学。如果非要说点什么,那就是任何创业公司,要按一条线去看,不能按一个点去看,你要看今年怎么做、明年怎么做、未来怎么样做。这个过程中要把人照顾好,把资金安排好。人很重要,方向有问题还可以调整,人不对了就很难回头了,创业团队有80%都是自己把自己弄死的。

另外,融资以后,有的团队会平均花费资金,比如分五年花,有的则玩命花,前期投入很大,一年半内把资金全烧掉。我觉得融资一定要做好规划和预算,该花的花该省的省,不能平均也不能玩命。TalkingData推游戏产品的时候,我们砸了很多钱做广告,该用的广告位都去打广告,之前很多小朋友质疑,这么打对不对,但最后我们该扫的开发者都扫到了。

坚持很重要。刚创业的时候,老前辈说,创业最危险的是第一两年,撑过了就安全了,无数团队就是死于头两年,所以做规划和预算的时候,要考虑怎么撑到第二个年头,但是,如果你两年之后你再重复做同样的事情,那就不要做了。

Leave a comment

随时欢迎您 联系我们