你好,游客 登录
背景:
阅读新闻

TalkingData CEO崔晓波深度专访:真正懂大数据的公司不说大数据

[日期:2014-02-13] 来源:CSDN  作者: [字体: ]

  “友盟被阿里收购了,如果有巨头考虑收购TalkingData,你会同意吗?”“你可以把如果两个字去掉,因为你能想到的巨头都找我们谈过了,但是数据分析这个行业,如果壁垒垒得够高,后来者很难超越,我们一开始就决定继续往上做。”崔晓波如是说。
  崔晓波是 TalkingData创始人兼CEO,公司去年年底刚从北极光创投获得了1000万美元的投资,在友盟被收购以后,TalkingData也就成了国内唯一一家有实力的第三方数据分析平台。下面是对崔晓波(如下简称崔)的专访全文:


  CSDN:可否说说您自己曾经的计算机经历?
  崔:我1993年到1997年都在南开大学信管专业。1993年那会儿,计算机还处于286、386、586的时代,大家都喜欢研究操作系统,包括当时的OS2、DOS系统,而与操作系统结合紧密的就是病毒,所以那时候也一直在研究病毒,比如第一代大麻病毒、小球病毒、变性病毒等。
  大一的时候就开始研究学校机房的管理员如何保护计算机,喜欢写一些病毒植入学校机房,某天他们发现有人进入了内部系统,还会留下“CXB”几个字,于是开始调查,最后发现是大一一个叫崔晓波的新生,他在这方面有特殊爱好,于是找到我加入管理团队。也就是在那个时候开始研究加解密,认识了王江民、求伯君、吴晓军。当时大家基本上都在做汉字系统、操作系统,跟他们在算法上交流比较多。
  自己还发现了操作系统中的一些漏洞。比如微软的系统里面的一些逻辑问题,可能导致系统产生死循环,有次有台机器坏了怎么也无法修补,永远死在Starting MS Dos那个地方,很多老师学生都怀疑是硬件出问题了,但我觉得是系统逻辑上有问题,所以自己又把微软操作系统源码返回去看了一遍,发现系统读硬盘分区表可能会产生死循环,因为是链表结构,如果分区表坏了,循环图过不去就成了死循环,我为了验证猜想就做了一个病毒程序植入系统,把分区表拿出来来看看,发现果然是链表损坏。
  后来江民做了一个逻辑锁,破KV300,或者KV3000应用的时候,如果发现你是盗版,它就会给你加个逻辑锁,把你的机器锁住,实际上就是用了这个原理。因为当时跟江民交流比较多,东西大家共享也无所谓。
  身心俱疲后曾欲重返甲骨文
  CSDN:您是从甲骨文出来的,在毕业后到去甲骨文的这段时间里,您都在忙什么?
  崔:毕业之后直接去了晓军电脑,后来他正好也在北京的一个国企里面,因为大家比较熟悉,再加上自己当时觉得国企可以解决户口和住房,所以也跟着过去了。在那里待了两年多,到了1999年就出来做网站,当时做了几个网站,比如中国彩票网、51CP、融资网、棉花系统的交易系统。
  大概到2001年,互联网泡沫破灭,2002年1月进入BEA。大的外企他们的销售流程比较成体系,研发也有专业的流程,所以想进去感受一下。
  刚开始做售前,负责对大客户的沟通,包括移动电信银联的沟通,中间几年开始做解决方案,比如高铁客票,电信3G支撑系统,最后被调到研发,所以是从前做到后。在那里待了8年,第七年的时候BEA被Oracle用85亿美金收购,接着进入甲骨文的ANC部门,支撑大的合作伙伴,比如华为、普华永道、东软,做技术总监做了一年多出来。
  从甲骨文出来之后去了一家创业公司上班,那是一家做邮件推送的公司,产品形态类似于黑莓,但因为方向和当时的创始人看法不一样所以就出来了。2010离开那家公司,中间歇了半年,因为当时在创业公司加班很厉害,一周睡不了几个晚上,邮件服务是个强运营的服务,尤其是做邮件推送,版本迭代升级,大部分都在晚上做,长期疲劳休息不好,有一段时间都差点重返甲骨文,当时都拿了甲骨文offer,但从甲骨文出来的同事说都出来了就别回去了,再加上休息了一段时间以后,心态身体都恢复差不多了,觉得能再折腾一段时间,所以就想再试试。
  TalkingData的变迁:社交挖掘——推荐——数据分析
  CSDN:TalkingData最开始是做什么的?
  崔:从2011年6月开始筹划TalkingData,最开始想做社交网络数据挖掘工具,跟新浪微博也有过合作,包括情感分析、娱情分析等等,后来TalkingData跟新浪运营团队交流少,他们心气也比较高,认为微数据很多水平的方向他们可以自己搞定,给创业团队应该做一些垂直服务,比如礼品、招聘、旅游,但我觉得那个市场太小,所以很快就放弃了那个方向,虽然拿到社交数据的成本低,但大的环境不好,所以就决定做回移动。
  CSDN:怎么就进入了数据分析这个行业?
  崔:因为自己接触分布式系统和数据挖掘比较多,在上一家创业公司里也看清楚了趋势,移动互联网肯定是个方向;大数据肯定是个方向,但单纯做工具的意义不大。所以后来开始给应用商店做服务,比如91、机锋、因为它们本身对分布式的理解和投入的资源不够,所以就帮他们做排名和推荐算法,包括一些基于机器学习的推送。比如和机锋合作的云推送,都是基于算法做的,效果还不错,花了四个月的时间把机锋的应用推荐转换率最多提高了10倍,后来同步推也使用我们的推荐引擎,但那时候做得有点早,很多应用商店和应用也都刚起步,没有自己的盈利模式,作为技术提供方,就更没有盈利模式。
  所以当时很多朋友建议往更多基础的方向去做,比如做数据的统计分析,因为当时移动开发者的需求也就只到这个程度,我也觉得这个方向还不错,于是开始在2011年研发移动统计分析平台。第一个版本从2012年4月正式上线,到目前为止覆盖独立智能设备4.5亿,覆盖2万多款应用,是 现在算最大的第三方移动数据服务平台,因为友盟被收购了,Flurry还没有真正进入国内。
  免费只适合2C,不适合2B
  CSDN:TalkingData现在的商业模式是什么?
  崔:在数据分析上经历了三个阶段。最开始是做通用的分析工具,比如留存率分析、活跃度分析,类似于国外的Flurry,那时候Flurry如日中天,MixPanel刚转型到移动,Apsalar也刚刚出来,国外做类似产品的大概有20多款商品,但只有Flurry是免费的,包括国内的友盟也是走这样的路子——免费+广告的模式,但当时我们没太想明白这种模式,所以也没做,加上当时定位就是纯数据相关的服务,没有想过要进入一个特定的业务,所以就没有走F2P路线。
  其实大家都以为免费好,可能对于普通用户来讲,免费是好,但是对于企业用户,如果你免费了,人家会怀疑你的实力、动机,以及生命力,反倒起反作用。我们的垂直服务,包括游戏、电商、金融等服务全是收费的,其实企业的核心诉求还是服务质量和安全性,比如跟平安、招行的合作,如果免费,人家会认为你一家创业公司能撑多久?一些游戏的开发者很多都很有钱,宝开、触控、乐逗不在乎你的钱,如果你免费,人家会怀疑你是要用我的数据吗?所以免费逻辑在这时候并不成立。
  数据对很多开发商的意义不同,在电商那里可能是第一敏感,到游戏哪里,可能就不是了,比如移动游戏,很多生命周期都比较短,可能只有一两年,他们在意的是怎么在有限的时间里利用好数据,从而带来更多利益,而不是免费。
  很多人建议,你现在有移动游戏的几乎所有数据,不仅是活跃度、安装量、还有收入,你们应该做发行平台,很快你们就能成为大的游戏分发商;有的人也建议,你们是最大的移动广告监测平台,差不多有80%的开发商有合作,包括Inmobi,既然有这么多的广告监测数据,就应该做DSP平台,很快就能变大;也有人说,你有那么多的金融客户,就应该做互联网金融。反正有很多人告诉你很多可能性。
  但从创业开始就想的比较清楚,不会做任何具体业务,只提供数据服务,这份工作本身是个慢活,但需要中立性,一旦进入一个业务,你可能就失去了中立性,所以TalkingData只做数据挖掘、分析。
  另一方面,如果把移动互联网看成一个数据源,有开发者愿意提供数据,有大客户愿意花钱交换这些数据,TalkingData则提供数据交易平台,这在国外有很多例子。
  你见过Google或亚马逊说大数据吗?
  CSDN:你们做数据分析的怎么看待大数据?大家都在说,但其实大家都不懂。
  崔:第一点,大数据也不是一个新鲜概念,只是大家把许久未解决的问题解决了,然后用新的概念包装了一次。真正做大数据的公司都不谈大数据,比如Google、亚马逊,它们对大数据采集分析处理的能力远远超过同类公司。
  第二点,在存储领域,摩尔定律已经失效了,存储成本的上升高于摩尔定律。以前大家处理数据都是这样的,只要有数据就存下来,以后再去想怎么分析处理,怎么用于商业,但现在这种方式已经失效了,因为现在存储和处理数据的成本已经远远高于业务能带来的边际收益。大数据给大家带来的第一个问题是数据变现问题,否则业务可能都支撑不住。
  第三点,现在很多人都在提3V 、4V,但我就关注一个V,Value,就是数据真正的价值在哪里?TalkingData从创立以来一直特别注意这点,为什么通用的服务很快就不再推了,因为那些数据没有用,通用的数据,实际上是比较不规则的、无效的、没有价值的,对你来说就意味着成本。当时我们收集了很多数据,试图建立一些模型给伙伴提高转化率,但发现这个信息太弱了。去年和Flurry几个创始人聊过这个问题,他们成本很高,每年会花3100万美金在统计手机上,但并不带来收益,这点他们自己也表示后悔。
  CSDN:你觉得针对移动互联网,数据分为哪几类?TalkingData主攻哪一类?
  崔:如果纯针对移动互联网,那么数据类型有三大类:
  第一个类是基础信息,比如设备信息。用了什么设备?芯片是什么?用了什么运营商的服务?这些信息有用吗?有用,因为很多设备商运营商会购买报告,但是我们没有走这条路,因为在中国卖数据报告是不可行的,至少没有成功的先例,而且容易走偏。
  第二种类型的数据就是与应用相关的数据,包括客户用了哪些应用?程度有多深?因为和很多应用商店合作,所以我们会交换到很多这种数据,这些数据很有价值,很多投行也会来问我们,那些上市公司应用情况到底是什么样的?在Android的排名到底是不是真的?其实我们都有,但是不会说,说的意义不大,在这样的复杂的环境里面,没必要说。
  第三种是客户行为数据,反应客户的消费倾向性、交易行为、喜好、位置信息,这些数据蕴含巨大价值,但这些数据价值的挖掘需要找到一种可行的方式,所以现在我们在金融领域大量尝试这种方法。金融实际是数据的大客户,现在所有银行都想推出一些基于风控系统的新型信息系统。
  CSDN:移动应用的发展,你们应该看得很清楚,能否与开发者分享一下?
  崔:移动应用发展很快,去年前年就是工具、游戏,到2013年,各种应用已开始与人的生活息息相关。从使用设备的情况来看,人现在使用移动设备时长一般在8个小时左右。从互联网人群渗透率来看,去年活跃的是3.2亿,其中有3亿是游戏人群,每年还在以很高的量增长。
  CSDN:TalkingData未来是否也会对可穿戴或者物联网的数据进行分析?
  崔:移动是多维度的,有了传感器、陀螺仪、气压计,数据类型也更丰富,所以现在也做一些客厅、汽车、可穿戴比如健康类数据的研究,客厅市场比想象的来得还快,现在有客户会提需求,比如判断他精准投放广告时,人是否处在家庭里面。





收藏 推荐 打印 | 录入:elainebo | 阅读:
相关新闻      
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款