你好,游客 登录
背景:
阅读新闻

大数据能力培养:一次看懂淘宝『假货门』数字真义

[日期:2015-02-12] 来源:中国大数据  作者:邱小黑 [字体: ]

 

大数据

 

 

 

      很多人都在说『大数据能力』很重要,但是在我看来很多人对『数据分析』的角度及方式都不太正确。最近刚好有一个淘宝(阿里巴巴)被中国的工商总局说正品率只有 37.25% ,引发网路热议,甚至将面临集体诉讼。但是,这数字及实际状况是正确的嘛?今天我们就以这个案例来看,数据分析最常犯,或是该建立的心态

一、数据背景

      要做数据分析,首先你必须先完整的了解最塬始的数据资料(raw data),如果你要分析的资料数据是经过很多手,那这个数据可信度及实用度就差很多。所以我们溯本穷源找到最塬始的这份『2014年下半年网络交易商品定向监测结果』,我们就可以发现,很多媒体的报导『中国官方抽验:淘宝网6成山寨货』、『官方狠掴马云:淘宝网63%是假货』脑补的标题就都是错的,因为以工商总局的定义只有『正品』、『非正品』两者而已,而『非正品』的定义也很明确,只要是

  • 1. 伪劣产品
  • 2. 翻新产品
  • 3. 非授权正规渠道
  • 4. 含量与宣传不符产品
  • 5. 无3C认证
  • 6. 非中国大陆地区官方正品
  • 7. 不符合《消费品使用说明化妆品通用标籤》要求产品

      以上都属于『非正品』,所以『非正品』也就不一完全是假货, 但同样的定义放到台湾的 Y拍跟 P拍,会有怎样的结果呢?我想答案会是差不多多的数字,淘宝本来就是一个以 C2C 为基础的交易平台。水货、单帮货那些上不了 B2C 平台的,都只能在此生存。所以我们在看许多指标数字的时候,必须要先看清楚其维度分类的定义为何。就像最近我在看后台的时候,发现有个『新使用购物金数量』,对于这个定义我跟我同事都觉得怪怪的,因为ASAP的满额购物金理论上应该不会有『新使用购物金数量』(因为这是发给已购买的老客户)的出现,可见我们跟工程师那边的定义有点落差,后来经过沟通后,互相了解定义后,看到数字,才能做出正确的判断即预测。

      所以马云称之为「网货」也真不过分,你也可以在 Y拍上买到海洋迪士尼限定的Dufy,也可以不用集点就可以买到超商的整套蛋黄哥,也可以用接近半价的价格买到空姐从欧洲带回来的精品包。以上在工商总的定义下都是「非正品」。大多数的『正品』其实都在 B2C 或是 B2B2C 平台去了,这 37.25% 的数字其实是值得玩味的,如果正品率真的有这么高(对,你没看错,是高),这其实淘宝带起了一股新的网路销售风潮啊。『网路品牌』的崛起,那些只打传统通路的大牌子都得要小心。

二、样本数多寡

      不过 37.25% 这个数字是很瞎的,根本不值得一提,你知道这次淘宝抽样的商品数有多少嘛?51件产品!就算是部分媒体写说:淘宝买手机全都是假货,也是因为他只抽样 4 支,而且『假冒伪劣』的定义其实也不明确。在数据统计的领域内,其实看样本数的大小及组成是很重要的,像这次监测结果,就完全是个不科学且乱七八糟的统计。裡面的其他数字比例其实都可以忽略不看了…

三、谁说这数字、对谁有利?

      通常一份调查报告要看之前,你必须要先了解,自从『内容行销』被广泛吹捧之后(事实上内容行销一直都存在),网路上总是充斥着许多『统计整理报告』,但是『谁讲这句话』一定很重要,相信我:绝大多数的人都只会讲对自己有利的事情,工商总在1月23号发的『2014年下半年网络交易商品定向监测结果』其实是个假议题,真正的目的是为了1月28日的『关于对阿里巴巴集团进行行政指导工作情况的白皮书』。我先做好一个大家调查报告,全部各打50大板,其中再找一个出来修理。至于为什么要修理阿里巴巴,那就不在我们的讨论範畴了。

      所以我在许多场合裡面都讲过,面对数据的第一心法就是:不要相信数据,环境随时间而变,以最新的状况做判断。




收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (2)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款
第 2 楼
* 匿名 发表于 2015/2/12 12:41:25
事实是怎样,消费者最清楚!
第 1 楼
* 匿名 发表于 2015/2/12 12:39:13
假货那么多!又买到假的了