你好,游客 登录
背景:
阅读新闻

关于大数据的精辟论断

[日期:2014-08-26] 来源:中国统计网  作者: [字体: ]

大数据

  作者在先期一直在强调大数据的三个要点:随机让位全体;精确让位模糊;因果让位相关。因为数据存储成本的下降和分析能力的进步,我们可以逐渐摆脱抽样带来的局限性,而将所有的数据放在一起,发现以前从未发现的结果。

  这些思路几乎可以对每个行业产生改变,对航空业亦是如此。书中举了一个例子,一个叫farecast的网站运用数据分析来预测航空公司的票价,指导旅客在合适的时间买到便宜机票,每张票可以平均为旅客节省45美元。那么反过来想,航空公司能不能去分析旅客的购票行为呢?我们现在已经在上客速度、始发地、出票地等诸多因素上做分析,未来还可以加诸时间流、空间流等一切围绕机票的信息,甚至旅客订票时候的天气、心情。根据作者的意思,你甚至不需要知道为什么这个因素会决定机票价格,只要它的相关性高即可。

  当然,这些还都是美好的愿景,走到这一步还非常非常难。事实上,现在真正能说掌握大数据、有分析大数据的技术以及本身具有大数据思维的公司不过Google,Amazon等极少数的几家公司。难怪有句笑话说Big data is like teenage sex.Everyone talks about it, nobody really knows how to do it.

  另外,作者在最后几章表达了对大数据的忧虑和迷思,是非常有价值的。一切都基于数据做判断,让我们的未来变得”有据可依“,我们的未来变得不再是无限的,而是根据你的过去设定好了框架。对大数据的滥用,可以从预测一个街区的犯罪率到预测一个人是否会犯罪,直至提前逮捕他,因为大数据”预测“到了他会犯罪。当我们的未来全部被数据化,那我们作为人类最神圣的自由意志该何去何从?

  读到这里,竟觉得百年前笛卡尔的“我思故我在”一种悲壮之感。人之所以为人,不就是因为这无法用数据预测的灵感和创意吗?





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款