你好,游客 登录 注册 搜索
背景:
阅读新闻

大数据时代,一个被嚼烂的词汇

[日期:2015-02-28] 来源:中国大数据  作者:Whatever Young [字体: ]

upload/2015-02/150228095451491.jpg

  大数据时代,一个被嚼烂的词汇,不知从何时起,兴起了数据科学的狂潮,本书核心论点,第一,要全体不要抽样,第二,要相关不要因果,第三,要效率不要精确。弊端:产业生态环境,数据安全隐私,信息公正公开。本书实例众多,理论残缺,可以说是举了一系列的例子要论证观点的,我们知道这种论证方式逻辑上存在谬误。故而,本书可以说是一本数据科学的正面的背景教学,供谈资。数据科学基础:云计算,人工智能和机器学习,大规模处理结构数据算法,日渐增长的计算速度和数据规模的指数增加。

  Eg:

  1.2009年甲型H1N1病毒,公共卫生组织和谷歌的预测;

  2.1994年Farecast系统,预测机票走势;

  3.2003年,谷歌开始进入机器翻译,无所不包的谷歌翻译系统;

  4.亚马逊的图书推荐;

  5.沃尔玛的蛋挞和雨伞;

  6.ReCapthca,验证码;

  7.Decide.com 预测商品价格;

  Q&A:

  1.大数据的核心是预测,不论是预测未来还是预测人类行为,或是其他什么,存疑。

  2.相关论取代因果论,上帝已死的时代,上升到哲学高度,存疑。

  3.作者对样本分析给予了所能给予的极大的批评,并强烈的认为总体代替样本的种种理由,而没有具体言明其中道理,何为总体,如何定义总体,总体就那么容易获得?还是说获得总体中的大部分,如果是后者,本质上还是统计学的抽样,只不过置信概率大一些,为何要将抽样一棒子打死,如此的论证方式,不得不让人联想到稻草人谬误,存疑。

  4.作者说谷歌的翻译系统优于微软的,简单几笔,仅仅给出了数据量的区别,然后给出结论,大数据牛,存疑。

  Thinking:

  淘宝、京东、亚马逊监视着我们的购物习惯,百度、谷歌监视着我们浏览网页习惯,人人、微博窃听我们心中的TA,微信似乎什么都知道,包括我们的社交关系网。

  凡事过去,皆为序曲;测量一切,即为上帝。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款