你好,游客 登录 注册 搜索
背景:
阅读新闻

为什么我对大数据持怀疑态度(续)

[日期:2014-12-11] 来源:人人网  作者:张雨辰 [字体: ]

  撰写“为什么我对大数据持怀疑态度”这篇日志两年后,我认为重新讨论当年的一些观点会很有趣。事实证明,不仅我的“怀疑”引起了争议,作为权威学者的Michael Jordan教授的“怀疑”同样引起了争议。这些争议是如此明显,以至于Jordan在他接受IEEE Spectrum的采访后,还专门在实验室主页上撰写了一篇博客澄清他的看法。Jordan声称,他没有任何反对大数据的意思,他唯一反对的是针对大数据进行炒作。看了这篇文章以后我想,拜托,您这不是反对大数据是什么?

  以我个人粗浅的理解,任何领域如果突然火爆起来,必然是因为有一群人因为它的火爆而获益。那么谁因为大数据概念的盛行获益呢?首先是学术界。大数据的概念帮学校争取了更多的经费,创造了更多的教职岗位,从而能招收更多的研究生。其次是工业界,大企业通过宣传“谷歌大脑”这类的概念性产品赚足公众眼球,股价节节上升。创业公司通过塑造自己的“大数据”背景拉到天使投资。最后是新闻媒体,他们找到了一个制造新话题的机会,满足读者们对未来世界的科幻梦想。这三类人构成了大数据潮流下的参与者主体。如果我们思考这个集团的原生冲动,那不就是炒作吗?他们因为炒作而生,在炒作中不断发展壮大。而Jordan说,你们最好都各回各家,把大数据研究交给严谨的学者和工程师让他们慢慢去做。道理上是没错。只是,如果您把绝大部分人都遣散了,大数据这个概念还存在吗?

  我阅读过原日志和Jordan采访下面的评论。一类主流反对声音是,大数据已经有了很多重要应用嘛。比如,它大幅提高了语音识别准确率,它让机器从图片中识别出上万种物体,这些都是真的。难道我们还要对大数据的意义有任何怀疑吗?我们当然还需要怀疑。在没有炒作的情况下,这些成果同样能被创造出来,并且创造他们并不需要太多成本。而当人们发现炒作有利可图的时候,成百倍的人拥向这个领域,抢夺原本有限的资源。资源消耗的速度增加了无数倍,但产出率却没有太大增加。这是因为,炒作的人拿钱是为了忽悠更多的钱,而踏踏实实做事的人还是只有那么少啊。当资源的消耗速度超过信心的增加速度时,轰!炒作的人和做事的人同归于尽,而这个领域陷于长期的停滞。为了避免悲剧发生,给大数据浇浇冷水也不错。

  最后我想问,为什么大数据这个概念能被炒作起来?不妨先看看深度学习。我在近年的深度学习文献中感觉到一种明显的倾向,就是人们不再重视对机器学习方法给出合乎理性的解释,而越来越诉诸于一个极其简单的理由:因为它深。算法结构越深越好,从一个实验结论变成了不证自明的公理,变成了论文的动机。而大数据为什么有前途,社会大众的解释就是因为它大。人们或许不知道大数据有什么用,但每个人都知道大比小好。如此简单朴素地观念形成了大数据浪潮的基础。普通人的不求甚解尚可原谅,科学界的不求甚解却让人担忧。当学者热衷于撰写看似有理却经不起推敲的论文,而舆论习惯于夸大一切,对这样的现实难道不该抱有一点怀疑吗?





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款