正如前面在比较Spark及DSM系统时所提到的,由于RDD只支持粗粒度的操作,因此它有定 的局限性。但是RDD的表达性对于大多数程序而言其实已经足够好了。AMPLabs团队他们仅花了数百行代码就开发出了整个Pregel,这是Spark上的个小的库。可以通过RDD及相关的操作来表示的集群计算模型列举如下:
日期:04/21/2015 13:13:35
作者:
可能很多人都还很困惑,什么是大数据,其实可以简单的这么理解:大数据就是对大量数据进行有效处理的种解决方案;因为随着数据量的不断增加,传统的框架及计算模型已经无法满足数据增加的需求,所以出现了种新型的框架,hadoop框架
你可能已经知道“大数据”是2015年来较热门的话题。你怎么可能不知道呢?因为供应商和记者之流总是不停地用这个词给大家洗脑(这条指控点儿也 没冤枉他们)。相信你也知道他们都是如何大肆宣传的吧?大数据将为我们提供切问题的答案,可以使公司的运作更加高效,有助于制定绝妙的、由数据驱动的决 策,为公司提供柄竞争利器。
英国《卫报》认为大数据削弱了人们的同理心。我们的确不清楚斯大林是否真的说过:“个人的死亡是悲剧,数百万人的死亡仅仅只是个统计数据而已”,但这话似乎是正确的。前苏联独裁者剥夺人们的生命,其数量大得惊人,简直难以置信。然而“难以置信”只是我们形容数字巨大时所采用的文字描述而已,实际上,人们并不知道如何处理些与己无关的庞大数...
日期:04/20/2015 11:35:28
作者:
物联网(结合大数据)正在进入我们生活中的每天。虽然有些创新是超酷的,但是在成为我们日常生活的部之前, 我们将会面临着很多问题需要解决。
在Google准备对抗触犯欧洲竞争法律的告诉之际,当地律师正摩拳擦掌,打算另辟「大数据」战场,追究Google、脸书等科技公司探勘用户资料,是否触犯反托辣斯法规。
日期:04/20/2015 11:27:55
作者:
做智能硬件的团队,不仅要做硬件本身,还要做App,较难的是要自己做后台大数据支撑平台。虽然可以从公有云租来虚拟机,但这只相当于有了服务器,上面的数据库及后台软件还是需要你自己开发!特别是,如果你的智能硬件的用户非常多,般的软件根本就支撑不了,你得做个特别强大的、支撑大量并发的、容错的、可动态扩展的数据平台,这岂是般的硬件团队能实现的?
众所周知,美国大零售商Target运用的怀孕预测模型,几年前缔造了「比父亲还更早知道女儿怀孕」的惊人案例,可谓大数据(Big Data)的经典教材,某种程度上,也称得上是促发智慧零售风潮的触媒之。
日期:04/17/2015 10:44:57
作者:
近年来,透过群众活动或社群网站进行资料收集的热潮,已经烧到了这个世界网路所及的任何个角落。即使没有网路延伸到的角落,facebook以及Google也致力于应用太阳能无人机以及热气球来进行网路扩展的计划。各式各样的新创服务也藉社群网路的力量,透过不断地收集以及分析群众在不知不觉中贡献的资料来服务更多人。
日期:04/17/2015 10:17:35
作者:
苏文利,山东莱芜人,资深互联网营销就业指导专家,互联网营销Double系统,提出互联网价值营销理论,现为多家教育初创企业互联网营销顾问。2015年4月创立互联网营销实战沙盘平台—沙盘烩,把互联网营销思维应用到教学之中,把自己要讲的东西通过带着学员起实战,通过实战的过程中,由学员自己体会总结出来,是国内引用欧美教学模式的网络营销导师,被学员称...
23andMe是家谷歌支持的面向消费者的基因检测公司,较近他们宣布将他们已有的海量基因数据应用于药物开发。我想这是个非常好的主意,但我们要提醒谷歌记住他们的“不作恶”原则。
自引进IC封装开始,台湾半导体产业已发展40余年,近年来总产值已近20,000亿元新台币,在全世界占有席之地。半导体产业竞争力来自於成本、良率及交货时间,其中良率更是家公司有竞争力之所在。近年来自动化生产及物联网(技术发展,使得所有半导体制程相关的数据得以蒐集与保存,这些数据包含产品数据、机台数据、量测数据、缺陷机数据、晶圆接受度测试数据及晶圆测试数据...
日期:04/16/2015 10:07:41
作者:
|
Digg排行
本周热门内容
|