你好,游客 登录 注册 搜索
背景:
阅读新闻

【PDF下载】Spark一体化大数据分析流水线

[日期:2014-05-30] 来源:CSDN  作者: [字体: ]

  速度上,Spark很快,在迭代型类似于机器学习这样的数据分析上,Spark在内存中运行速度比MapReduce快100倍,在磁盘上快10倍;兼容性上,Spark几乎兼容HDFS上的所有流行存储系统,新用户部署Spark时不必要使用 ETL;接着,易用性上,支持Scala、Java、Python API,代码减少2-5倍。


【PDF下载】





收藏 推荐 打印 | 录入:elainebo | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款