你好,游客 登录 注册 搜索
背景:
阅读新闻

Oracle大数据设备贴牌Cloudera解决方案

[日期:2012-04-16] 来源:博客  作者:dostor [字体: ]

随着Oracle宣布Big Data Appliance(大数据设备),Oracle联合创始人兼首席执行官Larry Ellison在去年10月回到了自己大数据路线,当时Oracle给人的印象是它将会推出自己的开源Apache Hadoop。

Ozbutun表示Exadata数据库集群、Exalogic中间件集群以及现在的Big Data Appliance的主要关注点在于停止将注意力放在CPU上而应该将注意力放在如何拥有正确的系统I/O和网络带宽组合。许多客户过度配置CPU,而在 网络和I/O上则犯了过少配置的错误。这意味着他们虽然在硬件上花了很多钱,但是却没有让Hadoop运行得更好。Oracle花了数月时间设置并调整这 个系统,确保机架中没有不必要的配置,因为——和其他高性能计算客户一样——Hadoop的客户也很小气。

Big Data Appliance包含CDH3终身贴牌许可以及核心Oracle软件许可证,每个机架的价格是45万美元。这比全配置的Exadata要便宜得多,后者包含数据库服务器、Exadata存储阵列、Oracle 11g R2数据库和Real Application集群扩展,同时96核的Exadata X2-2价格是447万美元。这个价格里面的硬件成本是110万美元——只是用于比较。

连接器

除了Big Data Appliance以外,Oracle还推出一套连接器来连接Oracle数据库和Hadoop数据仓库。在去年10月,Oracle就在幻灯片上暗示了这一点,但是没有讨论具体的细节。

第一个连接器是Oracle Loader for Hadoop。它可以将数据从Oracle 11g R2数据库迁移到Hadoop数据仓库。有许多方法可以实现这个功能并,不过Ozbutun表示这个连接器的特点在于它专门针对大宗数据分区、转换,而其他工作则由Hadoop集群来做而不是由运行Oracle数据库的机器来做。

第二个连接器是Oracle Data Integrator for Hadoop。它是现有Data Integrator(数据整合器)工具上的一个功能,可以自动生成MapReduce代码来分析数据并将数据集呈给Oracle数据库。

第三个连接器是所谓的Direct Connection for HDFS。它基本上是HDFS文件系统的一部分,可以将数据映射为一个Oracle数据库表。

最后第四个连接器是所谓的R Connector for Hadoop。通过这个工具,Oracle确实已经消化了开源的R统计分析包并增加了优化的算法库来将其连接到Big Data Appliance堆栈的各种数据仓库。这个连接器并不是基于来自Revolution Analytics的Hadoop友好型R工具。

这四个Hadoop数据连接器的捆绑包的价格是每台服务器处理器2000美元。

 




收藏 推荐 打印 | 录入: | 阅读:
相关新闻