你好,游客 登录
背景:
阅读新闻

EMC存储上的大数据–HDFS存储可靠性

[日期:2015-01-13] 来源:EMC中文支持论坛  作者:Fenglin Li [字体: ]

    企业为了从其hadoop分析投资中获取最大价值,企业需要富有弹性的大数据存储基础架构。在传统Hadoop集群中,用户必须依赖于自定义的子数据块CRC校验和来提供硬件层数据保护,并且在HDFS层使用镜像技术以保持某种级别的数据冗余。但是,在规模较大的情况下,这会成为一个非常高成本的方案。如果通过EMC Isilon作为存储层,Isilon的数据保护是在OneFS文件系统级别实施的,因此要使新的保护和性能方案可用,只需执行OneFS软件升级即可。OneFS使用经过广泛验证的Reed-Solomon擦除编码算法来执行其奇偶校验保护计算。在文件界别应用保护,使得集群可以快速高效地恢复数据。信息节点、目录和其他元数据在于其引用的数据块相同或更高的级别进行保护。由于所有数据、元数据和向前纠错(FEC)数据跨多个节点条带化,因此不需要专用的奇偶校验驱动器。这不仅可以防止出现单点故障和瓶颈,还使文件重建成为一个高度并行化的过程。

    OneFS还支持多种混合保护方案。这包括N+21N+31,前者可针对两个驱动器故障或者一个节点故障提供保护,后者可针对三个驱动器故障或一个节点故障提供保护。对于高密度节点配置而言,这些保护方案特别有用。万一发生多个设备同时故障的情况,以至于文件“超过了其保护级别”,则OneFS将尽可能重新保护所有可保护的内容,并且将与受影响的个别文件相关的错误报告到Isilon集群的日志。

 

HDFS1.png

 

Isilon还支持多项保证数据可靠性功能,例如:

 

  • 日志文件系统:每个Isilon节点都配备了一个由双电池支持的NVRAM卡,以保护节点的文件系统。
  • 主动节点/设备故障:OneFS将主动删除任何达到特点的已检测ECC错误阀值的驱动器,自动重建该驱动器中的数据并将其定位至该集群中的其他位置。整个过程完全自动化,无需人工干预。
  • Isilon数据完整性:ISI数据完整性(IDI)是一种通过32CRC校验和防止文件系统结构损坏的OneFS过程。所有Isilon数据块(包括文件和元数据)都利用校验和验证。
  • 协议校验和:OneFS为远程数据块管理(RBM)协议数据提供了校验和验证。RBMIsilon开发的机遇RPC的单播协议,可供在后端集群互连上使用。
  • 动态扇区修复:DSR功能可用来隔离损坏的磁盘扇区,重新向完好的数据以便在其他位置重新写入。
  • MediascanMediaScanOneFS中的作用是检查磁盘扇区并部署DSR机制,以便强制磁盘驱动器修复他们可能遇到的任何扇区ECC错误。

 

      总之,在HDFS存储层使用EMC Isilon存储,可以避免多种传统Hadoop存储实施的许多缺点,如下所示:

HDFS2.png

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese





收藏 推荐 打印 | 录入: | 阅读:
本文评论   查看全部评论 (3)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款