你好,游客 登录
背景:
阅读新闻

EMC Isilon轻松维稳某高校高性能计算平台

[日期:2012-04-13] 来源:赛迪网  作者:赛迪网 [字体: ]

客户证言

“到我们计算中心来做高性能计算的人越来越多,面对高度并发的访问,以前采用开源的解决方案,由于稳定性较差,每个月就要进行一次全面的系统维护。采用EMC Isilon解决方案以后,到现在已经六个月,一直运行稳定,没有进行过一次系统维护。我们对此非常满意。”

――某大学高性能计算中心负责人范老师

背景与需求

南京某综合大学早在2008年就建成了十万亿次的计算平台,其计算能力当年位居全国高性能计算机TOP100前列。随着应用能力的提升,目前该计算平台已拥有300多名用户,应用内容涵盖气象、空间、海洋、电磁、化学等多个领域。

高性能计算系统中的存储系统一直是制约系统整体应用能力发挥的瓶颈,通常采用并行文件系统的方案以有效提升存储系统的I/O服务能力,早期的许多高性能计算系统出于节省建设成本、I/O性能等方面考虑,往往采用开源的存储系统。该大学计算中心就是这样的典型用户。但随着用户量、数据量、计算量的增长,开源存储系统在可管理性和稳定性方面的问题就会逐渐暴露出来。例如,当设备冗余机制不完善时易导致数据的意外丢失,存储系统满负荷(容量占满或频繁读写)运转时会出现各种不可预测的问题,对底层磁盘系统未进行有效操作限制而带来的各种风险,等等。

存储系统的不可靠性、不稳定性严重影响了计算平台的运行,当存储系统宕机下线时,计算平台不得不停止对外服务,该大学计算中心在过去经常会因为此类问题而遭到计算平台用户的责备,管理员不得不花费大量的时间定期去检查和维护平台的存储系统。2011年初,该大学在多方考察后,决定采用EMC的Isilon解决方案替换原有开源存储系统,以提升计算平台的稳定性。

解决方案:EMC Isilon轻松维稳

2011年6月,该校计算中心实施了EMC Isilon集群存储解决方案。经过近半年的应用表明,较之以前使用的开源系统,EMC Isilon使得该校的高性能计算在统一界面、数据共享、容量吞吐、冗余体系、可扩展性等方面都有了质的提升。

该校计算高性能计算中心负责人范老师介绍说,以前使用开源的并行文件系统lustre,采用PC服务器加磁盘阵列组合的方式。这种模式出故障的环节太多,任何一个环节出现问题都可能导致数据无效或者丢失,需要经常性的检查系统并进行维护,稳定性很难保证。例如当用户目录非常庞大,目录层次很深,文件名很长的时候,在该系统下读取和存放数据就会频繁出错。有一次数据中心遇到突然断电,缓存没有写入,存储系统的元数据损坏,整个系统就宕掉了,并丢失了大量的用户文件。

相对于传统的NAS使所有数据都从其控制器出入造成性能和扩展性瓶颈,EMC Isilon支持大规模信息的集中访问,可实现数据的共享,每台服务器都可以看到所有的存储空间。客户端能够随时按需安全的访问数据,单个卷可实现PB级文件系统支持,而且更易于安装、管理和扩展。

有一组数据可供参考:Isilon的单个96节点集群和单个文件系统可以提供1.6PB的存储容量,而其他厂商的系统和开源的NAS产品每文件系统大部分只能提供16TB的容量。Isilon采用冗余体系结构,可实现节点内及节点间的冗余,大大提高了系统可靠性和可用性。

通过Isilon IQ集群存储系统的支持,一个从10TB到100多TB的群集系统可以在不到10分钟时间完成安装、配置和连机使用。另外,Isilon独特的“按需购买,渐进扩展”(pay-as-you-grow)方式,体现了Isilon存储系统的优秀扩展能力。Isilon存储节点之间采用infiniband高速互联,存储节点扩展时,性能随着节点增加而线性扩展。在线(免停机)升级只需不到1分钟的时间,无需对原有设备及应用做任何改动移植,系统扩展的整个过程无需宕机。可以说,EMC Isilon解决方案让系统宕机的风险降到了最低。

技术详解:EMC Isilon优势

EMC Isilon是一种横向扩展(Scale-Out)NAS,它采用了全新的设计,以实现大量的性能特性。

Isilon Scale-Out NAS 由模块化节点构成,有两种节点:一种是存储平台节点,一种是性能加速节点。系统的核心是存储平台节点,它由智能分布式文件系统支持。该文件系统将所有资源集中在一起,以处理几乎所有类型应用程序工作负载的存储需要。如果工作流受到磁盘 I/O 限制,可以在系统运行时添加更多平台节点,以添加磁盘轴和处理能力。同样,如果工作负载仅受 CPU 和内存限制,可以在系统运行时添加性能加速器节点。根据需求添加不同数量的存储平台节点或性能加速节点,使得Isilon可以同时扩展两项性能,或独立扩展一项,以适应变化的应用程序环境。

Isilon集群将文件分配到多个节点和磁盘中,使 I/O 操作并行化。系统使用大容量连续磁盘段(128K)来优化文件布局。在写操作过程中,数据先被存放在大容量内存缓冲区内,然后以精心规划的顺序将数据转存到磁盘中,以减少磁盘开销。在读取过程中,会先预取数据以避免其它方向的类似 I/O 开支。由于每个文件都被划分到集群中的不同节点和磁盘集合中,随机存取一系列文件时产生的总负载被分配到集群中的所有磁盘上,并且不会像基于 RAID 的系统一样受到有限的磁盘集合限制。由于所有节点都参与 I/O 处理,相比传统的单一磁头或 RAID,可以支持使用更多的 CPU 和内存处理单元。

对于随机 I/O 操作,系统使用小至 8KB 的数据块,以更细化的方式来读取数据。数据同时也保存在所有节点集合成的大容量缓存中,以减少 I/O 响应时间。

在本案例中,该大学计算中心的Isilon群集存储配置了4个存储节点,一个加速节点(提供万兆网络连接)。群集存储通过加速节点的两个万兆接口和交换机相连,同时也将存储节点的千兆接口与交换机连接,通过Isilon提供的软件对存储请求进行判断,根据各个节点的负载情况将存储请求进行合理的分配,以保证整个集群存储的高性能。

同时,在原有网络中部署万兆交换机,用以连接各个网络核心及新部署的高性能存储。在这种架构下,未来可随时根据系统容量及性能需求在线添加Isilon集群节点,无需对原有系统做任何改动。(拓扑图如下)

Isilon将文件数据和元数据分散保存在横向扩展的存储系统中,且系统集群中的多个节点具有同等地位,可以共同处理数据和元数据操作的 I/O。在这种分布式架构中,I/O 处理被均衡分布到集群中的各个节点上,任何单个节点都不会成为瓶颈或单一故障点。此外,Isilon还提供用户配额管理的功能,避免一个用户占用资源太多,影响其它并发用户的性能。

总之,EMC Isilon是目前市场最领先的横向扩展NAS系统,是大数据存储和管理的首要选择。该校的案例,便是Isilon在全球大量成功应用的一个例证。





收藏 推荐 打印 | 录入:admin | 阅读:
相关新闻