全面跨越新技术,迈向科学大平台

1476085461124512.png

北京大学工学院创办于1940年,前身诞生于延安的“自然科学院”,是中国共产党创办的第一所理工科大学,是新中国成立以来国家历批次重点建设的高校,首批设立研究生院,首批进入国家“211工程”和“985工程”建设行列,现隶属于工业和信息化部。

多年以来,工学院在科研方面取得了较大成果。2006年至今,工学院共承担各类项目1000余项,其中仅国家级项目就超过370 项。973、863、国家杰出青年科学基金、国家自然科学基金重大研究计划、工信部重大科技攻关、科技部支撑计划及重大科学研究计划和重大专项等重大项目近100项。




科研发展势头迅猛,科学计算能力亟待提升



科研发展离不开科学计算系统的支持。在科学计算领域,北京大学工学院已经建立了颇具规模的超算平台系统。随着学校科研工作的不断发展,现有系统的总体科学计算能力不仅亟待提升,而且还急需建立一个可持续发展的新平台。因此,北京大学工学院坚持科学发展,决定与金商祺公司合作打造一个集中高效、便于扩展、易于管理的HPCC平台。



技术先进、实用性强、开放兼容、可靠安全、扩展方便的建设原则



在项目规划阶段,北京大学工学院本着实事求是的态度,以严谨科学的工作作风进行了多方面调研,确定了自己的建设原则。首先先进性要好,HPCC方案要具有一定的技术前瞻性,即要满足现有科研计算应用需求,又要兼顾未来科研业务的发展;其次实用性要强,HPCC系统的各部件要采用标准化的IT部件;第三开放兼容性高,要能够支持各类运行环境;第四可靠性高,HPCC系统应具有良好的可靠性,建设者对系统故障修复所需时间应有严格的控制,尽可能减少宕机对业务的影响;第五可扩展性强,新建HPCC系统可平滑地扩展和升级。



打造先进的科学计算平台



鉴于对HPCC平台建设的深刻了解,金商祺公司选用了世界领先的专门用于x86大规模高性能计算平台的产品,平台中包括Flex以及InfiniBand高性能网络交换机和高性能存储系统,来构建高性能计算系统,力争在满足计算性能、扩展性和并行吞吐能力的同时,提供和小型机平台相近的高可靠性和高可用性特征,更好的满足生命科学研究的需要。

     本次建设的HPCC系统包括计算节点、管理节点与存储系统、计算网络、管理网络、接入网络等几个部分,系统整体架构如下图所示:

1476085496444647.png

整体架构图

具体来讲,北京大学工学院的HPCC系统包含214台联想X86两路服务器计算节点、管理和登录节点,500TB高性能存储系统。所有节点间通过56Gb Infiniband高速网络连接。计算节点部分通过多个节点协同计算,共同负责数据处理和计算任务;节点通过网络连接共享存储系统,从而为计算节点提供高速存储读写服务;管理节点负责集群系统监控管理,系统部署,计算作业的分发与调度;计算网络由高速交换机组成,提供计算节点之间的数据交换;监控与管理网络连接所有节点的管理模块,实现集群系统的整体监控管理与维护,同时连接到前端网络,为用户提供远程连接服务。逻辑拓扑图如下所示:

1476085817187790.png

逻辑拓扑图



专业、专注、专人、专心的服务



      北京大学工学院超算平台绝不仅仅是一个高性能设备的建设,而是一个跨硬件资源的高性能计算应用平台。其技术要求的复杂性和全面性对于项目的实施提出了极高的要求。

       作为高性能计算领域的技术先行者与实践者,金商祺不仅积累了大量的技术,而且拥有丰富的实施经验。多年来,金商祺HPCC团队参与了多个国内高校大型HPCC项目的实施工作,可以说是国内最有实力的实施团队之一。针对此次北京大学工学院高性能计算平台项目,在项目的规划阶段,金商祺就成立了专门的HPCC项目小组,HPCC小组始终站在用户的角度,从用户的计算需求出发,从用户的预算出发,不断地修正节点参数、优化网络架构、完善存储设计,力争给用户提供超高性价比的HPCC方案;其次,在项目的实施阶段,金商祺承担了硬件系统上架、存储安装、网络调试等HPCC系统的全套建设任务;在维护阶段,金商祺联合联想等厂商为用户提供全面的技术支持服务。

项目的实施阶段期间,金商祺员工将监控项目,根据经审批的质量与性能条件查看已完成的工作。具体内容有:



机房实施服务


•   深化设计服务

•   物料和设备采购服务

•   数据中心建造总承包服务

•   系统安装调试服务

•   总体项目管理服务

软硬件平台实施服务


•   硬件实施人员负责硬件上架、加电、网络连接、存储连接

•   软件实施人员负责操作系统之上各功能模块的安装调试

•   提供客户化开发和配置服务,包括Web门户定制和应用程序集成等





1476085884841787.png

北大机房展示

1476085908550462.png

金商祺谢总亲临现场指导



                      我们的服务

      金商祺公司提供七天二十四小时故障报修热线电话服务。当系统维护人员发现系统硬件或系统软件发生异常,或遇难以解决的系统疑问时,可以通过热线电话获得服务支持。同时,金商祺值班经理、值班工程师电话也全天开通,随时准备帮助处理各种突发事件。

故障报修热线:400-811-6200