您的位置首页  南京资讯  信息

如何打造一款“物有所值”的超算平台?

  “联想FLEX超算平台我们非常信任,应用起来也是得心应手”,在的最后,南京大学高性能计算中心副主任周庆林教授如是说。

  这是昨日刚刚在南京古南都酒店闭幕的会议,会议的主题叫做“超越-E级超算与人工智能”。在报告中,周庆林教授主要介绍了南京大学超算应用与科研的历史,并重点介绍了高性能计算中心的运营情况。作为全国顶尖的高等学府,南京大学一直重视高性能计算在科学研究中的作用,也是中国最早一批采购高性能计算机的高校之一。

  “早在2001年,我校就在985工程1期项目中投资了1000万元购置了超级计算机,并且在后续的2007年进行了升级”,周教授说。到了2010年3月,南京大学高性能计算中心正式挂牌成立,并隶属于“南京微结构国家实验室”。

  不过随着高性能计算深入到各个学科当中,南京大学原有的计算资源已经捉襟见肘,“基本都是满负荷运行状态,作业基本需要长时间排队”。面对这样的情形,2015年11月,南京大学校长办公会议决定投资5000万建设高性能计算中心二期项目,缓解一期平台计算机资源严重不足的状况。

  一石激起千层浪,即便是放在现在,5000万元的项目也算是高校领域的“大单”。为此,来自国内外各个品牌的解决方案提供商纷纷登场,展开了激烈的角逐。在经过多方比对与慎重考虑之后,南京大学选择了联想提供的软硬件一体化解决方案,这也成为了当年苏皖地区最大的项目。

  在谈到当年如何拿下这个大单的时候,联想集团数据中心业务教育行业总监蔡斯扬至今依然是如数家珍:“从拿到需求到最终确认只花了短短的十天,过程中我们与南京大学进行了深入的交流,有太多的故事可以分享。”蔡斯扬带领团队从计算到存储再到网络,从硬件到软件再到应用,一项一项问题确认,一个问题一个问题地解决。

  为了能够拿下这一单,蔡斯扬考虑到了实施的多种可能性,并且咨询了众多业内的专家,最终拿出了一份更具体、更翔实、更有针对性的解决方案。“现在想来,那10天里,团队每个人的睡眠时间加起来最多只有1天,真的是没日没夜地投入工作”。辛苦的付出终于换来了丰硕的回报。如今,南京大学的项目已经成为联想高性能行业内部的“灯塔”,也凭借着这个项目的出色战绩,联想一举拿下了苏皖地区90%的教育行业,彻底成为领先者。

  对于南京大学来说,5000万元的预算花出去了,结果又如何呢?在采访中,周庆林教授用了一个四字成语来表达他的感受——物有所值。他进一步解释到:联想所提供的不仅仅是硬件方案,还包括的软件、调优等一系列服务,包括软硬件5年质保,专人驻场等服务,完全能够解决南京大学的后顾之忧,让师生专心投入研发与应用当中。

  从数字层面或许能够更直观的解决这个问题。升级之后的南京大学FELX超算平台具备910个CPU计算节点,有21840个CPU核心,理论计算峰值达到870万亿次秒。经测试,系统的Linpack测试成绩达到79.62%(标书承诺76%);ESS GL6存储I/O带宽测试,最大随机写18.98GB/s, 最大随机读25.89GB/s (标书承诺 15GB/s);SSD 并行存储I/O带宽测试,15个节点最大随机写80.21GB/s,最大随机读118.35GB/s (标书承诺75GB/s)。

  应该说,计算到存储,联想以Flex刀片服务器帮助南大搭建的超算中心远高于南京大学的原有预期,也难怪周庆林教授会有如此褒的评价。在大会现场,除了周教授之外,来自南京大学的几位老师也纷纷登台发言,从实际用户的角度介绍了应用FLEX平台的体验,这也从应用层面印证了FLEX平台的优秀性能。

  来自南京大学气象学院的雷荔傈教授是2016年江苏特聘教授,也是美国大学的气象博士。在美国,雷荔傈一直从事气象学的研究工作,但是自从回到南京大学任教,应用了全新的联想FLEX高性能计算机之后,雷荔傈觉得之前美国的那些设备简直是“弱爆了”。

  在当天的中,雷荔傈分享了她对比的气象行业高性能计算应用模型。雷荔傈表示:相比美国高校应用的系统,南京大学的FLEX平台在内存容量上更大,从而能够进一步降低处理器核心应用量,使得运算效率更高。

  在应用层面,借助于FLEX平台的帮助,雷荔傈的研究也获得大大提升,台风的大涡模拟变量维度达到了10的11次方,从而更准确的模拟台风,更准确的实现台风预报。

  与此同时,雷荔傈还分析了2016年台风季节的集合和模拟。相比于欧洲中心和美国国家预报中心的预报,她的研究模式精度达到了6KM(欧洲和美国分别是18KM和56KM),一共使用2400和处理器核心,总输出文件达到了150TB。

  特别是2016年关于台风“鲶鱼”的预报,雷荔傈的研究相比于美国的预报在强度层面改善了20-30%。在的最后,雷荔傈教授进一步表示:如今,同样进入了台风季,南大的预报正在开始,南大气象组也正在将人工智能用于气象预报中,借助于联想FLEX平台实现更精准的分析,争取新的科研突破。

  如今,联想FLEX超算平台已经在南京大学展开了全面应用,以往因为计算资源太过紧张而选择校外购买机时的老师也正在回归。为了帮助师生更好的利用超算,南京大学高性能计算中心推出了面对师生的“优惠政策”:FLEX平台每核心时只要6毛钱,并贴提供1TB的免费存储容量。

  这样一来,使得FLEX的应用正在不断的提升当中。据南京大学高性能计算中心副主任董锦明介绍,目前FLEX的利用率已经达到了三分之一最有未来将会有越来越多的师生加入到超算应用当中,并且包括南京大学周边的兄弟院校乃至上海地区的超算机构也在考虑应用FLEX平台,包括紫金山天文台也是FLEX的用户。

  未来,南京大学未来的计算平台也将会是多应用的融合平台。在谈到具体的研究方向时,董锦明教授表示:以物理学研究为例,借助于FLEX强大的计算能力,物理研究可以从原本的、原子即便进入更微观层面(比如纳米级材料)的研究,这也将大大推动南京大学相关学科的进步。

  南京大学的FLEX超算平台即是联想高性能计算在高校应用的“灯塔”,也是整个行业应用的缩影。如今,联想已经实现了985、211院校的全方位覆盖,包括南京大学、厦门大学、大学等一系列高校的网络中心、高性能计算中心或者其他院所中,都能看到联想的身影。

  在谈到这些成绩的时候,蔡斯扬十分自豪,他特别强调了联想在HPC领域取得的成就和未来的计划。在他看来,联想不仅能够为客户提供软硬件的端到端解决方案,更重要的是联想提供了全套的HPC服务。

  “我们有飞虎、FLEX等多款产品,可以适应高端计算与存储的需求;我们可以交付完整的整机柜产品,其线缆、上架都已经在工厂组装完成,只需推进客户的机房就可供电应用。同时,我们还提供高性能计算的调优服务,这些服务比硬件更能带给用户无忧的体验”。

  据相关数据显示,全球未来的3年时间人工智能市场将达到1170多亿的规模,增速接近19.7%;中国占据全球人工智能市场大概10%,市场的规模也接近100亿美金。

  面对人工智能这项新兴技术,身为行业领导者的联想必然不能错失良机。未来,联想将整合联想研究院的资源,体现布局AI和大数据的决心。蔡斯扬介绍道,联想成立了近百人的AI实验室,进行图形图像的识别和自然语言的研究,并将研究应用于基于LiCO的智能计算平台。与此同时,联想还计划推出基于GPU的人工智能一体机,不断进行技术和产品储备。

  伴随着人工智能的崛起,联想已经站在了智能化的风口之上。或许在整个HPC产业来看,教育只是其中的一个缩影,但是联想为南京大学提供的软硬件一体化服务器却已经彰显出它在平台、应用、服务、管理等多个层面的强大实力,这也正是迈向人工智能时代所迫切需求的。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
友荐云推荐