制图:潘旭涛
“申威26010”众核处理器。
6月20日,德国法兰克福国际超算大会(ISC)公布了新一期全球超级计算机500强榜单,由国家并行计算机工程技术研究中心研制的“神威·太湖之光”运算速度夺得世界第一。更令人振奋的是,这套系统实现了包括处理器在内的所有核心部件全面国产化。
“神威·太湖之光”运算速度究竟有多快?它可以在哪些方面大显身手?核心部件的国产化意味着什么?国产超级计算机的推广应用还需要在哪些方面不断完善?本报记者带您寻找答案。
1分钟完成地球人32年计算
江苏,国家超级计算无锡中心。“神威·太湖之光”的机身就安放在一间约1000平方米的房间内。它由40个运算机柜和8个网络机柜组成,每个运算机柜比家用的双门冰箱略大。打开柜门,4块由32块运算插件组成的超节点分布其中;每个插件由4个运算节点板组成,一个运算节点板又含2块“申威26010”高性能处理器。据统计,一台机柜装有1024块处理器,整台“神威·太湖之光”共有40960块处理器。
这样一个“庞然大物”的运行速度究竟有多快?国际超算大会上传来的数据显示,“神威·太湖之光”系统的峰值性能为12.5亿亿次/秒,世界第一;持续性能为9.3亿亿次/秒,还是世界第一。
“简单来说,这套系统1分钟的计算能力,相当于全球72亿人同时用计算器不间断计算32年;如果用2016年生产的主流笔记本电脑或个人台式机作参照,‘太湖之光’相当于200多万台普通电脑。”对此,国家超级计算无锡中心主任杨广文作了一个形象的比较。
“每一块处理器相当于20多台常用笔记本电脑的计算能力,4万多块再组装到一起,速度之快可想而知。”
据了解,在全球超级计算机500强榜单上,名列前十的除了“神威·太湖之光”,还有中国的“天河二号”、美国的“泰坦”与“红杉”、日本的“京”、美国的“米拉”与“三一”、瑞士的“代恩特峰”、德国的“花尾榛鸡”和沙特阿拉伯的“沙欣II”。但在运算速度上,“神威·太湖之光”接近“天河二号”的3倍,美国“泰坦”的5倍,超过排名第二到第五的4台超级计算机运算速度的总和。
超级计算机500强排名发起人杰克·唐加拉表示,相比10年前中国只有28台超级计算机进入世界500强榜单并且名列30名以外,“在超级计算机历史上,中国进步的速度和广度前所未有。除了美国的领先地位被打破,中国的整体阵容也大大超越了其他国家。”
榜单上的成绩证明了唐加拉的看法。因为不仅排在前两名的计算机属于中国,整个500强榜单里中国入榜的超级计算机数量达到167台,超过美国的165台。
事实上,中国在1958年才刚刚开始在超级计算机领域的探索。从首台数字电子计算机——103机到1983年成功研制“银河”系列超级计算机,再到曙光系列、神威超级计算机,中国在这一领域的发展越来越快,成果越来越多。
预测天气检查身体更加准确
超级计算机为何需要拼速度?计算快能够带来更好的应用吗?
针对这一问题,中山大学数据科学与计算机学院院长钱德沛表示,计算机速度越快,性能越好,那么在应用过程中精准度就会越高,提升了检测和预判的准确性。
比如在预测天气方面,近年来准确度的提升就离不开超级计算机的功劳。北京师范大学全球变化与地球系统科学研究院王兰宁教授表示,下不下雨关键看云层运动,在没有超算之前,观测云层的精度是按照经纬度。有了超算之后,就可对云层运动进行精确模拟与观测。
2011年,他在天津的“天河一号”上实现了观测精度10万公里的目标;随后,他又在“神威蓝光”实现了1万公里精度;今年,他在“神威·太湖之光”上实现了9公里精度。如今,他又在向着3公里精度努力。
更值得一提的是,“神威·太湖之光”系统可以在30天内完成未来100年的地球气候模拟,这在之前是不可想象的。有专家表示,以往过去2到3小时才能发出的海啸预警,现在最快十几分钟就可以完成。
除了预测天气,还有更多接地气的事情倚仗超级计算机来解决。
建一栋楼对周边的环境到底有什么影响?如何建设风道便于污染物扩散?中科院深圳先进技术研究院正在国家超算无锡中心进行的一项课题,就是深圳市污染物扩散的模拟。通过超算模拟,可以根据目前污染物的情况,计算出未来一段时间的大气污染物浓度和分布,进行空气质量预报。
“现在已经可以实现倒推排查究竟是哪个排放点导致了某次大气污染,未来将能够实现每个小区、每个居民点空气质量的准确预报。”中科院深圳先进技术研究院副研究员陈荣亮说。
而在医疗方面,超级计算机能够通过扫描真人的血管系统,运用3D建模技术建立动脉系统模型,成功地再现整个人体的动脉系统。陈荣亮近日便用“神威·太湖之光”对人体血流进行了模拟与分析。
“过去,对一个可能发生脑梗塞的病人,医院难以判断是否要进行支架手术,一般都会通过从大腿动脉处放进测压导丝进行测量,这种方式既危险又痛苦。如今,经过模拟计算,只要血流储备分数小于0.8,就要做手术。”陈荣亮说。
此外,钱德沛表示,不论是在石油勘探、生物信息、新药创新、材料化工,还是环境科学、船舶工程、航空航天设计、传统制造业改造等方面,超级计算机都可以发挥作用。
从技术受制于人到自立自强
与此前“天河二号”使用的是英特尔至强处理器和Xeon Phi协处理器不同,“神威·太湖之光”首次使用的是“中国芯”。这块“中国芯”就是5厘米见方的薄块“申威26010”,它集成了260个运算核心,数十亿晶体管,达到了每秒3万多亿次计算能力;单芯片计算能力相当于3台2000年全球排名第一的超级计算机。
“如果没有坚持完全自主生态,没有‘搞十几年不行,再搞十几年’的劲头,不可能有今天核心指标齐头并进的神威。”国家并行计算机工程技术研究中心副主任梁军说。
许多超级计算机领域的中国专家都难以忘记这样一段屈辱的历史:30年前,中国的超级计算机用户有一个神秘的“玻璃房”——美国人把一台超级计算机卖给中国,用不透明的玻璃包裹得严严实实,中国技术人员没有授权不得入内。
王兰宁教授至今记得这个中国土地上的“技术飞地”。“全国只有几个有授权的科学家能够进入玻璃房,而且是在美国人的监视下。一旦程序运行完,机器立即被锁回玻璃房。那个所谓的超算速度,在今天看来充其量是一台高性能电脑,但对于当时的中国来说,却是一个难以企及的高峰。”
上世纪80年代,我国已逐步迈入独立设计和制造巨型机的国家之列,但却因核心处理器等关键部件与技术的短板只能受制于人,直接导致了我国虽是国外超级计算机“大买家”,却无法拥有匹配的“议价权”。2015年4月,美国政府更是宣布,把与超级计算机相关的4家中国机构列入限制出口名单。
如今,“中国芯”“申威26010”成了我国自主研发打破30年技术封锁的一柄利器。
普及应用还需完善配套措施
“虽然中国在处理器的研制上取得了突破,但我们并非掌握了所有核心技术,依然任重道远。”谈及中国超级计算机发展的未来时,钱德沛这样认为,目前与“中国芯”的超级计算机配套的其他硬件及软件系统国产化程度还需提升,这对将来的推广应用有很大影响。
国家并行计算中心的相关科研人员表示,虽然中国的超级计算机发展取得了很大成果,但其中需要解决的技术关键环节非常多,以能耗为例,“神威·太湖之光”一年的用电量达到15兆瓦时,相当于3个清华大学的用电量。以现有技术即使能够实现百亿亿次,其能源消耗恐怕也承受不起。
关于应用方面的问题,中科院计算机网络信息中心研究员张鉴表示,我国利用超算系统解决问题的能力长期不足,相关商业应用软件仍为国外垄断,在软件研制、应用开发和人才培养方面还有待进一步提高。将“制好”优势转化为“用好”优势,才能真正实现对产业创新与升级的带动。
据统计,国内超级计算机研发经费中用于开发应用软件的尚不足10%,而在美国占比多达30%以上。超级计算机未能充分投入商用,将造成巨大的资源浪费。2014年4月“天河二号”试运行对外开放期间,只有120家企业和研究机构选择试用,许多商用飞机公司宁可使用陈旧过时的计算平台也不愿意采纳新技术。
“事实上对企业来说,运用超级计算机解决问题是一种更‘省钱’的办法,而不是增加成本的方式。”钱德沛告诉记者,相比于用超级计算机建立模拟系统、运用数据分析,建造普通实验室、实体装备来做检测的花费要更高。但因为当下许多企业缺少懂超级计算机技术的人才,也没有开发与之相匹配的软件,因而在原本“事半功倍”的新设备、新技术面前望而却步。
“应用是超级计算的核心牵引,所有硬件和软件的发展目的都是为了解决应用中的问题。”国家超算无锡中心副主任付昊桓表示,下一步,他们将围绕“神威·太湖之光”进一步移植优化相关软件,使其发挥更大效用。
“未来这台超级计算机将在4个方向发挥作用:首先是全球高分辨率模拟,为气候变化研究提供量化研究的基础;其次是先进制造,强大的计算机将助力“中国制造”转向“中国创造”;第三个方向是生命科学,为研发新药和探索生命奥秘提供支撑;第四个方向是大数据分析。应用需求和算法的发展将不断推动超级计算机跑得更快、更强。”