凭借每秒遍历边数 2054、能效比 4385.24MTEPS/W,中国 “天河” 超级计算机夺得两项世界第一。
7 月 1 日,国际超算排名 Graph500 发布,由国防科技大学研制、并部署在天津国家超级计算中心的 “天河” 超级计算机,同时成为 SSSP Graph500(单源最短路径)榜单全球第一名、以及 BIG Data Green Graph500(大数据图计算能效)榜单全球第一名。
图 | SSSP Graph500(单源最短路径)榜单全球第一名(来源:Graph500 官网)
相比侧重计算性能的国际超算领域另一知名排行榜 Top500,在评价超级计算机图计算性能方面,Graph500 是目前国际最权威的领域内榜单。
Graph500 主要针对人工智能、大数据处理等数据密集型应用进行评测,可同时反映超级计算机的数据处理能力、访存和通信性能。
图 | BIG Data Green Graph500(大数据图计算能效)榜单全球第一名(来源:Graph500 官网)
其中,图计算指的是,用图的方式对数据进行建模和运算,主要用于人工智能和大数据领域。而本次一举夺得双魁,这意味着在数据密集型应用方面,“天河” 超级计算机获得了国际领先突破,可帮助提升中国在人工智能和大数据处理方面的处理能力。
中国计算机学会高性能计算专业委员会秘书长,中科院计算所研究员张云泉在此前接受 DeepTech 采访时表示:“农业社会靠体力,工业社会靠机器,信息社会靠互联网,而人工智能社会要靠 ‘算力’,谁能占领 ‘算力’ 的制高点,谁就有了引领社会发展的基础。” 由此可知,代表着算力巅峰的超级计算机,其重要性不言而喻。
国家超级计算天津中心主任杨灿群告诉媒体:“‘天河’团队以‘天河一号’首夺世界第一为起点,历经十余年的不懈努力、自主创新,使‘天河’超算系统在硬件和软件全自主化的同时,应用领域从传统科学工程计算向大数据处理和智能计算拓展。‘天河’E 级验证系统能在强调实用好用、高效节能的关键评测中排名两项世界第一,具有十分重要的意义。”
据悉,国家超级计算天津中心位于天津市滨海新区,作为中国首个千万亿次超算的 “天河一号” 也坐落于此,一起被部署的还有 “天河” E 级验证系统。
(来源:国家超级计算天津中心)
从受制于人到世界第一
据悉,“天河一号” 千万亿次超级计算机由中国自主研制,也是国际 TOP500 相关榜单中运行时间最长的超级计算机。它的峰值计算能力为 4700 万亿次每秒,中国 13 亿人同时计算 340 多年,才比得上“天河一号”运算 1 小时。
(来源:国家超级计算天津中心)
在中国超算的路上,也曾遇到过坎坷。如前文所述,超算是反映国家科技水平的重要标志之一。20 世纪 70 年代,中国还没有自己的超算,这难免会导致受制于人。
为此,国家在 1978 年开展巨型计算机研制工程,5 年后成功研制 “银河 -Ⅰ” 巨型计算机,并成为全球能研制亿次巨型机的少数国家之一。
2000 年以后,为满足高性能计算机在运算速度和容量上的紧迫需求,国防科技大学和天津于 2008 年开始建设国家超级计算天津中心,并开始联合研制 “千万亿次高效能计算系统”。
在长达半年的时间中,研究人员采取封闭攻关,使用混合语言编程等技术,经过 8 万多次软件程序改进优化,最终实现了计算核心异构协同,并把 GPU 计算效率提到 70% 以上,这达到了当时的世界最高水平。
此后,又取得了多项成绩。2009 年 10 月,中国诞生首台千万亿次超级计算机 “天河”,并成为在美国之后的第二个研制出千万亿次超级计算机系统的国家。
几个月后,“天河一号” 超级计算机被安装部署在天津滨海新区。2010 年 11 月,在美国举办的世界超级计算大会上,凭借 4700 万亿次的计算峰值、以及比第二名高出一倍多的优势,“天河一号” 超级计算机获得国际 T0P500 排名第一。
图 | “天河一号” 超级计算机
现在的 “天河一号”,服役时间已超过十年,每天它运行 1400 多个计算任务,并构筑出动漫与影视特效渲染、高端装备制造、地理信息、石油勘探、生物医药等五大高性能计算应用平台。目前,已有 1000 多支科研团队,通过 “天河一号” 进行科研。
1 亿美元、280 名科学家,耗时两年研发出 “天河二号”
2013 年 5 月,“天河二号” 超级计算机首次亮相。这台超级计算机由科技部、广东省人民政府、广州市人民政府联合出资建设,花费约 1 亿美元,由 280 名科研人员用时两年多研发而来。
那么该怎么使用 “天河” 呢?
事实上,从宇宙中微子数值模拟、到计算量子优越标准、到地理考古再到新冠肺炎筛查,都能用到超级计算机技术。
2015 年 5 月,北京师范大学天文系教授张同杰带领的宇宙中微子数值模拟团队,通过 “天河二号” 超级计算机系统完成了 3 万亿粒子数的宇宙中微子和暗物质数值模拟,宇宙大爆炸 1600 万年之后至今约 137 亿年的漫长演化进程得以被揭示。
图 | 右一为张同杰
据张同杰介绍,在当时只有 “天河二号” 能担此重任,“天河二号” 就像一架拥有极高像素的 “超高速摄像机”,可借助相关模拟还原出宇宙的演化 “视频”。就这一成果,张同杰还在《自然・天文学》发表了论文。
2018 年,国防科技大学吴俊杰团队与上海交通大学金贤敏合作,使用 “天河二号” 计算出量子优越标准。借助 “天河二号” 超级计算机,该团队完成了积和式的求解这一玻色采样核心难题。
据悉,真正参与测试的问题规模达 48 个光子,他们还推断出 “天河二号” 模拟 50 个光子的玻色采样,大概需要 100 分钟。也就是说,只要实际量子物理装置实现了每组样本 100 分钟以内 50 光子的玻色采样,即可在求解该问题的本领上超过 “天河二号”,那时即可实现量子优越。
当时金贤敏还没回国,如今谈及这段经历,他向 DeepTech 回忆:“我当时是在牛津大学参与完成了玻色采样问题的首次实验演示,这是一个非常典型的有量子优势而经典计算机难解的问题,我们都很兴奋。而那时‘天河’二号连续六次位列算力世界排名第一,代表了人类最强大经典计算机的能力,所以我们就想到用‘天河’二号来算玻色采样问题,从而用这个特定问题来标定量子霸权,也就是未来量子计算做到什么程度时才会超过经典计算机,这也为后来的量子霸权演示定好了目标。概括来说,这是一个很交叉的研究,我们和国防科大吴俊杰团队合作,从算法选择、到算法优化、再到‘天河’二号全系统的计算单元调用,最终把经典计算机的能力发挥到了极致,给出了一个严格的量子霸权标定。”
2020 年初,南京大学地球科学与工程学院教授樊隽轩团队,使用 “天河二号” 超级计算机,深入挖掘了一个包含大约 5.4 亿到 2.5 亿年前的(古生代时期)1.1 万种化石物种,借此发现了 5 亿年前的地球物种演化秘密他们将物种大爆发和大灭绝时期的生物多样性精确度缩小到了 2.6 万年左右,相关论文发表于在 Science 主刊上。
(来源:Shutterstock)
在 2020 年新冠疫情中,研究人员借助超级计算机的演算,发现新冠肺炎会让人体停止分解缓激肽,然后患者的肺部会被液体充满,进而引发炎症并带来呼吸困难。这一发现给疫情联防联控、以及精准施策带来了帮助。
通过多部门合作,借助天津超算中心的 “天河人工智能创新一体化平台”,中国也研发出全球首个新冠肺炎 CT 影像人工智能辅助诊断平台。
这是一种临床辅助诊断手段,可帮助提高新冠肺炎筛查能力。平台投入使用以来,已被访问 100 多万次。期间,还支持了美国、墨西哥、印度等国家的相关机构。
“天河三号 E 级原型机系统”,让中国进入 E 级超级计算时代
2018 年 7 月,国防科技大学和天津超算中心等团队研发出 “天河三号 E 级原型机系统”。目前,中国已启动百亿亿次超级计算机系统研制工作,也已经进入 E 级超级计算时代。
图 | 天河高性能计算机系统(来源:国家超级计算天津中心)
“天河” 计算机骨干孟祥飞博士告诉媒体,“天河三号 E 级原型机系统” 具备四大自主创新:
- 第一个创新是,“天河三号 E 级原型机系统” 包含 3 款芯片,其中包含互连接口芯片、路由器芯片和 “迈创” 众核处理器;
- 第二个创新是,包含 4 类计算 & 存储节点和服务节点、以及 10 余种 PCB 电路板;
- 第三个创新是具备并行存储、服务处理、计算处理、高速互连、监控诊断、基础架构等硬件分系统;
- 第四个创新是具备并行开发、应用支撑、系统操作和综合管理等软件分系统。
自从开放应用以来,中科院和北京临近空间飞行器系统工程研究所等单位已对 “天河” E 级原型机,进行了大规模并行应用测试。
“天河三号 E 级原型机系统” 诞生后,相关计算应用测试显示,只需 6 个 “天河三号 E 级原型机” 机柜,计算能力就相当于 120 个 “天河一号” 机柜。
它的浮点计算处理能力可达 10 的 18 次方,浮点计算处理能力 “天河一号” 的 200 倍,存储规模则是‘天河一号’的 100 倍,13 亿人上万年的工作量才抵得上它一小时的工作量。
2021 年,世界 500 强超级计算机名单中,中国有 186 台,美国有 123 台。张云泉对 DeepTech 介绍称,目前中国主流的几个超算中心算力利用率已经达到 60%-70% 左右,基本处于较理想工作状态。
张云泉也曾在 2020 年向 DeepTech 作出如下预测:日本富岳以半 E 级(算力 > 1000 PFlops)超算的未完成形态冲榜,旨在打中美 E 级超算一个时间差,短期成为 “独孤求败”,但等到年底或明年,中美超算一出,就会变成 “独孤必败”。如今来看,这预测非常准确。