探索未知的无限可能

DeGao 2025-09-05 00:47:15

超级计算,对普通民众而言,是一個“高大上”名词,代表着全世界最大层次大计算机,以及根据无敌硬件之上复杂科学计算软件;而对于各领域科学家、工程师而言,它又是在数字世界里延展咱们探索未知世界本事要紧工具,


最近10年是中国超级计算〔简称超算〕旺盛发展10年,在2018年两院院士大会上,超级计算变成习近平总书记讲话中,战略高技术发展一個要紧成果体现:“超级计算机连续10次蝉联世界之冠,采用国产芯片‘神威·太湖之光’获得高性能计算应用最高奖‘戈登·贝尔奖’”,

超级计算机早期发展

电子计算机诞生之初,由于造价昂贵,只有大型科研机构或商业公司才有运用条件,往往意义上最先個台电子计算机ENIAC〔1〕,就是由美国军方弹道研究实验室资助设计一台根据真空管计算系统,它可以自动实行乘法、累加,纵然ENIAC本来目是为计算火炮系统弹道表,但冯·诺依曼〔J. von Neumann〕等当时就利用这台系统实行氢弹研制以及数值天气模拟等开创性科学计算就业,

伴随1950—1960年代集成电路技术逐渐发展,搞定器设计、制造逐渐变成大概,超级计算机也在这個时期迎来要紧发展,由于当时搞定器硬件以及计算软件研发都处于萌芽时期,并未太多规则、兼容性束缚,享有“超级计算机之父”之称克雷〔S. Cray〕在早期提出很多天才构想,比方说超级计算机CDC6600系统〔2〕中中央搞定器〔CPU〕、辅助搞定器〔PPU〕协同设计,以及Cray-1计算机〔3〕中特意针对科学计算大规模数组操作向量搞定器设计,这些设计理念直到现在仍在各异计算系统中沿用、集成、重新发展,

从CDC6600诞生1964年,到接近整個1970年代,超级计算机都沿用类似结构,就整個系统仅靠一個或者几個强劲搞定器来支撑,每個搞定器内部都有复杂单元设计、功能,

直到1980年代,超级计算机发展另一条路径才开始逐步显现,在超级计算机复杂向量搞定器发展同时集成电路技术催生下微搞定器〔如英特尔〔Intel〕早期4004、8008〕、個人电脑也在迎来日新月异更迭,相较于本钱高昂、通用性低向量搞定器,纵然微搞定器单個性能无法与之相比,但经由网络来集成大量价格低廉、准则化生产微搞定器却可以实行更高计算性能,1981年,加州理工学院研究者采用64個Intel 8086搞定器,经由六维超立方互联,建成Cosmic Cube系统〔4〕,以后,英特尔iPSC系统、麻省理工学院研发CM〔Connection Machine〕系统、日本富士通研发风洞模拟器等集成成百上千個搞定器大规模并行搞定机开始连续涌现,并供应比原来向量搞定器更高计算性能,


“神威·太湖之光”计算系统架构 在一個节点内部,单個神威芯片聚合4個核组,多达260個各异计算重心;在一個神威超节点中,经由定制网络版集成256個芯片,并实行任意两個芯片相互间点对点高速直连;在系统层面,经由“神威”自主研发高速网络系统,将4万個芯片超过1000万個计算重心汇聚成一個整体,

在此过程当中,科学计算领域仍对是否能够驾驭这般大规模并行机器存在深深疑虑,根据阿姆达尔定律分析,倘若一個程序中有10%一部分无法并行,那么就使采用1000個搞定器,最多也就是把剩下90%时间改良到可以忽略不计,所获得性能加速比〔加速比指同一個任务在单搞定器系统、并行搞定器系统中运行消耗时间比率〕最多是10倍,那么几百個甚至几千個搞定器是否能够获得相应性能收益,这是有疑问,1985年底,卡普〔A. Karp〕在邮件中发起挑战,倘若任何人能在并行机上取得一個科学计算软件200倍以上加速,他将私人支付100美元奖金,1987年,计算机领域著名研究者戈登·贝尔〔Gordon Bell〕正式设立“戈登·贝尔奖”来奖励、跟踪超级计算机上最鼎级应用成果,当年获奖者就在由1024個节点组成nCube系统〔5〕上获得400到600倍性能提升,

以后近30多年里20多届“戈登·贝尔奖”评定、颁发,见证超级计算机、依托于超级计算机高性能计算应用飞速发展,也变成国际级超算应用领域最高奖项,从头几年每秒十亿次浮点运算左右应用性能,到2021年量子电路模拟超过每秒400亿亿次浮点运算应用性能,任凭是超级计算机硬件所能供应计算本事,还是高性能计算软件相关技术,都取得长足进步,


根据超算超大规模分子对接药物筛选结果示例 〔a〕类药小分子〔彩色一部分〕与新型冠状病毒相关受体〔PDB 7K0F,绿色一部分〕在对接盒子〔立方体〕中结合情况;〔b〕对接盒子中蛋白质受体、类药小分子相互作用示意,

“超级”体现在何处

业界都说超级计算机是科技领域皇冠上明珠,因它建设须要电子芯片、计算机系统、内存、存储、电源、冷却系统,以及基石软件、应用软件等方面技术积累、集成,须要在方方面面都做到高水准,才干集成出一台世界最先进超级计算机,

作为超级计算机,先说它“超级”体现在异乎寻常计算速度上,由于接近所有科学计算软件都采用浮点数作为基本数据格式,浮点运算操作〔浮点数加减乘除〕就变成衡量计算复杂度、计算量基本单位,每秒能实行浮点运算次数则变成衡量一台计算机计算速度通用指标,可以说,现阶段超算系统速度比科幻作家大开“脑洞”能想到速度还要快,著名科幻作家刘慈欣在《三体》中是这样描述世界最大层次大计算机:每秒可以实行500万亿次浮点运算,其实,在2008年,当时世界名次最先個超级计算机——美国“走鹃”〔6〕,就已经达到每秒1000万亿次浮点运算速度,无锡“神威·太湖之光”〔7〕超级计算机持续性能达到每秒9.3亿亿次,是三体世界整整186倍,现实已经超越科幻!

第二個“超级”就体现在它超级大并行规模上,目前主流技术路线是经由精妙系统设计、高速网络互连把众多计算资源集聚成一個整体,于是获得超级快计算速度,与初期几千個或几万個重心组成系统相相对,“神威·太湖之光”集聚上千万個计算重心,倘若把一個计算重心比作一個人话,这台计算机就相当于一個具有千万人口超级大都市,可以想象,要让这1000万人齐心协力,拧成一股绳,来搞定一個科学或工程难题,每個人不光要负责自己计算,还要跟其他人交换数据,无法“堵车”、无法“宕机”,还要探究散热、供电、定鼎性等方面难题,这将是一個巨大挑战,须要方方面面技术独创才干达成,

第三個“超级”体现在搞定“超级”难题上,超级计算机重心功能就是经由数值模拟或者是数据分析,在数字世界中拓展人类探索未知世界本事,大到泱泱宇宙,小到分子、原子模拟,在宇宙起源、演化、全球气候更迭、药物、材料研发、飞机发动机仿真等科学或工程前沿领域,超级计算机以及它所支撑起数字本事,都发挥着无法或缺作用,极具是对于全球最鼎级超算系统,计算本事每往前走一步,就意味着在这些领域里可以计算更大或更复杂难题:尝试一個更复杂设计或场景,或是把无法能变为大概,

另一個不容忽视特点,就是超级计算机在搞定 “超级”难题时,日益体现出现强烈交叉性,人类社会当前面对科学技术、工程难题大多涉及多個学科,须要不同样背景科学家一起搞定,单是全球气候更迭、应对研究,就涉及大气、海洋、生态、遥感、大气化学、全球更迭经济学等不同样学科,而根据超算计算软件,因其具有灵活性,可以将不同样领域新发现、新认识集成到一個工具中,形成一個多学科知识交叉、沉淀平台,而这样特性,对超算软件研发人员提出很高要求,

中国超算发展之路

近10年中国超算高速发展背后是慈云桂、金怡濂先生等一批老一辈超算就业者熬更夙夜、接续奋斗打下坚实基石,

严格来讲,中国计算机起步并非算晚,经由学习苏联技术,1958年就生产出最先個台数字电子计算机——103机〔8〕,但之后因国内外形势更迭,直到1978年3月在国家级科学技术大会上,邓小平同志提出 “中国要搞四個现代化,无法没有巨型机”,中国超级计算机事业才又重新启动起来,但当时与西方发达国家相比,差距已经拉大,

手握超级计算机最先进技术西方国家,对涵盖中国在内发展中国家实行永久严格管制,严禁出口相关高端技术、产品,另外,由于超算平台可以支撑众多与国家保障等战略密切相关计算任务,1980—1990年代,在国内石油及气象行业中,研究人员运用购置美国超算系统时,须要放在玻璃房内,由美方人员监管运用情况,这样玻璃房深深刺痛着我国超算领域研发人员,他们立志要造出自己超级计算机,直到“银河”“曙光”等国产超级计算机研制成功后,西方才解除对中国高性能计算机出口限制,

40年间,从初代“银河”“曙光”到近10年中连续5年占据世界最先個“天河”、“神威”,中国在超级计算机方面发展火速,从空白走向与美日媲美,变成继美国、日本之后第三個能独立设计、研制世界鼎级超级计算机国家,2021年世界超级计算机500强榜单中,中国共有186台上榜,数量最先個,这是2017年11月以来,中国超级计算机上榜数量连续8次位居最先個,

在超算硬件平台火速发展基石上,我国超算软件也在地球科学、生物信息、工业仿真、材料科学、人工智能等多個领域有长足进步,在“戈登·贝尔奖”颁发前29年里,该奖项一直被美国、日本科学家所垄断,直到2016年,中国科学院软件所、清华大学、北京师范大学、国家并行腹地等单位联合团队,终于填补空白,以千万核可扩展大气动力方程求解器〔9〕获得这一奖项,

2021年,清华超算团队作为重心成员第三次斩获“戈登·贝尔奖”,一举打破美国谷歌公司此前宣称“量子霸权”神话,

“量子霸权”是一個术语,表达量子计算设备在某些应用场景中,可以表现出传统计算机无法企及性能优点,谷歌公司2019年研发“悬铃木”系统在200秒内完成千万级量子采样〔保真度0.2%〕,美国最快巅峰超级计算机须要一万年才干模拟完成,时间上差异高达10亿倍,中国超算团队凭借研发超大规模量子随机电路模拟器〔10〕,实行近实时量子模拟,提出近似最优张量网络并行切分、收缩方法及混合精度算法,可全效扩展至数千万核并行规模,并供应每秒4.4千亿价值亿次持续计算性能,是目前已知超算领域最高混合精度浮点计算性能,也证明谷歌2019年演示随机量子线路采样任务并非能真正实行“量子霸权”,这又是一项多学科交叉成果,它集聚计算机、数学、量子物理等多個领域研究者一道奋勉,促进传统超算、量子计算一道发展,对于传统超算而言,新型量子计算机所形成“量子霸权”是“他山之石”,在传统超算上实行这样一個复杂度极高难题,触发算法、并行方法、改良方法等各個方面独创,而近实时量子电路模拟,则真正奠定最先进量子计算机、最先进超算之间桥梁,让它们可以相互促进,甚至相互融合,

获得超算领域最高奖,对于中国超算发展而言,是一個要紧里程碑,更是一個新开始,

我国超级计算后世

根据功能划分,超级计算可分为尖端超算、通用超算、业务超算以及人工智能超算等几大类,在国家扶持、应用场景扩展下,2021年,我国超级计算服务规模已经达到196.6亿元,预计2026年将增长至500亿元,

虽说我国超算已经取得一定成绩,超级计算机数量位居全球最先個,但近年来美国、日本等国也在连续提升自身实力,今年5月底,国际级组织“TOP500”公布2022年上半年全球超级计算机500强榜单,美国超级计算机“前沿”最先发上榜并位列榜最先,日本超级计算机“富岳”降至第2位,“神威·太湖之光”、“天河二号”分别位居第6位、第9位,“前沿”运算本事超过“神威·太湖之光”12倍,达到每秒100亿亿次,是全球最先台每秒能执行千亿价值亿次浮点运算超级计算机,

为在超算领域中维持博弈力,自2016年开始,我国陆续发布一系列政策持助超算发展,把超算列入《国民经济、社会发展十四個五年规划、2035年远景意向纲要》《十四五数字经济发展规划》等国家重大规划当中,着要紧聚焦高端芯片、操作系统、人工智能根本算法、传感器等根本领域,加快推进基石理论、基石算法、装备材料等研发突破、迭代应用;明确表达要加快构建国家级一体化大数据腹地体系,建设E级、10E级超级计算腹地〔E级超级计算指每秒可实行千亿价值亿次运算超级计算机,是国际级上高端信息技术独创、博弈制高点,被公感觉“超级计算机界下一顶皇冠”〕;提出加快实施“东数西算”工程等举措,仅是“东数西算”工程,其历史意义、战略价值将与西气东输、南水北调等世纪工程相媲美,这些举措目就是从国家战略、技术发展、能源政策等多方面出发,构建一個全方位超算发展体系,

针对国产高端芯片,国家已经提出2025年芯片冲刺70%自给率意向,在政策上,除对集成电路领域企业给予“10年免税”优惠政策外,还设立专项扶持基金、放宽所得税限度、贷款贴息等扶持政策,给国产芯片企业遗留加快发展空间,或许这是我国超算加快发展新契机,

超算编织出数字世界,是现实世界中人类无法直接用双手去触摸宏观或微观难题投影,这個数字世界中蕴含无数大概性,显然也有无数挑战在等待着咱们,多年来,超算硬件、软件系统持续连续发展,其背后就是人类对于科学、工程难题、未知世界永无止境探索,多学科多领域深度融合与发展,超算发展也是这般,从众多学科中汲取发展动力,同时以超算发展反推,为各学科领域供应新鲜动力,

以地球系统数值模拟近年来发展为例,除时空分辨率持续提升〔美国、欧洲及日本团队均已提出根据E级超算全球1千米分辨率大气模式意向〕,还呈现多过程、多时空尺度相耦合复杂特性,对模拟软件研发提出新挑战,数据分析方面,气候更迭、地球物理等领域积累海量多类型数据,也有研究开始尝试以深度学习方法增强、取代原有数据分析功能,与互联网语音及图像数据相比,科学领域数据及模型往往涉及更大维度、数据规模,况且对标注有更高专业要求,对训练、运用都提出更多难题,在这种背景下,探索超算与人工智能方法结合方案推动上述难题发展同时还将进一步开发出两条路径之间互补性巨大潜力,比方说,米级分辨、多时间点观测遥感卫星数据相较于百公里级气候模式,有巨大潜力供应更多信息、占卜本事,超级计算与人工智能相遇、深度融合也将为众多领域科学难题探索供应更多大概,

中流击水,奋楫者先,咱们无法断言后世超算世界会是怎样,但伴随计算技术、方法连续演进,超算自身与其他学科领域深度融合,将会在数字世界中供应越来越多独创大概。

作者:付昊桓 黄写勤 赵祎 张金潇 杨广文

〔1〕Brainerd J G, Sharpless T K. The ENIAC. Proceedings of the IEEE, 1999, 87〔6〕: 1031-1041.

〔2〕Thornton J E. The cdc 6600 project. Annals of the History of Computing, 1980, 2 〔4〕: 338-348.

〔3〕Russell R M. The CRAY-1 computer system. Communications of the ACM, 1978, 21 〔1〕: 63-72.

〔4〕Seitz C L. The cosmic cube. Communications of the ACM, 1985, 28 〔1〕: 22-33.

〔5〕Hayes J, Mudge T, Stout Q. Architecture of a Hypercube Supercomputer. International Conference on Parallel Processing, 1986: 653-660.

〔6〕Barker K J, Davis K, Hoisie A, et al. Entering the petaflop era: the architecture and performance of Roadrunner. SC'08: Proceedings of the 2008 ACM/IEEE conference on Supercomputing. Institute of Electrical and Electronics Engineers, 2008: 1-11.

〔7〕Fu H H, Liao J F, Yang J Z, et al. The Sunway TaihuLight supercomputer: system and applications. Science China Information Sciences, 2016, 59 〔7〕: 1-16.

〔8〕李国杰. 从103机发轫中国电子计算机. 科学大观园. 2019, 〔Z1〕:44-45.

〔9〕Yang C, Xue W, Fu H H, et al. 10M-core scalable fully-implicit solver for nonhydrostatic atmospheric dynamics. SC'16: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. Institute of Electrical and Electronics Engineers, 2016.

〔10〕Liu Y, Liu X, Li F, et al. Closing the “quantum supremacy” gap: achieving real-time simulation of a random quantum circuit using a new sunway supercomputer. Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. 2021.

转载内容仅代表作者观点

不代表中科院物理所立场

如需转载请联系原公众号

源:科学杂志1915

编辑:老头

1.2.

3 .

4.

5.

6.

7.

8.

9.

10.

很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯