
国家超级计算深圳中心。
深圳新闻网2026年7月3日讯(深圳特区报记者 闻坤/文 毕晗/图)光明科学城,几栋高大的“黑立方”建筑在蓝天白云下格外显眼。昨日,记者推开国家超级计算深圳中心(以下简称“深圳超算二期”)机房的大门,7排蓝色机柜整齐排列,层层叠叠的芯片在绿色光纤的链接下,构成了一座算力奔腾不息的“超级工厂”。
6月23日,这台全国产自主研制的超级计算机在德国ISC2026大会上,以2.198EFlops(每秒2.198百亿亿次浮点运算)持续双精度浮点性能,登顶全球超算TOP500榜单,成为世界首台持续性能超二百亿亿次的超算系统。
每秒2.198百亿亿次浮点运算,面对这个难以直观理解的数字,不禁让人发问:这台“纯血”国产超算到底有多快?凭啥能这么快?时隔9年中国重返第一意味着什么?它又能解决什么难题?
“灵晟”为何在深圳诞生?
“灵晟”诞生在深圳,绝非偶然。
关键的原因,藏在深圳的产业链图谱里。“灵晟”这台顶级算力平台,并非孤悬于光明科学城的高冷机器。它选择深圳,是因为这里生长着最懂“算力”的产业土壤。
“深圳的优势是产业场景密集、创新主体活跃。”卢宇彤说,“国家超级计算深圳中心能够把顶级算力和大湾区的科研、产业需求连接起来,为深圳建设现代化产业体系提供算力底座。”
在光明科学城的规划蓝图上,这种“靠近”是刻意的。深圳超算二期被设计为大科学装置集聚区的“算力枢纽”——它和鹏城云脑Ⅲ以及合成生物研究、脑解析与脑模拟、自由电子激光等重大科技基础设施比邻而居。这种物理上的“聚集”,让深圳超算从实验室直接走向了应用场。
更重要的是,深圳拥有电子信息、生物医药、先进制造、新能源、新材料、低空经济和人工智能等产业基础,“灵晟”可以为这些产业提供高端算力底座。
正是这种“算力靠近产业、产业反哺算力”的生态闭环,让“灵晟”的价值不只体现在榜单上,更体现在每一个产业创新的细节里,成为流淌在产业链中的“新质能量”。
重返第一意味着什么?
2013年,天河二号首次问鼎全球超算榜首;2016年至2017年,神威·太湖之光4次蝉联第一。此后,中国超算一度从TOP500榜单中“隐身”。
这9年,中国超算到底经历了什么?
2015年前后,国际环境发生了很大变化,高端处理器、加速器、互连等关键技术面临更严格的限制,过去一些可以依赖国际产业链协同完成的环节,开始必须更多依靠自主力量解决。
“那几年,中国超算面对的并不是‘会不会做一台机器’的问题,而是怎样在关键环节受限的情况下,重构一条自主可控、可持续演进的技术路线。”卢宇彤说。
她把这9年看作一段“深度积累期”——中国超算并没有停下来,而是在真实科研、工程、产业和人工智能场景里持续迭代。
“灵晟”的登顶,标志着我国超算领域突破国外技术封锁、构建自主可控软硬件体系的历史性跨越。“从‘银河’解决‘有没有’,到‘天河’解决‘强不强’,再到今天‘灵晟’探索‘能不能引领’——这是一代代科研人员接续攻关的结果。”卢宇彤说。
在深圳超算二期的展厅,记者看到一张世界地图,上面标注着全球主要超算中心的位置。蓝色的光点串联起德国、瑞士、意大利、美国、日本、广州、天津……而深圳,也被标注其中,格外醒目。“自主创新,引领世界算力新高度”——这是中国超算人的信念,如今已成为现实。
这个第一到底有多快?
“2.198百亿亿次浮点运算是一个很大的数字,普通人很难直观理解。”“灵晟”超算系统总设计师、国家超算深圳中心主任、中山大学教授卢宇彤告诉记者。
卢宇彤用一个比喻让这个数字变得生动:“‘灵晟’工作一秒钟的计算量,相当于全球70亿人,每人每秒完成一次简单计算,昼夜不停也要算上整整10年。”
但这并非简单的数字堆砌。与排名第二的美国El Captain超算(1.809EFlops)相比,“灵晟”的性能足足领先了20%以上。
更让人惊叹的是速度背后的效率。卢宇彤介绍,系统大规模并行环境下平均扩展效率达84.4%,实现超过千万核心的全系统高效可扩展运行。“很多优化只有到了全系统规模才会暴露出来,需要反复测试、定位和迭代。”
这意味着,这台“超级大脑”不仅跑得快,还能让千万颗“脑细胞”高效协作,最大限度利用算力。
“灵晟”为啥能“跑”第一?
“灵晟”凭什么站上世界之巅?答案藏在一条“反主流”的技术路线里。
在当前全球超算领域,CPU+GPU的异构架构几乎是所有顶尖系统的共同选择。但“灵晟”却走出了一条截然不同的路——全CPU架构。
“这不是被逼出来的被动选择。”卢宇彤斩钉截铁地说,这条技术路线是团队在项目设计之初,经过广泛调研、深入研判后主动选择的方向。
“国际上很多顶级超算采用CPU+GPU的异构路线,这条路有显著性能优势,但也带来数据搬移开销大、编程复杂、应用迁移成本高、系统能效平衡难等问题。”卢宇彤说。
“灵晟”的核心思路,是把类似GPU的矩阵加速计算能力引入CPU内部,让CPU自带加速能力。卢宇彤称之为“Online Acceleration的全CPU架构”——在CPU内嵌AI矩阵加速单元,通过自研的高带宽内存等技术,实现超算、智算等多种计算模式的高效协同、深度融合。
这相当于给CPU装上了一颗“加速心脏”。自研LX2 CPU创新性地引入多精度与矩阵加速能力,并集成了首颗国产HBM高带宽内存,内存带宽相比传统CPU提升10倍。图灵奖得主Jack Dongarra教授评价:“中国的‘灵晟’系统让世界看到了超算通向AI4Science新型系统架构的希望之光。”
从芯片、互连到系统,“灵晟”的全栈国产能力令人惊叹。92个计算柜集成47000多个处理器,10万级节点超大规模组网,100%全液冷散热计算机柜——每一个环节都掌握在中国人自己手里。
“这套设计的核心,是回到计算加速的本质。”卢宇彤说,“减少不必要的数据搬运,让计算、内存、互连和软件更紧密协同。”
“灵晟”能解决哪些难题?
“灵晟”不是一台只为榜单存在的机器。它的真正价值,在于把算力转化为解决真实问题的能力。
一个生动的实例:在药物发现领域,“灵晟”可以支撑10万亿规模可合成药物筛选,把过去需要数月的计算任务压缩到一天。
这不是理论设想。在深圳超算二期展厅的生命科学展示区,记者看到了一项成果:依托“灵晟”系统实现了高效的大规模分子对接,大幅提升了超大规模虚拟筛选的效率。这种能力,可以帮助科研人员加速新药研发。
在气象领域,“灵晟”可以支撑更高分辨率的天气和气候模拟。工作人员告诉记者:“如果预报精度从公里级提升到百米级,算力需求会急剧上升。‘灵晟’能轻松应对这种变化。”
在工程仿真、材料科学、脑科学、大模型训练等领域,“灵晟”同样大显身手。极端尺度湍流DNS、全脑仿真、万亿网格地震模拟——这些过去算不动、算不快、算不细的问题,现在变得可算、快算、算得更准。
“我们全面对社会开放服务。”卢宇彤说,“科研机构、高校、政府、企业都是我们的服务对象。”
登顶TOP500是阶段性成功,也是新的起点。卢宇彤说,下一步团队会进一步完善超智融合多领域应用软件和服务环境,构建国产超算软件生态和应用生态,让算力真正转化为科学发现、工程突破和产业创新的生产力。
顶峰从来不是终点。对于中国超算,比跑多快更重要的,是跑向哪里——让国之重器真正变成民之利器,让顶尖算力赋能千行百业。当“灵晟”的算力流淌进气象预报、药物研发、材料设计、城市治理的毛细血管,一个算力驱动的未来,正在深圳、在中国加速到来。