近日,国家超算互联网联合体成立,首批15家区域、高校超算中心意向入网。这就意味着,未来算力将如同电力那样走进千家万户。而超级计算机就是可以提供强大算力的“超级大脑”,是体现国家创新能力的国之利器。在江苏,国家超级计算无锡中心和盐城超算中心把这些“超级大脑”联合起来,组成超算互联网“超级战队”,此举无疑将增强我国在超算领域的核心竞争力。但“超级大脑”进万家,要过3道关:包括算力设施分布不均衡、标准不完善、应用不多元等。江苏超算如何越关晋级?为此,记者进行了探访。
(相关资料图)
算力中心“打团战”
系统峰值性能12.5亿亿次、持续性能9.3亿亿次、性能功耗比每瓦特60.5亿次……一项项惊人的数据向我们展示出了无锡中心这台“超级大脑”的超强算力“成绩”。如果将不同超算中心的算力联合起来,又会产生什么样的影响?
国家超级计算无锡中心主任杨广文介绍,为了解决我国超算中心运行面临的挑战,提升我国超算的应用水平,推动超算中心从提供裸机时向提供多领域应用服务转变,构建超算互联网势在必行。
超算互联网,简单来说,是一种以超级计算机和高速互联网为基础的国家级先进计算基础设施。杨广文介绍,它以高速网络连接分布各地的超算中心,聚合多个超算中心的软硬件资源,并通过建设超算资源共享与交易平台,支持算力、数据、软件、应用等资源的共享与交易,同时向用户提供多样化的算力服务。
“和传统的超算应用相比,超算互联网的最大特点是将提供超算算力转变为提供超算应用服务。”杨广文介绍,超算互联网可将各级超算中心、云计算企业、科研机构等不同来源的算力、数据、软件、应用等统一为超算资源并整合到一起,为科研、生产生活等提供高效、专业的超级计算服务。
早在2020年,国家超级计算无锡中心便承担了国家高性能计算专项项目“国家高性能计算环境领域应用平台及服务体系研究与构建”。国家超级计算无锡中心联合国家超级计算广州中心、中科院计算机网络信息中心等多家国家级超级计算中心,以及清华大学、之江实验室等多家核心应用单位,开展了超算互联网技术体系和应用模式研究。
在研究中,多个国家级超级计算中心资源的互联互通与资源共享,集成了每秒钟完成超百亿亿次浮点运算的异构超算算力。这些遍布全国的超算算力被有机地整合为一个整体,形成国家高性能计算核心资源网,为超算互联网提供了强大的算力基础。
在江苏,国家超级计算无锡中心和盐城超算中心正逐渐成为江苏超算队伍的“双子星”。其中,国家超级计算无锡中心由科技部、江苏省和无锡市政府三方共同投资18亿元建成,由清华大学相关团队负责运营管理。无锡超算所运营的“神威·太湖之光”是世界上首台峰值运行速度超过十亿亿次(125PFlops)的超级计算机,也是我国第一台全部采用国产处理器构建的世界第一的超级计算机。
而在去年七月揭牌的盐城超算中心,由盐城高新区联合国家超算无锡中心共建,采用“平台+运营公司”模式,依托无锡中心和创新团队资源开展超级计算相关研究,实现科技成果转化,由是石科技(江苏)有限公司负责超算中心的运营与管理。截至目前,盐城超算中心已建智能算力达到100P,并由省科技厅报送至科技部申报“国家新一代人工智能公共算力开放创新平台”。
“盐城超算作为国家超级计算无锡中心的首个分中心,算力共享,运营互通。”无锡超算国产生态实验室副主任叶跃进介绍,未来,国家超级计算无锡中心盐城分中心作为分调度超算中心的一分子,在无锡就可以轻松调度盐城的算力,让两台计算机共同求解一个任务。“盐城分中心以超级计算产业化为目标,重点围绕人工智能、航空航天、医疗医药等领域实现应用落地,带动上下游产业链的聚集和发展。”
“超级大脑”走进千家万户
实际上,算力并不遥远。目前,算力已经应用于太空探索、人类基因测序、医药研发等场景,甚至在日常生活中,几乎每个人都会遇到的打车、购物、订外卖等场景,都要靠算力设施来处理海量数据。
2016年以来,无锡超算“神威·太湖之光”已应用于20多个领域,服务用户超300家,已经完成1000余项应用课题的计算任务,平均每天完成超7000项作业任务。现阶段,超算互联网应用和落地更偏向于传统的高性能计算,如天气预报、大型工程设计和基础科学研究等。而让算力走向大众是互联网思维下超算建设的重要目标之一。
“未来,超算互联网由各大超算中心提供算力,以各种软件的方式将其提供给用户,如同电商购物,更多用户可以很方便地获得需要的资源,超算的使用将更为普及。”相关专家表示,最终将实现超算算力能像电力一样走进千家万户,在任何地方、任何人、任何时间都可以获得大数据算力来支持相关应用。
目前,无锡超算搭建的超算互联网体系已经在分子模拟与药物设计、环境治理与灾害防治等多个重点领域开展应用示范。杨广文介绍,在分子模拟与药物设计领域,可设计和初步构建分子模拟与药物设计领域应用平台,实现和部署高通量药物筛选、分子动力学模拟以及化合物库和数据管理系统;在环境治理与灾害防治领域,可设计和初步构建全国精细化短期气候预测业务系统、全球涡分辨率海洋—海冰预报、浪潮流耦合的精细化海洋预报、典型流域精细化水文预报、长三角/环太湖气象预报等领域应用平台。
而盐城超算也与产业链发展紧密结合。据悉,盐城超算在200余人的研发团队力量下,基于团队积累的涉及天气气候、航空航天、海洋环境、新药创制、先进制造、新材料、新能源、人工智能等20个领域应用,结合优势资源,在人工智能、航空航天、生物医药板块集中发力。在对盐城当地的工业应用场景中,盐城超算全力服务盐城市“5+2”战略性新兴产业和23条产业链,聚焦场景、车间、工厂、园区四个维度,推动企业传统生产工厂(车间)智能化改造和数字化转型,打造一批可复制、可推广的实践案例,助力全市产业数字化发展。
算力建设挑战升级越关势在必行
“超算互联网的核心目标是确保超级计算服务实现从传统提供算力到提供服务的革命性转变。”杨广文说,只有实现了资源的高速互联,各种超算资源才有可能成为一个有机整体,才能为应用领域和相关产业提供有效的高性能计算应用服务。
然而,目前超算互联网的构建在技术、产业生态等领域都面临着诸多挑战。在技术上,超算互联网仍需要通过高速网络高效连接来自不同超算中心和资源提供单位的、分布异构的超算资源,需要实现算力、存储、数据等各种高性能计算资源的共享,以及高性能计算任务的有效调度。
“从产业生态来看,超算互联网构建于超级计算和高速网络的基础之上,对相关产业生态的依赖非常明显,从操作系统、基础软件到并行应用软件的开发与优化,这些都会影响到超算互联网的构建与运营。”杨广文说。
如何在未来利用算力提升用户计算效率?盐城中心产品负责人侯建业表示,需要用好用足超算中心算力资源,通过云桌面形式,向用户提供基础算力租赁服务和高性能计算优化服务,在工业互联网、人工智能、新能源等领域,提供高效并行计算解决方案。
东西部算力资源不均衡这个“老大难”如何破解?侯建业认为,应结合国家“东数西算”工程、国家超算互联网工作部署,全面融入全国一体化算力网络长三角国家枢纽节点,以超算中心建设为样板,整合技术、数据、算力等资源,为目标客户定制包含算力建设与运营的一体化解决方案,共同构建超算国产软硬件生态系统。
人才是第一资源,超算互联网的搭建,人才是关键突破点。中心人才发展负责人冯伟表示,基于成熟的运维技术及体系化人才培养,依托专业运维团队及高效管理系统,中心将强化与清华、北大等院校合作,对网络通信和存储读写进行实时维护,提高超算互联网整体运行效率,打造面向全国的“超算产业化人才培养基地”。
“未来,国家超级计算无锡中心将依托现有的高性能计算人才与技术优势,持续建设高性能计算人才高地,拓展高性能计算应用领域,探索关键核心技术创新,支持企业产品创新设计,将无锡超算打造成超级计算和关键学科交叉领域人才聚集地、项目汇集地和成果产出地,充分体现国家重大设施在科研与产业化方面的价值,服务于国家战略,支持地方产业升级,力争建成世界上一流的超算中心。”杨广文表示。
记者 张宣 程晓琳
关键词: