2022年8月31日,柳朝晖教授团队参加湖北赛区鲲鹏应用创新大赛,并获得HPC决赛二等奖,入围全国半决赛。
本次比赛,柳朝晖教授团队组织“华中科技大学-SKLCC103”战队,以自主研发的“PFlows”软件参与HPC赛道的比赛。战队主要成员为2020级研究生马匡和2022级研究生王亚宁,江茂强博士后和柳朝晖教授全程参与指导。“PFLows”是团队在自主提出的边界增厚浸入边界-格子Boltzmann算法(Jiang&Liu, JCP, 2019)基础上,近年来开发出的可大规模高效并行计算的颗粒两相流直接数值模拟软件(Jiang et al., Compt. Fluid, 2022)。该软件目前已在天河-3超算平台上实现了1.6万CPU核心上的高效并行。
本次比赛,战队在短时间内将PFlows从基于X86-NVIDIA GPU异构并行计算框架,迁移拓展到基于鲲鹏ARM-NVIDIA GPU异构计算并行计算框架,并进行了细粒度并行、合并内存访问、通讯隐藏等多方面的性能优化。进一步针对GPU计算特点,创新性地提出了One-Step Index算法,满足更低的内存消耗、更小的内存带宽需求和更简单的编程实现。测试实现单GPU与单CPU核心相比近千倍加速,最高24 GPU异构并行效率达到95%,测试结果展示了极佳的加速效果、并行效率和可扩展性能。
现代计算流体力学在强大算力发展的基础上,形成了大尺度、高精度和高效率的发展需求,因此需要强大高效的数值模拟软件。PFlows定位于颗粒两相流的全解析直接数值模拟(FDNS)研究,其基础算法克服了早先模型处理颗粒移动边界时计算精度和计算效率上的矛盾,实现了流体流动、颗粒碰撞和颗粒流固耦合的高效并行,目前已可支持基于OpenACC/CUDA/HIP等多种同构和异构MPI大规模并行加速计算,未来可以广泛应用于能源、化工、水利、医药、生物、环境等众多领域。该软件以及中科院过程所EMMS团队LBM软件、德国埃尔朗根-纽伦堡大学的WaLBerla软件等,是国际上已报道的少数几个可实现百亿网格/百万颗粒,并行计算能力达每秒两千亿次网格更新率(200GLUPS)的大规模颗粒两相流全解析模拟软件。
鲲鹏应用创新大赛是面向全球开发者的顶级赛事,大赛由鲲鹏生态创新中心与华为、联合中国软件行业协会、绿色计算产业联盟、中国计算机行业协会、中国计算机学会高专委共同举办,旨在激发行业应用创新、加速产业融合、促进人才培养。本次湖北赛区主要面向企业伙伴/高校/科研院所参赛者,共49.9万元奖金池,有78支参赛队伍、235人参与了区域赛的角逐,最终包括华中科技大学-SKLCC103战队在内的6支队伍(其中HPC赛道仅2支队伍)成功挺入鲲鹏应用创新大赛的全国半决赛。
柳朝晖教授团队注重国际前沿的基础研究和技术开发,包括化石能源清洁低碳利用技术(富氧燃烧、无焰燃烧)、湍流两相反应流体力学、能源动力装置和系统的仿真及优化等。PFlows相关工作得到了国家自然科学基金(NSFC 51876075)的支持。
图1 颗粒两相流软件PFlows的算法架构
图2 战队成员获颁奖杯和证书