随着工业4.0和人工智能等技术的发展,高性能计算(HPC)系统在制造业和人工智能中也得到了创新性的发展,如在制造业中,利用HPC系统进行高精度的数值模拟来优化设计方案,减少实验成本;在人工智能中,利用HPC进行深度学习、大规模数据分析和机器学习等任务,以提高人工智能的效果和性能。
云安全联盟大中华区发布《高性能计算(HPC)桌面演习指南》(以下简称指南),指南旨在帮助HPC高性能计算运营者及其利益相关者在网络安全事件发生时讨论HPC的安全问题,为改善HPC系统的安全而采取的行动建立共识,并围绕HPC系统制定事件响应(IR)流程。
随着越来越多的HPC系统应用面向终端用户开放,提供互联网接入服务,针对HPC系统的网络攻击也逐渐增多。然后目前大部分HPC系统在IT部门之外处理,通常由专门从事HPC系统的个人管理,可能缺乏正式的网络安全培训和网络攻防实战经验,导致HPC系统一旦被攻击,其发现、响应、处置和溯源等安全流程将变得更加模糊与困难。
指南首先定义了桌面演习的各方参与者,包括行政领导、HPC系统管理者、网络安全/信息安全人员、HPC应用开发者、利用HPC环境的研究人员、事故应对人员/取证人员、法律人员和媒体人员等,并强调了各方参与人员不应该因为某些控制措施的存在而争论该场景的可行性。桌面演习的目标是假设控制失败,以引导组织全面了解其事件响应(IR)流程,并作为一种识别额外补偿控制的方式,在控制失败的情况下应该有所帮助。基于HPC架构,指南详细定义了涉及桌面推演的各个大区,包括访问区、管理区、高性能计算区和数据存储区。
针对HPC网络安全桌面演习,指南定义了四个阶段,包括预备计划阶段、演习计划和准备阶段、练习设计阶段和演习执行阶段,如下图所示:
指南根据具体的桌面推演场景给出了一个具体实例,该实例涉及一个HPC系统,该系统提供一个基于Web的前端(访问区),允许应用程序的用户将数据提交给HPC集群进行处理,HPC网络服务器由防火墙保护,只允许HTTPS流量通过。网络服务器与HPC集群被另一个防火墙隔开,该防火墙只允许网络服务器与HPC集群之间的互动所需的流量通过。高性能计算、数据存储和管理区都在这第二道防火墙后面。该架构保持最小化,以使桌面练习更普遍地适用于利用HPC的各种组织。具体实例网络架构如图所示:
基于该实例,指南详细描述了HPC桌面演习中的各类注意事项和关键点,并对具体的演习推演事项进行了详细的解读和规划。
总体而言,指南从HPC系统的网络安全桌面推演出发,详细阐述了HPC系统的架构、HPC系统安全桌面推演中的各方角色、场景构建和注意事项等,并给出实例进行说明,给读者提供了一个详细可落地的高性能计算HPC系统网络安全桌面推演方案,以帮助HPC系统安全管理人员快速获取网络安全及攻防相关经验,提升HPC安全管理人员的网络安全响应和处置水平。
致谢
《高性能计算(HPC)桌面演习指南》(中文版)报告支持单位:
浪潮云是中国最早提供云服务的厂商之一(2010),是首批国家机关云服务提供商。作为中国行业云的引领者,浪潮云致力于成为高品质云服务提供商,具备“专业、生态、可信赖”三大核心优势。为客户提供云网边端融合、云数智融合、建管运融合的全栈云服务,构建零信任的云数安全体系,打造新一代混合云。携手合作伙伴,共建云舟联盟生态,支撑政府、企业数字化转型,助力数字中国建设。
浪潮云是CSA全球会员单位,支持该报告内容的翻译,但不影响CSA研究内容的开发权和编辑权。