电磁仿真(时域频域)单机集群精准配置推荐

2018-05-21 11:15:31 [ 中关村在线原创 ] 作者：zoler

目录
  1. 电磁仿真计算特点与硬件配资分析
  2. 电磁仿真计算绝配~UltraLAB工作站介绍
  3.  电磁仿真计算硬件配置（单机与集群）推荐

一．电磁仿真计算特点与硬件配置分析

电磁场仿真软件广泛应用于无线和有线通信、计算机、卫星、雷达、半导体和微波集成电路、航空航天等领域，从毫米波电路、射频电路封装设计验证，到混合集成电路、PCB板、无源板级器件、RFIC/MMIC设计，天线设计，微波腔体、衰减器、微波转接头、波导录波器等设计等

电磁仿真(时域频域)单机集群精准配置推荐

1.1电磁仿真算法分类、计算特点

计算电磁学（CEM）方法大致可分为2类：精确算法和高频近似方法。

（1）全波精确计算法

包括差分法（FDTD，FDFD）、有限元（FEM）、矩量法（MoM）以及基于矩量法的快速算法（如快速多极子FMM和多层快速多极子MLFMA）等，其中，在解决电大目标电磁问题中最有效的方法为多层快速多极子方法。

（2）高频近似方法

一般可归作2类：一类基于射线光学，包括几何光学（GO）、几何绕射理论（GTD）以及在GTD 基础上发展起来的一致性绕射理论（UTD）等；另一类基于波前光学，包括物理光学（PO）、物理绕射理论（PTD）、等效电磁流方法（MEC）以及增量长度绕射系数法（ILDC）等

算法计算特点汇总如下

NO	关键项	时域算法		频域算法
1	主要算法	时域有限差分 FDTD	时域有限积分 FIT	有限元 FEM	矩量法 MOM
2	典型软件	EMPIRE XPU XFDTD EMPro	CST	HFSS EMPro JMAG FLU	FEKO Momentum Sonnet
3	计算特点	线性加速比高、高度多线程，支持多核CPU 支持大型GPU 内存要求不高回写很少		多线程，线性加速有限支持多核CPU并行求解内存要求高回写有

小结：

1. 时域算法，属于显式算法，传统的CPU多核加速比好，核数越多计算越快，此外，并行度高，支持GPU加速计算，注意大部分求解器对GPU要求是双精度计算为主，也就是说需要用双精度性能高的GPU卡

2 频域算法，属于隐式算法，支持多核并行计算，但核数并行计算有限，不支持GPU计算，提升性能的手段，就是提升CPU的频率，足够大的内存，值得注意当内存非常大的时候（超过192GB），硬盘io性能非常关键

1.2对并行计算求解过程分析

如何配置CPU要根据求解过程和算法特点，尤其要了解时域、频域两大算法特点紧密结合，这样才能更高效更合理，从并行求解流程图看，循环计算过程是单核和多核交叉过程

上图可以看出，CPU选型非常重要，CPU睿频足够高，大幅缩短【阶段1】求解时间，和整机足够核数+高频运行，大幅缩短【阶段2】的求解器解算时间

常规工作站卖家，提供的机器往往多核忽视了睿频的重要性，整个计算过程效率非常低，

因此硬件配置注意：

1. 如果是时域算法为主，例如 FDTD、FIT求解器，由于并行度高，工作站配置尽量多核，可显著提升求解速度，同时注意阶段1睿频高的处理器更快，如果是以GPU计算为主，可以配置CPU频率高，核数少的，这样整个过程显著提升

2. 如果是隐式算法为主，例如 FEM，MOM求解器，由于并行度有限，一定要睿频尽可能高，同时保证足够的核数的并行，这样整个求解过程无死角瓶颈

3. 如果是多种算法并用，CPU要足够核数与高睿频之间选择一个兼顾的规格，三种应用（时域算法、频域算法、混合算法）都均能确保工作站硬件计算性能最大化

考虑到上述计算特点，CPU的选择对整个求解过程极其重要，下面是最新上市的intel Xeon Schalable(可扩展)处理器多种规格，UltraLAB选型分析：

1.3CEM求解规模与硬件配置推荐

a）基于时域算法~UltraLAB硬件配置参考（CPU类）

NO	分类	规模划分	核数	全核频率	睿频	内存	并行存储
1	小规模	<50倍波长	14核	4.6GHz	4.6GHz	32GB
1	小规模	<50倍波长	18核	4.5GHz	4.5GHz	64GB
2	中等规模	50~100倍波长	36核	3.1GHz	3.7GHz	64GB
2	中等规模	50~100倍波长	40核	3.1GHz	3.7GHz	96GB
3	大规模	100~200倍波长	48核	3.5GHz	3.7GHz	96GB
3	大规模	100~200倍波长	56核	3.3GHz	3.8GHz	192GB	13*4TB
4	超大规模	>200倍波长	96核	2.8GHz	3.3GHz	512GB	13*4TB

b）基于频域算法~UltraLAB硬件配置参考

NO	分类	规模划分	核数	全核频率	睿频	内存	并行存储
1	小规模	<20万网格 (</100万未知量)	14核	4.6GHz	4.6GHz	64GB

		20万~80万网格 (100~400万未知量)	18核	4.5GHz	4.5GHz	96GB

2	中等规模	80万~200万网格 (400万~1000万未知量)	24核	4GHz	4.2GHz	96GB

		200万~500万网格	36核	3.7GHz	3.7GHz	192GB	8*4TB
		(1000万~2500万未知量)
3	大规模	500万~1000万网格(2500万~5000万未知量)	48核	3.5GHz	3.7GHz	256GB	10*4TB
4	超大规模	1000万~2000万网格 (5000万~1亿未知量)	56核	3.3GHz	3.8GHz	384GB	13*4TB
5	超大规模	>2000万网格 (>1亿个未知量)	集群18*6 =108	4.4GHz	4.4GHz	64GB	并行存储

c）基于超大规模时域算法求解GPU选型

如果以GPU求解为为主，可选的GPU卡参考下表

二．基于电磁仿真计算的UltraLAB机型介绍

UltraLAB是西安坤隆计算机科技有限公司推出的定制图形工作站品牌，经过多年发展，该产品拥有傲视群雄的三大领先优势：先进计算硬件架构、完整齐全行业应用定制方案、专业硬件系统优化技术，大幅超越同类的“图形工作站”产品，我们提供基于电磁仿真计算应用最快硬件架构产品系列

2.1 极速图形工作站H490介绍

配置特点：

（1）CPU具有超高的频率，中小规模时域与频域求解，发挥极致性能

6核5.0GHz，8~10核4.8GHz，12~14核4.6GHz，16~18核4.4GHz
（2）GPU 支持双GPU架构超算

显著优势：

和市场上单路cpu架构的工作站（单Xeon E5v4，单Xeon W-2100系列，单Xeon Schalable系列）相比，拥有超高频率，在多核并行计算（特别是频域求解），性能出众

2.2 高性能计算工作站EX620

配置特点：
CPU 支持双Xeon Schalable（可扩展）处理器，拥有更高频率和更低延迟，中大规模时域与频域求解，发挥极致性能

提供规格：
24核*4GHz/4.2GHz
36核3.7GHz/3.7GHz
40核3.1GHz/3.7GHz
48核*3.5GHz/3.7GHz
56核*3.3GHz/3.8GHz

GPU 支持双GPU架构超算

显著优势：

和市场上常规双路cpu工作站（双Xeon E5v4，双Xeon Schalable系列）相比，拥有更高频率，多核并行计算（时域、频域算法），定位精准高效，显式计算（EX620i）、显式隐式计算通吃（EX620）

2.3 超大规模仿真计算机型Alpha720

配置特点：
CPU 支持4颗Xeon E7v4处理器(最高到96核)，拥有更高频率和更低延迟，超大规模时域算法求解，极致性能

提供规格：72核2.8GHz，96核2.7GHz
GPU 支持双GPU架构超算

显著优势市面上唯一的最快时域求解（CPU计算架构）工作站，极致性能还静音

2.4 图灵超算工作站GX490M或GX620M

GX490M配置特点：
CPU 具有超高的频率，中小规模时域与频域求解，发挥极致性能

提供规格：10核4.8GHz，12~14核4.6GHz，16~18核4.4GHz
GPU 支持7块双槽GPU卡

GX620M配置特点：
CPU 支持双Xeon Schalable（可扩展）处理器，拥有更高频率和更低延迟，中大规模时域与频域求解，发挥极致性能

提供规格：24核4GHz，36核3.7GHz，40核3.1GHz，48核3.5GHz，56核3.3GHz
GPU 支持9块双槽GPU卡

显著优势市面上唯一的基于办公环境（静音级）最强大GPU超算性能时域求解计算系统，同时兼顾频域隐式算法极致性能展现

各种机型性能与差异对比表

NO	机型	硬件配置特点	适合应用
1	H490	单CPU+双GPU （14核4.7GHz，18核4.5GHz）	中小规模频域、时域算法求解
2	EX620i	双CPU（56核）+双CPU	大规模时域、频域算法求解
3	EX620	双CPU（56核）+双GPU+并行存储	大规模的全能求解
4	GX490M	单CPU+7个GPU+并行存储	超大规模时域GPU超级
5	GX620M	双CPU（56核）+9个GPU+并行存储（16）	超大规模全能求解、时域GPU求解
6	Alpha720	四CPU(96核)+双GPU+并行存储	超大规模CPU架构时域求解