适用于混合网格的改进雅可比迭代法及其应用

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

玩滑板的野马 · 彻底理解HashMap及LinkedHash ...· 7 月前 ·

英勇无比的移动电源 · mybatis查询同时返回总数和数据_myb ...· 8 月前 ·

稳重的海豚 · java动态加载jar包 - 朗笑江湖 - 博客园· 8 月前 ·

阳刚的凉面 · 如何用Python和Excel公式处理数据？· 1 年前 ·

有腹肌的火锅 · Python - dbutils - ...· 1 年前 ·

1. School of Aeronautic Science and Engineering, Beijing University of Aeronautics and Astronautics, Beijing 100083, China;
2. Super Computing Center, Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China

Received: 2015-04-07; Accepted: 2015-07-10; Published online: 2015-10-14 15:09

Corresponding author. Tel.: 010-82317019 E-mail: yanchao@buaa.edu.cn

Abstract : LU-SGS scheme is widely used today because of its robustness and cheap memory cost. However, the original LU-SGS shows less competitive convergence rate; in order to apply paralleled codes on hybrid unstructured grid, the grid reordering and regrouping procedure must be carried out beforehand. In this paper, an improved implicit method suitable for complex hybrid gird is developed to achieve fast convergence rate and to parallelize the algorithm without grid reordering and regrouping procedure. This method is simple for coding and easy to use OpenMP for code parallelization. The numerical results of Euler and viscous flows show that the method has a reliable performance, and it is able to achieve a significant efficiency improvement over implicit counterparts such as LU-SGS scheme with less requirement of extra memory, and parallel computation produce exactly the same result as serial case. Key words : hybrid grid implicit method parallel computation OpenMP Jacobi iteration grid reorder 计算流体力学(Computational Fluid Dynamics,CFD)已得到广泛应用。随着需要模拟的外形越来越复杂,混合网格由于其能充分利用非结构网格的生成优势和对复杂外形的强大适应能力,已得到越来越多的使用。然而,由于混合网格单元间的无序性和复杂的数据结构,相比于结构网格其计算效率较低且存储需求较大 ^{[

1

]} 。另一方面,显式格式如Runge-Kutta法等虽实现简单,计算量小,然而在高雷诺数流动计算中,由于稳定性限制,时间步长不能过大,计算效率不高。由于上述原因,为了在混合网格上提高计算效率,隐式方法如Gauss-Seidel、LU-SGS、BLU-SGS和GMRES等格式在近年来得到广泛的研究和应用 ^{[

1

,

2

,

3

,

4

,

5

,

6

,

7

,

8

,

9

,

10

,

11

,

12

,

13

,

14

,

15

]} 。

由于LU-SGS鲁棒性较好,存储需求低,其在非结构/混合网格上得到了广泛的应用 ^{[

3

,

5

,

7

,

9

]} 。然而,由于近似处理,LU-SGS收敛速度相对较低。另外,在混合网格上应用LU-SGS,必须预先对网格进行重新排序以减小系数矩阵带宽 ^{[

6

,

9

,

16

]} ,为了并行计算,网格单元也需预先进行分组。Luo等 ^{[

6

]} 为了提高计算效率,提出了应用于混合网格上的基于共享内存OpenMP并行模式的GMRES+LU-SGS隐式格式。为了并行化,该格式事先也需以某种方法对网格进行分组,并将网格在处理器多个进程间划分。但该方法改变了串行程序执行顺序,造成串行、并行结果不一致,且实现复杂。此外当采用动网格计算时,网格排序和分组需反复进行,为求解带来了额外的时间消耗。

为了克服上述问题,本文提出了一种无需网格排序和分组的改进雅可比迭代方法。将每个单元同其相邻单元作为独立的块处理,并行地直接求解各块相应的方程组;为了使算法并行化,抛弃了LU-SGS中的前扫描和后扫描模式,依次扫描各个单元块,并用内迭代加速收敛。在构造每个独立块的雅可比矩阵时,采用了基于重构变量的近似通量函数,降低了计算复杂性,并能保证对角占优特性。

本文提出的方法实现简单,数值算例表明,相比于LU-SGS格式,具有更高的收敛效率和鲁棒性,并行和串行结果一致,且内存需求增加很少。

1 格心有限体积法三维非定常可压Navier-Stokes方程守恒积分形式为

式中: W 为守恒变量; Ω 和 S 分别为控制体和表面; F _c 和 F _v 分别为对流通量和黏性通量;n为面法矢量。各项具体形式参见文献[ 16 ]。本文中对流通量采用Roe ^{[

17

]} 格式离散,控制面两侧重构变量采用Barth ^{[

18

]} 提出的分段线性重构获得,单元中心梯度采用最小二乘法计算,用Venkatakrishnan ^{[

19

]} 限制器抑制振荡,黏性通量采用中心格式离散,湍流方程与平均方程解耦求解,湍流模型为一方程SA模型 ^{[

20

]} 。对一个固定控制体 i ,采用向后差分,方程(1)的半离散形式可写为

式中:Δ为变量在时间步 n +1和时间步 n 的差; R 为右端项。式(2)右端残差项为式中: S _ij 为面积矢量( S _ij ·n ); ij 为单元 i 的第 j 个面,该面被单元 i 和其第 j 个相邻单元共享。用第 n 时间步残差线化式(3),可得式中: ∂ R /∂ W 为通量雅可比矩阵,其包含了无黏通量和黏性通量对守恒变量的导数。将式(4)代入式(2),整理可得式(5)左端方括号内称为系数矩阵,该项为一个不对称大型稀疏分块矩阵,存储量需求很大。在LU-SGS中,对该项做了若干近似处理,以减小存储和计算量。

由第2.1节可见,原始LU-SGS格式中存在2个近似处理。其一,忽略了 LD ^-1 U 项,用 (D+L)D ^-1 (D+U) 代替系数矩阵;其二,在计算系数矩阵时利用1阶通量函数构造雅可比矩阵,使得式(5)左端项同右端项不匹配。这些近似处理导致LU-SGS格式收敛效率不高。

2.2.1 改进的算法流程在本文方法中,不对系数矩阵近似处理。对于每个单元,将式(5)中的系数矩阵分解为对角矩阵D和非对角矩阵O之和,则式(5)变为

当达到这2个条件时,内迭代停止。由于抛弃了LU-SGS中的前后扫描模式,且需求解的式(14)仅对应于各个单元,由上述流程可见,求解过程同网格的顺序无关,因此对于本文方法,网格排序步骤可以省略。

2.2.2 通量雅可比矩阵计算原则上,构造通量雅可比矩阵时,应采用同空间格式相同精度的通量函数。由于本文使用2阶Roe格式计算通量,按上述原则,通量函数为

式中: A _roe 为Roe矩阵;下标L和R表示界面左和右。然而采用式(16)计算通量雅可比矩阵的计算量很大,再考虑到保证对角占优,本文提出用如下通量函数构造雅可比矩阵: 由式(20)可见,由于采用了重构的变量,与式(11)中对角阵相比, J(W _L )项被保留下来,增大了对角占优特性。相比式(16),采用式(17)计算通量雅可比矩阵的计算量和复杂性较小,在第3.1节中可以看到,采用式(17)中的通量函数对本文方法收敛性和稳定性都没有影响。

3 算例及讨论 3.1 NACA0012翼型跨声速无黏绕流本算例对比了本文方法和LU-SGS格式的收敛效率,LU-SGS格式采用排序后网格计算。来流条件为:马赫数为0.8,攻角为1.25°。计算网格见图 1 。将翼型沿展向拉伸为三维,共包含161个壁面节点,7168个六面体单元,第一层网格高度为翼型弦长的1×10 ^-2 倍。

图 1 NACA0012翼型计算网格 Fig. 1 Computational grid of NACA0012 airfoil