中国科学院数学与系统科学研究院期刊网

数值计算与计算机应用 2016年 37卷

Please wait a minute...
选择: 显示/隐藏图片
1. 散乱数据渐近正定径向基函数插值
徐应祥
数值计算与计算机应用    2016, 37 (1): 1-10.   DOI: 10.12288/szjs.2016.1.1
摘要551)      PDF(pc) (2579KB)(325)    收藏
结合一元B样条和已有径向基函数的优点, 提出了一种渐近正定径向基函数, 并将其应用于散乱数据插值, 得到了一种新的插值方法.数值例子表明, 这种插值方法具有良好的效果.最后将这种插值与其他散乱数据插值方法做了一些对比, 讨论了其优缺点, 并提出了进一步的研究方向.
参考文献 | 相关文章 | 多维度评价
2. 几种特殊循环矩阵的PROCRUSTES问题
邓远北, 刘莹, 杨娟
数值计算与计算机应用    2016, 37 (1): 11-24.   DOI: 10.12288/szjs.2016.1.11
摘要690)      PDF(pc) (396KB)(379)    收藏
本文研究了在Hankel-循环矩阵和Hankel-反循环矩阵的约束下矩阵方程组AX=B,XC=D的最小二乘解问题. 结合最优化理论和循环矩阵的性质, 将其转化为简单的线性方程Qy=b的求解问题, 得到了通解的表达式. 进一步, 证得系数矩阵Q是一个与所求矩阵X相关联的循环矩阵, 从而找到了解唯一的充分必要条件并给出了解的表达式. 此外, 借助于矩阵的广义1-范数, 给出了有唯一解的判定条件. 最后, 给出了具体的算法和算例.
参考文献 | 相关文章 | 多维度评价
3. 时间域两网格全波形反演
张文生, 罗嘉
数值计算与计算机应用    2016, 37 (1): 25-40.   DOI: 10.12288/szjs.2016.1.25
摘要797)      PDF(pc) (2069KB)(337)    收藏
全波形反演同时利用波场的振幅、相位和走时信息来推测介质物性参数, 是一个极小化模拟数据与已知观测数据之间残量的优化迭代过程.由于正问题是关于模型参数的一个非线性算子及波形拟合中的周期跳跃现象, 全波形反演是一个典型的不适定性问题. 本文我们在前期频率多尺度反演工作的基础上, 提出了多重网格全波形反演方法, 文中详细描述了有限差分正演方法及两层网格全波形反演的策略, 并对复杂构造Marmousi模型, 基于MPI并行编程语言, 进行了大规模反演计算, 得到了较高精度的反演结果. 数值计算表明两网格全波形反演具有提高计算效率和加速收敛的优点.
参考文献 | 相关文章 | 多维度评价
被引次数: Baidu(1)
4. K-power系统在 Grassmann流形上的单侧模型降阶方法
杨平, 徐康丽, 蒋耀林
数值计算与计算机应用    2016, 37 (1): 41-56.   DOI: 10.12288/szjs.2016.1.41
摘要528)      PDF(pc) (825KB)(324)    收藏
K-power 系统作为一类比较特殊的双线性系统, 可以由一系列阶数相对较小的子系统构成, 这使得 K-power 系统具有特殊的结构.K-power 系统在 Grassmann 流形上的模型降阶方法将误差系统的H2范数看作是定义在 Grassmann 流形上的代价函数, 然后,沿测地线执行线性搜索寻找使得代价函数最小的变换矩阵. 为了保持系统降阶前后结构的一致性, 算法以 K-power 系统中各个子系统的变换矩阵为对角线元素构成双线性系统的变换矩阵. 此外, 算法有效地利用了 K-power 系统的结构特性,使得该算法在对 K-power 系统进行降阶时较一般的双线性系统的模型降阶方法有更少的计算量.
参考文献 | 相关文章 | 多维度评价
5. 非匹配网格上求解扩散方程的高精度结点值重构算法
常利娜, 袁光伟, 曾清红
数值计算与计算机应用    2016, 37 (1): 57-66.   DOI: 10.12288/szjs.2016.1.57
摘要517)      PDF(pc) (1044KB)(289)    收藏
构造了非匹配网格上求解多介质扩散问题的高精度格式. 格式中只包含单元中心未知量, 物理意义明确, 易于实施, 适用于模拟复杂 的实际工程问题. 格式的特点在于, 给出了由中心未知量重构结点未知量的显式表达式, 对非匹配网格上的内点和悬点, 这一 表达式具有统一的形式. 在非匹配随机网格上进行数值实验, 结果显示, 格式对强间断问题和非线性问题都具有二阶精度.
参考文献 | 相关文章 | 多维度评价
6. 一个基于PHG平台的并行有限元生物分子模拟解法器
许竞劼, 谢妍, 卢本卓
数值计算与计算机应用    2016, 37 (1): 67-82.   DOI: 10.12288/szjs.2016.1.67
摘要881)      PDF(pc) (1131KB)(619)    收藏
本文介绍一个面向生物分子模拟的并行有限元解法器, 该解法器基于三维并行自适应有限元软件平台PHG, 计算并模拟在生物溶液系统在静电场下的扩散过程. 该解法器的最新版本在已有算法的基础上, 添加了整体求解、含时求解等一些新算法, 规范并扩展了边界条件的选取, 并整合多项辅助功能,现提供对于~Poisson-Nernst-Planck (PNP) 方程的两个含时算法和四个稳态算法,以及对于~Smoluchowski-Poisson-Boltzmann (SPB) 方程的一个稳态算法. 解法器可模拟生物分子, 离子通道和纳米管等模型, 通过有限元方法计算静电场和离子浓度分布, 并计算电流强度、反应速率等物理量, 可研究离子通道的选择机理, 酶的催化反应过程及反应速率等问题. 相关软件、工具和进展见www.continuummodel.org.
参考文献 | 相关文章 | 多维度评价
被引次数: Baidu(2) CSCD(1)
7. 前言
刘铁钢, 蔚喜军, 李若
数值计算与计算机应用    2016, 37 (2): 83-84.   DOI: 10.12288/szjs.2016.2.83
摘要372)      PDF(pc) (103KB)(369)    收藏
相关文章 | 多维度评价
8. 混合网格DG方法及其在高超声速流动模拟中的应用
王利, 石磊, 周伟江
数值计算与计算机应用    2016, 37 (2): 85-94.   DOI: 10.12288/szjs.2016.2.85
摘要562)      PDF(pc) (3729KB)(343)    收藏
混合网格高精度DG方法在高超声速模拟中面临诸多困难,其中以稳定性问题尤为突出.本文在二维三角形、四边形网格上构建了直到4阶的高精度DG方法,用于模拟可压缩无粘流动.采用Cockburn等人提出的斜率限制器和基于密度的Krivodonova间断探测器技术解决高超声速流动计算中的激波捕捉问题.首先通过等熵涡算例和Lax激波管问题对方法进行了精度与激波捕捉效果的验证,然后将其应用到双压缩拐角9马赫高超声速流动模拟中.模拟结果显示,高阶DG方法准确捕捉了激波相互作用结构,与文献2阶有限体积方法相比,在很少的网格上获得了令人满意的壁面压力数据.本文研究还表明,基于密度的Krivodonova间断探测器在含膨胀波的高超声速流动计算中的应用可能有一定局限性.
参考文献 | 相关文章 | 多维度评价
9. 求解Cahn-Hilliard方程非线性项的两种数值格式对比
卿欢, 李晓, 纪光华, 张辉
数值计算与计算机应用    2016, 37 (2): 95-115.   DOI: 10.12288/szjs.2016.2.95
摘要960)      PDF(pc) (552KB)(399)    收藏
基于快速显式算子分裂方法,将Cahn-Hilliard方程与分子束外延(MBE)方程分裂为非线性与线性两个部分.对非线性部分,采用中心差分与半离散有限差分两种格式进行数值计算;线性部分通过拟谱方法进行精确求解.在两种格式下,通过对数值解的全局L误差估计,比较分析了两种格式的数值解差异以及运行效率.对于Cahn-Hilliard方程与MBE方程,两种格式的数值解一致;对Cahn-Hilliard方程的数值求解,中心差分格式的效率是半离散有限差分格式的3到6倍;在MBE方程的数值求解中,半离散有限差分格式的效率是中心差分格式的2倍.
参考文献 | 相关文章 | 多维度评价
10. 虚拟流体方法在动边界问题中的应用
许亮, 冯成亮, 刘铁钢
数值计算与计算机应用    2016, 37 (2): 116-124.   DOI: 10.12288/szjs.2016.2.116
摘要552)      PDF(pc) (2112KB)(335)    收藏
研究笛卡尔网格下求解动边界问题的虚拟流体方法.根据波系结构的不同形式推导虚拟流体状态的所有合理定义方式.并进一步推广两种简单有效的虚拟流体方法,不依赖于虚拟流体区域可能产生的波系结构.一维数值结果表明只要虚拟流体状态的定义符合推导条件,求解动边界条件下的可压缩无粘流问题理论上完全精确.二维算例表明虽然对虚拟流体状态的定义方式不同,但是获得的两种虚拟流体方法在实际应用中几乎具有完全相同的效果.
参考文献 | 相关文章 | 多维度评价
11. 两类相场方程的紧致指数时间差分法设计
吴响, 周纯葆, 张鉴, 陆忠华, 迟学斌
数值计算与计算机应用    2016, 37 (2): 125-139.   DOI: 10.12288/szjs.2016.2.125
摘要778)      PDF(pc) (2831KB)(381)    收藏
本文针对相场方程提出稳定的高阶紧致指数时间差分算法.该算法具有完全显式的特性,从而避免了求解线性或非线性方程组.算法使用精确指数时间差分和多步法近似以保证精确性;通过线性算子分裂控制刚性非线性项以增强稳定性;同时引入有限差分格式的紧致表示大大降低了指数时间差分法的存储需求和计算量.算法的精确性和高效性通过Cahn-Hilliard方程和Willmore问题相场模型的大规模三维模拟进行了验证.
参考文献 | 相关文章 | 多维度评价
12. 随机最优切换模型的建立与数值求解
张书华, 唐文广
数值计算与计算机应用    2016, 37 (2): 140-151.   DOI: 10.12288/szjs.2016.2.140
摘要424)      PDF(pc) (2286KB)(264)    收藏
利用动态规划原理,建立了由生产(经营)模式一向模式二切换的随机最优切换模型,得到了一个关于期权价值的偏微分方程互补问题,进而利用罚函数方法求解此问题而得到了一个非线性偏微分方程.在空间离散上采用拟合有限体积法求解此非线性偏微分方程,获得了最优切换模型的最优执行边界.最后进行了数值模拟,并讨论了参数关于最优执行边界的灵敏度.
参考文献 | 相关文章 | 多维度评价
13. 虚拟单元有限体积WENO5格式及其应用
刘旭, 朱君, 赵宁
数值计算与计算机应用    2016, 37 (2): 152-164.   DOI: 10.12288/szjs.2016.2.152
摘要693)      PDF(pc) (8751KB)(331)    收藏
本文在笛卡尔网格上给出一种五阶有限体积加权基本无振荡格式:首先在二十五个单元构成的空间大模板上构造五次不完全多项式;将此大模板划分为九个子模板,并在其上构造三次不完全多项式;计算线性权,光滑指示器和非线性权;利用三阶TVD Runge-Kutta时间离散方法得到时空一致高精度格式.虽然该格式具有较高数值精度但不能直接应用于具有复杂拓扑结构物体的可压缩绕流问题.为降低该格式对网格的要求,本文采用ST和GBCM两种浸入边界虚拟单元方法处理物面边界条件,将有限体积高精度格式同虚拟单元方法相结合,能有效降低格式构造和网格生成的复杂性.文中给出的多个经典复杂物体绕流问题的数值计算充分表明了本方法的可靠性和有效性.
参考文献 | 相关文章 | 多维度评价
14. 前言
刘新为, 彭拯, 徐凤敏
数值计算与计算机应用    2016, 37 (3): 165-166.   DOI: 10.12288/szjs.2016.3.165
摘要404)      PDF(pc) (308KB)(407)    收藏
相关文章 | 多维度评价
15. 求鞍点问题的新的原始-对偶算法
张纯, 蔡邢菊, 韩德仁
数值计算与计算机应用    2016, 37 (3): 167-178.   DOI: 10.12288/szjs.2016.3.167
摘要874)      PDF(pc) (3769KB)(424)    收藏
本文考虑求解鞍点问题的原始-对偶算法.通过对算法中的子问题加以修正,得到一类新的原始-对偶算法.在适当的假设条件下,证明了算法的收敛性.同时,将算法应用到一些图像处理问题,并与其它的原始-对偶类算法进行数值比较.结果表明,新的算法更加有效.
参考文献 | 相关文章 | 多维度评价
16. 联合稀疏独立法则及其在疾病分类中的应用
王丽平, 吴亚飞
数值计算与计算机应用    2016, 37 (3): 179-185.   DOI: 10.12288/szjs.2016.3.179
摘要569)      PDF(pc) (556KB)(287)    收藏
通过有效的特征选择进行疾病分类是当前生物信息学研究的常见问题,从高维基因数据中消除噪声、筛选出存在于低维子空间的特征基因,对预测、诊断和治疗疾病至关重要.基于新兴的联合稀疏优化算法与经典的独立法则,本文提出了联合稀疏独立分类方法.在特征选择时考虑了数据的整体稀疏结构及集体特征之间的关系,弥补了基因表达分析数据小样本信息不足的缺点.而利用独立法则进行疾病分类不仅方式简单、易于实现,并且有效阻断了噪声的相互干扰,具有较好的稳定性.在三个基因表达分析数据集上的疾病分类实验结果表明,新的分类方法具有良好的分类正确率和运行速度.
参考文献 | 相关文章 | 多维度评价
17. —种修正的Cauchy-Barzilai-Borwein算法
庄杰鹏, 彭拯
数值计算与计算机应用    2016, 37 (3): 186-198.   DOI: 10.12288/szjs.2016.3.186
摘要883)      PDF(pc) (637KB)(404)    收藏
高效率求解无约束二次凸优化问题是优化算法设计的重要任务.针对这类问题,本文提出了一种修正的Cauchy-Barzilai-Borwein算法,简称为MCBB算法.文章证明了MCBB算法对于无约束二次严格凸优化问题具有全局收敛和Q-线性收敛速率.初步的数值对比实验表明,对于坏条件问题,MCBB算法比CBB与BB算法更为有效.
参考文献 | 相关文章 | 多维度评价
18. 增强型指数的稀疏鲁棒优化模型及其实证分析
赵志华, 徐凤敏, 袁晓玲
数值计算与计算机应用    2016, 37 (3): 199-210.   DOI: 10.12288/szjs.2016.3.199
摘要479)      PDF(pc) (908KB)(353)    收藏
本文针对增强型指数基金管理问题,建立稀疏鲁棒优化模型并进行实证分析.首先引入收益率的扰动集合,建立稀疏鲁棒超越指数模型,并精确给出其SOCP形式的鲁棒对等式;然后利用混合遗传算法求解,其子问题利用CVX软件包进行求解;最后利用OR-Libmry中5个市场指数历史数据在未来市场收益相对波动的状态下进行实证检验.结果表明稀疏鲁棒超越指数模型在保证样本外超额收益的同时,显著降低了追踪的波动风险,从而表明其具有较高的理论和应用价值.
参考文献 | 相关文章 | 多维度评价
19. 外推系数带参数的加速邻近梯度算法
刘紫娟, 李慧云, 刘新为
数值计算与计算机应用    2016, 37 (3): 211-222.   DOI: 10.12288/szjs.2016.3.211
摘要790)      PDF(pc) (864KB)(347)    收藏
加速邻近梯度算法(APG)是求解极小化光滑与非光滑凸函数和问题的一种非常有效的一阶方法.注意到外推系数选取的好坏与算法的数值表现息息相关.本文考虑了算法中外推系数的更一般形式,提出了一类外推系数带参数的加速邻近梯度算法,证明了该算法在一定的条件下具有和快速迭代收缩阈值算法(FISTA)相同的全局收敛速率.数值试验表明,适当地选取外推系数的参数会使新算法产生的误差值小于FISTA产生的误差值,从而得到更清晰的图像.数值试验同时给出了外推系数中参数的变化对图像去模糊的影响.
参考文献 | 相关文章 | 多维度评价
被引次数: Baidu(5)
20. 求解正则化最小二乘问题的一个非精确交替方向乘子法
乐航睿, 杨庆之
数值计算与计算机应用    2016, 37 (3): 223-232.   DOI: 10.12288/szjs.2016.3.223
摘要973)      PDF(pc) (597KB)(416)    收藏
正则化最小二乘问题广泛出现在图像处理、统计学等领域中,交替方向乘子法(ADMM)是求解这个问题的一种有效方法.ADMM在每一步迭代过程中,都需要求解两个子问题,子问题能否有效地求解对整个算法的有效性有重要影响.在有些情形,精确求解子问题是不可能的,或者是需要花费很大代价的.由于这个原因,非精确地求解子问题的一类算法得到了发展.而己有的非精确类ADMM算法,在迭代过程中需要不断提高子问题解的精度,从而子问题迭代步数也越来越多,这就影响了整个算法的效率.这篇文章提出了一个不精确ADMM算法,该算法的特点是在迭代过程中,子问题的迭代步数是确定的,这克服了之前算法的不足.文章中的数值例子也说明了提出的算法是有效的.
参考文献 | 相关文章 | 多维度评价
21. 运输机群装载优化的整数规划模型
李高西, 陈伟坤, 万仲平, 戴或虹
数值计算与计算机应用    2016, 37 (3): 233-244.   DOI: 10.12288/szjs.2016.3.233
摘要875)      PDF(pc) (785KB)(326)    收藏
运输机群装载优化是大量货物运输过程中亟待解决的问题.本文基于整数规划建立了以飞机架次最少、装载效率最高为优化目标,且满足重心包线、舱段承载能力等约束的整数规划模型,并通过一系列线性化技巧将其线性化.数值实验表明该模型能生成最佳运输方案,对提高航空运输的效率有一定的指导意义.
参考文献 | 相关文章 | 多维度评价
22. 多介质黎曼问题精确解解算器软件包MultiRP开发
高斯, 刘铁钢
数值计算与计算机应用    2016, 37 (4): 245-256.   DOI: 10.12288/szjs.2016.4.245
摘要1315)      PDF(pc) (900KB)(566)    收藏
黎曼问题是双曲守恒律方程(组)的一类特殊的初值问题,研究黎曼问题精确解在计算流体力学等领域中具有重要应用,其结果可以用来构造Godunov型格式的数值通量,也可以用来对数值格式的准确性进行验证.多介质黎曼问题则作为单介质黎曼问题的推广,能够描述带有不同状态方程或本构关系的黎曼问题.本文在实现多介质黎曼问题精确解理论推导的基础上,完成软件包MultiRP及相应的MFC界面应用程序的开发.MultiRP软件包目前包括可以求解理想气体、爆炸气体、液体、理想弹塑性固体之间相互作用的多介质黎曼问题C++程序.该软件包具有可以求解多介质黎曼问题及弹塑性固体黎曼问题等特性.
参考文献 | 相关文章 | 多维度评价
被引次数: CSCD(2)
23. 一种有效的格子Boltzmann方法格点判断法
蔡力, 袁涛, 徐文静
数值计算与计算机应用    2016, 37 (4): 257-264.   DOI: 10.12288/szjs.2016.4.257
摘要1036)      PDF(pc) (1410KB)(464)    收藏
绕流问题中若物体边界不规则会给格子Boltzmann方法中离散边界的格点类型判断以及后续边界处理带来一定的困难.本文提出了简单的三角形不包含算法来有效判断不规则离散边界点的格点类型.针对离散边界,通过改进虚拟平衡态分布函数插值法中的虚拟速度,提高了格子Boltzmann方法在边界处的数值稳定性和精度.通过对经典的二维圆柱,方柱和椭圆柱绕流问题的数值模拟,验证了本文方法的有效性.
参考文献 | 相关文章 | 多维度评价
24. 基于FLUENT的新型跨介质航行器气动水动特性研究
廖保全, 冯金富, 齐铎, 李永利, 胡俊华
数值计算与计算机应用    2016, 37 (4): 265-272.   DOI: 10.12288/szjs.2016.4.265
摘要814)      PDF(pc) (1118KB)(588)    收藏
针对目前水下航行器和空中航行器难以以单一外形同时满足水空两种航行环境的特点,提出一种通过改变机体外形实现水空介质跨越的新型航行器.应用FLUENT对航行器的气动水动特性进行数值仿真,得到了航行器水中、空中航行的阻力、升力曲线.对结果的分析发现,通过改变外形能够满足航行器水中、空中的航行和机动要求,新型航行器的流体受弹体扰动较大,升阻特性有一定减弱,水空跨介质航行器的外形还有较大的优化空间.
参考文献 | 相关文章 | 多维度评价
被引次数: CSCD(2)
25. 数字图像修复的变分方法与实现过程
邱俊, 胡晓, 王汉权
数值计算与计算机应用    2016, 37 (4): 273-286.   DOI: 10.12288/szjs.2016.4.273
摘要1183)      PDF(pc) (1707KB)(569)    收藏
图像修复是数字图像处理过程的一个很重要的方面.图像修复目的是将图像中污损或破损的部分运用相关的方法将其恢复.本文主要讨论数字图像恢复的变分方法及其实现过程,重点讨论变分方法之中的偏微分方程模型建立的基本过程和求解方法.图像恢复的变分方法的核心思想是将恢复过程归结为求解一个含约束条件的泛函极小值问题.为得到此泛函极小值问题的解,先根据拉格朗日乘子法,将含约束条件的泛函极小值问题化为无约束的泛函极小值问题.由于无约束的泛函极小值问题的解满足一偏微分方程,于是可构造一梯度流并通过它找出该偏微分方程的解.最终用偏微分方程数值方法-有限差分法来离散得到此梯度流的稳态解的近似,并将此近似解作为图像修复之后的结果表示.
参考文献 | 相关文章 | 多维度评价
26. CAS-ESM编译运行脚本文件系统设计与实现
王天一, 姜金荣, 张贺, 何卷雄, 迟学斌
数值计算与计算机应用    2016, 37 (4): 287-298.   DOI: 10.12288/szjs.2016.4.287
摘要1016)      PDF(pc) (674KB)(516)    收藏
CAS-ESM是中国科学院大气物理所开发的地球系统模式,是全球气候变化研究的重要工具.CAS-ESM是一个非常复杂的系统,有众多的分量模式及其开发者,应用各不相同,因此,有必要开发一套便捷的编译运行脚本文件系统,以利于模式的版本统一以及应用组装、编译和运行.该文在简要介绍了中科院地球系统模式CAS-ESM的基础上,针对CAS-ESM应用特点和用户使用特点,设计开发了其编译运行脚本文件系统;通过大量运行实验,发现全耦合模式存在的问题并进行改进;最后设计了耦合模式数值实验,验证编译运行脚本文件系统的正确性,得到运行结果.
参考文献 | 相关文章 | 多维度评价
27. 基于Padé迭代法的数值保角变换计算法
王樱子, 赖富明, 吕毅斌, 武德安
数值计算与计算机应用    2016, 37 (4): 299-306.   DOI: 10.12288/szjs.2016.4.299
摘要752)      PDF(pc) (651KB)(432)    收藏
本文对基于模拟电荷法的双连通区域数值保角变换进行了研究.通过对其约束方程进行预处理,构造了一个对称正定线性方程组.进而,利用Padé迭代法求解对称正定线性方程组得到新的电荷点和变换半径,构造了近似保角变换函数.数值算例验证了算法的可行性.
参考文献 | 相关文章 | 多维度评价
28. 一种新的自适应步长梯度投影法
申远, 刘珊珊
数值计算与计算机应用    2016, 37 (4): 307-314.   DOI: 10.12288/szjs.2016.4.307
摘要1151)      PDF(pc) (341KB)(606)    收藏
梯度投影法是一种求解约束优化问题的经典算法.它具有单步计算量低等优点,但其效率受步长规则影响较大.本文提出的一种新的自适应步长规则的梯度投影法.该算法一方面,它无需函数值信息;另一方面,它的步长接受规则比Armijo规则更为宽松,因而可以接受较长的步长以加速收敛.初步的数值实验表面新算法较为高效.
参考文献 | 相关文章 | 多维度评价
29. 一种针对GPU上的油藏数值模拟的高效SpMV
李政, 冯春生, 张晨松
数值计算与计算机应用    2016, 37 (4): 315-324.   DOI: 10.12288/szjs.2016.4.315
摘要1009)      PDF(pc) (1187KB)(485)    收藏
油藏数值模拟和很多其他科学计算问题一样需要求解大型稀疏线性代数方程组.在求解稀疏线性代数方程组的迭代法中,稀疏矩阵向量乘法(SpMV)是影响计算效率的核心函数之一.随着计算机硬件架构异构化,科学计算从单核、多核CPU计算架构逐渐发展到多核CPU+众核加速卡(GPU卡或MIC等)的计算架构.SpMV的实现效率与稀疏矩阵的存储格式及硬件架构关系密切.本文针对油藏模拟中常见的Jacobian矩阵的稀疏模式,利用GPU核心的合并访问和并发计算等特点,结合油藏模拟线性解法器的算法要求,设计了一种BHYB矩阵存储格式及其对应的线程组并行策略.数值实验测得基于该存储格式的SpMV相对串行BCSR格式的SpMV的加速比可达19倍,比cuSPARSE库中效率最高的HYB格式的SpMV快30%到80%.此外,本文所提出的BHYB存储格式对块状矩阵在GPU上的存储以及线程组并行策略对其它GPU并行程序中内核函数的设计和优化能起到一定的借鉴作用.
参考文献 | 相关文章 | 多维度评价
被引次数: Baidu(1) CSCD(1)