3 第一步:打开并行池的方式:
1)p = parpool('local',2); % 在知道有几个本地核的情况下,选择调用几个核进行并行运算。
2)parpool; % 这是直接打开并行池的方式。
备注:建议采用第一种,方便关闭和更改参数。
第二步:parfor函数的问题
:
1)很多简单的低纬度运算,建议只需要用普通函数和关键字即可,用parfor函数进行运算并不能提升性能。
2)MATLAB利用多核心的计算能力来加速计算时非常有必要的,因为目前所有的电脑最少都双核心了。
3)循环并行使用parfor循环代替for循环,但是很多时候parfor很不好用,当parfor循环体内的代码比较多时,非常不容易满足循环条件而失败。因此我们首先要分析代码,另一种方式用profiler打开代码分析器来分析代码那一部分耗时较大,进行代码分析。
3)
通用格式
:
parfor ss = 1:100
......
......
4)
通用并行计算模板
:其基本思路就是将循环体内代码打包为函数!
parfor ss=1:100
func(ss,...,...);
end
函数如下所示:
function func(ss,...,...)
xxx
.....
.....
end
备注:该函数不应该有返回值,当parfor循环体内计算结果需要返回主函数时(绝大多数情况是这样的),那么将结果在循环体内保存为文件,文件名与循环变量ss有关。当parfor的并行运行完之后,将保存的临时文件读取进来即可,保存和读取计算结果相比于大型的计算耗时来讲应该小很多,从而体现出并行的优势。所提供的该方法可以用于任何一维、二维或者多维循环的加速计算,采用这种方法,规避了学习parofr规则的所有难点,非常具有通用性。
第三步:删除并行池参数关闭
delete(p)
举个例子
:比如有这么一段并行计算代码,其中绿色标注的位置为循环体。
p = parpool('local',2);
tic
n = 200;
A = 500;
a = zeros(n);
parfor i = 1:n
a(i) = max(abs(eig(rand(A))));
toc
delete(p)
当然这个循环体内可以有不同的计算队列,我们把这个队列封装成为一个函数,如下:
function [a] = sample(A)
a = max(abs(eig(rand(A))));
然后再用parpool调用,如下:
p = parpool('local',2);
clear;
n = 200;
A = 500;
a = zeros(n);
parfor i = 1:n
b = sample(A);
a(i) = b;
clear b;
delete(p);
时间已过 28.838599 秒。
对比原先的代码:
n = 200;
A = 500;
a = zeros(n);
for i = 1:n
a(i) = max(abs(eig(rand(A))));
时间已过 42.570194 秒。
4 MATLAB并行计算的提升有限和MATLAB语言的效率有关,并且和处理的数据量和计算复杂度有关。
本博客所有文章仅用于学习、研究和交流目的,欢迎非商业性质转载。