您的位置：首页 > 其它

MPI并行计算学习笔记4——奇偶排序的优雅实现

2020-06-09 05:05 281 查看

1.运行环境VS2017 + MPI

2.算法背景与原理，可见博客：https://www.geek-share.com/detail/2702794820.html

值得一提的是，奇偶排序算法设计的初衷便是并行计算，只是更加贴合OpenMP这种共享内存式的编程框架，以后会和大家分享。

3.MPI模式下的奇偶排序算法，有更大的灵活性（个人观点：用到了奇偶排序的思想，并不是完全意义上的串行改并行）。

排序算法示意图：

注1：存在严格的定理可证明，如果有n个数进行奇偶排序，至多进行n次排序，数据则有序；对于MPI并行算法，类比可得，如果有n个进程进行奇偶排序，则同样至多进行n次排序（一次排序指的是一次奇排序加一次偶排序）。

注2：事实上，可设置标志位，若一次排序中，没有发生数据交换，则可以跳出循环，不用执行n步，本文的程序实现正是这种思路。

注3：上述局部排序阶段中，本文仍旧使用了奇偶排序，事实上可选择任何一种排序方法，如快速排序等。

4.程序代码如下

[code]#include<iostream>
#include"mpi.h"
#include<ctime>
#include<cmath>

using namespace std;

int myid, numprocs;//进程标识，进程总数
int part;//每个核心需排序元素个数
double start, finish;//计算时间
const int N = 9900;//待排元素个数
const int INF = 0X7FFFFFFF;//设置一个无穷大值

void odd_even_sort(float *p,int num);//顺序执行的奇偶排序
void swap(float *p, int i, int j);//交换算法
void mergeSort(float *data, float *buffer, float *tmp, bool &sort);//两块排好序的元素进行排序合并
void parallelMergeSort(float *data);//奇偶排序式的 融合排序算法

int main(int argc, char *argv[])
{
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &myid);
MPI_Comm_size(MPI_COMM_WORLD, &numprocs);
int masterNode = 0;
float *memoryPool = nullptr;

if (myid == masterNode)
{

int padding = numprocs - N % numprocs;//若不能整除则需加上padding个无穷大的元素使能够整除

memoryPool = new float[N + padding] {0};
srand(time(NULL));
for (int i = 0; i < N; ++i)
memoryPool[i] = (rand() % 1000)/10.0;

start = MPI_Wtime();//串行开始计时
/*for (int i = 0; i < N; ++i)
cout << memoryPool[i] << endl;*/
if (numprocs == 1)
{
odd_even_sort(memoryPool, N);
finish = MPI_Wtime();//串行停止计时
cout <<"串行时间"<< finish - start << endl;
MPI_Finalize();
return 0;
}
for (int i = 0; i < padding; ++i)
memoryPool[N + i] = INF;
part = (N + padding) / numprocs;

}
start = MPI_Wtime();//并行开始计时
MPI_Bcast(&part, 1, MPI_INT, masterNode, MPI_COMM_WORLD);

float *data = new float[part] {0};

//主进程向各进程播撒数据
MPI_Scatter(memoryPool, part, MPI_FLOAT, data, part, MPI_FLOAT, masterNode, MPI_COMM_WORLD);

//保证部分有序
odd_even_sort(data, part);

parallelMergeSort(data);

//将全局有序的数据收集到主进程
MPI_Gather(data, part, MPI_FLOAT, memoryPool, part, MPI_FLOAT, masterNode, MPI_COMM_WORLD);

//输出排序后结果
/*if (myid == masterNode)
{

for (int i = 0; i < N; ++i)
cout << memoryPool[i] << endl;
}*/
finish = MPI_Wtime();//并行停止计算

if (memoryPool)delete[]memoryPool;

if(myid == masterNode)
cout << "调用进程数：" << numprocs << " 计算时间：" << finish - start << endl;
delete[]data;
MPI_Finalize();
return 0;
}

void odd_even_sort(float *p,int num)
{
bool sort = false;
while (!sort)//若一次奇数排序，一次偶数排序，均未发生数据交换，则认为已排好序
{
sort = true;
for (int i = 1; i < num; i+=2)
{
if (p[i] < p[i - 1])//此处不能写等号
{
swap(p, i, i - 1);
sort = false;
}
}
for (int i = 2; i < num; i += 2)
{
if (p[i] < p[i - 1])
{
swap(p, i, i - 1);
sort = false;
}
}
}
}
inline void swap(float *p, int i, int j)
{
float tmp = p[i];
p[i] = p[j];
p[j] = tmp;
}
void mergeSort(float *data, float *buffer,float *tmp, bool &sort)
{
int i = 0, j = 0, k = 0;
while (i != part && j != part)
{
if (data[i] <= buffer[j]) { tmp[k++] = data[i++]; }//此处等号一定要加
else { tmp[k++] = buffer[j++]; }
}
if (j != 0)sort = false;
if (i != part) { while (k != 2 * part)tmp[k++] = data[i++]; }
if (j != part) { while (k != 2 * part)tmp[k++] = buffer[j++]; }
memcpy(data, tmp, sizeof(float)*part);
memcpy(buffer, tmp + part, sizeof(float)*part);

}

void parallelMergeSort(float *data)
{
MPI_Status status;
int left = myid - 1, right = myid + 1;
if (left < 0)left = MPI_PROC_NULL;//虚拟进程，使所有进程都有左右，边界上无序特殊处理
if (right > numprocs - 1)right = MPI_PROC_NULL;

float *buffer = new float[part] { 0 };
float *tmp = new float[2 * part]{ 0 };
bool sort = false;
bool flag = false;

while (!flag)
{
sort = true;
if (myid % 2 == 0)
{
MPI_Send(data, part, MPI_FLOAT, left, 0, MPI_COMM_WORLD);
MPI_Recv(data, part, MPI_FLOAT, left, 0, MPI_COMM_WORLD,&status);
}
else if(right != MPI_PROC_NULL)//如果接受的是虚拟进程的消息（空），那就不应该进行mergeSort
{
MPI_Recv(buffer, part, MPI_FLOAT, right, 0, MPI_COMM_WORLD, &status);
mergeSort(data, buffer, tmp, sort);
MPI_Send(buffer, part, MPI_FLOAT, right, 0, MPI_COMM_WORLD);
}

MPI_Barrier(MPI_COMM_WORLD);//屏障函数，显式将奇排序和偶排序分开，不加也可以

if (myid % 2 == 1)
{
MPI_Send(data, part, MPI_FLOAT, left, 0, MPI_COMM_WORLD);
MPI_Recv(data, part, MPI_FLOAT, left, 0, MPI_COMM_WORLD, &status);
}
else if (right != MPI_PROC_NULL)
{
MPI_Recv(buffer, part, MPI_FLOAT, right, 0, MPI_COMM_WORLD, &status);
mergeSort(data, buffer, tmp, sort);
MPI_Send(buffer, part, MPI_FLOAT, right, 0, MPI_COMM_WORLD);
}

//全规约函数，对每个进程中的sort标识求逻辑与，结果保存在flag中，flag=1 意味着每个进程的sort都为1，排序完成
MPI_Allreduce(&sort, &flag, 1, MPI_C_BOOL, MPI_LAND, MPI_COMM_WORLD);

}

delete[]tmp;
delete[]buffer;
}

5.运行结果

结果说明：1.此处Amdahl定律是失效的，计算量并不等价

2.程序计时时，应把输出语句注释掉，一方面输出本身比较耗时；另一方面多进程抢占输出设备资源，互相等待；

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航