并行程序VS串行程序——优化实录

　　在多核处理器、超级计算机日益普及的今天，程序员们怎能对并行程序“袖手旁观”呢？

创新互联-专业网站定制、快速模板网站建设、高性价比镇平网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式镇平网站制作公司更省心,省钱,快速模板网站建设找我们，业务覆盖镇平地区。费用合理售后完善，十年实体公司更值得信赖。

　　为了练手，我用MPI写了一个并行排序程序，

　　先介绍下我的第一个版本，大概的思路是：

　　使用MPI在各个进程之间进行通信，

　　1. 进程0生成随机数，并且讲数据分段，将各段数据分配给其他进程

　　2. 其他进程收到数据段，使用冒泡排序进行，发送回进程0

　　3. 进程0收到这些数据，通过归并排序按顺序整合起来。

　　下面是这个版本代码，

 
 
 
  
  
  　　//MPI Hello World demo  
  
  
  　　#include   
  
  
  　　#include   
  
  
  　　#include   
  
  
  　　#include   
  
  
  　　#defineN 30  
  
  
  　　intmain(intargc, char** argv)  
  
  
  　　{  
  
  
  　intprocessRank, processNum, t, data, num;  
  
  
  　　intdataArr[N];  
  
  
  　　intdataArrB[N];  
  
  
  　　intpointer[100];  
  
  
  　　intsecEnd[100];  
  
  
  　　MPI_Status mpistat;  
  
  
  　　MPI_Init(&argc, &argv);  
  
  
  　　MPI_Comm_size(MPI_COMM_WORLD, &processNum);  
  
  
  　　MPI_Comm_rank(MPI_COMM_WORLD, &processRank);  
  
  
  　　printf("Yes, Sir! From process %i of %i ", processRank, processNum);  
  
  
  　　if(processRank == 0)  
  
  
  　　{  
  
  
  　　srand(time(NULL));  
  
  
  　　for(inti = 0;i 
  
  
  
　　dataArr[i] = rand()%1000;  
  
  
  　}  
  
  
  　　printf("Original Array: ");  
  
  
  　　for(inti = 0;i< N; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　puts("Distribute data to processes");  
  
  
  　　for(inti = 1;i 
  
  
  
　　num = (N/(processNum-1));  
  
  
  　if(i == processNum -1)  
  
  
  　　num = N - num * (processNum -2);  
  
  
  　　///distribute data to each process  
  
  
  　　printf("Sending to process %d... ", i);  
  
  
  　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　///gather the sorted data  
  
  
  　　printf("Receiving from process %d... ", i);  
  
  
  　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　///prepare for merge, set the pointers  
  
  
  　　pointer[i] = (N/(processNum-1)) * (i-1);  
  
  
  　　secEnd[i] = pointer[i] + N/(processNum-1);  
  
  
  　　if(i == processNum-1) secEnd[i] = N;  
  
  
  　　}  
  
  
  　　printf("Sorted Sections Array: ");  
  
  
  　　for(inti = 0;i< N; i++){  
  
  
  　　printf("%d ", dataArrB[i]);  
  
  
  　　}  
  
  
  　　puts("");  
  
  
  　　///merge the sorted sections  
  
  
  　　puts("Merging...");  
  
  
  　　for(inti = 0;i 
  
  
  
　　inttMin = 1;  
  
  
  　　intmin = 10000;  
  
  
  　　for(t = 1;t 
  
  
  
　　if(pointer[t] 
  
  
  
　　min = dataArrB[pointer[t]];  
  
  
  　　tMin = t;  
  
  
  　　}  
  
  
  　　}  
  
  
  　　dataArr[i] = dataArrB[pointer[tMin]];  
  
  
  　　pointer[tMin]++;  
  
  
  　　}  
  
  
  　　///output the results  
  
  
  　　printf("Final Sorted Array: ");  
  
  
  　　for(inti = 0;i< N; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　}  
  
  
  　　else 
  
  
  　　{  
  
  
  　　//receieve the section  
  
  
  　　MPI_Recv(&num, 1, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　MPI_Recv(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　printf("Received Original Array: ");  
  
  
  　　for(inti = 0;i< num; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　//sort this section  
  
  
  　　for(inti = 0;i 
  
  
  
　　for(intj = num-1;j>=i+1;j--)  
  
  
  　　if(dataArr[j] 
  
  
  
　　inttmp = dataArr[j];  
  
  
  　　dataArr[j]= dataArr[j-1];  
  
  
  　　dataArr[j-1] = tmp;  
  
  
  　　}  
  
  
  　　MPI_Send(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD);  
  
  
  　　///display  
  
  
  　　printf("My Sorted Section: ");  
  
  
  　　for(inti = 0;i< num; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　printf(" ");  
  
  
  　　}  
  
  
  　　MPI_Finalize();  
  
  
  　　return0;  
  
  
  　　}

　　自己写出之后当然高兴，不过程序经过高手检查之后，提出了一些问题。

　　最要命的是这个

 
 
 
  
  
  　　for(inti = 1;i 
  
  
  
　　num = (N/(processNum-1));  
  
  
  　　if(i == processNum -1)  
  
  
  　　num = N - num * (processNum -2);  
  
  
  　　///distribute data to each process  
  
  
  　　printf("Sending to process %d... ", i);  
  
  
  　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　///gather the sorted data  
  
  
  　　printf("Receiving from process %d... ", i);  
  
  
  　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　///prepare for merge, set the pointers  
  
  
  　　pointer[i] = (N/(processNum-1)) * (i-1);  
  
  
  　　secEnd[i] = pointer[i] + N/(processNum-1);  
  
  
  　　if(i == processNum-1) secEnd[i] = N;  
  
  
  　　}

　　这段程序彻底抹杀掉了我这个并行程序的光辉形象，因为这段煞有介事的并行程序，其实是一段串行程序。

　　屏幕前的高手应该看出来了吧，同一段程序的收发，都在同一段循环中。

　　也就意味着，不同段之间的收发是一个接着一个的。也就意味着，其他每个进程各自的排序也是一个接着一个进行的，并不会如我初衷并行排序。

　　想来，这段错误应该是并行程序小白们常犯的错误，所以我也很乐于把我做过的蠢事发出来给大家分享。前车之鉴，警钟长鸣lol

　　改正之后的这段程序是这样的，

 
 
 
  
  
  　　for(inti = 1;i 
  
  
  
　　num = (N/(processNum-1));  
  
  
  　　if(i == processNum -1)  
  
  
  　　num = N - num * (processNum -2);  
  
  
  　　///distribute data to each process  
  
  
  　　printf("Sending to process %d... ", i);  
  
  
  　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　}  
  
  
  　　for(inti = 1;i 
  
  
  
　　num = (N/(processNum-1));  
  
  
  　　if(i == processNum -1)  
  
  
  　　num = N - num * (processNum -2);  
  
  
  　　///gather the sorted data  
  
  
  　　printf("Receiving from process %d... ", i);  
  
  
  　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　///prepare for merge, set the pointers  
  
  
  　　pointer[i] = (N/(processNum-1)) * (i-1);  
  
  
  　　secEnd[i] = pointer[i] + N/(processNum-1);  
  
  
  　　if(i == processNum-1) secEnd[i] = N;  
  
  
  　　}

　　同时程序的效率还可以提升，比如说把其他进程排序的算法换成快排什么的。

　　最后奉上优化后的版本

 
 
 
  
  
  　　//MPI Hello World demo  
  
  
  　　#include   
  
  
  　　#include   
  
  
  　　#include  //'qsort' is in it.  
  
  
  　　#include   
  
  
  　　#include   
  
  
  　　#defineN 30  
  
  
  　　intQuickSortCompareFun(constvoid*p1, constvoid*p2)  
  
  
  　　{  
  
  
  　　return*((constint*)p1) - *((constint*)p2);  
  
  
  　　}  
  
  
  　　intmain(intargc, char** argv)  
  
  
  　　{  
  
  
  　　intprocessRank, processNum, t, data, num;  
  
  
  　　intdataArr[N];  
  
  
  　　intdataArrB[N];  
  
  
  　　intpointer[100];  
  
  
  　　intsecEnd[100];  
  
  
  　　MPI_Status mpistat;  
  
  
  　　MPI_Init(&argc, &argv);  
  
  
  　　MPI_Comm_size(MPI_COMM_WORLD, &processNum);  
  
  
  　　MPI_Comm_rank(MPI_COMM_WORLD, &processRank);  
  
  
  　　printf("Yes, Sir! From process %i of %i ", processRank, processNum);  
  
  
  　　if(processRank == 0)  
  
  
  　　{  
  
  
  　　srand(time(NULL));  
  
  
  　　for(inti = 0;i 
  
  
  
　　dataArr[i] = rand()%1000;  
  
  
  　　}  
  
  
  　　printf("Original Array: ");  
  
  
  　for(inti = 0;i< N; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　puts("Distribute data to processes");  
  
  
  　　for(inti = 1;i 
  
  
  
　　num = (N/(processNum-1));  
  
  
  　　if(i == processNum -1)  
  
  
  　　num = N - num * (processNum -2);  
  
  
  　　///distribute data to each process  
  
  
  　　printf("Sending to process %d... ", i);  
  
  
  　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
  
  
  　　}  
  
  
  　　for(inti = 1;i 
  
  
  
　　num = (N/(processNum-1));  
  
  
  　if(i == processNum -1)  
  
  
  　　num = N - num * (processNum -2);  
  
  
  　　///gather the sorted data  
  
  
  　　printf("Receiving from process %d... ", i);  
  
  
  　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　///prepare for merge, set the pointers  
  
  
  　　pointer[i] = (N/(processNum-1)) * (i-1);  
  
  
  　　secEnd[i] = pointer[i] + N/(processNum-1);  
  
  
  　　if(i == processNum-1) secEnd[i] = N;  
  
  
  　　}  
  
  
  　　printf("Sorted Sections Array: ");  
  
  
  　　for(inti = 0;i< N; i++){  
  
  
  　　printf("%d ", dataArrB[i]);  
  
  
  　　}  
  
  
  　　puts("");  
  
  
  　　///merge the sorted sections  
  
  
  　　puts("Merging...");  
  
  
  　　std::mapdata2rank;  
  
  
  　　for(t = 1;t 
  
  
  
　　if(pointer[t] 
  
  
  
　　data2rank.insert(std::make_pair(dataArrB[pointer[t]], t));  
  
  
  　　pointer[t]++;  
  
  
  　　}  
  
  
  　　}  
  
  
  　　for(inti = 0;i 
  
  
  
　　intdata = data2rank.begin()->first;  
  
  
  　　intrank = data2rank.begin()->second;  
  
  
  　　dataArr[i] = data;  
  
  
  　　data2rank.erase(data2rank.begin());  
  
  
  　　if(pointer[rank] 
  
  
  
　　{  
  
  
  　　data2rank.insert(std::make_pair(dataArrB[pointer[rank]], rank));  
  
  
  　　pointer[rank]++;  
  
  
  　　}  
  
  
  　　}  
  
  
  　　///output the results  
  
  
  　　printf("Final Sorted Array: ");  
  
  
  　　for(inti = 0;i< N; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　}  
  
  
  　　else 
  
  
  　　{  
  
  
  　　//receieve the section  
  
  
  　　MPI_Recv(&num, 1, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　MPI_Recv(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
  
  
  　　printf("Received Original Array: ");  
  
  
  　　for(inti = 0;i< num; i++){  
  
  
  　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　//sort this section  
  
  
  　　qsort(dataArr, num, sizeof(int), QuickSortCompareFun);  
  
  
  　　MPI_Send(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD);  
  
  
  　　///display  
  
  
  　　printf("My Sorted Section: ");  
  
  
  　　for(inti = 0;i< num; i++){  
  
  
  　　printf("%d ", dataArr[i]);  
  
  
  　　}  
  
  
  　　printf(" ");  
  
  
  　　}  
  
  
  　　MPI_Finalize();  
  
  
  　return0;

原文链接：http://www.cnblogs.com/rosting/archive/2011/11/16/2251892.html

【编辑推荐】

微软发布新版Windows 7及.NET 4软件开发工具包
详解.NET 4.0并行计算支持历史
详读.NET 4.0环境配置
详解.NET 4.0中异常处理方面的新特性
三方面诠释.NET 4.0的新特性

文章题目：并行程序VS串行程序——优化实录
网站路径：http://www.csdahua.cn/qtweb/news24/138874.html

网站建设、网络推广公司-快上网，是专注品牌与效果的网站制作，网络营销seo公司；服务项目有等

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：快上网

成都快上网为您推荐相关内容