Strassen矩阵乘法
2015-09-05 22:19
302 查看
转载自Strassen矩阵乘法
==================================================================================================================================
Strassen矩阵乘法是通过递归实现的,它将一般情况下二阶矩阵乘法(可扩展到n阶,但Strassen矩阵乘法要求n是2的幂)所需的8次乘法降低为7次,将计算时间从O(nE3)降低为O(nE2.81)。
矩阵C = AB,可写为
C11 = A11B11 + A12B21
C12 = A11B12 + A12B22
C21 = A21B11 + A22B21
C22 = A21B12 + A22B22
如果A、B、C都是二阶矩阵,则共需要8次乘法和4次加法。如果阶大于2,可以将矩阵分块进行计算。耗费的时间是O(nE3)。
要改进算法计算时间的复杂度,必须减少乘法运算次数。按分治法的思想,Strassen提出一种新的方法,用7次乘法完成2阶矩阵的乘法,算法如下:
M1 = A11(B12 - B12)
M2 = (A11 + A12)B22
M3 = (A21 + A22)B11
M4 = A22(B21 - B11)
M5 = (A11 + A22)(B11 + B22)
M6 = (A12 - A22)(B21 + B22)
M7 = (A11 - A21)(B11 + B12)
完成了7次乘法,再做如下加法:
C11 = M5 + M4 - M2 + M6
C12 = M1 + M2
C21 = M3 + M4
C22 = M5 + M1 - M3 - M7
全部计算使用了7次乘法和18次加减法,计算时间降低到O(nE2.81)。计算复杂性得到较大改进。
附Strassen矩阵乘法代码:
==================================================================================================================================
Strassen矩阵乘法是通过递归实现的,它将一般情况下二阶矩阵乘法(可扩展到n阶,但Strassen矩阵乘法要求n是2的幂)所需的8次乘法降低为7次,将计算时间从O(nE3)降低为O(nE2.81)。
矩阵C = AB,可写为
C11 = A11B11 + A12B21
C12 = A11B12 + A12B22
C21 = A21B11 + A22B21
C22 = A21B12 + A22B22
如果A、B、C都是二阶矩阵,则共需要8次乘法和4次加法。如果阶大于2,可以将矩阵分块进行计算。耗费的时间是O(nE3)。
要改进算法计算时间的复杂度,必须减少乘法运算次数。按分治法的思想,Strassen提出一种新的方法,用7次乘法完成2阶矩阵的乘法,算法如下:
M1 = A11(B12 - B12)
M2 = (A11 + A12)B22
M3 = (A21 + A22)B11
M4 = A22(B21 - B11)
M5 = (A11 + A22)(B11 + B22)
M6 = (A12 - A22)(B21 + B22)
M7 = (A11 - A21)(B11 + B12)
完成了7次乘法,再做如下加法:
C11 = M5 + M4 - M2 + M6
C12 = M1 + M2
C21 = M3 + M4
C22 = M5 + M1 - M3 - M7
全部计算使用了7次乘法和18次加减法,计算时间降低到O(nE2.81)。计算复杂性得到较大改进。
附Strassen矩阵乘法代码:
//STRASSEN矩阵乘法算法 #include <iostream.h> const int N=4; //常量N用来定义矩阵的大小 void main() { void STRASSEN(int n,float A[] ,float B[] ,float C[] ); void input(int n,float p[] ); void output(int n,float C[] ); //函数声明部分 float A ,B ,C ; //定义三个矩阵A,B,C cout<<"现在录入矩阵A :"<<endl<<endl; input(N,A); cout<<endl<<"现在录入矩阵B :"<<endl<<endl; input(N,B); //录入数组 STRASSEN(N,A,B,C); //调用STRASSEN函数计算 output(N,C); //输出计算结果 } void input(int n,float p[] ) //矩阵输入函数 { int i,j; for(i=0;i<n;i++) { cout<<"请输入第"<<i+1<<"行"<<endl; for(j=0;j<n;j++) cin>>p[i][j]; } } void output(int n,float C[] ) //据矩阵输出函数 { int i,j; cout<<"输出矩阵:"<<endl; for(i=0;i<n;i++) { cout<<endl; for(j=0;j<n;j++) cout<<C[i][j]<<" "; } cout<<endl<<endl; } void MATRIX_MULTIPLY(float A[] ,float B[] ,float C[] ) //按通常的矩阵乘法计算C=AB的子算法(仅做2阶) { int i,j,t; for(i=0;i<2;i++) //计算A*B-->C for(j=0;j<2;j++) { C[i][j]=0; //计算完一个C[i][j],C[i][j]应重新赋值为零 for(t=0;t<2;t++) C[i][j]=C[i][j]+A[i][t]*B[t][j]; } } void MATRIX_ADD(int n,float X[] ,float Y[] ,float Z[] ) //矩阵加法函数X+Y—>Z { int i,j; for(i=0;i<n;i++) for(j=0;j<n;j++) Z[i][j]=X[i][j]+Y[i][j]; } void MATRIX_SUB(int n,float X[] ,float Y[] ,float Z[] ) //矩阵减法函数X-Y—>Z { int i,j; for(i=0;i<n;i++) for(j=0;j<n;j++) Z[i][j]=X[i][j]-Y[i][j]; } void STRASSEN(int n,float A[] ,float B[] ,float C[] ) //STRASSEN函数(递归) { float A11 ,A12 ,A21 ,A22 ; float B11 ,B12 ,B21 ,B22 ; float C11 ,C12 ,C21 ,C22 ; float M1 ,M2 ,M3 ,M4 ,M5 ,M6 ,M7 ; float AA ,BB ,MM1 ,MM2 ; int i,j;//,x; if (n==2) MATRIX_MULTIPLY(A,B,C);//按通常的矩阵乘法计算C=AB的子算法(仅做2阶) else { for(i=0;i<n/2;i++) for(j=0;j<n/2;j++) { A11[i][j]=A[i][j]; A12[i][j]=A[i][j+n/2]; A21[i][j]=A[i+n/2][j]; A22[i][j]=A[i+n/2][j+n/2]; B11[i][j]=B[i][j]; B12[i][j]=B[i][j+n/2]; B21[i][j]=B[i+n/2][j]; B22[i][j]=B[i+n/2][j+n/2]; } //将矩阵A和B式分为四块 MATRIX_SUB(n/2,B12,B22,BB); STRASSEN(n/2,A11,BB,M1);//M1=A11(B12-B22) MATRIX_ADD(n/2,A11,A12,AA); STRASSEN(n/2,AA,B22,M2);//M2=(A11+A12)B22 MATRIX_ADD(n/2,A21,A22,AA); STRASSEN(n/2,AA,B11,M3);//M3=(A21+A22)B11 MATRIX_SUB(n/2,B21,B11,BB); STRASSEN(n/2,A22,BB,M4);//M4=A22(B21-B11) MATRIX_ADD(n/2,A11,A22,AA); MATRIX_ADD(n/2,B11,B22,BB); STRASSEN(n/2,AA,BB,M5);//M5=(A11+A22)(B11+B22) MATRIX_SUB(n/2,A12,A22,AA); MATRIX_SUB(n/2,B21,B22,BB); STRASSEN(n/2,AA,BB,M6);//M6=(A12-A22)(B21+B22) MATRIX_SUB(n/2,A11,A21,AA); MATRIX_SUB(n/2,B11,B12,BB); STRASSEN(n/2,AA,BB,M7);//M7=(A11-A21)(B11+B12) //计算M1,M2,M3,M4,M5,M6,M7(递归部分) MATRIX_ADD(N/2,M5,M4,MM1); MATRIX_SUB(N/2,M2,M6,MM2); MATRIX_SUB(N/2,MM1,MM2,C11);//C11=M5+M4-M2+M6 MATRIX_ADD(N/2,M1,M2,C12);//C12=M1+M2 MATRIX_ADD(N/2,M3,M4,C21);//C21=M3+M4 MATRIX_ADD(N/2,M5,M1,MM1); MATRIX_ADD(N/2,M3,M7,MM2); MATRIX_SUB(N/2,MM1,MM2,C22);//C22=M5+M1-M3-M7 for(i=0;i<n/2;i++) for(j=0;j<n/2;j++) { C[i][j]=C11[i][j]; C[i][j+n/2]=C12[i][j]; C[i+n/2][j]=C21[i][j]; C[i+n/2][j+n/2]=C22[i][j]; } //计算结果送回C } }
相关文章推荐
- 对数据库一些基本知识的认识
- myeclipse 破解 生成注册码的代码
- Canvas制作排序算法演示动画
- maven本地仓库.m2文件夹路径讲解
- 关于C++中父类指针引用对象在内存中的分布
- 修改Android签名证书keystore作为eclipse默认debug签名证书
- UIPanGestureRecognizer使用小结
- Android回调机制(java)
- Java学习路线图
- IOS 类方法与实例方法的区别
- Adding Users to Passwordfile / Using Passwordfile Authentication (Doc ID 184696.1)
- 翻转吧!方块
- 划分数
- usaco The Tamworth Two
- c语言学习第二天
- IOS 常用快捷键----蓝懿教育
- 解决为什么每次打开Eclipse新的workspace需要更新nexus-maven-repository-index问题
- Windows查看进程taskList,终止进程tskill
- 1022. Digital Library (30)
- 【CCF】节日