您的位置:首页 > 其它

矩阵连乘-动态规划

2018-11-03 14:19 99 查看

动态规划的基本思想

将待求解的问题分解成若干个相互联系的子问题,先求解子问题,然后从这些子问题的解得到原问题的解;对于重复出现的子问题,只在第一次遇到的时候对它进行求解,并把答案保存起来,让以后再次遇到时直接引用答案,不必重新求解。

问题描述:

 给定n个矩阵:A1,A2,...,An,其中Ai与Ai+1是可乘的,i=1,2...,n-1。确定计算矩阵连乘积的计算次序,使得依此次序计算矩阵连乘积需要的数乘次数最少

问题解析:

  由于矩阵乘法满足结合律,故计算矩阵的连乘积可以有许多不同的计算次序。这种计算次序可以用加括号的方式来确定。若一个矩阵连乘积的计算次序完全确定,也就是说该连乘积已完全加括号,则可以依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。

       完全加括号的矩阵连乘积可递归地定义为:

     (1)单个矩阵是完全加括号的;

     (2)矩阵连乘积A是完全加括号的,则A可表示为2个完全加括号的矩阵连乘积B和C的乘积并加括号,即A=(BC)

     

 例如,矩阵连乘积A1A2A3有2种不同的完全加括号的方式:

((A1*A2)*A3), (A1*(A2*A3))

每一种完全加括号的方式对应于一个矩阵连乘积的计算次序,这决定着作乘积所需要的计算量。

A1*A2  A1:10*25, A2:25*35  则A1*A2=10*25*35 即两个矩阵相乘等于第一个矩阵的行数*列数*第二个矩阵的列数

看下面一个例子,计算三个矩阵连乘{A1,A2,A3};维数分别为10*100 , 100*5 , 5*50

按此顺序计算需要的次数((A1*A2*A3):10X100X5+10X5X50=7500次,

按此顺序计算需要的次数(A1*(A2*A3)):10*5*50+10*100*50=75000次

能用动态规划的一个性质就是最优子结构性质,也就是说计算A[i:j]的最优次序所包含的计算矩阵子链A[i:k]和A[k+1:j]的次序也是最优的。动态规划算法解此问题,可依据其递归式以自底向上的方式进行计算(即先从最小的开始计算)。在计算过程中,保存已解决的子问题答案。每个子问题只计算一次,而在后面需要时只要简单查一下,从而避免大量的重复计算,最终得到多项式时间的算法。我们可以根据下面这个公式来计算结果。m[i,j]表示矩阵i到矩阵j连乘的最小次数,其中p[i-1]表示的是第i个矩阵的行数,p[k]表示i:k矩阵合起来后最后得到的列数,p[j]是k+1:j合起来后得到的列数。

 

求解步骤:

假设p={10,5,2,8,4,9,10}; 表示有六个矩阵,维数分别为:10*5  5*2  2*8  8*4  4*9  9*10

从连乘矩阵个数为2开始计算每次的最小乘次数m[i][j]:

 m[1][2] m[2][3] m[3][4]  m[4][5]     //m[1][2]表示第一个矩阵与第二个矩阵的最小乘次数

然后再计算再依次计算连乘矩阵个数为3:

m[1][3] m[2][4] m[3][5] m[4][6]

连乘矩阵个数为4:

m[1][4] m[2][5] m[3][6]

连乘矩阵个数为5:m[1][5] m[2][6]

连乘矩阵个数为6:m[1][6]    //即最后我们要的结果

代码实现:

[code]package dongtaiguihua;
public class MatrixChain1 {

/**
* 此方法用来求解矩阵连乘的最小数乘次数
*/
public static void matrixChain(int p[]) {
int n=p.length-1+1;//p.length-1:矩阵的个数,+1:即定义二维数组的大小,A1-An,s[0][:]=0,s[:][0]=0;
int[][] m=new int

;//保存Ai-Aj 矩阵连乘的最小个数
int[][] s=new int

;//保存矩阵连乘最小情况的断开位置
for (int i=1;i<n;i++)
{
m[i][i]=0;//即A1,A2...An单个矩阵连乘的个数为0
}
for(int r=2;r<n;r++)//r为当前计算的链长(子问题规模)
{
for(int i=1;i<=n-1-r+1;i++)//n-1:总的矩阵个数,n-1-k+1:最后一个r链的前边界
{
int j=i+r-1;
m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//将Ai:Aj分成A(i)*A[i+1:j]
s[i][j]=i;//记录断开的位置
for(int k=i+1;k<j;k++)
{
int temp=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j];
if(temp<m[i][j])
{
m[i][j]=temp;
s[i][j]=k;
}
}
}
}
matrixDivide(1,n-1,s);
System.out.println(m[1][n-1]);
}
public static void  matrixDivide(int i,int j,int[][] s)//矩阵的断开位置
{
if(i==j)
{
return;
}
matrixDivide(i,s[i][j],s);
matrixDivide(s[i][j]+1,j,s);
int x = s[i][j] + 1;
System.out.print("Multipy A" + i + "," + s[i][j]);
System.out.println(" and A" + x + "," + j);
}
public static void main(String[] args)
{
int[] p={10,5,2,8,4,9,10,7,6};//传入的要连乘的矩阵的维数信息的数组
matrixChain(p);
}
}

 

阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: