矩阵链相乘
矩阵链乘法
求解矩阵链相乘问题时动态规划算法的另一个例子。给定一个n个矩阵的序列(矩阵链)<A1,A2,…,An>,我们希望计算它们的乘积 A1A2…An
两个矩阵A和B只有相容(compatible),即A的列数等于B的行数时,才能相乘。如果A是p×q的矩阵,B是q×r的矩阵,那么乘积C是p×r的矩阵。计算C所需要时间由第8行的标量乘法的次数决定的,即pqr。
以矩阵链<A1,A2,A3>为例,来说明不同的加括号方式会导致不同的计算代价。假设三个矩阵的规模分别为10×100、100×5和5×50。
如果按照((A1A2)A3)的顺序计算,为计算A1A2(规模10×5),需要做10×100×5=5000次标量乘法,再与A3相乘又需要做10×5×50=2500次标量乘法,共需7500次标量乘法。
如果按照(A1(A2A3))的顺序计算,为计算A2A3(规模100×50),需100×5×50=25000次标量乘法,再与A1相乘又需10×100×50=50000次标量乘法,共需75000次标量乘法。因此第一种顺序计算要比第二种顺序计算快10倍。
矩阵链乘法问题(matrix-chain multiplication problem)可描述如下:给定n个矩阵的链<A1,A2,…,An>,矩阵Ai的规模为p(i-1)×p(i) (1<=i<=n),求完全括号化方案,使得计算乘积A1A2…An所需标量乘法次数最少。
递推关系式
https://blog.csdn.net/Neo_kh/article/details/81282025
①如果i=j,m[i,j]=0
②如果i<j,m[i,j]=min{m[i,k]+m[k+1,j]+p(i-1)p(k)p(j)} i<=k<j
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61
| #include <bits/stdc++.h> #define max_size 400 #define INF 100000000 long long s[max_size][max_size]; long long p[max_size]; long long m[max_size][max_size];
void matrix_chain_order(int n) { for(int i=1;i<=n;i++) { m[i][i]=0; } for(int l=2;l<=n;l++) { for(int i=1;i<=n-l+1;i++) { int j=i+l-1; m[i][j]=INF; s[i][j]=0; for(int k=j-1;k>=i;k--) { int q=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; if(q<m[i][j]) { m[i][j]=q; s[i][j]=k; } } } } }
void print_optimal_parents(int i,int j) { if(i==j) printf("A%d",i); else { printf("("); print_optimal_parents(i,s[i][j]); print_optimal_parents(s[i][j]+1,j); printf(")"); } }
int main() { int n; while(~scanf("%d",&n)) { memset(p,0,sizeof(p)); for(int i=0;i<=n;i++) { scanf("%lld",&p[i]); } matrix_chain_order(n); print_optimal_parents(1,n); printf("\n"); } }
|
小结:
动态规划算法设计要素
1.多阶段决策过程,每步处理一个子问题,界定子问题的边界
2.列出优化函数的递推方程及初值
3.问题要满足优化原则或最优子结构性质,即:一个最优决策序列的任何子序列本身一定是相对于子序列的
初始和结束状态的最优决策序列
拓展: 递归实现
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
| #include<string> #include<cstring> #include<iostream> using namespace std;
int n; int p[100]; int m[100][100]; int s[100][100]; int dp(int i,int j){ if(i==j) return m[i][j]; m[i][j]=999999999; s[i][j]=i; for(int k=i;k<j;k++){ int q=dp(i,k)+dp(k+1,j)+p[i-1]*p[k]*p[j]; if(q<m[i][j]){ m[i][j]=q; s[i][j]=k; } } return m[i][j]; } int main(){ while(cin>>n){ for(int i=0;i<=n;i++){ cin>>p[i]; } memset(m,0,sizeof(m)); dp(1,n); cout<<m[1][n]<<" "<<s[1][n]<<endl; } return 0; }
|
迭代