您的位置：首页 > 其它

LIS算法: 最长上升子序列

2017-08-25 11:49 162 查看

LIS定义

LIS（Longest Increasing Subsequence）最长上升子序列

一个数的序列bi，当b1 < b2 < … < bS的时候，我们称这个序列是上升的。对于给定的一个序列(a1, a2, …, aN)，我们可以得到一些上升的子序列(ai1, ai2, …, aiK)，这里1 <= i1 < i2 < … < iK <= N。

比如，对于序列(1, 7, 3, 5, 9, 4, 8)，有它的一些上升子序列，如(1, 7), (3, 4, 8)等等。这些子序列中最长的长度是4，比如子序列(1, 3, 5, 8).

你的任务，就是对于给定的序列，求出最长上升子序列的长度。

两种做法

O(N^2)做法：dp动态规划

状态设计：dp[i]代表以a[i]结尾的LIS的长度

状态转移：dp[i]=max(dp[i], dp[j]+1) (0<=j< i, a[j]< a[i])

边界处理：dp[i]=1 (0<=j< n)

时间复杂度：O(N^2)

举例：对于序列(1, 7, 3, 5, 9, 4, 8)，dp的变化过程如下


dp[i]	初始值	j=0	j=1	j=2	j=3	j=4	j=5
dp[0]	1
dp[1]	1	2
dp[2]	1	2	2
dp[3]	1	2	2	3
dp[4]	1	2	3	3	4
dp[5]	1	2	2	3	3	3
dp[6]	1	2	3	3	4	4	4

求完dp数组后，取其中的最大值就是LIS的长度。【注意答案不是dp[n-1]，这个样例只是巧合】

#include <bits/stdc++.h>
using namespace std;
const int MAXX=100000+5;
const int INF=INT_MAX;

int a[MAXX],dp[MAXX]; // a数组为数据，dp[i]表示以a[i]结尾的最长递增子序列长度

int main()
{
int n;
while(cin>>n)
{
for(int i=0; i<n; i++)
{
cin>>a[i];
dp[i]=1; // 初始化为1，长度最短为自身
}
int ans=1;
for(int i=1; i<n; i++)
{
for(int j=0; j<i; j++)
{
if(a[i]>a[j])
{
dp[i]=max(dp[i],dp[j]+1);  // 状态转移
}
}
ans=max(ans,dp[i]);  // 比较每一个dp[i],最大值为答案
}
cout<<ans<<endl;
}
return 0;
}

O(NlogN)做法：贪心+二分

a[i]表示第i个数据。

dp[i]表示表示长度为i+1的LIS结尾元素的最小值。

利用贪心的思想，对于一个上升子序列，显然当前最后一个元素越小，越有利于添加新的元素，这样LIS长度自然更长。

因此，我们只需要维护dp数组，其表示的就是长度为i+1的LIS结尾元素的最小值，保证每一位都是最小值，这样子dp数组的长度就是LIS的长度。

dp数组具体维护过程同样举例讲解更为清晰。

同样对于序列 a(1, 7, 3, 5, 9, 4, 8)，dp的变化过程如下：

dp[0] = a[0] = 1，长度为1的LIS结尾元素的最小值自然没得挑，就是第一个数。（dp = {1}）

对于a[1]=7，a[1]>dp[0]，因此直接添加到dp尾，dp[1]=a[1]。（dp = {1, 7}）

对于a[2]=3，dp[0]< a[2]< dp[1]，因此a[2]替换dp[1]，令dp[1]=a[2]，因为长度为2的LIS，结尾元素自然是3好过于7，因为越小这样有利于后续添加新元素。（dp = {1, 3}）

对于a[3]=5，a[3]>dp[1]，因此直接添加到dp尾，dp[2]=a[3]。（dp = {1, 3, 5}）

对于a[4]=9，a[4]>dp[2]，因此同样直接添加到dp尾，dp[3]=a[9]。（dp = {1, 3, 5, 9}）

对于a[5]=4，dp[1]< a[5]< dp[2]，因此a[5]替换值为5的dp[2]，因此长度为3的LIS，结尾元素为4会比5好，越小越好嘛。（dp = {1, 3, 4, 9}）

对于a[6]=8，dp[2]< a[6]< dp[3]，同理a[6]替换值为9的dp[3]，道理你懂。（dp = {1, 3, 5, 8}）

ok，这样子dp数组就维护完毕，所求LIS长度就是dp数组长度4。

通过上述求解，可以发现dp数组是单调递增的，因此对于每一个a[i]，先判断是否可以直接插入到dp数组尾部，即比较其与dp数组的最大值即最后一位；如果不可以，则找出dp中第一个大于等于a[i]的位置，用a[i]替换之。

这个过程可以利用二分查找，因此查找时间复杂度为O(logN)，所以总的时间复杂度为O(NlogN)

#include <bits/stdc++.h>
using namespace std;
const int MAXX=100000+5;
const int INF=INT_MAX;

int a[MAXX],dp[MAXX]; // a数组为数据，dp[i]表示长度为i+1的LIS结尾元素的最小值

int main()
{
int n;
while(cin>>n)
{
for(int i=0; i<n; i++)
{
cin>>a[i];
dp[i]=INF; // 初始化为无限大
}
int pos=0;    // 记录dp当前最后一位的下标
dp[0]=a[0];   // dp[0]值显然为a[0]
for(int i=1; i<n; i++)
{
if(a[i]>dp[pos])    // 若a[i]大于dp数组最大值，则直接添加
dp[++pos] = a[i];
else    // 否则找到dp中第一个大于等于a[i]的位置，用a[i]替换之。
dp[lower_bound(dp,dp+pos+1,a[i])-dp]=a[i];  // 二分查找
}
cout<<pos+1<<endl;
}
return 0;
}

一道例题

洛谷【p1439】排列LCS问题

题目描述：

给出1-n的两个排列P1和P2，求它们的最长公共子序列。

输入格式：

第一行是一个数n，

接下来两行，每行为n个数，为自然数1-n的一个排列。

输出格式：

一个数，即最长公共子序列的长度

输入样例：

5

3 2 1 4 5

1 2 3 4 5

输出样例：

3

【数据规模】

对于50%的数据，n≤1000

对于100%的数据，n≤100000

求解：

显然这是一道LCS最长公共子序列的问题，但是N特别大，对于LCS的O(N^2)做法，时间肯定得爆吧，由于题目中的两个序列都是1~n的一个排列，噢很巧哦，由于这个条件LCS的问题可以用LIS来解决。

若其中一个排列是1,2,3…n，那么他们的LCS（最长公共子序列）就是就是另一个序列的LIS（最长上升子序列）。如果两个序列的排列都不是1,2,3…n，那么我们可以认为其中一个序列是1,2,3..n，然后把第一个序列的a[1]映射到1，a[2]映射到2，a
映射到n，对b序列也按照a序列的映射规则处理，这样再求b序列的LIS即可。

#include <bits/stdc++.h>
using namespace std;
const int MAXX=100000+5;
const int INF=INT_MAX;

int dp[MAXX];
int a[MAXX],b[MAXX];

int main()
{
int n;
while(cin>>n)
{
int v;
for(int i=0; i<n; i++)
{
cin>>v;
a[v]=i;//把a[i]映射到i
}
for(int i=0; i<n; i++)
{
cin>>v;
b[i]=a[v];//把b数组按照a数组的映射规则进行映射
}
for(int i=0; i<n; i++)
dp[i]=INF; //初始化

int pos=0;    // 记录dp当前最后一位的下标
dp[0]=b[0];
for(int i=1; i<n; i++)
{
if(b[i]>=dp[pos])
dp[++pos]=b[i];
else
dp[lower_bound(dp,dp+pos+1,b[i])-dp]=b[i];
}
cout<<pos+1<<endl;
}
return 0;
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 算法 acm lis算法最长公共子序列最长递增子序列

相关文章推荐

新的分享

章节导航