您的位置:首页 > 其它

LIS算法: 最长上升子序列

2017-08-25 11:49 162 查看

LIS定义

LIS(Longest Increasing Subsequence)最长上升子序列

一个数的序列bi,当b1 < b2 < … < bS的时候,我们称这个序列是上升的。对于给定的一个序列(a1, a2, …, aN),我们可以得到一些上升的子序列(ai1, ai2, …, aiK),这里1 <= i1 < i2 < … < iK <= N。

比如,对于序列(1, 7, 3, 5, 9, 4, 8),有它的一些上升子序列,如(1, 7), (3, 4, 8)等等。这些子序列中最长的长度是4,比如子序列(1, 3, 5, 8).

你的任务,就是对于给定的序列,求出最长上升子序列的长度

两种做法

O(N^2)做法:dp动态规划

状态设计:dp[i]代表以a[i]结尾的LIS的长度

状态转移:dp[i]=max(dp[i], dp[j]+1) (0<=j< i, a[j]< a[i])

边界处理:dp[i]=1 (0<=j< n)

时间复杂度:O(N^2)

举例: 对于序列(1, 7, 3, 5, 9, 4, 8),dp的变化过程如下

dp[i]初始值j=0j=1j=2j=3j=4j=5
dp[0]1
dp[1]12
dp[2]122
dp[3]1223
dp[4]12334
dp[5]122333
dp[6]1233444
求完dp数组后,取其中的最大值就是LIS的长度。【注意答案不是dp[n-1],这个样例只是巧合】

#include <bits/stdc++.h>
using namespace std;
const int MAXX=100000+5;
const int INF=INT_MAX;

int a[MAXX],dp[MAXX]; // a数组为数据,dp[i]表示以a[i]结尾的最长递增子序列长度

int main()
{
int n;
while(cin>>n)
{
for(int i=0; i<n; i++)
{
cin>>a[i];
dp[i]=1; // 初始化为1,长度最短为自身
}
int ans=1;
for(int i=1; i<n; i++)
{
for(int j=0; j<i; j++)
{
if(a[i]>a[j])
{
dp[i]=max(dp[i],dp[j]+1);  // 状态转移
}
}
ans=max(ans,dp[i]);  // 比较每一个dp[i],最大值为答案
}
cout<<ans<<endl;
}
return 0;
}


O(NlogN)做法:贪心+二分

a[i]表示第i个数据。

dp[i]表示表示长度为i+1的LIS结尾元素的最小值。

利用贪心的思想,对于一个上升子序列,显然当前最后一个元素越小,越有利于添加新的元素,这样LIS长度自然更长。

因此,我们只需要维护dp数组,其表示的就是长度为i+1的LIS结尾元素的最小值,保证每一位都是最小值,这样子dp数组的长度就是LIS的长度。

dp数组具体维护过程同样举例讲解更为清晰。

同样对于序列 a(1, 7, 3, 5, 9, 4, 8),dp的变化过程如下:

dp[0] = a[0] = 1,长度为1的LIS结尾元素的最小值自然没得挑,就是第一个数。 (dp = {1})

对于a[1]=7,a[1]>dp[0],因此直接添加到dp尾,dp[1]=a[1]。(dp = {1, 7})

对于a[2]=3,dp[0]< a[2]< dp[1],因此a[2]替换dp[1],令dp[1]=a[2],因为长度为2的LIS,结尾元素自然是3好过于7,因为越小这样有利于后续添加新元素。 (dp = {1, 3})

对于a[3]=5,a[3]>dp[1],因此直接添加到dp尾,dp[2]=a[3]。 (dp = {1, 3, 5})

对于a[4]=9,a[4]>dp[2],因此同样直接添加到dp尾,dp[3]=a[9]。 (dp = {1, 3, 5, 9})

对于a[5]=4,dp[1]< a[5]< dp[2],因此a[5]替换值为5的dp[2],因此长度为3的LIS,结尾元素为4会比5好,越小越好嘛。(dp = {1, 3, 4, 9})

对于a[6]=8,dp[2]< a[6]< dp[3],同理a[6]替换值为9的dp[3],道理你懂。 (dp = {1, 3, 5, 8})

ok,这样子dp数组就维护完毕,所求LIS长度就是dp数组长度4。

通过上述求解,可以发现dp数组是单调递增的,因此对于每一个a[i],先判断是否可以直接插入到dp数组尾部,即比较其与dp数组的最大值即最后一位;如果不可以,则找出dp中第一个大于等于a[i]的位置,用a[i]替换之。

这个过程可以利用二分查找,因此查找时间复杂度为O(logN),所以总的时间复杂度为O(NlogN)

#include <bits/stdc++.h>
using namespace std;
const int MAXX=100000+5;
const int INF=INT_MAX;

int a[MAXX],dp[MAXX]; // a数组为数据,dp[i]表示长度为i+1的LIS结尾元素的最小值

int main()
{
int n;
while(cin>>n)
{
for(int i=0; i<n; i++)
{
cin>>a[i];
dp[i]=INF; // 初始化为无限大
}
int pos=0;    // 记录dp当前最后一位的下标
dp[0]=a[0];   // dp[0]值显然为a[0]
for(int i=1; i<n; i++)
{
if(a[i]>dp[pos])    // 若a[i]大于dp数组最大值,则直接添加
dp[++pos] = a[i];
else    // 否则找到dp中第一个大于等于a[i]的位置,用a[i]替换之。
dp[lower_bound(dp,dp+pos+1,a[i])-dp]=a[i];  // 二分查找
}
cout<<pos+1<<endl;
}
return 0;
}


一道例题

洛谷【p1439】排列LCS问题

题目描述:

给出1-n的两个排列P1和P2,求它们的最长公共子序列。

输入格式:

第一行是一个数n,

接下来两行,每行为n个数,为自然数1-n的一个排列。

输出格式:

一个数,即最长公共子序列的长度

输入样例:

5

3 2 1 4 5

1 2 3 4 5

输出样例:

3

【数据规模】

对于50%的数据,n≤1000

对于100%的数据,n≤100000

求解:

显然这是一道LCS最长公共子序列的问题,但是N特别大,对于LCS的O(N^2)做法,时间肯定得爆吧,由于题目中的两个序列都是1~n的一个排列,噢很巧哦,由于这个条件LCS的问题可以用LIS来解决。

若其中一个排列是1,2,3…n,那么他们的LCS(最长公共子序列)就是就是另一个序列的LIS(最长上升子序列)。如果两个序列的排列都不是1,2,3…n,那么我们可以认为其中一个序列是1,2,3..n,然后把第一个序列的a[1]映射到1,a[2]映射到2,a
映射到n,对b序列也按照a序列的映射规则处理,这样再求b序列的LIS即可。

#include <bits/stdc++.h>
using namespace std;
const int MAXX=100000+5;
const int INF=INT_MAX;

int dp[MAXX];
int a[MAXX],b[MAXX];

int main()
{
int n;
while(cin>>n)
{
int v;
for(int i=0; i<n; i++)
{
cin>>v;
a[v]=i;//把a[i]映射到i
}
for(int i=0; i<n; i++)
{
cin>>v;
b[i]=a[v];//把b数组按照a数组的映射规则进行映射
}
for(int i=0; i<n; i++)
dp[i]=INF; //初始化

int pos=0;    // 记录dp当前最后一位的下标
dp[0]=b[0];
for(int i=1; i<n; i++)
{
if(b[i]>=dp[pos])
dp[++pos]=b[i];
else
dp[lower_bound(dp,dp+pos+1,b[i])-dp]=b[i];
}
cout<<pos+1<<endl;
}
return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息