您的位置:首页 > 编程语言 > C语言/C++

最长上升子序列nlogn算法

2015-04-23 11:42 141 查看
转载:

 


最长上升子序列nlogn算法

最长上升子序列nlogn算法

在川大oj上遇到一道题无法用n^2过于是,各种纠结,最后习得nlogn的算法

最长递增子序列,Longest Increasing Subsequence 下面我们简记为 LIS。

排序+LCS算法 以及 DP算法就忽略了,这两个太容易理解了。

假设存在一个序列d[1..9] = 2 1 5 3 6 4 8 9 7,可以看出来它的LIS长度为5。n

下面一步一步试着找出它。

我们定义一个序列B,然后令 i = 1 to 9 逐个考察这个序列。

此外,我们用一个变量Len来记录现在最长算到多少了

首先,把d[1]有序地放到B里,令B[1] = 2,就是说当只有1一个数字2的时候,长度为1的LIS的最小末尾是2。这时Len=1

然后,把d[2]有序地放到B里,令B[1] = 1,就是说长度为1的LIS的最小末尾是1,d[1]=2已经没用了,很容易理解吧。这时Len=1

接着,d[3] = 5,d[3]>B[1],所以令B[1+1]=B[2]=d[3]=5,就是说长度为2的LIS的最小末尾是5,很容易理解吧。这时候B[1..2] = 1, 5,Len=2

再来,d[4] = 3,它正好加在1,5之间,放在1的位置显然不合适,因为1小于3,长度为1的LIS最小末尾应该是1,这样很容易推知,长度为2的LIS最小末尾是3,于是可以把5淘汰掉,这时候B[1..2] = 1, 3,Len = 2

继续,d[5] = 6,它在3后面,因为B[2] = 3, 而6在3后面,于是很容易可以推知B[3] = 6, 这时B[1..3] = 1, 3, 6,还是很容易理解吧? Len = 3 了噢。

第6个, d[6] = 4,你看它在3和6之间,于是我们就可以把6替换掉,得到B[3] = 4。B[1..3] = 1, 3, 4, Len继续等于3

第7个, d[7] = 8,它很大,比4大,嗯。于是B[4] = 8。Len变成4了

第8个, d[8] = 9,得到B[5] = 9,嗯。Len继续增大,到5了。

最后一个, d[9] = 7,它在B[3] = 4和B[4] = 8之间,所以我们知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。

于是我们知道了LIS的长度为5。

!!!!! 注意。这个1,3,4,7,9不是LIS,它只是存储的对应长度LIS的最小末尾。有了这个末尾,我们就可以一个一个地插入数据。虽然最后一个d[9] = 7更新进去对于这组数据没有什么意义,但是如果后面再出现两个数字 8 和 9,那么就可以把8更新到d[5], 9更新到d[6],得出LIS的长度为6。

然后应该发现一件事情了:在B中插入数据是有序的,而且是进行替换而不需要挪动——也就是说,我们可以使用二分查找,将每一个数字的插入时间优化到O(logN)~~~~~于是算法的时间复杂度就降低到了O(NlogN)~!

 

[plain] view
plaincopy

个人理解:nlogn算法(不知道具体名字,暂且这样叫吧)求的是一列数每一位所对应的最小末尾。  

     例如:2 1 5 3 6 4 8 9 7   

         1位的最小末尾是1,2位数的最小末尾是3,3位是4,4位是7,5位是9,想想便可发现,每一位的最小末尾的个数(len),即是最小上升子序列的长度  

基础代码:

[cpp] view
plaincopy

#include<cstdio>  

int a[3002],ans[3002],len;  

int LowerBound(int i)//求下界   

{    

    int left=0,right=len,mid;  

    while(left<right)  

    {  

        mid = (left+right)/2;  

        if(ans[mid]>=a[i])  

            right = mid;  

        else  

            left = mid+1;  

    }  

    return left;  

}  

int main()  

{  

    int n,i,j;  

    while(scanf("%d",&n)&&n!=-1)//注意题意要求!=EOF会Wrong   

    {  

        for(i=1; i<=n; i++)  

            scanf("%d",&a[i]);  

        ans[1] = a[1];  

        for(i=2,len=1; i<=n; i++)  

        {  

            if(a[i]>ans[len])  

                ans[++len] = a[i];  

            else  

            {  

                j = LowerBound(i);//STL:j=lower_bound(ans,ans+len,arr[i])-ans;   

                ans[j] = a[i];  

            }  

        }  

        printf("%d\n",len);  

    }  

}  

总结:
   
看完了这一篇文章后获益良多,这篇文章不好之处是没说这麽做的原理是什么。所以看起来会吃力,过一段时间后就很快会忘记,因为我们只是记住了这个模版而没有深入了解它(我第一次是这样的,仅仅是个人的感想)。最后隔了一段时间再看这篇文章有了质的飞跃。因为终于明白了原理。其实原理很简单,那就是每次为什么每次都要将小的和前面的数交换呢?那是因为我要选一个最长的递增序列,而这个算法正是利用了末尾增加的方法来判断长度的。如:1
4 3 7 6 9 这个数列,每次我们找的最长的序列都是尾部最大的,如果有大于尾部的数,那就代表了数列又能找到符合条件的数啊;若是小于尾部,则前面的数改变,包括尾部在内。肯定有很多人不明白为什么能这样做,这样不就是改变了吗?如1 3 7 8 5 6 这个就很好解析了。之所以会不断找最优的序列是为以后是否有更优的取代数列末尾的那个8,那就换了一个更优的了,比如6后还有7,那原来的就不能添加了。所以它不断的更新前面的值。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  c++ 优化 二分查找