您的位置:首页 > 其它

CodeVS 2245 浅谈二维线段树优化间距限制型LCS动态规划状态转移

2017-10-30 22:01 357 查看


世界真的很大

终于算是学会了这个什么二维线段树了233

今天第二题考了这道题,讲道理当时DP方程已经到必须一个二维数据结构来维护的地步了

当时整个人是蒙蔽的,这玩意儿我不会啊

然后感觉大家都做出来了,就很慌,怀疑有没有什么别的解法,可能是自己想复杂之类的

就想了很久,然后第三题的暴力转正解就没有去检查:

BZOJ 2744

就炸

说一句事后诸葛亮的话,这道题要是我当时会二维线段树岂不是今天AK?

233那当然是不可能的

看题先:

description:

彭先生任职于证券公司,是一位股票分析师。公司经理认为目前的股票分析软件仍可再改进,希望彭先生再设计一套更准确的软件。近日來,彭先生埋头钻研,他发现过去的研究结果,有人提到,如果能在历史资料中,找到与近期股票走势相近的样型,即可使用此历史样型的交易策略,做为近期的买卖策略。为了验证这样的讲法是否正确,彭先生从股票历史资料抽出一些特征资料,并以大写英文字母A~Z 代表特征资料,因此股票资料变成一串的英文字母序列。判断近期股票资料与某一段历史资料是否相近,就变成判断二串字母序列( 长度不一定相等) 的相似度,亦即找出兩者的最长共同子序列(LCS,longest common subsequence) 。

在计算二串股票资料序列的相似度时,还有一个限制,兩个相似点( 相同字母) 的前后间距不能太远,否则相似度会被扭曲。发现了这个特性后,彭先生将此问题正式定义为「有间距限制的最长共同子序列」(GLCS, gapped longest common subsequence)问题。

假设第一个序列称为α,第二个序列称为β。例如,α =“ACBDCAA”,β=“ADDBCDBAC” 。兩者在无间距限制的情形下,其 LCS 可为“ADCA” , “ABCA” ,或“ACBC” ,长度为4。假设间距限制如下:

A 2, B 0, C 3, D 0

上述间距之意义为,如果字母A 被选入LCS 中,则与其前一个被选入的字母之间,在α序列最多只能有2 个未被选入的字母,在β序列亦同。α与β在上述间距限制的情形,GLCS 可为“ACA” 或“ACC” ,长度为3。

对于无间距限制的情形,可将每个字母的间距视为无限大。本题的答案只要输出GLCS 的长度即可。

input:

共分成二部分。第一部分,第一行为α序列,第二行为β序列,兩者都是大写英文字母A~Z 的序列,每个序列长度至少为 1,最长为 800。第二部分自第三行起,第三行有一个数值 k,代表以下有 k 组测试资料(1 ≤ k≤ 5) ,每一组测试资料为一行,每一行有多个( 可能零个) 字母间距限制,每个限制的第一个为英文字母,第二个为间距数值( 数值介于0 与400 之间);英文字母不一定按照顺序,也不一定每个字母都会出现,未出现的字母间距可视为无限大。每一行字母间距限制的最后一个符号为$ ,代表该行( 该组) 的资料结束。每一行的字母间距限制情形,相邻兩项资料之间均有一个空白隔开。

output:

对于每一组测试资料,输出它的 GLCS 长度。输出这 k 个值于一行,且相邻兩个整数之间以一个空白隔开。

首先考虑朴素LCS,直接暴力的话本来就是n^4的,但是为什么我们可以有n^2的做法呢?

大概就是因为我们不关心匹配是从哪里来的,i,j这个位置不管能不能匹配都可以取到之前的最大的答案。

所以在递推时我们就可以把答案“传递”或者说“延展”下去

但这样的结果就是,我们无法得知每一次匹配的上一次匹配位置,从而无法完成这道题的约束条件

所以说优化版本的LCS求法在这道题面前就作废了,还得回到原先的n^4版本

f(i,j)表示到A的第i位,B的第j位,且i,j可以匹配的最大答案,不能就是0

每次往前面找限制范围内的最大答案

设i,j可以匹配,匹配字母的间距限制为len

那么相当于就是在f(i-len,j-len)到f(i,j)的矩阵里面求一个最值

那么这一步就可以用二维线段树来维护,求出来之后在加入ij的答案

需要注意的就是边界问题的讨论与判断了

现在来谈谈二维线段树

本质上是维护一个矩阵的答案

实现方式是通过对横坐标开一个线段树,此线段树的每一个节点保存一颗维护纵坐标的线段树

查询的时候现在横坐标上找到对应的区间,访问这个区间的纵坐标线段树然后查询纵坐标对应的区间

修改的时候因为是单点修改,找到横纵坐标的线段树位置就好

值得注意的是纵坐标的线段树维护的是值,是可以合并的,但是横坐标的线段树维护的是“纵坐标的线段树”,是不能轻易合并的

所以我们采取的方法就是,并不是先修改再合并,而是在访问修改节点的路上就把沿途经过的横坐标区间对应的纵坐标线段树修改好,避免合并的问题

完整代码:

#include<stdio.h>
#include<cstring>
#include<algorithm>
using namespace std;

const int INF=0x3f3f3f3f;

struct node
{
int sum;
node *ls,*rs;
void update()
{
sum=max(ls->sum,rs->sum);
}
}pool1[8000010],*tail=pool1;

struct Node
{
node *root;
Node *ls,*rs;
}pool[8000010],*head=pool,*root;

int n,m,T,ans=0;
int f[3010][3010],src[110];
char A[100010],B[100010],tmp[10];

void init()
{
ans=0;
tail=pool1,head=pool;
memset(f,0,sizeof(f));
memset(src,INF,sizeof(src));
}

node *built(int lf,int rg)
{
node *nd=++tail;
if(lf==rg)
{
nd->sum=0;
nd->ls=nd->rs=0;
return nd;
}
int mid=(lf+rg)>>1;
nd->ls=built(lf,mid);
nd->rs=built(mid+1,rg);
nd->update();
return nd;
}

Node *build(int lf,int rg)
{
Node *nd=++head;
nd->root=built(1,m);
if(lf==rg)
{
nd->ls=nd->rs=0;
return nd;
}
int mid=(lf+rg)>>1;
nd->ls=build(lf,mid);
nd->rs=build(mid+1,rg);
return nd;
}

void modify(node *nd,int lf,int rg,int pos,int delta)
{
if(lf==rg)
{
nd->sum=max(nd->sum,delta);
return ;
}
int mid=(lf+rg)>>1;
if(pos<=mid) modify(nd->ls,lf,mid,pos,delta);
else modify(nd->rs,mid+1,rg,pos,delta);
nd->update();
}

void modify(Node *nd,int lf,int rg,int pos1,int pos2,int delta)
{
modify(nd->root,1,m,pos2,delta);
if(lf==rg) return ;
int mid=(lf+rg)>>1;
if(pos1<=mid) modify(nd->ls,lf,mid,pos1,pos2,delta);
else modify(nd->rs,mid+1,rg,pos1,pos2,delta);
}

int query(node *nd,int lf,int rg,int L,int R)
{
if(L>R) return 0;
if(L<=lf && rg<=R)
return nd->sum;
int mid=(lf+rg)>>1,rt=0;
if(L<=mid) rt=max(rt,query(nd->ls,lf,mid,L,R));
if(R>mid) rt=max(rt,query(nd->rs,mid+1,rg,L,R));
return rt;
}

int query(Node *nd,int lf,int rg,int L1,int R1,int L2,int R2)
{
if(L1>R1) return 0;
if(L1<=lf && rg<=R1)
return query(nd->root,1,m,L2,R2);
int mid=(lf+rg)>>1,rt=0;
if(L1<=mid) rt=max(rt,query(nd->ls,lf,mid,L1,R1,L2,R2));
if(R1>mid) rt=max(rt,query(nd->rs,mid+1,rg,L1,R1,L2,R2));
return rt;
}

int main()
{
scanf("%s",A+1);
scanf("%s",B+1);
n=strlen(A+1),m=strlen(B+1);
scanf("%d",&T);
while(T--)
{
init();
root=build(1,n);
while(scanf("%s",tmp) && tmp[0]!='$')
{
int x;
scanf("%d",&x);
src[tmp[0]-'A']=x;
}
for(int i=1;i<=n;i++)
for(int j=1;j<=m;j++)
if(A[i]==B[j])
{
int R1=i-1,L1=max(1,i-src[A[i]-'A']-1);
int R2=j-1,L2=max(1,j-src[A[i]-'A']-1);
f[i][j]=query(root,1,n,L1,R1,L2,R2)+1;
modify(root,1,n,i,j,f[i][j]);
}else f[i][j]=0;
for(int i=1;i<=n;i++)
for(int j=1;j<=m;j++)
ans=max(ans,f[i][j]);
printf("%d ",ans);
}
return 0;
}
/*
Whoso pulleth out this sword from this stone and anvil is duly born King of all England
*/


嗯,就是这样
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: