LCP 与 height

前言

阅读此篇前,可先阅读后缀数组

LCP

LCP 就是最长公共前缀,在后缀数组中,\(LCP(i,j)\) 就代表从 \(sa_i\) 开始的后缀和从 \(sa_j\) 开始的后缀的最长公共前缀。

height 的定义

\(height[i]=LCP(sa[i],sa[i-1])\),即从 \(i\) 开始的后缀与它前一个的后缀的最长公共前缀。

一些性质

\(height[rak[i]] \ge height[rak[i-1]]-1\)

证明:

\(height[rak[i-1]] \le 1\) 时,很好看出,\(height[rak[i]] \ge 0\),故正确。

\(height[rak[i-1]] > 1\) 时,因为 \(LCP(i-1,sa[rak[i-1]-1])=height[rak[i-1]] > 1\),那么设这个最长公共为 \(aA\)(其中 \(a\) 代表一个字符 \(A\) 代表一个字符串),从 \(i-1\) 开始的后缀为 \(aAB\),从 \(sa[rak[i-1]-1]\) 开始的后缀为 \(aAC\),所以从 \(i\) 开始的后缀为 \(AB\),从 \(sa[rak[i-1]-1]+1\) 开始的后缀就为 \(AC\),所以 \(LCP(i,sa[rak[i-1]-1]+1)=|A|\)。设从 \(sa[rak[i]-1]\) 开始的后缀就为 \(D\)

那么因为 \(aAB > aAC\),所以 \(AB>AC\),因为从 \(sa[rak[i]-1]\) 开始的后缀只比从 \(i\) 开始的后缀少一位,那么 \(AB > D \ge AC\),所以 \(D\) 肯定有一个 \(A\) 的前缀,即 \(height[rak[i]] \ge |A|\)\(height[rak[i]] \ge height[rak[i-1]]-1\)

Code

void GetHeight(){int k=0;for(int i=1;i<=n;++i) {    if(k) k--;    while(s[i+k]==s[sa[rak[i]-1]+k]) ++k;    height[rak[i]]=k;}}

6666

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享