问题描述
- RMQ是Range Minimim(Maximum)Query的简称 即区间最值查询问题。
- 给定一个数组a1,a2,a3,a4,a5……设计一个数据结构,支持查询操作Query(L,R) ; 计算min(a1,a2,a3,a5….) 或max(a1,a2,a3,a4…..)。
解决方法
- 最简单的方法就是遍历查询,时间复杂度是O(n),但是如果数组大,并且查询次数也非常大,那么效率是非常低的。因此我们需要新的算法。
ST算法
算法主要框架
1 设dp[i][j]表示从i元素开始 1>>j个数中的最值
2 求出dp[i][j]
3 查询Query( x, y) 将 y 转换为 k
4 答案max(dp[x][k],dp[y-(1<< k)][k])需要解决的问题
1 dp数组如何求
2 查询长度如何转换(y如何转换成k)解决方法
1 dp数组的求法当dp[i][j] 中 j=0 时 ,
dp[i][0] = a[i];
(a数组表示待查询的数
组)每个查询区间都可以分成2个小区间( 二分法 ),求出2个小区间的最 值,然后取两者的最值即可。同样被分成的小区间可以继续二分,这样就出现的子问题。可以写出状态转移方程:
dp[i][j]=max(dp[i][j-1],dp[i+(1<< j)][j-1]);
2 查询长度如何转换( y 如何转换成 k )
y-x+1表示的是x到y的长度 得到等式:
2 k =y?x+1
两边同时取对数后可求得k的值
k=log(y?x+1)log2
- 核心代码
//ST(Sparse-Table)算法
void RMQ(){
for(int i=1 ;i<=n ;i++) dp[i][0]=a[i];
//注意从j变量在外层,先求短区间
for(int j=1 ;(1<<j)<=n ;j++){
for(int i=1 ;i+(1<<j)-1<=n ;i++){
dp[i][j] = max(dp[i][j-1],dp[i+(1<<(j-1))][j-1]);
}
}
}
//求k代码
int k = (int)(log(y - x + 1.0) / log(2.0));
//求最值
int ans = max(dp[x][k],dp[y-(1<<k)+1][k]);
注
有读者可能会疑惑,既然dp[ i ][ j ] 表示从 i 开始 1<< j 个数中的最值,为什么不是直接输出呢。试想:
如果 给定查询区间 2-4 即第2,3,4号元素,一共有3个元素,求得的 k = 1 (强制转换为int型后),那么dp[ i ][ k ] 查询的就是2 ,3元素。答案肯定是不对的。而dp [ x ][ k ] 和 dp[ y-(1<< k)+1][ k ]分别查询的是 2,3 和3,4。 去两者的最值,一定是答案。
如果是偶数,那该式还成立吗,假设查询区间是2-5,即第2,3,4,5号元素,k=2。 y-(1<< k) == x,说明两个查询的区间都是相同的。所以不能直接输出dp[ x ][ k ]。