pal*_*tok 4 algorithm data-structures
如何找到整数数组的最小间隔,其中存在该数组的所有唯一元素.例如我的数组是:1 1 1 2 3 1 1 4 3 3 3 2 1 2 2 4 1最小间隔是从索引3到索引7.我正在寻找一个O(nlogn)或更少的算法(n < = 100000)
策略从结束到开始迭代,记住上次查看每个整数的时间.例如.在中间的某个地方,您最后在索引15处看到1,在索引20处看到2,在索引17处看到3.间隔长度是您上次看到的最大索引减去当前索引.
要轻松找到最大索引,应使用自平衡二叉搜索树(BST),因为它具有O(log n)插入和删除时间,以及最大索引的常量查找时间.
例如,如果您必须更新上次看到1的索引,则删除当前最后看到的索引(15),并插入新的上次查看的索引.
通过使用每个整数类型允许的所有结束索引更新自平衡BST,我们可以选择最大的,并说我们可以在那里结束.
确切的代码取决于输入的定义方式(例如,您是否知道所有整数是什么,即您知道数组中存在1到4之间的所有整数,然后简化代码).
迭代是O(n),BST是O(log n).总的来说O(n log n).
实现这一点需要一些工作.
初始化:
map<>在C++中)).现在在循环内部(从输入数组的末尾到输入数组的开始循环索引),
您可以更新此特定索引的上次看到的数组.
只需检查您看到的整数,并更新索引上次看到的数组中的条目.
在最后看到的数组中使用之前和之后,更新BST(删除旧的结束索引,添加新索引)
根据所需的最大结束索引(来自BST)更新此起始索引的间隔长度.
如果你看到一个你以前没见过的整数,那么在索引之上开始索引的所有区间长度都会无效(或者只是避免更新区间长度,直到所有整数至少被看到一次为止).
#include并main发挥作用码:
int n=10,k=3;
int input[n]=?;
unsigned int interval[n];
for (int i=0;i<n;i++) interval[i]=-1; // initialize interval to very large number
int lastseen[k];
for (int i=0;i<k;i++) lastseen[i]=-1; // initialize lastseen
multiset<int> pq;
for (int i=n-1;i>=0;i--) {
if (lastseen[input[i]] != -1) // if lastseen[] already has index
pq.erase(pq.find(lastseen[input[i]])); // erase single copy
lastseen[input[i]]=i; // update last seen
pq.insert(i); // put last seen index into BST
if (pq.size()==k) { // if all integers seen (nothing missing)
// get (maximum of endindex requirements) - current index
interval[i] = (*pq.rbegin())-i+1;
}
}
// find best answer
unsigned int minlength=-1;
int startindex;
for (int i=0;i<n;i++) {
if (minlength>interval[i]) { // better answer?
minlength=interval[i];
startindex=i;
}
}
// Your answer is [startindex,startindex+minlength)
Run Code Online (Sandbox Code Playgroud)