Ale*_*sky 7 algorithm data-structures
我正在寻找一个大致对应的数据结构(用Java术语)Map<Set<int>, double>.基本上是一组标记的大理石,其中每组大理石与标量相关联.我希望它能够有效地处理以下操作:
在以下条件下:
我已经考虑过尝试,但是我没有看到处理"删除包含给定整数的每个集合"操作的好方法.
此数据结构的目的是表示离散随机变量,并允许对它们进行加法,乘法和标量乘法运算.这些离散随机变量中的每一个最终都是通过将这些操作应用于固定的(在编译时)一组独立的伯努利随机变量(即每个以一定概率取值1或0)来创建的.
被建模的系统接近于可表示为时间不均匀的马尔可夫链(当然这将极大地简化)但不幸的是,跟踪各种转换以来的持续时间是必要的.
这是一个数据结构,可以非常有效地完成所有操作:
为了进行解释,我将把它称为 BitmapArray 。
考虑一下,显然对于您描述的以位图作为键、以权重(双精度)作为值的排序数组的操作来说,将非常有效。
位图用于维护集合中的成员资格。既然你说集合中的整数范围在 1-10,000 之间,我们就可以用长度为 10,000 的位图来维护任何集合的信息。
对键可能大到 2^10000 的数组进行排序会很困难,但您可以通过以下方式聪明地实现比较函数:
我知道这仍然是一个缓慢的比较。但不要太慢,这是我在长度为 10000 的位图上做的基准小提琴。这是用 Javascript 编写的,如果你要用 Java 编写,它会表现得更好。
function runTest() {
var num = document.getElementById("txtValue").value;
num = isNaN(num * 1) ? 0 : num * 1;
/*For integers in the range 1-10,000 the worst case for comparison are any equal integers which will cause the comparision to iterate over the whole BitArray*/
bitmap1 = convertToBitmap(10000, num);
bitmap2 = convertToBitmap(10000, num);
before = new Date().getMilliseconds();
var result = firstIsGreater(bitmap1, bitmap2, 10000);
after = new Date().getMilliseconds();
alert(result + " in time: " + (after-before) + " ms");
}
function convertToBitmap(size, number) {
var bits = new Array();
var q = number;
do {
bits.push(q % 2);
q = Math.floor(q / 2);
} while (q > 0);
xbitArray = new Array();
for (var i = 0; i < size; i++) {
xbitArray.push(0);
}
var j = xbitArray.length - 1;
for (var i = bits.length - 1; i >= 0; i--) {
xbitArray[j] = bits[i];
j--
}
return xbitArray;
}
function firstIsGreater(bitArray1, bitArray2, lengthOfArrays) {
for (var i = 0; i < lengthOfArrays; i++) {
if (bitArray1[i] ^ bitArray2[i]) {
if (bitArray1[i]) return true;
else return false;
}
}
return false;
}
document.getElementById("btnTest").onclick = function (e) {
runTest();
};
Run Code Online (Sandbox Code Playgroud)
另外,请记住,在构建 BitmapArray(或在取并集时)时,您只需执行一次此操作,然后对于您最常执行的操作来说,它将变得非常高效:
注意:N 是 BitmapArray 的长度。
将整数添加到每个集合:最坏/最好情况 O(N) 时间。将每个位图中的 0 翻转为 1。
删除包含给定整数的每个集合:最坏情况 O(N) 时间。
如果您同意将权重设置为 0,那么效率会更高。如果您想删除给定集合中包含任何元素的所有集合,这也变得非常容易。
两个映射的并集:最坏情况 O(N1+N2) 时间。就像合并两个已排序的数组一样,只不过您必须再次聪明地进行比较。
将所有双精度数乘以给定的双精度数:最坏/最好情况 O(N) 时间。迭代每个值并将其乘以输入双精度值。
迭代 BitmapArray:下一个元素的最坏/最好情况 O(1) 时间。