相关疑难解决方法(0)

为什么处理排序数组比处理未排序数组更快？

这是一段看似非常特殊的C++代码.出于某种奇怪的原因,奇迹般地对数据进行排序使得代码几乎快了六倍.

#include <algorithm>
#include <ctime>
#include <iostream>

int main()
{
    // Generate data
    const unsigned arraySize = 32768;
    int data[arraySize];

    for (unsigned c = 0; c < arraySize; ++c)
        data[c] = std::rand() % 256;

    // !!! With this, the next loop runs faster.
    std::sort(data, data + arraySize);

    // Test
    clock_t start = clock();
    long long sum = 0;

    for (unsigned i = 0; i < 100000; ++i)
    {
        // Primary loop
        for (unsigned c = 0; c < arraySize; ++c) …

Run Code Online (Sandbox Code Playgroud)

c++ java optimization performance branch-prediction

GMa*_*ckG

2019 10-02

2万
推荐指数

27
解决办法

142万
查看次数

随机矩阵的所有行的快速随机加权选择

numpy.random.choice 允许从矢量加权选择,即

arr = numpy.array([1, 2, 3])
weights = numpy.array([0.2, 0.5, 0.3])
choice = numpy.random.choice(arr, p=weights)

Run Code Online (Sandbox Code Playgroud)

选择1概率为0.2,2选择概率为0.5,3选择概率为0.3.

如果我们想以矢量化的方式快速完成2D阵列(矩阵),每个行都是概率矢量,该怎么办？也就是说,我们想要一个随机矩阵的选择向量？这是超级慢的方式:

import numpy as np

m = 10
n = 100 # Or some very large number

items = np.arange(m)
prob_weights = np.random.rand(m, n)
prob_matrix = prob_weights / prob_weights.sum(axis=0, keepdims=True)

choices = np.zeros((n,))
# This is slow, because of the loop in Python
for i in range(n):
    choices[i] = np.random.choice(items, p=prob_matrix[:,i])

Run Code Online (Sandbox Code Playgroud)

print(choices):

array([ 4.,  7.,  8.,  1.,  0.,  4.,  3.,  7.,  1., …

Run Code Online (Sandbox Code Playgroud)

python numpy matrix vectorization random-sample

And*_*Mao

2017 05-23

12
推荐指数

1
解决办法

1528
查看次数

为什么用<work？对JS数组进行排序？

在JavaScript中对数字数组进行排序时,我意外地使用<而不是通常- - 但它仍然有效.我想知道为什么？

例:

var a  = [1,3,2,4]
a.sort(function(n1, n2){
    return n1<n2
})
// result is correct: [4,3,2,1]

Run Code Online (Sandbox Code Playgroud)

一个不起作用的示例数组(感谢Nicolas的例子):

[1,2,1,2,1,2,1,2,1,2,1,2]

Run Code Online (Sandbox Code Playgroud)

javascript

Kua*_*uan

2018 10-06

12
推荐指数

1
解决办法

246
查看次数

Tango树有什么实际应用吗？

平衡二叉搜索树提供有O(log(n))保证的搜索时间.

Tango树实现了搜索,O(log(log(n))同时损害了每个节点的少量内存.虽然我从理论的角度理解log(n)并且log(log(n))产生了巨大的差异,但对于大多数实际应用来说,它几乎没有任何优势.

例如,即使对于像一个巨大的数字n = 10^20(就像几千PB级)之间的区别log(n) = 64和log(log(n)) = 6是相当微不足道的.那么Tango树有什么实际用途吗？

algorithm tree complexity-theory

Sal*_*ali

2015 12-26

8
推荐指数

1
解决办法

1281
查看次数

为什么使用 np.empty 进行分配而不是 O(1)

官方文档上是numpy 这么说的

返回给定形状和类型的新数组，而不初始化条目。

for np.empty，这意味着创建（分配）这个数组所花费的时间将是 O(1)，但一些简单的测试timeit表明情况并非如此：

>>> timeit.timeit(lambda: np.empty(100000000 ), number=10000)
0.2733485999999914
>>> timeit.timeit(lambda: np.empty(1000000000), number=10000)
0.8293009999999867

Run Code Online (Sandbox Code Playgroud)

作为一个附带问题，未触及的np.empty数组中存在哪些值？它们都是非常小的值，但我希望它们只是该地址内存中存在的任何值。（示例数组：np.empty(2) = array([-6.42940774e-036, 2.07409447e-117])。这些看起来不像存储在内存中的东西）

python numpy time-complexity

Rec*_*ive

lucky-day

4
推荐指数

1
解决办法

66
查看次数