在numpy中生成字母数字随机数

dha*_*ana 2 python random numpy

我想要随机数100000+,我发现numpy适合我的项目,基于性能它是好的.但我想根据下面的模式随机编号4位,

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789'
Run Code Online (Sandbox Code Playgroud)

在上面的例子中,26个小写字母,26个大写字母和10个数字等于62个字母,让我们进行排列和组合,

我想要这些字母的4位数,所以,

62 ^ 4 / 4! = 615680 (Combinations)
Run Code Online (Sandbox Code Playgroud)

如果我拿26个小写字母+10个数字输出,

(26+10) ^ 4 / 4! = 69984 (Combinations)
Run Code Online (Sandbox Code Playgroud)

从这两个案例中,第一个是最好的,它提供了更好的随机数,我在这里做了一些逻辑,

from numpy.random.mtrand import RandomState
import binascii
lo = 1000000000000000
hi = 999999999999999999
In [65]: %timeit [ binascii.b2a_hex(rand.randint(lo, hi, 2).tostring())[:4] for _ in xrange(100000)]
1 loops, best of 3: 272 ms per loop
Run Code Online (Sandbox Code Playgroud)

但随机数计数低于100000,因为它只需要小的字母+数字

In [66]: len(set([binascii.b2a_hex(rand.randint(lo, hi, 2).tostring())[:4] for _ in xrange(100000)]))
Out[66]: 51210
Run Code Online (Sandbox Code Playgroud)

任何人都建议我如何在numpy中实现这个?

mar*_*ama 8

正如NPE所指出的,你可以使用numpy.random.choice.这段代码能达到你想要的吗?

import numpy as np

LENGTH = 4
NO_CODES = 100000

alphabet = list('abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789')
np_alphabet = np.array(alphabet, dtype="|S1")
np_codes = np.random.choice(np_alphabet, [NO_CODES, LENGTH])
codes = ["".join(np_codes[i]) for i in range(len(np_codes))]

print(codes)
Run Code Online (Sandbox Code Playgroud)

NO_CODES = 1000000在我2岁但不坏的计算机上执行它需要几秒钟.


小智 7

使用 numpy view 可以更快地完成此操作。

A, Z = np.array(["A","Z"]).view("int32") 

NO_CODES = 100
LEN = 20

np.random.randint(low=A,high=Z,size=NO_CODES*LEN,dtype="int32").view(f"U{LEN}")
Run Code Online (Sandbox Code Playgroud)