相关疑难解决方法(0)

可预测地生成大量伪随机数据

我购买了便宜的 2 TB HDD(每个 60 欧元),并想在使用它们之前检查它们是否返回读取时提供的数据。我检查了一些廉价的拇指驱动器,方法是复制我放在它们身边的大文件并检查它们返回的数据的哈希值(并发现那些在实际存储容量耗尽后将数据扔掉的)。不幸的是,我没有任何 2 TB 的文件。

我现在想生成 2 TB 的伪随机数据,将其写入磁盘,然后对磁盘进行散列。然后我想将相同的数据直接写入散列函数并获得它应该以这种方式产生的散列。伪随机函数不必以任何方式加密安全,它只需要快速生成具有高熵的数据。

如果我编写的脚本只是对包含数字的变量进行散列,将散列打印到标准输出,增加变量并重复,则数据速率太慢,即使在使用快速 CPU 时也是如此。像 5 个数量级太慢(甚至不是 60 kByte/s)。

现在,我可以尝试这样做,tee但这似乎是一个非常糟糕的主意,我不能一遍又一遍地重现相同的数据。

理想情况下,我会向程序传递一些简短的参数(一个数字、一个字符串,我不在乎)并在其标准输出中获取任意大量的数据,并且每次调用时这些数据都是相同的。

random

8
推荐指数
1
解决办法
827
查看次数

标签 统计

random ×1