小编Jon*_* Lu的帖子

处理Python中大型词典列表的最佳方法

我正在执行统计测试,使用10,000个排列作为空分布.

每个排列都是10,000个密钥字典.每个关键词都是一个基因,每个值都是一组对应基因的患者.该字典是以编程方式生成的,可以写入文件并从文件读入.

我希望能够迭代这些排列来执行我的统计测试; 但是,将这个大型列表保留在堆栈上会降低我的性能.

有没有办法将这些字典保存在存储的内存中,并在迭代它们时产生排列?

谢谢!

python dictionary

7
推荐指数
1
解决办法
704
查看次数

生成随机二进制矩阵

我希望生成10,000个随机二进制矩阵,其每行和每列具有与给定二进制矩阵相同数量的1.

矩阵约为500×10,000.大概有2,000,000 1s.没有零行或列.

我当前的方法将二进制矩阵转换为二分邻接矩阵,并执行1,000,000个随机边缘切换以保证随机性.对于1个矩阵,这需要13,000秒.我在python中编码,使用networkx的double_edge_swap函数的修改版本.

有没有更有效的方法来生成这样的矩阵?

python random matrix

7
推荐指数
1
解决办法
1293
查看次数

标签 统计

python ×2

dictionary ×1

matrix ×1

random ×1