我正在执行统计测试,使用10,000个排列作为空分布.
每个排列都是10,000个密钥字典.每个关键词都是一个基因,每个值都是一组对应基因的患者.该字典是以编程方式生成的,可以写入文件并从文件读入.
我希望能够迭代这些排列来执行我的统计测试; 但是,将这个大型列表保留在堆栈上会降低我的性能.
有没有办法将这些字典保存在存储的内存中,并在迭代它们时产生排列?
谢谢!
我希望生成10,000个随机二进制矩阵,其每行和每列具有与给定二进制矩阵相同数量的1.
矩阵约为500×10,000.大概有2,000,000 1s.没有零行或列.
我当前的方法将二进制矩阵转换为二分邻接矩阵,并执行1,000,000个随机边缘切换以保证随机性.对于1个矩阵,这需要13,000秒.我在python中编码,使用networkx的double_edge_swap函数的修改版本.
有没有更有效的方法来生成这样的矩阵?