小编Key*_*i0r的帖子

使用不同的选项标志多次执行 Python 脚本

我有一个 Python 脚本,使用该parser包设置选项标志(例如-d dataset-s size,最后将结果写入文件中)。如何多次(顺序)运行该命令,每次运行使用不同的选项标志?

我需要这样的东西:

datasets = [a,b,c]
sizes = [100,200,300]

for dataset in dataset:                           #specify parameters
    for size in sizes:                            #specify more parameters
         python script.py -d dataset -s size      #run script
Run Code Online (Sandbox Code Playgroud)

最好的(甚至是“a”)方法是什么?

bash python-2.7

3
推荐指数
1
解决办法
6510
查看次数

用户、项目对的稀疏矩阵实现

我有一个包含数百万条记录的数据集,其中包含 100,000 个用户,他们购买了 20,000 件商品的子集,格式如下:

<user1, item1>
<user1, item12>
...
<user100,000, item>
Run Code Online (Sandbox Code Playgroud)

我需要跟踪一个大小(物品 x 用户)=(20,000 x 100,000)的矩阵,如果用户购买了物品,则为 1,否则为 0。目前我使用的是传统的 numpy 数组,但在后面的步骤中处理它需要很长时间。任何人都可以推荐一种使用 SciPy 稀疏矩阵之一的有效方法,它仍然允许基于索引搜索矩阵?

numpy matrix scipy sparse-matrix python-2.7

2
推荐指数
1
解决办法
1823
查看次数

标签 统计

python-2.7 ×2

bash ×1

matrix ×1

numpy ×1

scipy ×1

sparse-matrix ×1