我有一个 Python 脚本,使用该parser包设置选项标志(例如-d dataset等-s size,最后将结果写入文件中)。如何多次(顺序)运行该命令,每次运行使用不同的选项标志?
我需要这样的东西:
datasets = [a,b,c]
sizes = [100,200,300]
for dataset in dataset: #specify parameters
for size in sizes: #specify more parameters
python script.py -d dataset -s size #run script
Run Code Online (Sandbox Code Playgroud)
最好的(甚至是“a”)方法是什么?
我有一个包含数百万条记录的数据集,其中包含 100,000 个用户,他们购买了 20,000 件商品的子集,格式如下:
<user1, item1>
<user1, item12>
...
<user100,000, item>
Run Code Online (Sandbox Code Playgroud)
我需要跟踪一个大小(物品 x 用户)=(20,000 x 100,000)的矩阵,如果用户购买了物品,则为 1,否则为 0。目前我使用的是传统的 numpy 数组,但在后面的步骤中处理它需要很长时间。任何人都可以推荐一种使用 SciPy 稀疏矩阵之一的有效方法,它仍然允许基于索引搜索矩阵?