小编Sre*_*ndh的帖子

将分隔符分隔的字符串转换为numpy数组的有效方法

我有一个字符串如下:

1|234|4456|789
Run Code Online (Sandbox Code Playgroud)

我必须把它转换成numpy数组.我想知道最有效的方法.因为我将调用这个函数超过5000万次!

python numpy

12
推荐指数
3
解决办法
1万
查看次数

亚马逊EC2与PiCloud

我们是学生试图处理大约1.4亿条记录的数据大小并试图运行一些机器学习算法.我们是整个云解决方案和mahout实现的新手.目前我们已经在postgresql数据库中设置它们但是当前的实现没有扩展,并且在经过多次性能调整后,读/写操作似乎非常慢.因此我们计划寻求基于云的服务.

我们已经探索了一些可能的替代方案.

  1. 亚马逊云服务(Mahout实施)
  2. 带有scikits的Picloud学习(我们计划在NumPy中使用HDF5格式)
  3. 如果有的话,请推荐任何其他选择.

以下是以下问题

  1. 哪会产生更好的结果(转变时间)并且具有成本效益?请提及我们存在的任何其他替代品.
  2. 如果我们设置亚马逊服务,我们应该如何拥有数据格式?如果我们使用dynamodb,成本会上升吗?

谢谢

hadoop numpy machine-learning amazon-ec2 mahout

6
推荐指数
2
解决办法
1985
查看次数

标签 统计

numpy ×2

amazon-ec2 ×1

hadoop ×1

machine-learning ×1

mahout ×1

python ×1