use*_*627 3 python tuples numpy list
我已将文本文件导入到numpy数组中,如下所示.
data=np.genfromtxt(f,dtype=None,delimiter=',',names=None)
Run Code Online (Sandbox Code Playgroud)
其中f包含我的csv文件的路径
现在数据包含以下内容.
array([(534, 116.48482, 39.89821, '2008-02-03 00:00:49'),
(650, 116.4978, 39.98097, '2008-02-03 00:00:02'),
(675, 116.31873, 39.9374, '2008-02-03 00:00:04'),
(715, 116.70027, 40.16545, '2008-02-03 00:00:45'),
(2884, 116.67727, 39.88201, '2008-02-03 00:00:48'),
(3799, 116.29838, 40.04533, '2008-02-03 00:00:37'),
(4549, 116.48405, 39.91403, '2008-02-03 00:00:42'),
(4819, 116.42967, 39.93963, '2008-02-03 00:00:43')],
dtype=[('f0', '<i4'), ('f1', '<f8'), ('f2', '<f8'), ('f3', 'S19')])
Run Code Online (Sandbox Code Playgroud)
如果我现在尝试列切片,即使用提取第一列或第二列
data[:,0]
Run Code Online (Sandbox Code Playgroud)
它说"太多指数".我发现这是由于它的存储方式.所有行都存储为元组而不是列表/数组.我想过使用"最丑"的方式来执行切片而不必使用迭代.那就是将每行中的元组转换为列表并将其放回到numpy数组中.这样的事情
data=np.asarray([list(i) for i in data])
Run Code Online (Sandbox Code Playgroud)
但是对于上面的问题,我正在丢失每列的数据类型.每个元素都将存储为字符串,而不是整数或浮点数,这是在前一种情况下自动检测到的.
现在,如果我想切片列而不必使用迭代,有什么办法吗?
什么np.genfromtext已经为您创建不是元组,这将有数组objectD型,但创纪录的阵列.你可以从奇怪的dtype中看出来:
dtype=[('f0', '<i4'), ('f1', '<f8'), ('f2', '<f8'), ('f3', 'S19')]
Run Code Online (Sandbox Code Playgroud)
每个在清单中的元组保存的相应字段的名称,和其D型细胞,<i4是一个小端4字节整数,<f8一个小端8字节浮点和S19一个19字符长的串.您可以按名称访问字段:
In [2]: x['f0']
Out[2]: array([ 534, 650, 675, 715, 2884, 3799, 4549, 4819])
In [3]: x['f1']
Out[3]:
array([ 116.48482, 116.4978 , 116.31873, 116.70027, 116.67727,
116.29838, 116.48405, 116.42967])
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4097 次 |
| 最近记录: |