Mwi*_*s03 12 python numpy matplotlib
我在python中使用源数据的文本文件创建图形,使用matplotlib绘制图形.下面的简单逻辑很有效.
但有没有办法让numpy.gentfromtxt只读取文件'temperature_logging'中的前50行?目前它读取整个文件.
temp = numpy.genfromtxt('temperature_logging',dtype=None,usecols=(0))
time = numpy.genfromtxt('temperature_logging',dtype=None,usecols=(1))
dates = matplotlib.dates.datestr2num(time)
pylab.plot_date(dates,temp,xdate=True,fmt='b-')
pylab.savefig('gp.png')
Run Code Online (Sandbox Code Playgroud)
温度记录中的内容;
21.75 12-01-2012-15:53:35
21.75 12-01-2012-15:54:35
21.75 12-01-2012-15:55:35
.
.
.
Run Code Online (Sandbox Code Playgroud)
sen*_*rle 12
numpy.genfromtxt接受迭代器和文件.这意味着它将接受输出itertools.islice.这test.txt是一个五行文件:
>>> import itertools, numpy
>>> with open('test.txt') as t_in:
... numpy.genfromtxt(itertools.islice(t_in, 3))
...
array([[ 1., 2., 3., 4., 5.],
[ 6., 7., 8., 9., 10.],
[ 11., 12., 13., 14., 15.]])
Run Code Online (Sandbox Code Playgroud)
有人可能会认为这比numpy处理文件IO 要慢,但快速测试表明不然.genfromtxt提供了一个skip_footer关键字参数,如果你知道文件有多长,你可以使用它...
>>> numpy.genfromtxt('test.txt', skip_footer=2)
array([[ 1., 2., 3., 4., 5.],
[ 6., 7., 8., 9., 10.],
[ 11., 12., 13., 14., 15.]])
Run Code Online (Sandbox Code Playgroud)
...但是对1000行文件进行的一些非正式测试表明,islice即使您只跳过几行,使用速度也会更快:
>>> def get(nlines, islice=itertools.islice):
... with open('test.txt') as t_in:
... numpy.genfromtxt(islice(t_in, nlines))
...
>>> %timeit get(3)
1000 loops, best of 3: 338 us per loop
>>> %timeit numpy.genfromtxt('test.txt', skip_footer=997)
100 loops, best of 3: 4.92 ms per loop
>>> %timeit get(300)
100 loops, best of 3: 5.04 ms per loop
>>> %timeit numpy.genfromtxt('test.txt', skip_footer=700)
100 loops, best of 3: 8.48 ms per loop
>>> %timeit get(999)
100 loops, best of 3: 16.2 ms per loop
>>> %timeit numpy.genfromtxt('test.txt', skip_footer=1)
100 loops, best of 3: 16.7 ms per loop
Run Code Online (Sandbox Code Playgroud)