NumPy 直方图 - ValueError 范围参数必须是有限的 - 输入数组没问题

Fil*_*zzi 4 python numpy histogram python-3.x valueerror

我正在努力理解这个错误,因为我会给你一个有效的例子,而我感兴趣的例子却不

我必须分析一组包含一整年每小时价格的数据,称为sys_prices,经过各种转换后,它是一个numpy.ndarray具有 8785 行(1 列)的对象,每行都是一个numpy.ndarray只有一个元素(一个numpy.float64数字)的项目。

不起作用的代码如下:

stop_day = 95
start_day = stop_day - 10 # 10 days before
stop_day = (stop_day-1)*24
start_day = (start_day-1)*24

pcs=[] # list of prices to analyse
for ii in range(start_day, stop_day):
    pcs.append(sys_prices[ii][0])

p, x = np.histogram(pcs, bins='fd') 
Run Code Online (Sandbox Code Playgroud)

*24部分是调整数据集中的索引,以便遵守每小时分辨率。

我期望的是将列表提供pcs直方图方法,以便将直方图和 bin 边缘的值分别放入px中。

我说我期望如此,因为以下代码有效

start_day = 1 
start_month = 1 
start_year = 2016 
stop_day = 1
stop_month = 2 
stop_year = 2016
num_prices = (date(stop_year, stop_month, stop_day) - date(start_year, start_month, start_day)).days*24

jan_prices = []
for ii in range(num_prices):
    jan_prices.append(sys_prices[ii][0])

p, x = np.histogram(jan_prices, bins='fd') # bin the data`
Run Code Online (Sandbox Code Playgroud)

代码的区别在于,工作代码仅分析从一年中选定的一天开始的任意时间段内的 10 天,而工作示例使用 1 月份的所有价格(例如,前 744 个值)数据集)。

奇怪的事情:我使用了不同的值stop_day,似乎 95 会引发错误,而 99 或 100 或 200则不会

你可以帮帮我吗?

Fil*_*zzi 6

我解决了它,数据集中有一个 NaN 我无法发现。

对于那些想知道如何发现它的人,我只是使用此代码来查找该项目的索引:

nanlist=[]
for ii in range(len(array)):
    if numpy.isnan(array[ii]):
        nanlist.append(ii)
Run Code Online (Sandbox Code Playgroud)

你的容器在哪里array

  • 请注意,您可以使用“np.argwhere(np.isnan(array)))”来执行该循环。 (3认同)