Nou*_*our 5 numpy matplotlib pandas arcpy
我正在尝试为某些数据设置 ARIMA 模型,为此,我在时间序列中使用了“autocorrelation_plot()”。然而它会产生标题中的错误。
我有一个属性表,其中包括日期和时间字段。我提取了它们(将属性表转换为 numpy 表后),将它们放入“datetime”变量中并将它们全部附加到列表中:
O,A = [],[]
dt = datetime.strptime(dt1, "%Y/%m/%d %H:%M")
A.append(dt)
Run Code Online (Sandbox Code Playgroud)
然后我尝试创建时间序列并打印它们以确保结果:
data2 = pd.Series(A, O)
print data2
Run Code Online (Sandbox Code Playgroud)
结果令人满意,直到我决定自动关联:
自相关命令:
autocorrelation_plot(data2)
Run Code Online (Sandbox Code Playgroud)
执行此命令后,返回:
TypeError: ufunc add 无法使用类型为 dtype('M8[ns]') 和 dtype('M8[ns]') 的操作数
我猜这是由于 datetime.strptime 转换为 numpy 造成的?我尝试遵循之前问题 index.to_pydatetime()、 dtype、M8[ns] error ...的一些建议,但徒劳。
最小可重现示例:
from pandas import datetime
from pandas import DataFrame
import pandas as pd
from matplotlib import pyplot as plt
from pandas.tools.plotting import autocorrelation_plot
arr = arcpy.da.TableToNumPyArray(inTable ,("PROVINCE","ZONE_CODE","MEAN", "Datetime","Time"))
arr_length = len(arr)
j = 1
O,A = [],[]
while j<=55: #I have 55 provinces
i = 0
while i<arr_length:
if arr[i][1]== j:
O.append(arr[i][2])
c = str(arr[i][3])
d = str(c[0:4]+"/"+c[5:7]+"/"+c[8:10])
t = str(arr[i][4])
if t=="10":
dt1 = str(d+" 10:00")
else:
dt1 = str(d+" 14:00")
dt = datetime.strptime(dt1, "%Y/%m/%d %H:%M")
A.append(dt)
i = i+1
data2 = pd.Series(A, O)
print data2
autocorrelation_plot(data2)
del A[:]
del O[:]
j += 1
Run Code Online (Sandbox Code Playgroud)
结果截图: 结果
小智 2
我用这个来解决我的问题:
import matplotlib.dates as mpl_dates
df.reset_index(inplace=True)
df['Date']=df['Date'].apply(mpl_dates.date2num)
df = df.astype(float)
Run Code Online (Sandbox Code Playgroud)