我有一个包含时间序列数据的 csv 文件,第一列是格式中的日期,%Y:%m:%d第二列是格式为“%H:%M:%S”的日内时间。我想将此 csv 文件导入多索引数据框或面板对象。
使用此代码,它已经可以工作:
_file_data = pd.read_csv(_file,
sep=",",
header=0,
index_col=['Date', 'Time'],
thousands="'",
parse_dates=True,
skipinitialspace=True
)
Run Code Online (Sandbox Code Playgroud)
它以以下格式返回数据:
Date Time Volume
2016-01-04 2018-04-25 09:01:29 53645
2018-04-25 10:01:29 123
2018-04-25 10:01:29 1345
....
2016-01-05 2018-04-25 10:01:29 123
2018-04-25 12:01:29 213
2018-04-25 10:01:29 123
Run Code Online (Sandbox Code Playgroud)
第一个问题:我想将第二个索引显示为纯时间对象而不是日期时间。为此,我必须在 read_csv 函数中声明两个不同的日期传递器,但我不知道如何。做到这一点的“最佳”方法是什么?
第二个问题:创建数据框后,我将其转换为面板对象。你会建议这样做吗?面板对象是这种数据结构的更好选择吗?面板对象的优点(缺点)是什么?
我在定量和科学编程方面非常陌生,并且遇到了 scipy 的最小化函数scipy.optimize.fmin。有人可以为非工程专业的学生解释这个函数的基本直觉吗?
Letz 说我想最小化以下功能:
def f(x): x**2
Run Code Online (Sandbox Code Playgroud)
1)最小化器实际上最小化了什么?因变量还是自变量?
2)什么之间的区别scipy.optimize.fmin和scipy.optimize.minimize?