所以我完全理解如何使用resample,但文档并没有很好地解释选项.
所以resample函数中的大多数选项都很简单,除了这两个:
因此,通过查看我在网上找到的尽可能多的示例,我可以看到规则,你可以做'D'一天,'xMin'几分钟,'xL'几毫秒,但这就是我能找到的.
对我怎么看到以下内容:'first',np.max,'last','mean',和'n1n2n3n4...nx'其中nx为每列索引的第一个字母.
那么在我缺少的文档中是否有某个地方显示了pandas.resample规则和输入的每个选项?如果是的话,因为我找不到它.如果不是,那么他们的选择是什么?
假设我有一个时间戳列datetime的pandas.DataFrame.例如,时间戳以秒为单位分辨率.我想在10分钟[1]水桶/垃圾箱中装箱/垃圾箱.我知道我可以datetime将整数时间戳表示为整数,然后使用直方图.有更简单的方法吗?内置的东西pandas?
[1] 10分钟只是一个例子.最终,我想使用不同的分辨率.
我有一个带有datetime列的pandas数据框。我想根据该日期列绘制行的分布,但是我当前遇到一个无用的错误。我有:
df['Date'] = pd.to_datetime(df['Date'], errors='raise')
s = sns.distplot(df['Date'])
Run Code Online (Sandbox Code Playgroud)
引发错误:
TypeError: ufunc add cannot use operands with types dtype('<M8[ns]') and dtype('<M8[ns]')
Run Code Online (Sandbox Code Playgroud)
如果我将要打印的列更改为数字数据,则一切正常。如何使datetime列表现良好?我在文档中找不到真正需要的东西。任何和所有帮助表示赞赏。
以下是的结果df.head(2),出于安全原因等原因,我删除了一些列:
Date
2812 2016-03-05
2813 2016-03-05
Run Code Online (Sandbox Code Playgroud)
显然,列(当作为系列时)具有属性
Name: Date, dtype: datetime64[ns]
Run Code Online (Sandbox Code Playgroud) 我有一个文件(.dat)格式的数据
%dd%mm%yyyy%HH%MM%SS值
由空格分隔.我想在x轴上绘制日,月,年和时间,在y轴上绘制值.它应该始终从文件中读取它,因为我有许多非常大的文件需要分析.
我的最新尝试:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
from time import gmtime, strftime
date, time, level = np.loadtxt('my_file.txt', unpack=True, usecols = (0,1,2,3), converters={ 0,1: mdates.strpdate2num('%dd/%mm/%YY %HH:%MM')}) #read format of file
# then to plot
plt.plot_date(x=date, y=level, fmt='%dd/%mm/%YY %HH:%MM') # fmt is changed from r-
plt.title('title')
plt.ylabel('Waterlevel (m)')
plt.grid(True)
plt.show()
Run Code Online (Sandbox Code Playgroud)