使用 mdates 和 matplotlib 将 x 轴设置为日期

J.H*_*.H. 2 python matplotlib pandas seaborn

我正在加载这些包:

import pandas as pd
from matplotlib import pyplot as plt
import numpy
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib
import matplotlib.dates as mdates
sns.set()
%matplotlib inline
Run Code Online (Sandbox Code Playgroud)

我有一个df看起来像这样的数据框

df['element_date'] = pd.to_datetime(df['element_date'])
df['mdate'] = [mdates.date2num(d) for d in df['element_date']]
df.head()

id            Tier    element     element_date           mdate
5228039     Tier B      4      2018-05-28 10:59:00  736842.457639
5232263     Tier B      3      2018-05-28 10:59:00  736842.457639
5245478     Tier B      EA     2018-05-27 13:58:00  736841.581944
4975552     Tier B      2      2018-05-30 21:01:00  736844.875694
4975563     Tier A      2      2018-05-30 21:01:00  736844.875694
Run Code Online (Sandbox Code Playgroud)

我试图将计数图的 x 轴设置为仅月和日,但收到一条错误消息。这是我正在运行的代码(我删除了命名标签以节省空间):

fig, ax = plt.subplots(figsize=(15,10))
fig = sns.countplot(x="mdate", hue="element", data=df)
ax.xaxis.set_major_formatter(mdates.DateFormatter('%m-%d'))
plt.show(fig)
Run Code Online (Sandbox Code Playgroud)

我越来越 DateFormatter found a value of x=0, which is an illegal date. This usually occurs because you have not informed the axis that it is plotting dates, e.g., with ax.xaxis_date()

现在,我当然尝试添加ax.xaxis_date(),但无济于事。我也没有等于 0 的 x 值。我已经删除了 NA,并且值计数为 mdate,并且找不到 0。

我在这里看了一堆不同的答案,似乎无法找到解决方案。我已经尝试使用element_date作为我的日期时间值,以及使用“mathplotlib”日期使用mdate.

任何想法将不胜感激。本质上,我只是想让我的 x 轴成为两个月内的有序日期系列,每个日期都计算元素。

谢谢!

Par*_*ait 5

在 GitHub pandas 问题页面上,用户 @pawaller 找到了一种解决方法,使用plt.FixedFormatter字符串格式化日期时间数据帧列。

ax.xaxis.set_major_formatter(plt.FixedFormatter(df['element_date'].dt.strftime("%m-%d")))
Run Code Online (Sandbox Code Playgroud)

但是,由于值标签乱序且未正确对齐,因此无法立即使用上述方法。因此,unique()并且sort_values()是必需的:

x_dates = df['element_date'].dt.strftime('%m-%d').sort_values().unique()
ax.xaxis.set_major_formatter(plt.FixedFormatter(x_dates))
Run Code Online (Sandbox Code Playgroud)

演示如下(从不使用mdate列):

数据

from io import StringIO
...

txt = '''id            Tier    element     element_date           mdate
5228039     "Tier B"      4      "2018-05-28 10:59:00"  736842.457639
5232263     "Tier B"      3      "2018-05-28 10:59:00"  736842.457639
5245478     "Tier B"      EA     "2018-05-27 13:58:00"  736841.581944
4975552     "Tier B"      2      "2018-05-30 21:01:00"  736844.875694
4975563     "Tier A"      2      "2018-05-30 21:01:00"  736844.875694'''

df = pd.read_table(StringIO(txt), sep="\s+", parse_dates=[3])
Run Code Online (Sandbox Code Playgroud)

阴谋

fig, ax = plt.subplots(figsize=(13,4))

fig = sns.countplot(x="element_date", hue="element", data=df, ax=ax)

x_dates = df['element_date'].dt.strftime('%m-%d').sort_values().unique()
ax.xaxis.set_major_formatter(plt.FixedFormatter(x_dates))

plt.legend(loc='upper left')
plt.show()
plt.close()
Run Code Online (Sandbox Code Playgroud)

绘图输出