Matplotlib:如何在使用日期时间轴绘图时跳过一个小时范围?

mtc*_*tcg 6 python datetime matplotlib pandas

我有一个金融工具的逐笔报价数据,我试图使用matplotlib. 我正在使用pandas,并且数据是用DatetimeIndex.

问题是,当我尝试绘制多个交易日时,我无法跳过市场收盘时间和第二天开盘之间的时间范围(参见示例),这当然是我不感兴趣的。

有没有办法让 matplotlib 忽略这一点,而只是将结束语与第二天的开盘“粘”在一起?我试图传递一个自定义的时间范围:

plt.xticks(time_range)
Run Code Online (Sandbox Code Playgroud)

但结果是一样的。任何想法如何做到这一点?

# Example data
instrument = pd.DataFrame(data={
    'Datetime': [
        dt.datetime.strptime('2018-01-11 11:00:11', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-11 13:02:17', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-11 16:59:14', '%Y-%m-%d %H:%M:%S'),

        dt.datetime.strptime('2018-01-12 11:00:11', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-12 13:15:24', '%Y-%m-%d %H:%M:%S'),
        dt.datetime.strptime('2018-01-12 16:58:43', '%Y-%m-%d %H:%M:%S')
    ],
    'Price': [127.6, 128.1, 127.95, 129.85, 129.7, 131.2],
    'Volume': [725, 146, 48, 650, 75, 160]
}).set_index('Datetime')

plt.figure(figsize=(10,5))
top = plt.subplot2grid((4,4), (0, 0), rowspan=3, colspan=4)
bottom = plt.subplot2grid((4,4), (3,0), rowspan=1, colspan=4)
top.plot(instrument.index, instrument['Price'])
bottom.bar(instrument.index, instrument['Volume'], 0.005) 

top.xaxis.get_major_ticks()
top.axes.get_xaxis().set_visible(False)
top.set_title('Example')
top.set_ylabel('Price')
bottom.set_ylabel('Volume')
Run Code Online (Sandbox Code Playgroud)

例子

Pat*_*ald 5

长话短说

替换 matplotlib 绘图函数:

top.plot(instrument.index, instrument['Price'])
bottom.bar(instrument.index, instrument['Volume'], 0.005)
Run Code Online (Sandbox Code Playgroud)

有了这些:

top.plot(range(instrument.index.size), instrument['Price'])
bottom.bar(range(instrument.index.size), instrument['Volume'], width=1)
Run Code Online (Sandbox Code Playgroud)

或者使用这些 pandas 绘图函数(只有 x 轴限制看起来不同):

instrument['Price'].plot(use_index=False, ax=top)
instrument['Volume'].plot.bar(width=1, ax=bottom)
Run Code Online (Sandbox Code Playgroud)

通过共享 x 轴来对齐两个图,并sharex=True使用数据帧索引根据需要设置刻度,如下面的示例所示。




让我首先创建一个示例数据集,并展示如果使用 matplotlib 绘图函数绘制它会是什么样子,就像在您的示例中使用 用作DatetimeIndexx 变量一样。


创建样本数据集

示例数据是使用pandas_market_calendarsDatetimeIndex包创建的,以创建跨越几个工作日和周末的按分钟频率的真实数据。

import numpy as np                        # v 1.19.2
import pandas as pd                       # v 1.1.3
import matplotlib.pyplot as plt           # v 3.3.2
import matplotlib.ticker as ticker
import pandas_market_calendars as mcal    # v 1.6.1

# Create datetime index with a 'minute start' frequency based on the New
# York Stock Exchange trading hours (end date is inclusive)
nyse = mcal.get_calendar('NYSE')
nyse_schedule = nyse.schedule(start_date='2021-01-07', end_date='2021-01-11')
nyse_dti = mcal.date_range(nyse_schedule, frequency='1min', closed='left')\
               .tz_convert(nyse.tz.zone)
# Remove timestamps of closing times to create a 'period start' datetime index
nyse_dti = nyse_dti.delete(nyse_dti.indexer_at_time('16:00'))

# Create sample of random data consisting of opening price and
# volume of financial instrument traded for each period
rng = np.random.default_rng(seed=1234)  # random number generator
price_change = rng.normal(scale=0.1, size=nyse_dti.size)
price_open = 127.5 + np.cumsum(price_change)
volume = rng.integers(100, 10000, size=nyse_dti.size)
df = pd.DataFrame(data=dict(Price=price_open, Volume=volume), index=nyse_dti)
Run Code Online (Sandbox Code Playgroud)
df.head()

#                             Price       Volume
#  2021-01-07 09:30:00-05:00  127.339616  7476
#  2021-01-07 09:31:00-05:00  127.346026  3633
#  2021-01-07 09:32:00-05:00  127.420115  1339
#  2021-01-07 09:33:00-05:00  127.435377  3750
#  2021-01-07 09:34:00-05:00  127.521752  7354
Run Code Online (Sandbox Code Playgroud)

使用 DatetimeIndex 使用 matplotlib 绘制数据

现在可以使用 matplotlib 绘图函数(如示例中所示)绘制此示例数据,但请注意,子图是通过使用plt.subplotswithsharex=True参数创建的。这会将线条与条正确对齐,并且可以将 matplotlib 的交互式界面与两个子图一起使用。

# Create figure and plots using matplotlib functions
fig, (top, bot) = plt.subplots(2, 1, sharex=True, figsize=(10,5),
                               gridspec_kw=dict(height_ratios=[0.75,0.25]))
top.plot(df.index, df['Price'])
bot.bar(df.index, df['Volume'], 0.0008)

# Set title and labels
top.set_title('Matplotlib plots with unwanted gaps', pad=20, size=14, weight='semibold')
top.set_ylabel('Price', labelpad=10)
bot.set_ylabel('Volume', labelpad=10);
Run Code Online (Sandbox Code Playgroud)

mpl_plots_gaps



使用一系列整数,使用 matplotlib 绘制没有任何间隙的数据

这些间隙的问题可以通过简单地忽略DatetimeIndex并使用一系列整数来解决。大部分工作在于创建适当的刻度标签。这是一个例子:

# Create figure and matplotlib plots with some additional formatting
fig, (top, bot) = plt.subplots(2, 1, sharex=True, figsize=(10,5),
                               gridspec_kw=dict(height_ratios=[0.75,0.25]))
top.plot(range(df.index.size), df['Price'])
top.set_title('Matplotlib plots without any gaps', pad=20, size=14, weight='semibold')
top.set_ylabel('Price', labelpad=10)
top.grid(axis='x', alpha=0.3)
bot.bar(range(df.index.size), df['Volume'], width=1)
bot.set_ylabel('Volume', labelpad=10)

# Set fixed major and minor tick locations
ticks_date = df.index.indexer_at_time('09:30')
ticks_time = np.arange(df.index.size)[df.index.minute == 0][::2] # step in hours
bot.set_xticks(ticks_date)
bot.set_xticks(ticks_time, minor=True)

# Format major and minor tick labels
labels_date = [maj_tick.strftime('\n%d-%b').replace('\n0', '\n')
               for maj_tick in df.index[ticks_date]]
labels_time = [min_tick.strftime('%I %p').lstrip('0').lower()
               for min_tick in df.index[ticks_time]]
bot.set_xticklabels(labels_date)
bot.set_xticklabels(labels_time, minor=True)
bot.figure.autofmt_xdate(rotation=0, ha='center', which='both')
Run Code Online (Sandbox Code Playgroud)

mpl_plots_nogaps



为交互式绘图创建动态刻度

如果您喜欢使用 matplotlib 的交互式界面(带有平移/缩放),则需要使用matplotlib 股票代码模块中的定位器和格式化程序。以下是如何设置刻度的示例,其中主要刻度是固定的并且格式如上,但次要刻度会在您放大/缩小绘图时自动生成:

# Set fixed major tick locations and automatic minor tick locations
ticks_date = df.index.indexer_at_time('09:30')
bot.set_xticks(ticks_date)
bot.xaxis.set_minor_locator(ticker.AutoLocator())

# Format major tick labels
labels_date = [maj_tick.strftime('\n%d-%b').replace('\n0', '\n')
               for maj_tick in df.index[ticks_date]]
bot.set_xticklabels(labels_date)

# Format minor tick labels
def min_label(x, pos):
    if 0 <= x < df.index.size:
        return df.index[int(x)].strftime('%H:%M')
min_fmtr = ticker.FuncFormatter(min_label)
bot.xaxis.set_minor_formatter(min_fmtr)

bot.figure.autofmt_xdate(rotation=0, ha='center', which='both')
Run Code Online (Sandbox Code Playgroud)

文档:替代解决方案的示例日期时间字符串格式代码