Python Dash 刷新页面不更新源数据

Tit*_*rth 4 python plotly-dash

我编写了一个基本的绘图破折号应用程序,它从 csv 中提取数据并将其显示在图表上。然后,您可以在应用程序上切换值并更新图表。

但是,当我向 csv 添加新数据(每天一次)时,应用程序不会在刷新页面时更新数据。

解决方法通常是将您定义app.layout为一个函数,如此处所述(向下滚动到页面加载时的更新)。您将在下面的代码中看到我已经做到了这一点。

这是我的代码:

import dash
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output
import numpy as np

import pandas as pd

external_stylesheets = ['https://codepen.io/chriddyp/pen/bWLwgP.css']

app = dash.Dash(__name__, external_stylesheets=external_stylesheets)

path = 'https://raw.githubusercontent.com/tbuckworth/Public/master/CSVTest.csv'

df = pd.read_csv(path)
df2 = df[(df.Map==df.Map)]


def layout_function():

    df = pd.read_csv(path)
    df2 = df[(df.Map==df.Map)]
    
    available_strats = np.append('ALL',pd.unique(df2.Map.sort_values()))
    classes1 = pd.unique(df2["class"].sort_values())
    metrics1 = pd.unique(df2.metric.sort_values())
    
    return html.Div([
            html.Div([
                dcc.Dropdown(
                    id="Strategy",
                    options=[{"label":i,"value":i} for i in available_strats],
                    value=list(available_strats[0:1]),
                    multi=True
                ),
                dcc.Dropdown(
                    id="Class1",
                    options=[{"label":i,"value":i} for i in classes1],
                    value=classes1[0]
                ),
                dcc.Dropdown(
                    id="Metric",
                    options=[{"label":i,"value":i} for i in metrics1],
                    value=metrics1[0]
                )],
            style={"width":"20%","display":"block"}),
                
        html.Hr(),
    
        dcc.Graph(id='Risk-Report')          
    ])
            
app.layout = layout_function


@app.callback(
        Output("Risk-Report","figure"),
        [Input("Strategy","value"),
         Input("Class1","value"),
         Input("Metric","value"),
         ])

def update_graph(selected_strat,selected_class,selected_metric):
    if 'ALL' in selected_strat:
        df3 = df2[(df2["class"]==selected_class)&(df2.metric==selected_metric)]
    else:
        df3 = df2[(df2.Map.isin(selected_strat))&(df2["class"]==selected_class)&(df2.metric==selected_metric)]
    df4 = df3.pivot_table(index=["Fund","Date","metric","class"],values="value",aggfunc="sum").reset_index()
    traces = []
    for i in df4.Fund.unique():
        df_by_fund = df4[df4["Fund"] == i]
        traces.append(dict(
                x=df_by_fund["Date"],
                y=df_by_fund["value"],
                mode="lines",
                name=i
                ))
    
    if selected_class=='USD':
        tick_format=None
    else:
        tick_format='.2%'
    
    return {
            'data': traces,
            'layout': dict(
                xaxis={'type': 'date', 'title': 'Date'},
                yaxis={'title': 'Values','tickformat':tick_format},
                margin={'l': 40, 'b': 40, 't': 10, 'r': 10},
                legend={'x': 0, 'y': 1},
                hovermode='closest'
            )
        }
    

if __name__ == '__main__':
    app.run_server(debug=True)
Run Code Online (Sandbox Code Playgroud)

我尝试过的事情

  1. df = pd.read_csv(path)删除之前的首字母def layout_function():。这会导致错误。
  2. 使用以下代码创建回调按钮来刷新数据:
@app.callback(
        Output('Output-1','children'),
        [Input('reload_button','n_clicks')]        
        )

def update_data(nclicks):
    if nclicks == 0:
        raise PreventUpdate
    else:
        df = pd.read_csv(path)
        df2 = df[(df.Map==df.Map)]
        return('Data refreshed. Click to refresh again')
Run Code Online (Sandbox Code Playgroud)

这不会产生错误,但该按钮也不会刷新数据。

  1. df在回调中定义update_graph。每次切换某些内容时都会更新数据,这是不切实际的(我的真实数据> 10^6 行,所以我不想每次用户更改切换值时都读取它)

简而言之,我认为定义app.layout = layout_function应该使这项工作可行,但事实并非如此。我错过/没有看到什么?

感谢任何帮助。

emh*_*her 8

太长了;我建议您只需从回调中加载数据即可。如果加载时间太长,您可以更改格式(例如羽化)和/或通过预处理减小数据大小。如果这仍然不够快,下一步是将数据存储在服务器端内存缓存中,例如Redis


由于您正在重新分配df和,这些变量df2Python 中layout_function被视为本地变量,因此您不会在全局范围内修改和变量。虽然您可以使用global 关键字来实现此行为,但在 Dash 中不鼓励使用全局变量dfdf2

Dash 中的标准方法是在回调(或 )中加载数据layout_function并将其存储在Store对象(或等效的隐藏对象Div)中。结构会是这样的

import pandas as pd
import dash_core_components as dcc
from dash.dependencies import Output, Input

app.layout = html.Div([
    ...
    dcc.Store(id="store"), html.Div(id="trigger")
])

@app.callback(Output('store','data'), [Input('trigger','children')], prevent_initial_call=False)
def update_data(children):
    df = pd.read_csv(path)
    return df.to_json()

@app.callback(Output("Risk-Report","figure"), [Input(...)], [State('store', 'data')])
def update_graph(..., data):
    if data is None:
        raise PreventUpdate
    df = pd.read_json(data)
    ...
Run Code Online (Sandbox Code Playgroud)

但是,这种方法通常比仅在回调内从磁盘读取数据慢得多(这似乎是您试图避免的),因为它会导致数据在服务器和客户端之间传输。