从多于一列的 pandas 数据帧构建 networkx 有向图或流程图

Pun*_*nha 5 python directed-graph networkx dataframe pandas

我有 pandas 数据框,由 10 列组成。

  • 每行包含用户在线执行的一个步骤。总共 10 列,因此所有 10 个步骤过程
  • 假设第一个活动是预订机票,那么步骤是登录网站-->给出 src 目的地时间-->选择座位-->付款--查看

在此输入图像描述

所以每一步都可能发生各种排列,我想从所有数据集中绘制一个有向图。

目前networkx仅支持2列

# libraries
import pandas as pd
import numpy as np
import networkx as nx
import matplotlib.pyplot as plt

# Build your graph
G=nx.from_pandas_dataframe(df, 'src', 'dest',create_using=nx.DiGraph())

# Plot it
nx.draw(G, with_labels=True)
plt.show()
Run Code Online (Sandbox Code Playgroud)

有人可以告诉我如何为两列以上的有向图绘制它吗

Din*_*ari 4

networkxfrom_pandas_dataframe使用add_edges_from,你可以做类似的事情:

# libraries
import pandas as pd
import numpy as np
import networkx as nx
import matplotlib.pyplot as plt

# Build your graph

df = pd.DataFrame(np.random.randn(2,4),columns=list('ABCD')) #Create a 4 column data frame

columns = list(df.columns.values)# Get columns name

g = nx.empty_graph(0, nx.DiGraph()) #initialize an empty graph

for i in range(len(columns)-1):
    g.add_edges_from(zip(df[columns[i]], df[columns[i+1]])) #Create edge between 2 values, between all consecutive coumns

# Plot it
nx.draw(g, with_labels=True)
plt.show()
Run Code Online (Sandbox Code Playgroud)

结果是:

结果图