小编h3r*_*mit的帖子

从 pandas 数据帧创建边缘列表

我想创建一个以权重作为属性的边缘列表(计算对出现的次数 - 例如,对 ab 在同一组中在一起有多少个月)。

数据框包含特定团队中人员的每月快照(每月组中没有重复项)

月年 姓名
2020年6月 A
2020年6月
2020年6月 C
2020年7月 A
2020年7月
2020年7月 d

输出应如下所示(它是无方向性的,因此 ab 对与 ba 相同):

节点1 节点2 重量
A 2
C 1
A C 1
A d 1
d 1

我设法使用以下命令创建一个具有名称组合的新数据框:

df1 = pd.DataFrame(data=list(combinations(df['name'].unique().tolist(), 2)), columns=['node1', 'node2'])
Run Code Online (Sandbox Code Playgroud)

现在我不确定如何迭代这个新数据框来填充权重。如何才能做到这一点?

python networkx dataframe pandas

6
推荐指数
1
解决办法
658
查看次数

标签 统计

dataframe ×1

networkx ×1

pandas ×1

python ×1