Networkx:如何从csv文件创建图形边缘?

Viv*_*P20 5 python csv graph networkx python-2.7

我正在尝试使用networkx创建图,到目前为止,我已经从以下文本文件创建了节点:文件1(user_id.txt)样本数据:

user_000001
user_000002
user_000003
user_000004
user_000005
user_000006
user_000007
Run Code Online (Sandbox Code Playgroud)

文件2(user_country.txt)样本数据:如果用户未输入其国家/地区详细信息,也将包含少量空白行

 Japan
 Peru
 United States

 Bulgaria
 Russian Federation
 United States
Run Code Online (Sandbox Code Playgroud)

文件3(user_agegroup.txt)数据:包含四个年龄段

 [12-18],[19-25],[26-32],[33-39]
Run Code Online (Sandbox Code Playgroud)

我还有另外两个文件,其中包含以下示例数据,用于在图形中添加边

文件4(id,agegroup.txt)

user_000001,[19-25]
user_000002,[19-25]
user_000003,[33-39]
user_000004,[19-25]
user_000005,[19-25]
user_000006,[19-25]
user_000007,[26-32]
Run Code Online (Sandbox Code Playgroud)

文件5(id,country.txt)

(user_000001,Japan)
(user_000002,Peru)
(user_000003,United States)
(user_000004,)
(user_000005,Bulgaria)
(user_000006,Russian Federation)
(user_000007,United States)
Run Code Online (Sandbox Code Playgroud)

到目前为止,我已经编写了以下代码来绘制仅包含节点的图形:(请检查代码,因为print g.number_of_nodes() 尽管print g.nodes()显示了正确的节点数,但从不打印正确的节点数。)

import csv
import networkx as nx
import matplotlib.pyplot as plt
g=nx.Graph()

#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1: 
    g.add_nodes_from(row)
    nx.draw_circular(g,node_color='blue')

#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
    g.add_nodes_from(row) 
    nx.draw_circular(g,node_color='red')

#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
    g.add_nodes_from(row)
    nx.draw_random(g,node_color='yellow')

print g.nodes()
plt.savefig("path.png")
print g.number_of_nodes()
plt.show()
Run Code Online (Sandbox Code Playgroud)

除此之外,我不知道如何从file4和file5添加边。对此代码的任何帮助将不胜感激。谢谢。

Abd*_*ehy 3

为了简单起见,我在 user_id.txt 和 id,country.txt 文件中创建了用户 ID [1,2,3,4,5,6,7]。您的代码中存在一些问题:

1-首先向图表添加一些节点(例如从 user_id.txt 文件),然后绘制它,然后从另一个文件向图表添加一些其他节点,然后在同一个图上再次重新绘制整个图表。所以,最后你在一张图中就有了很多图。

2-您使用了draw_circular方法绘制了两次,这就是为什么蓝色节点从未出现,因为它们被“红色”节点覆盖。

我对你的代码做了一些更改,最终只绘制一次。为了用所需的颜色绘制节点,我在添加节点时添加了一个名为颜色的属性。然后我使用这个属性构建一个颜色图,并将其发送给draw_networkx函数。最后,由于 id,country.txt 中的空字段,添加边有点棘手,因此我必须在创建图之前删除空节点。这是代码和随后出现的图。

G=nx.Graph()

#extract and add AGE_GROUP nodes in graph
f1 = csv.reader(open("user_agegroup.txt","rb"))
for row in f1: 
    G.add_nodes_from(row, color = 'blue')

#extract and add COUNTRY nodes in graph
f2 = csv.reader(open('user_country.txt','rb'))
for row in f2:
    G.add_nodes_from(row, color = 'red') 

#extract and add USER_ID nodes in graph
f3 = csv.reader(open('user_id.txt','rb'))
for row in f3:
    G.add_nodes_from(row, color = 'yellow')

f4 = csv.reader(open('id,agegroup.txt','rb'))
for row in f4:
    if len(row) == 2 : # add an edge only if both values are provided
        G.add_edge(row[0],row[1])

f5 = csv.reader(open('id,country.txt','rb'))

for row in f5:
    if len(row) == 2 : # add an edge only if both values are provided
        G.add_edge(row[0],row[1])
# Remove empty nodes
for n in G.nodes():
    if n == '':
        G.remove_node(n)
# color nodes according to their color attribute
color_map = []
for n in G.nodes():
    color_map.append(G.node[n]['color'])
nx.draw_networkx(G, node_color = color_map, with_labels = True, node_size = 500)

plt.savefig("path.png")

plt.show()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述