小编J C*_*ena的帖子

检查python中networkx中是否存在具有相同标签的节点

我使用以下代码使用networkx构建我的图形,如下所示.

mylist = [('chocolate_pudding', 6.3), ('tim_tam', 178.5), ('bread', 3.5), 
('chocolate_pudding', 8.5), ('tim_tam', 3.0), ('butter', 204.0)]

G = nx.Graph()

for ele in mylist:
    #if node with ele[0] does not exists, add the new node
         G.add_node(ele[0], weight=ele[1])
    #else, update the weight with the new weight value (weight = existing_weight + ele[1])
Run Code Online (Sandbox Code Playgroud)

我想在创建新节点之前检查具有相同标签的节点是否存在.如果节点存在,我想通过将新值添加到现有值来更新其权重.

例如,在上面的例子中,我只想要4个节点chocolate_pudding, tim_tam, bread, butter,它们的权重应14.8, 181.5, 3.5, 204.0分别为.

我没有找到在networkx中这样做的正确方法.因此,请告诉我是否可以在networkx中进行此操作?

python networkx

6
推荐指数
1
解决办法
3297
查看次数

用python中的特定列名过滤pandas数据框

我有一个熊猫数据框和以下列表

mylist = ['nnn', 'mmm', 'yyy']
mydata =
   xxx   yyy zzz nnn ddd mmm
0  0  10      5    5   5  5
1  1   9      2    3   4  4
2  2   8      8    7   9  0
Run Code Online (Sandbox Code Playgroud)

现在,我只想获取其中提到的列mylist并将其另存为csv文件。

     yyy  nnn   mmm
0    10     5     5
1    9      3     4
2    8      7     0
Run Code Online (Sandbox Code Playgroud)

我当前的代码如下。

mydata = pd.read_csv( input_file, header=0)

for item in mylist:
    mydata_new = mydata[item]

print(mydata_new)
mydata_new.to_csv(file_name)
Run Code Online (Sandbox Code Playgroud)

在我看来,我的新数据框产生了错误的结果。请帮我!

python dataframe pandas

5
推荐指数
2
解决办法
1万
查看次数

在Python中获取大多数列表的共同元素

给定 4 个列表,我想获取 3 个或更多列表共有的元素。

a = [1, 2, 3, 4]
b = [1, 2, 3, 4, 5]
c = [1, 3, 4, 5, 6]
d = [1, 2, 6, 7]
Run Code Online (Sandbox Code Playgroud)

因此,输出应该是[1, 2, 3, 4].

我当前的代码如下。

result1 = set(a) & set(b) & set(c)
result2 = set(b) & set(c) & set(d)
result3 = set(c) & set(d) & set(a)
result4 = set(d) & set(a) & set(b)

final_result = list(result1)+list(result2)+list(result3)+list(result4)
print(set(final_result))
Run Code Online (Sandbox Code Playgroud)

它工作正常,并给出所需的输出。但是,我有兴趣知道在 Python 中是否有一种简单的方法可以做到这一点,即:是否有任何内置函数?

python

4
推荐指数
1
解决办法
608
查看次数

DBpedia Spotlight的参数是什么意思?

我对使用DBpedia Spotlight感兴趣。但是,我们需要在两个参数confidencesupport中插入一个值。这两个参数的真正含义是什么?

我想确定文本中重要的,突出的n-gram。在那种情况下,对置信度和支持参数一般建议是什么(经验法则)?

ontology dbpedia spotlight-dbpedia linked-data

4
推荐指数
1
解决办法
217
查看次数

如何从python中的列表中删除重复的元组?

我有一个包含元组列表的列表,如下所示.

mylist = [['xxx', 879], ['yyy', 315], ['xxx', 879], ['zzz', 171], ['yyy', 315]]
Run Code Online (Sandbox Code Playgroud)

我想从中删除重复的元组mylist并获得如下输出.

mylist = [['xxx', 879], ['yyy', 315], ['zzz', 171]]
Run Code Online (Sandbox Code Playgroud)

好像set在python中它不起作用.

mylist = list(set(mylist))
Run Code Online (Sandbox Code Playgroud)

有没有快速简便的方法在python中执行此操作(可能使用库)?

python list duplicates

3
推荐指数
3
解决办法
4122
查看次数

在python中对列表进行排序后如何获取原始索引

我的清单如下。

mylist= [0.0, 0.4, 0.81, 1.0, 0.9, 20.7, 0.0, 0.8, 1.0, 20.7]
Run Code Online (Sandbox Code Playgroud)

我想获取列表中前4个元素的索引(即[5, 9, 3, 8]),并删除值小于或等于1(<=1)的索引。

因此,我的最终输出应该是 [5, 9]

我当前的代码如下:

sorted_mylist = sorted(mylist, reverse = True)[:4]
for ele in sorted_mylist:
    if ele>1:
       print(mylist.index(ele))
Run Code Online (Sandbox Code Playgroud)

但是,它返回[5, 5],这是不正确的。

请让我知道如何在python中解决此问题?

python

3
推荐指数
1
解决办法
2544
查看次数

在python中获取维基百科文章的类别

我正在使用下面提到的代码来检查维基百科页面是否存在。

term = "forensics"
a = urllib.request.urlopen("https://en.wikipedia.org/wiki/"+term).getcode()
print(a) 
Run Code Online (Sandbox Code Playgroud)

如果页面存在(即a == 200),我想获取页面的类别(即,如果类别是计算机科学、工程等)。我们可以在 wikipedia api 中做到这一点吗?

python wikipedia wikipedia-api

2
推荐指数
1
解决办法
2421
查看次数