小编J C*_*ena的帖子

检查python中networkx中是否存在具有相同标签的节点

我使用以下代码使用networkx构建我的图形,如下所示.

mylist = [('chocolate_pudding', 6.3), ('tim_tam', 178.5), ('bread', 3.5), 
('chocolate_pudding', 8.5), ('tim_tam', 3.0), ('butter', 204.0)]

G = nx.Graph()

for ele in mylist:
    #if node with ele[0] does not exists, add the new node
         G.add_node(ele[0], weight=ele[1])
    #else, update the weight with the new weight value (weight = existing_weight + ele[1])

Run Code Online (Sandbox Code Playgroud)

我想在创建新节点之前检查具有相同标签的节点是否存在.如果节点存在,我想通过将新值添加到现有值来更新其权重.

例如,在上面的例子中,我只想要4个节点chocolate_pudding, tim_tam, bread, butter,它们的权重应14.8, 181.5, 3.5, 204.0分别为.

我没有找到在networkx中这样做的正确方法.因此,请告诉我是否可以在networkx中进行此操作？

python networkx

J C*_*ena

lucky-day

6
推荐指数

1
解决办法

3297
查看次数

用python中的特定列名过滤pandas数据框

我有一个熊猫数据框和以下列表

mylist = ['nnn', 'mmm', 'yyy']
mydata =
   xxx   yyy zzz nnn ddd mmm
0  0  10      5    5   5  5
1  1   9      2    3   4  4
2  2   8      8    7   9  0

Run Code Online (Sandbox Code Playgroud)

现在，我只想获取其中提到的列mylist并将其另存为csv文件。

即

     yyy  nnn   mmm
0    10     5     5
1    9      3     4
2    8      7     0

Run Code Online (Sandbox Code Playgroud)

我当前的代码如下。

mydata = pd.read_csv( input_file, header=0)

for item in mylist:
    mydata_new = mydata[item]

print(mydata_new)
mydata_new.to_csv(file_name)

Run Code Online (Sandbox Code Playgroud)

在我看来，我的新数据框产生了错误的结果。请帮我！

python dataframe pandas

J C*_*ena

2019 04-02

5
推荐指数

2
解决办法

1万
查看次数

在Python中获取大多数列表的共同元素

给定 4 个列表，我想获取 3 个或更多列表共有的元素。

a = [1, 2, 3, 4]
b = [1, 2, 3, 4, 5]
c = [1, 3, 4, 5, 6]
d = [1, 2, 6, 7]

Run Code Online (Sandbox Code Playgroud)

因此，输出应该是[1, 2, 3, 4].

我当前的代码如下。

result1 = set(a) & set(b) & set(c)
result2 = set(b) & set(c) & set(d)
result3 = set(c) & set(d) & set(a)
result4 = set(d) & set(a) & set(b)

final_result = list(result1)+list(result2)+list(result3)+list(result4)
print(set(final_result))

Run Code Online (Sandbox Code Playgroud)

它工作正常，并给出所需的输出。但是，我有兴趣知道在 Python 中是否有一种简单的方法可以做到这一点，即：是否有任何内置函数？

python

J C*_*ena

2018 01-22

4
推荐指数

1
解决办法

608
查看次数

DBpedia Spotlight的参数是什么意思？

我对使用DBpedia Spotlight感兴趣。但是，我们需要在两个参数confidence和support中插入一个值。这两个参数的真正含义是什么？

我想确定文本中重要的，突出的n-gram。在那种情况下，对置信度和支持参数的一般建议是什么（经验法则）？

ontology dbpedia spotlight-dbpedia linked-data

J C*_*ena

2018 03-26

4
推荐指数

1
解决办法

217
查看次数

如何从python中的列表中删除重复的元组？

我有一个包含元组列表的列表,如下所示.

mylist = [['xxx', 879], ['yyy', 315], ['xxx', 879], ['zzz', 171], ['yyy', 315]]

Run Code Online (Sandbox Code Playgroud)

我想从中删除重复的元组mylist并获得如下输出.

mylist = [['xxx', 879], ['yyy', 315], ['zzz', 171]]

Run Code Online (Sandbox Code Playgroud)

好像set在python中它不起作用.

mylist = list(set(mylist))

Run Code Online (Sandbox Code Playgroud)

有没有快速简便的方法在python中执行此操作(可能使用库)？

python list duplicates

J C*_*ena

2019 04-10

3
推荐指数

3
解决办法

4122
查看次数

在python中对列表进行排序后如何获取原始索引

我的清单如下。

mylist= [0.0, 0.4, 0.81, 1.0, 0.9, 20.7, 0.0, 0.8, 1.0, 20.7]

Run Code Online (Sandbox Code Playgroud)

我想获取列表中前4个元素的索引（即[5, 9, 3, 8]），并删除值小于或等于1（<=1）的索引。

因此，我的最终输出应该是 [5, 9]

我当前的代码如下：

sorted_mylist = sorted(mylist, reverse = True)[:4]
for ele in sorted_mylist:
    if ele>1:
       print(mylist.index(ele))

Run Code Online (Sandbox Code Playgroud)

但是，它返回[5, 5]，这是不正确的。

请让我知道如何在python中解决此问题？

python

J C*_*ena

2018 02-12

3
推荐指数

1
解决办法

2544
查看次数

在python中获取维基百科文章的类别

我正在使用下面提到的代码来检查维基百科页面是否存在。

term = "forensics"
a = urllib.request.urlopen("https://en.wikipedia.org/wiki/"+term).getcode()
print(a)

Run Code Online (Sandbox Code Playgroud)

如果页面存在（即a == 200），我想获取页面的类别（即，如果类别是计算机科学、工程等）。我们可以在 wikipedia api 中做到这一点吗？

python wikipedia wikipedia-api

J C*_*ena

lucky-day

2
推荐指数

1
解决办法

2421
查看次数

标签统计

python ×6

dataframe ×1

dbpedia ×1

duplicates ×1

linked-data ×1

list ×1

networkx ×1

ontology ×1

pandas ×1

spotlight-dbpedia ×1

wikipedia ×1

wikipedia-api ×1

标签 统计

小编J C_ena的帖子

标签统计