我使用以下代码使用networkx构建我的图形,如下所示.
mylist = [('chocolate_pudding', 6.3), ('tim_tam', 178.5), ('bread', 3.5),
('chocolate_pudding', 8.5), ('tim_tam', 3.0), ('butter', 204.0)]
G = nx.Graph()
for ele in mylist:
#if node with ele[0] does not exists, add the new node
G.add_node(ele[0], weight=ele[1])
#else, update the weight with the new weight value (weight = existing_weight + ele[1])
Run Code Online (Sandbox Code Playgroud)
我想在创建新节点之前检查具有相同标签的节点是否存在.如果节点存在,我想通过将新值添加到现有值来更新其权重.
例如,在上面的例子中,我只想要4个节点chocolate_pudding, tim_tam, bread, butter,它们的权重应14.8, 181.5, 3.5, 204.0分别为.
我没有找到在networkx中这样做的正确方法.因此,请告诉我是否可以在networkx中进行此操作?
我有一个熊猫数据框和以下列表
mylist = ['nnn', 'mmm', 'yyy']
mydata =
xxx yyy zzz nnn ddd mmm
0 0 10 5 5 5 5
1 1 9 2 3 4 4
2 2 8 8 7 9 0
Run Code Online (Sandbox Code Playgroud)
现在,我只想获取其中提到的列mylist并将其另存为csv文件。
即
yyy nnn mmm
0 10 5 5
1 9 3 4
2 8 7 0
Run Code Online (Sandbox Code Playgroud)
我当前的代码如下。
mydata = pd.read_csv( input_file, header=0)
for item in mylist:
mydata_new = mydata[item]
print(mydata_new)
mydata_new.to_csv(file_name)
Run Code Online (Sandbox Code Playgroud)
在我看来,我的新数据框产生了错误的结果。请帮我!
给定 4 个列表,我想获取 3 个或更多列表共有的元素。
a = [1, 2, 3, 4]
b = [1, 2, 3, 4, 5]
c = [1, 3, 4, 5, 6]
d = [1, 2, 6, 7]
Run Code Online (Sandbox Code Playgroud)
因此,输出应该是[1, 2, 3, 4].
我当前的代码如下。
result1 = set(a) & set(b) & set(c)
result2 = set(b) & set(c) & set(d)
result3 = set(c) & set(d) & set(a)
result4 = set(d) & set(a) & set(b)
final_result = list(result1)+list(result2)+list(result3)+list(result4)
print(set(final_result))
Run Code Online (Sandbox Code Playgroud)
它工作正常,并给出所需的输出。但是,我有兴趣知道在 Python 中是否有一种简单的方法可以做到这一点,即:是否有任何内置函数?
我对使用DBpedia Spotlight感兴趣。但是,我们需要在两个参数confidence和support中插入一个值。这两个参数的真正含义是什么?
我想确定文本中重要的,突出的n-gram。在那种情况下,对置信度和支持参数的一般建议是什么(经验法则)?
我有一个包含元组列表的列表,如下所示.
mylist = [['xxx', 879], ['yyy', 315], ['xxx', 879], ['zzz', 171], ['yyy', 315]]
Run Code Online (Sandbox Code Playgroud)
我想从中删除重复的元组mylist并获得如下输出.
mylist = [['xxx', 879], ['yyy', 315], ['zzz', 171]]
Run Code Online (Sandbox Code Playgroud)
好像set在python中它不起作用.
mylist = list(set(mylist))
Run Code Online (Sandbox Code Playgroud)
有没有快速简便的方法在python中执行此操作(可能使用库)?
我的清单如下。
mylist= [0.0, 0.4, 0.81, 1.0, 0.9, 20.7, 0.0, 0.8, 1.0, 20.7]
Run Code Online (Sandbox Code Playgroud)
我想获取列表中前4个元素的索引(即[5, 9, 3, 8]),并删除值小于或等于1(<=1)的索引。
因此,我的最终输出应该是 [5, 9]
我当前的代码如下:
sorted_mylist = sorted(mylist, reverse = True)[:4]
for ele in sorted_mylist:
if ele>1:
print(mylist.index(ele))
Run Code Online (Sandbox Code Playgroud)
但是,它返回[5, 5],这是不正确的。
请让我知道如何在python中解决此问题?
我正在使用下面提到的代码来检查维基百科页面是否存在。
term = "forensics"
a = urllib.request.urlopen("https://en.wikipedia.org/wiki/"+term).getcode()
print(a)
Run Code Online (Sandbox Code Playgroud)
如果页面存在(即a == 200),我想获取页面的类别(即,如果类别是计算机科学、工程等)。我们可以在 wikipedia api 中做到这一点吗?
python ×6
dataframe ×1
dbpedia ×1
duplicates ×1
linked-data ×1
list ×1
networkx ×1
ontology ×1
pandas ×1
wikipedia ×1