小编mat*_*tan的帖子

删除列表列中的重复列表元素

这是我的数据框：

pd.DataFrame({'A':[1, 3, 3, 4, 5, 3, 3],
              'B':[0, 2, 3, 4, 5, 6, 7],
              'C':[[1,4,4,4], [1,4,4,4], [3,4,4,5], [3,4,4,5], [4,4,2,1], [1,2,3,4,], [7,8,9,1]]})

Run Code Online (Sandbox Code Playgroud)

我想设置\删除每行 C 列的重复值，但不删除重复的行。

这是我希望得到的：

pd.DataFrame({'A':[1, 3, 3, 4, 5, 3, 3],
              'B':[0, 2, 3, 4, 5, 6, 7],
              'C':[[1,4], [1,4], [3,4,5], [3,4,5], [4,2,1], [1,2,3,4,], [7,8,9,1]]})

Run Code Online (Sandbox Code Playgroud)

python set pandas drop-duplicates

mat*_*tan

2020 07-13

6
推荐指数

2
解决办法

574
查看次数

如何绘制 networkx 图的节点子集

这是与我的代码类似的代码

import networkx as nx
from matplotlib import pyplot as plt
%matplotlib notebook
import pandas as pd

data={"A":["T1","T2","tom","adi","matan","tali","pimpunzu","jack","arzu"],
      "B":["end","end","T1","T1","T1","T2","T2","matan","matan"]}

df=pd.DataFrame.from_dict(data)

G = nx.from_pandas_edgelist(df,source='A',target='B', edge_attr=None, create_using=nx.DiGraph())
f, ax = plt.subplots(figsize=(10, 10))
nx.draw(G, with_labels=True, font_weight='bold', ax=ax)

Run Code Online (Sandbox Code Playgroud)

例如，我喜欢绘制图表的一部分，我喜欢只绘制["T1","matan","jack","arzu"]

那是我喜欢得到的

data={"A":["jack","arzu","matan"],
      "B":["matan","matan","T1"]}

df=pd.DataFrame.from_dict(data)

G = nx.from_pandas_edgelist(df,source='A',target='B', edge_attr=None, create_using=nx.DiGraph())
f, ax = plt.subplots(figsize=(10, 10))
nx.draw(G, with_labels=True, font_weight='bold', ax=ax)

Run Code Online (Sandbox Code Playgroud)

我可以列出我喜欢绘制的内容吗？或者也许我可以写我喜欢在它们之间绘制的节点？

python plot matplotlib networkx pandas

mat*_*tan

2020 07-30

5
推荐指数

1
解决办法

4369
查看次数

如何计算列熊猫数据框中列表的平均值

我有数据看起来像这样

data={"col1":[ [(1,22),(1.5,20),(3,32),(2,21)],
              [(2,24),(2.5,22)],
      [(6,12),(1.3,18),(5,21)],
              [(4,25),(5,33),(7,21),(2,30)]],
"name":["A","B","C","F"]}
df=pd.DataFrame.from_dict(data)
print(df)

Run Code Online (Sandbox Code Playgroud)

我想表示每行（列出）两个不同的 colls 中的第一个和第二个数字，因此对于第一个单元格，我将获得包含 (1+1.5+3+2)\4 的新 coll 和一个具有 22 的 col +20+32+21/4

我做了类似的事情，但它的循环看起来很乱

for i in df["col1"]:
    mean_list = []
    for first_numb in i:
        mean_list.append(first_numb[0])

Run Code Online (Sandbox Code Playgroud)

任何的想法？

python split mean pandas

mat*_*tan

lucky-day

3
推荐指数

1
解决办法

47
查看次数

标签统计

pandas ×3

python ×3

drop-duplicates ×1

matplotlib ×1

mean ×1

networkx ×1

plot ×1

set ×1

split ×1

删除列表列中的重复列表元素

如何绘制 networkx 图的节点子集

如何计算列熊猫数据框中列表的平均值

标签 统计

小编mat_tan的帖子

标签统计