小编ast*_*luv的帖子

如何一次性检测和删除每列pandas数据帧中的异常值？

我有一个带有六列的大熊猫数据框,我知道每列中都有一些异常值.所以我有这两行代码,它们正在做我想做的事情.但它只从数据帧的一列中删除异常值.那么如果我想从每一列中删除异常值怎么办？

df = pd.DataFrame({'stlines':np.random.normal(size=533)})
df = df[np.abs(df.stlines-df.stlines.mean()) <= (2*df.stlines.std())]

Run Code Online (Sandbox Code Playgroud)

这样做的优雅方式是什么？

python dataframe pandas

ast*_*luv

lucky-day

6
推荐指数

2
解决办法

3620
查看次数

有人可以解释一下这个“nx.connected_components()”的作用吗？

我从 git 得到了一些代码，我试图理解它，这是其中的一部分，我不明白这段代码的第二行

G = nx.Graph(network_map)  # Graph for the whole network
components = list(nx.connected_components(G))

Run Code Online (Sandbox Code Playgroud)

这个函数有什么作用connected_components呢？我浏览了文档但无法正确理解它。

networkx python-2.7

ast*_*luv

lucky-day

6
推荐指数

1
解决办法

4374
查看次数

如何从python中的pandas dataframe中的列中提取关键字(字符串)

我有一个数据框df,它看起来像这样:

         id                        Type                        agent_id  created_at
0       44525   Stunning 6 bedroom villa in New Delhi               184  2018-03-09
1       44859   Villa for sale in Amritsar                          182  2017-02-19
2       45465   House in Faridabad                                  154  2017-04-17
3       50685   5 Hectre land near New Delhi                        113  2017-09-01
4      130728   Duplex in Mumbai                                    157  2017-02-07
5      130856   Large plot with fantastic views in Mumbai           137  2018-01-16
6      130857   Modern Design Penthouse in Bangalore                199  2017-03-24

Run Code Online (Sandbox Code Playgroud)

我有这个表格数据,我试图通过从列中提取关键字来清理这些数据,从而创建一个包含新列的新数据框.

Apartment  = ['apartment', 'penthouse', 'duplex']
House      = ['house', …

Run Code Online (Sandbox Code Playgroud)

list keyword dataframe python-3.x pandas

ast*_*luv

lucky-day

5
推荐指数

1
解决办法

1187
查看次数

如何对多列进行分组以在 pandas DataFrame 中列出

我有一个数据框df：

    A   B   C        date
O   4   5   5   2019-06-2
1   3   5   2   2019-06-2
2   3   2   1   2019-06-2
3   4   4   3   2019-06-3
4   5   4   6   2019-06-3
5   2   3   7   2019-06-3

Run Code Online (Sandbox Code Playgroud)

现在我可以使用以下代码对一列进行分组：

df.groupby('date')['A'].apply(list)


         A         date
O   [4,3,3]   2019-06-2
1   [4,5,2]   2019-06-3

Run Code Online (Sandbox Code Playgroud)

但如果想按多列分组怎么办？我已经尝试过类似的方法，但它似乎不起作用：

df.groupby('date')[['A','B','C']].apply(list)

Run Code Online (Sandbox Code Playgroud)

最终的 DataFrame 应如下所示：

    A               B         C        date
O   [4,3,3]   [5,5,2]   [5,2,1]   2019-06-2
1   [4,5,2]   [4,4,3]   [3,6,7]   2019-06-3

Run Code Online (Sandbox Code Playgroud)

python list dataframe pandas pandas-groupby

ast*_*luv

2021 12-15

2
推荐指数

1
解决办法

8006
查看次数

标签统计

dataframe ×3

pandas ×3

list ×2

python ×2

keyword ×1

networkx ×1

pandas-groupby ×1

python-2.7 ×1

python-3.x ×1

如何一次性检测和删除每列pandas数据帧中的异常值？

有人可以解释一下这个“nx.connected_components()”的作用吗？

如何从python中的pandas dataframe中的列中提取关键字(字符串)

如何对多列进行分组以在 pandas DataFrame 中列出

标签 统计

小编ast_luv的帖子

标签统计