小编Sev*_*yns的帖子

import random
import pandas as pd
df = pd.DataFrame({'data':list(random.sample(range(10,100),25))})
df_filtered = df.query('data > 20 and data < 80')
df_filtered.rename(columns={'data':'observations'},inplace=True)

Run Code Online (Sandbox Code Playgroud)

问题是，当调用重命名方法时，我收到一个SettingWithCopy警告，据我所知，这意味着我正在操作原始对象（在这种情况下为df）的副本。警告文本为：“试图在DataFrame的切片副本上设置一个值”

我发现使用不同的子集化方法可以回答此问题。我本人（语法上）更喜欢Dataframe.query（）方法。有没有一种方法可以使用.query（）方法而不是我链接的问题中建议的方法来创建新的Dataframe对象？我已经尝试过iloc的一些选项，但到目前为止还没有成功。

python pandas

Sev*_*yns

2017 05-23

2
推荐指数

1
解决办法

256
查看次数

使用Python取消对数据集的错误

给出以下汇总数据集:

import pandas as pd
summarized_set = pd.DataFrame({'Value':[1,2,3],
                           'NumberOfObservations':[3,3,3]})

Run Code Online (Sandbox Code Playgroud)

我正在寻找一种方法将汇总值(观察次数)转换回实际观察值.

observed_values = pd.DataFrame({'Value':[1,1,1,2,2,2,3,3,3]})

Run Code Online (Sandbox Code Playgroud)

我有一个想法是迭代汇总集并将值(作为列表对象)乘以NumberOfObservations.像这样的东西:

z = []
z = z + ([1] * 3) + ([2] * 3) + ([3] * 3)

Run Code Online (Sandbox Code Playgroud)

但是,我想知道是否有更简单的方法可以做到这一点.

python pandas

Sev*_*yns

lucky-day

2
推荐指数

1
解决办法

36
查看次数

标签统计

pandas ×3

python ×3

dataframe ×1

dplyr ×1

lubridate ×1

numpy ×1

r ×1

teradata ×1

将2列中的值合并为pandas数据帧中的单个列

R从具有时间字段的日期开始按小时聚合数据帧

如何使用Teradata SQL检查字段是否包含所有数值？

Python Pandas SettingWithCopyWarning副本与新对象

使用Python取消对数据集的错误

标签 统计

小编Sev_yns的帖子

标签统计