小编Sev*_*yns的帖子

将2列中的值合并为pandas数据帧中的单个列

我正在寻找一种行为类似于在T-SQL中合并的方法.我有两列(A列和B列)在pandas数据帧中稀疏填充.我想使用以下规则创建一个新列:

  1. 如果A列中的值不为null,请将该值用于新列C
  2. 如果A列中的值为null,请使用B列中的值作为新列C

就像我提到的,这可以通过coalesce函数在MS SQL Server中完成.我还没有找到一个好的pythonic方法; 一个存在吗?

python numpy dataframe pandas

33
推荐指数
4
解决办法
2万
查看次数

R从具有时间字段的日期开始按小时聚合数据帧

我对R比较陌生,但我对Excel和T-SQL非常熟悉.

我有一个简单的数据集,它有一个带有时间的日期和一个与之相关的数值.我想要做的是总结当天的数字值.我在R中找到了一些用于处理时间类型的资源,但是我希望找到类似于提供excel的解决方案(我可以调用一个函数并传入我的日期/时间数据并让它返回小时当天).

任何建议将不胜感激 - 谢谢!

r lubridate dplyr

3
推荐指数
1
解决办法
3987
查看次数

如何使用Teradata SQL检查字段是否包含所有数值?

我正在寻找类似于ISNUMERIC()T-SQL和Teradata SQL的功能.如果字符类型字段中包含的数据都是数字,我想要一个返回布尔值(或数字1/0)的简单方法.

例如:

我的专栏包含以下记录:'001''ABC'

我希望查询返回:1(或True)0(或False).

是否存在类似于ISNUMERIC()TD原生支持的方法?我找到了一些我可以使用的正则表达式的选项,但是想在查看这条路径之前是否有更简单的方法.如果不存在这样的方法,我愿意接受有关完成此方法的建议.

teradata

3
推荐指数
1
解决办法
1万
查看次数

Python Pandas SettingWithCopyWarning副本与新对象

我正在通过子设置上一个创建的数据框“副本”进行操作-参见下文:

import random
import pandas as pd
df = pd.DataFrame({'data':list(random.sample(range(10,100),25))})
df_filtered = df.query('data > 20 and data < 80')
df_filtered.rename(columns={'data':'observations'},inplace=True)
Run Code Online (Sandbox Code Playgroud)

问题是,当调用重命名方法时,我收到一个SettingWithCopy警告,据我所知,这意味着我正在操作原始对象(在这种情况下为df)的副本。警告文本为:“试图在DataFrame的切片副本上设置一个值”

我发现使用不同的子集化方法可以回答此问题。我本人(语法上)更喜欢Dataframe.query()方法。有没有一种方法可以使用.query()方法而不是我链接的问题中建议的方法来创建新的Dataframe对象?我已经尝试过iloc的一些选项,但到目前为止还没有成功。

python pandas

2
推荐指数
1
解决办法
256
查看次数

使用Python取消对数据集的错误

给出以下汇总数据集:

import pandas as pd
summarized_set = pd.DataFrame({'Value':[1,2,3],
                           'NumberOfObservations':[3,3,3]})
Run Code Online (Sandbox Code Playgroud)

我正在寻找一种方法将汇总值(观察次数)转换回实际观察值.

observed_values = pd.DataFrame({'Value':[1,1,1,2,2,2,3,3,3]})
Run Code Online (Sandbox Code Playgroud)

我有一个想法是迭代汇总集并将值(作为列表对象)乘以NumberOfObservations.像这样的东西:

z = []
z = z + ([1] * 3) + ([2] * 3) + ([3] * 3)
Run Code Online (Sandbox Code Playgroud)

但是,我想知道是否有更简单的方法可以做到这一点.

python pandas

2
推荐指数
1
解决办法
36
查看次数

标签 统计

pandas ×3

python ×3

dataframe ×1

dplyr ×1

lubridate ×1

numpy ×1

r ×1

teradata ×1