小编Ric*_*ois的帖子

如何检查 <NA> 类型变量是否是来自 pandas 数据帧的 <NA> ?np.nan() 不工作

我有一个数据框,其中有一列,其值类似于:

     YEAR_TORONTO
0    <NA>
1    2016
2    <NA>
3    1999
Run Code Online (Sandbox Code Playgroud)

由于此代码段之外的其他原因,我需要通过循环单独检查此数据帧的每个元素for,因此我正在寻找符合我的实现的解决方案。

基本上我现在检查是否存在的代码是:

if np.isnan(df.get("YEAR_TORONTO")[row]):
Run Code Online (Sandbox Code Playgroud)

这导致我收到以下值错误<NA>

boolean value of NA is ambiguous
Run Code Online (Sandbox Code Playgroud)

知道我可以做什么来修复这个错误吗?非常感谢帮助

python nan dataframe pandas

7
推荐指数
1
解决办法
6901
查看次数

如何提取两个其他子字符串之间的子字符串?

我有一个逐行读取日志文件的脚本。我需要提取两个子字符串之间的文本(如果它们存在于我的脚本当前正在读取的行中)。

例如,如果一行有:

some random text here substring A abc/def/ghi substring B
Run Code Online (Sandbox Code Playgroud)

我需要通过将其存储在变量中来提取和abc/def/ghi之间的文本。我该怎么做呢?substring Asubstring B

我查看了Bash 中的 Extract substring,但找不到任何与我的用例完全匹配的内容。

bash shell substring

3
推荐指数
1
解决办法
3507
查看次数

如何检查 Amazon S3 存储桶中的文件夹是否为空?- boto3 蟒蛇

我有一个 Amazon S3 存储桶my-bucket和文件夹my-folder

我希望我的脚本根据my-folder. 因此,我想检查是否为my-folder空且不包含任何文件的条件。

我该怎么做呢?

不幸的是,我尝试搜索文档和其他 Stack Overflow 帖子,但似乎找不到类似的内容。

python amazon-s3 bucket amazon-web-services boto3

1
推荐指数
1
解决办法
8808
查看次数

如何使用基于分区的INSERT INTO覆盖表?- 雅典娜

我目前正在使用Athena 命令通过自动化作业更新按每天INSERT INTO分区的表。execution_date

我现在想通过每天更新表两次来配置此作业,但仍按execution_date. 因此,我早上的作业运行应该像往常一样工作,但是我下午的作业运行同样应该覆盖早上execution_date同样按同样分区的记录。execution_date

我已经研究过MSCK REPAIR TABLE,但不确定它如何适合我的用例。

如何使用 Athena 的INSERT INTO命令覆盖按相同值分区的记录?

sql amazon-web-services database-partitioning sql-insert amazon-athena

1
推荐指数
1
解决办法
6936
查看次数