小编Ric*_*ois的帖子

如何检查 <NA> 类型变量是否是来自 pandas 数据帧的 <NA> ？np.nan() 不工作

我有一个数据框，其中有一列，其值类似于：

     YEAR_TORONTO
0    <NA>
1    2016
2    <NA>
3    1999

Run Code Online (Sandbox Code Playgroud)

由于此代码段之外的其他原因，我需要通过循环单独检查此数据帧的每个元素for，因此我正在寻找符合我的实现的解决方案。

基本上我现在检查是否存在的代码是：

if np.isnan(df.get("YEAR_TORONTO")[row]):

Run Code Online (Sandbox Code Playgroud)

这导致我收到以下值错误<NA>：

boolean value of NA is ambiguous

Run Code Online (Sandbox Code Playgroud)

知道我可以做什么来修复这个错误吗？非常感谢帮助

python nan dataframe pandas

Ric*_*ois

2022 07-13

7
推荐指数

1
解决办法

6901
查看次数

如何提取两个其他子字符串之间的子字符串？

我有一个逐行读取日志文件的脚本。我需要提取两个子字符串之间的文本（如果它们存在于我的脚本当前正在读取的行中）。

例如，如果一行有：

some random text here substring A abc/def/ghi substring B

Run Code Online (Sandbox Code Playgroud)

我需要通过将其存储在变量中来提取和abc/def/ghi之间的文本。我该怎么做呢？substring Asubstring B

我查看了Bash 中的 Extract substring，但找不到任何与我的用例完全匹配的内容。

bash shell substring

Ric*_*ois

2021 12-27

3
推荐指数

1
解决办法

3507
查看次数

如何检查 Amazon S3 存储桶中的文件夹是否为空？- boto3 蟒蛇

我有一个 Amazon S3 存储桶my-bucket和文件夹my-folder。

我希望我的脚本根据my-folder. 因此，我想检查是否为my-folder空且不包含任何文件的条件。

我该怎么做呢？

不幸的是，我尝试搜索文档和其他 Stack Overflow 帖子，但似乎找不到类似的内容。

python amazon-s3 bucket amazon-web-services boto3

Ric*_*ois

2021 08-09

1
推荐指数

1
解决办法

8808
查看次数

如何使用基于分区的INSERT INTO覆盖表？- 雅典娜

我目前正在使用Athena 命令通过自动化作业更新按每天INSERT INTO分区的表。execution_date

我现在想通过每天更新表两次来配置此作业，但仍按execution_date. 因此，我早上的作业运行应该像往常一样工作，但是我下午的作业运行同样应该覆盖早上execution_date同样按同样分区的记录。execution_date

我已经研究过MSCK REPAIR TABLE，但不确定它如何适合我的用例。

如何使用 Athena 的INSERT INTO命令覆盖按相同值分区的记录？

sql amazon-web-services database-partitioning sql-insert amazon-athena

Ric*_*ois

lucky-day

1
推荐指数

1
解决办法

6936
查看次数

标签统计

amazon-web-services ×2

python ×2

amazon-athena ×1

amazon-s3 ×1

bash ×1

boto3 ×1

bucket ×1

database-partitioning ×1

dataframe ×1

nan ×1

pandas ×1

shell ×1

sql ×1

sql-insert ×1

substring ×1

如何检查 &lt;NA&gt; 类型变量是否是来自 pandas 数据帧的 &lt;NA&gt; ？np.nan() 不工作

如何提取两个其他子字符串之间的子字符串？

如何检查 Amazon S3 存储桶中的文件夹是否为空？- boto3 蟒蛇

如何使用基于分区的INSERT INTO覆盖表？- 雅典娜

标签 统计

小编Ric_ois的帖子

如何检查 <NA> 类型变量是否是来自 pandas 数据帧的 <NA> ？np.nan() 不工作

标签统计