小编Kri*_*kar的帖子

为什么布尔字段在 Hive 中不起作用?

我的配置单元表中有一个数据类型为布尔值的列。当我尝试从 csv 导入数据时,它存储为 NULL。

这是我的示例表:

CREATE tABLE if not exists Engineanalysis(

EngineModel String,

EnginePartNo String ,

Location String,

Position String,

InspectionReq boolean)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ','

LINES TERMINATED BY '\n';
Run Code Online (Sandbox Code Playgroud)

我的样本数据:

AB01,AS01-IT01,AIRFRAME,,0

AB02,AS01-IT02,AIRFRAME,,1

AB03,AS01-IT03,AIRFRAME,,1

AB04,AS01-IT04,AIRFRAME,,1

AB05,AS01-IT05,HEAD,,1

AB06,AS01-IT06,HEAD,,0

AB07,AS01-IT07,HEAD,,0

AB08,AS01-IT08,HEAD,,0

AB09,AS01-IT09,NOSE,,1

AB10,AS01-IT10,NOSE,,0
Run Code Online (Sandbox Code Playgroud)

结果 :

AB01 AS01-IT01 AIRFRAME NULL

AB02 AS01-IT02 AIRFRAME NULL

AB03 AS01-IT03 AIRFRAME NULL

AB04 AS01-IT04 AIRFRAME NULL

AB05 AS01-IT05 HEAD NULL

AB06 AS01-IT06 HEAD NULL

AB07 AS01-IT07 HEAD NULL

AB08 AS01-IT08 HEAD NULL

AB09 AS01-IT09 …
Run Code Online (Sandbox Code Playgroud)

sql hive boolean bigdata hiveql

2
推荐指数
1
解决办法
7410
查看次数

如何过滤掉spark数据框中的布尔字段?

我的数据框中有三列。在这第二个和第三个是布尔字段。我想过滤掉正确的值。我试过这个,nn.filter(col("col3")===true).show但它说无效的列名“true”。我的代码有什么用?请问有什么帮助吗?

我的代码:

scala> nn.printSchema
root
 |-- ID: integer (nullable = true)
 |-- col2: boolean (nullable = true)
 |-- col3: boolean (nullable = true)

scala> nn.show
+---+-----+-----+
| ID| col2| col3|
+---+-----+-----+
|  4| true|false|
|  5|false|false|
|  6|false|false|
|  7|false|false|
| 12|false|false|
| 13|false|false|
| 14|false|false|
| 15|false| true|
| 16|false|false|
| 17|false|false|
| 18|false|false|
| 22|false|false|
| 36|false|false|
| 37|false|false|
| 38|false|false|
| 39|false|false|
| 40|false|false|
| 41| true|false|
| 42|false|false|
+---+-----+-----+

scala> nn.filter(col("col3")===true).show
[Stage 14:>                                                         (0 …
Run Code Online (Sandbox Code Playgroud)

hadoop scala apache-spark

2
推荐指数
1
解决办法
5665
查看次数

标签 统计

apache-spark ×1

bigdata ×1

boolean ×1

hadoop ×1

hive ×1

hiveql ×1

scala ×1

sql ×1