小编Ram*_*dhi的帖子

使用 Spark 和 java 编写 CSV 文件 - 处理空值和引号

初始数据在 Dataset<Row> 中,我正在尝试写入管道分隔文件,我希望每个非空单元格和非空值都放在引号中。空值或空值不应包含引号

result.coalesce(1).write()
            .option("delimiter", "|")
            .option("header", "true")
            .option("nullValue", "")
            .option("quoteAll", "false")
            .csv(Location);
Run Code Online (Sandbox Code Playgroud)

预期输出:

"London"||"UK"
"Delhi"|"India"
"Moscow"|"Russia"
Run Code Online (Sandbox Code Playgroud)

电流输出:

London||UK
Delhi|India
Moscow|Russia
Run Code Online (Sandbox Code Playgroud)

如果我将“quoteAll”更改为“true”,我得到的输出是:

"London"|""|"UK"
"Delhi"|"India"
"Moscow"|"Russia"
Run Code Online (Sandbox Code Playgroud)

Spark 版本是 2.3,java 版本是 java 8

java csv java-8 apache-spark apache-spark-2.3

7
推荐指数
1
解决办法
1208
查看次数

使用"not in"运算符转换子查询以加入

是否可以转换带NOT IN运算符的子查询加入?我需要使用连接这个查询

SELECT *
FROM Contacts
WHERE ContactIntID NOT IN(
    SELECT LinkToIntID
    FROM Requirements
    WHERE Requirements.uuJobStatus = 'Open')

sql-server join subquery

2
推荐指数
1
解决办法
5445
查看次数

使用"NOT IN"运算符转换子查询以与多个表连接

我需要将以下子查询转换为JOIN.这里我在内部查询中已经有了JOIN运算符.请帮忙.

SELECT * 
FROM   Consultants 
WHERE  Consultants.ConsIntID 
NOT IN  (SELECT Links.ToID 
         FROM   Links JOIN Reminders 
         ON Links.FromID = Reminders.RemIntID 
            AND ApptSubType = 'Placed' 
            AND ToID LIKE 'CS%') 

sql sql-server join subquery

1
推荐指数
1
解决办法
1293
查看次数

标签 统计

join ×2

sql-server ×2

subquery ×2

apache-spark ×1

apache-spark-2.3 ×1

csv ×1

java ×1

java-8 ×1

sql ×1