小编Ram*_*dhi的帖子

使用 Spark 和 java 编写 CSV 文件 - 处理空值和引号

初始数据在 Dataset<Row> 中，我正在尝试写入管道分隔文件，我希望每个非空单元格和非空值都放在引号中。空值或空值不应包含引号

result.coalesce(1).write()
            .option("delimiter", "|")
            .option("header", "true")
            .option("nullValue", "")
            .option("quoteAll", "false")
            .csv(Location);

Run Code Online (Sandbox Code Playgroud)

预期输出：

"London"||"UK"
"Delhi"|"India"
"Moscow"|"Russia"

Run Code Online (Sandbox Code Playgroud)

电流输出：

London||UK
Delhi|India
Moscow|Russia

Run Code Online (Sandbox Code Playgroud)

如果我将“quoteAll”更改为“true”，我得到的输出是：

"London"|""|"UK"
"Delhi"|"India"
"Moscow"|"Russia"

Run Code Online (Sandbox Code Playgroud)

Spark 版本是 2.3，java 版本是 java 8

java csv java-8 apache-spark apache-spark-2.3

Ram*_*dhi

2020 02-28

7
推荐指数

1
解决办法

1208
查看次数

使用"not in"运算符转换子查询以加入

是否可以转换带NOT IN运算符的子查询加入？我需要使用连接这个查询

SELECT *
FROM Contacts
WHERE ContactIntID NOT IN(
    SELECT LinkToIntID
    FROM Requirements
    WHERE Requirements.uuJobStatus = 'Open')

sql-server join subquery

Ram*_*dhi

lucky-day

2
推荐指数

1
解决办法

5445
查看次数

使用"NOT IN"运算符转换子查询以与多个表连接

我需要将以下子查询转换为JOIN.这里我在内部查询中已经有了JOIN运算符.请帮忙.

SELECT * 
FROM   Consultants 
WHERE  Consultants.ConsIntID 
NOT IN  (SELECT Links.ToID 
         FROM   Links JOIN Reminders 
         ON Links.FromID = Reminders.RemIntID 
            AND ApptSubType = 'Placed' 
            AND ToID LIKE 'CS%')

sql sql-server join subquery

Ram*_*dhi

2014 01-04

1
推荐指数

1
解决办法

1293
查看次数