我的 JSON 如下所示。ADF 可以毫无问题地读取此 JSON 并导入所有行。
{"Row":{"Col1":"Val1", "Col2":"Val2"}}
{"Row":{"Col1":"Val1", "Col2":"Val2"}}
{"Row":{"Col1":"Val1", "Col2":"Val2"}}
Run Code Online (Sandbox Code Playgroud)
但是,当我使用下面的查询从 SQL 读取此内容时,它仅返回第一条记录。
SELECT * FROM OPENJSON(@JSONDATA, '$')
with (
Col1 varchar(25) '$.Row.Col1'
);
Run Code Online (Sandbox Code Playgroud)
你知道为什么吗?
我正在使用pyspark作为代码语言。我添加了列以获取带有路径的文件名。
from pyspark.sql.functions import input_file_name
data = data.withColumn("sourcefile",input_file_name())
Run Code Online (Sandbox Code Playgroud)
我只想从此列中检索带有其父文件夹的文件名。请帮忙。
例:
Inputfilename = "adl://dotdot.com/ingest/marketing/abc.json"
Run Code Online (Sandbox Code Playgroud)
我正在寻找的输出是:
marketing/abc.json
Run Code Online (Sandbox Code Playgroud)
注意:我可以做字符串操作。filepath列是数据框的一部分。