ss3*_*301 2 yaml scala dataframe apache-spark
我有包含以下详细信息的 yaml 文件。文件名:config.yml
- firstName: "James"
lastName: "Bond"
age: 30
- firstName: "Super"
lastName: "Man"
age: 25
Run Code Online (Sandbox Code Playgroud)
由此,我需要使用 spark 和 scala 来获取 spark 数据帧
+---+---------+--------+
|age|firstName|lastName|
+---+---------+--------+
|30 |James |Bond |
|25 |Super |Man |
+---+---------+--------+
Run Code Online (Sandbox Code Playgroud)
我曾尝试转换为 json,然后转换为数据帧,但我无法在数据集序列中指定它。
有一个解决方案,可以帮助您将 yaml 转换为 json,然后将其作为 DataFrame 读取
您需要添加这两个依赖项:
import com.fasterxml.jackson.databind.ObjectMapper
import com.fasterxml.jackson.dataformat.yaml.YAMLFactory
Run Code Online (Sandbox Code Playgroud)
import com.fasterxml.jackson.databind.ObjectMapper
import com.fasterxml.jackson.dataformat.yaml.YAMLFactory
Run Code Online (Sandbox Code Playgroud)
希望这可以帮助 !
| 归档时间: |
|
| 查看次数: |
3152 次 |
| 最近记录: |