小编Alb*_*bus的帖子

如何推断 JSON 文件的模式?

我在 Java 中有以下字符串

{
    "header": {
        "gtfs_realtime_version": "1.0",
        "incrementality": 0,
        "timestamp": 1528460625,
        "user-data": "metra"
    },
    "entity": [{
            "id": "8424",
            "vehicle": {
                "trip": {
                    "trip_id": "UP-N_UN314_V1_D",
                    "route_id": "UP-N",
                    "start_time": "06:17:00",
                    "start_date": "20180608",
                    "schedule_relationship": 0
                },
                "vehicle": {
                    "id": "8424",
                    "label": "314"
                },
                "position": {
                    "latitude": 42.10085,
                    "longitude": -87.72896
                },
                "current_status": 2,
                "timestamp": 1528460601
            }
        }
    ]
}
Run Code Online (Sandbox Code Playgroud)

表示 JSON 文档。我想为流应用程序推断Spark Dataframe 中的模式。

如何将 String 的字段拆分为类似于 CSV 文档(我可以在其中调用.split(""))?

java json apache-spark spark-streaming

1
推荐指数
1
解决办法
9802
查看次数

标签 统计

apache-spark ×1

java ×1

json ×1

spark-streaming ×1