以本地模式进行生产的 Spark

mhd*_*wrk 6 java json apache-spark-sql

在一个平台上工作,其中大多数数据集都是 json 格式,但几乎不支持查询语言来过滤、连接和......

查看 SparkSQL API 和示例似乎是解决该问题的好方法。考虑到这一点,截至目前,我们不需要完整的 Spark 安装,我正在考虑将其嵌入应用程序并在本地模式下运行。有什么想法吗?