小编Sim*_*am5的帖子

如何使用Intellij插件创建自定义实时模板

我想创建一个可以在我的插件中使用的自定义实时模板.我知道如何使用"设置"对话框创建自定义实时模板,但我希望能够将实时模板作为插件的一部分进行分发:

如何在插件中定义实时模板？
在应用程序中注册它的入口点在哪里？

谢谢.

intellij-idea intellij-plugin

Sim*_*am5

2014 12-24

7
推荐指数

1
解决办法

1222
查看次数

为具有大量输入文件的 Spark SQL 作业加速 InMemoryFileIndex

我有一个用 Java 编码的 apache spark sql 作业（使用数据集），它从 70,000 到 150,000 个文件中输入。

构建 InMemoryFileIndex 似乎需要 45 分钟到 1.5 小时不等。

在此期间没有日志，网络使用率非常低，并且几乎没有 CPU 使用率。

这是我在 std 输出中看到的示例：

24698 [main] INFO org.spark_project.jetty.server.handler.ContextHandler  - Started o.s.j.s.ServletContextHandler@32ec9c90{/static/sql,null,AVAILABLE,@Spark}
25467 [main] INFO org.apache.spark.sql.execution.streaming.state.StateStoreCoordinatorRef  - Registered StateStoreCoordinator endpoint
2922000 [main] INFO org.apache.spark.sql.execution.datasources.InMemoryFileIndex  - Listing leaf files and directories in parallel under: <a LOT of file url's...>
2922435 [main] INFO org.apache.spark.SparkContext  - Starting job: textFile at SomeClass.java:103

Run Code Online (Sandbox Code Playgroud)

在这种情况下，有 45 分钟基本上没有发生任何事情（据我所知）。

我使用以下方法加载文件：

sparkSession.read().textFile(pathsArray)

Run Code Online (Sandbox Code Playgroud)

有人可以解释 InMemoryFileIndex 中发生了什么，以及如何使这一步更快？

apache-spark apache-spark-sql

Sim*_*am5

lucky-day

5
推荐指数

1
解决办法

3258
查看次数

使用JNA列出所有导出的符号名称

如何使用JNA列出给定dll中的所有可用函数名称？

jna

Sim*_*am5

lucky-day

2
推荐指数

1
解决办法

1008
查看次数

标签统计

apache-spark ×1

apache-spark-sql ×1

intellij-idea ×1

intellij-plugin ×1

jna ×1

如何使用Intellij插件创建自定义实时模板

为具有大量输入文件的 Spark SQL 作业加速 InMemoryFileIndex

使用JNA列出所有导出的符号名称

标签 统计

小编Sim_am5的帖子

标签统计