小编Juh*_*uh_的帖子

如何在交互模式下运行 sbt multiple 命令

我想在 sbt 交互模式下运行几个 sbt 命令,即不离开 sbt “shell”?

(注意: 有些问题回答了如何在标准 shell 中使用 sbt 将参数传递给 sbt-commands。不是我在这里想要的)

示例:我在 sbt 交互式 shell 中,我想运行“test:compile”,然后运行“test”

我知道 test 会调用 required 编译,但在这个例子中,我想在任何测试开始之前运行所有子项目的编译。

sbt

5
推荐指数
1
解决办法
888
查看次数

如何解释JProfiler中的GC Activity图?

最近我一直在努力优化一些代码(需要计算时间和最大内存).要知道是否存在优化内存成本的潜在收益,我使用JProfiler.通常

  • 如果它很高,我应该尝试全局减少它
  • 如果它很尖刻,我应该尝试减少中间对象的创建

现在,我处于第二种情况,GC活动图显示了峰值,但都低于2%(见下图).我该怎么理解?

默认情况下,我的理解是GC活动曲线的总和/积分是用于收集数据的CPU总百分比的估计值.所以在这里意味着远远低于最大2%

这是正确的吗?我错过了什么吗?

在此输入图像描述

garbage-collection jprofiler

5
推荐指数
2
解决办法
1102
查看次数

如何知道数据何时插入clickhouse

我明白 clickhouse 最终是一致的。因此,一旦插入调用返回,并不意味着数据将出现在选择查询中。

  1. 这是否适用于独立的 clickhouse(无分发,无复制)?
  2. 我了解数据复制的最终一致性概念,但它是否适用于分发但不适用于复制?
  3. 使用分布式+复制的clickhouse,推荐的方法是什么来知道可以安全地查找某些插入?

基本上我没有找到关于这个主题的太多信息,所以也许我没有提出最好的问题。请随时启发我。

eventual-consistency clickhouse

5
推荐指数
1
解决办法
2006
查看次数

如何使用java对spark数据集中的可选字段进行编码?

我不想对数据集中使用的类的字段使用空值。我尝试使用 scalaOption和 javaOptional但失败了:

    @AllArgsConstructor // lombok
    @NoArgsConstructor  // mutable type is required in java :(
    @Data               // see /sf/ask/4172695341/
    public static class TestClass {
        String id;
        Option<Integer> optionalInt;
    }

    @Test
    public void testDatasetWithOptionField(){
        Dataset<TestClass> ds = spark.createDataset(Arrays.asList(
                new TestClass("item 1", Option.apply(1)),
                new TestClass("item .", Option.empty())
        ), Encoders.bean(TestClass.class));

        ds.collectAsList().forEach(x -> System.out.println("Found " + x));
    }
Run Code Online (Sandbox Code Playgroud)

在运行时失败并显示消息File 'generated.java', Line 77, Column 47: Cannot instantiate abstract "scala.Option"


问题:有没有一种方法可以使用 java 对数据集中不带 null 的可选字段进行编码?

附属问题:顺便说一句,我在 scala 中也没有使用太多数据集,您能否验证在 scala 中实际上可以对包含选项字段的案例类进行编码?


注意:这用于中间数据集,即不读也不写的数据(但用于 …

java encoder apache-spark option-type

5
推荐指数
1
解决办法
2812
查看次数

如何在scala中获得正确的数组哈希码?

计算取决于其内容的 Array 的 hashCode 的合适方法是什么?

Array.hashCode 用于数组实例:

val h = a.hashCode
println(h == Array(1,2).hashCode) // false

a(0) = 42
println(h == a.hashCode) // true
Run Code Online (Sandbox Code Playgroud)

注意:在计算 hashCode 之前,最好避免将整个数组复制到例如 List

为什么我问:我在类中使用数组(作为私有字段),因为查找时间很关键,其内容与计算类的 hashCode 相关

arrays scala hashcode

4
推荐指数
2
解决办法
1959
查看次数

如何在Clickhouse中添加列

我在Clickhouse中有一个表,说“ my_table”,其中有重复项(my_table_rep1,...)。我需要添加一列float64类型的默认值(-1)。

我应该怎么做?

我希望默认值不会实际添加到现有条目中。

alter-table clickhouse

4
推荐指数
1
解决办法
4004
查看次数

列出Java Web应用程序中的servlet(在tomcat中运行)

我试图重新打包一个相对较大的Java Webapp,但我没有编写代码,并且该项目的配置丢失了。我设置了第一个包装,并将其部署在tomcat中。现在要了解它,我想获得成功启动或失败的servlet的列表,以及相应的访问URL。

  • 有没有办法获取该列表(可能是从一些启动日志中获取)?

一些细节:webapp使用gwt(我不掌握),我在ubuntu上使用tomcat7。如果可行,我不反对使用其他servlet容器的解决方案。

java gwt tomcat servlets

3
推荐指数
1
解决办法
1986
查看次数

如何测试maven部署?

我在一个 Maven 项目上工作,但无权在我们公司的 Nexus 中部署(这是由 CI 工具完成的)。但是,在配置部署时,我想测试“mvn clean deploy”实际部署的内容。

问:有没有办法运行部署但不向 Nexus 存储库发送任何内容?

我期望 2 个选项中的 1 个:

  • 为此目的部署了某种试运行选项
  • 有一个选项可以将部署重定向到充当 Nexus 存储库的某个本地文件夹(因此可以查看将部署的内容)

注意:我的项目是多模块的。

deployment maven

3
推荐指数
1
解决办法
5041
查看次数

SortedSet到seq保留(排序)顺序

我有一个SortedSet,我需要将它转换为Seq保留顺序(因为我需要map使用seq输出调用).

REPL中的几个测试显示toSeq保持订单以及toIndexedSeq但我需要确定:是否保证保持订单?

否则我可以使用,.toSeq.sorted但严重矫枉过正...

scala sortedset seq

2
推荐指数
1
解决办法
180
查看次数

当rdd项很大时,为什么rdd.map(identity).cache会变慢?

我发现当.map( identity ).cache在rdd上使用时,如果物品很大,它会变得很慢.虽然它几乎是瞬间的.

注意:这可能与这个问题有关,但在这里我提供了一个非常精确的例子(可以直接在spark-shell中执行):

// simple function to profile execution time (in ms)
def profile[R](code: => R): R = {
  val t = System.nanoTime
  val out = code
  println(s"time = ${(System.nanoTime - t)/1000000}ms")
  out
}

// create some big size item
def bigContent() = (1 to 1000).map( i => (1 to 1000).map( j => (i,j) ).toMap )

// create rdd
val n = 1000 // size of the rdd

val rdd = sc.parallelize(1 to n).map( k …
Run Code Online (Sandbox Code Playgroud)

performance caching apache-spark

2
推荐指数
1
解决办法
2126
查看次数