小编Juh*_*uh_的帖子

    @AllArgsConstructor // lombok
    @NoArgsConstructor  // mutable type is required in java :(
    @Data               // see /sf/ask/4172695341/
    public static class TestClass {
        String id;
        Option<Integer> optionalInt;
    }

    @Test
    public void testDatasetWithOptionField(){
        Dataset<TestClass> ds = spark.createDataset(Arrays.asList(
                new TestClass("item 1", Option.apply(1)),
                new TestClass("item .", Option.empty())
        ), Encoders.bean(TestClass.class));

        ds.collectAsList().forEach(x -> System.out.println("Found " + x));
    }

Run Code Online (Sandbox Code Playgroud)

在运行时失败并显示消息File 'generated.java', Line 77, Column 47: Cannot instantiate abstract "scala.Option"

问题：有没有一种方法可以使用 java 对数据集中不带 null 的可选字段进行编码？

附属问题：顺便说一句，我在 scala 中也没有使用太多数据集，您能否验证在 scala 中实际上可以对包含选项字段的案例类进行编码？

注意：这用于中间数据集，即不读也不写的数据（但用于 …

java encoder apache-spark option-type

Juh*_*uh_

lucky-day

5
推荐指数

1
解决办法

2812
查看次数

如何在scala中获得正确的数组哈希码？

计算取决于其内容的 Array 的 hashCode 的合适方法是什么？

Array.hashCode 用于数组实例：

val h = a.hashCode
println(h == Array(1,2).hashCode) // false

a(0) = 42
println(h == a.hashCode) // true

Run Code Online (Sandbox Code Playgroud)

注意：在计算 hashCode 之前，最好避免将整个数组复制到例如 List

为什么我问：我在类中使用数组（作为私有字段），因为查找时间很关键，其内容与计算类的 hashCode 相关

arrays scala hashcode

Juh*_*uh_

2016 11-18

4
推荐指数

2
解决办法

1959
查看次数

如何在Clickhouse中添加列

我在Clickhouse中有一个表，说“ my_table”，其中有重复项（my_table_rep1，...）。我需要添加一列float64类型的默认值（-1）。

我应该怎么做？

我希望默认值不会实际添加到现有条目中。

alter-table clickhouse

Juh*_*uh_

lucky-day

4
推荐指数

1
解决办法

4004
查看次数

列出Java Web应用程序中的servlet（在tomcat中运行）

我试图重新打包一个相对较大的Java Webapp，但我没有编写代码，并且该项目的配置丢失了。我设置了第一个包装，并将其部署在tomcat中。现在要了解它，我想获得成功启动或失败的servlet的列表，以及相应的访问URL。

有没有办法获取该列表（可能是从一些启动日志中获取）？

一些细节：webapp使用gwt（我不掌握），我在ubuntu上使用tomcat7。如果可行，我不反对使用其他servlet容器的解决方案。

java gwt tomcat servlets

Juh*_*uh_

lucky-day

3
推荐指数

1
解决办法

1986
查看次数

如何测试maven部署？

我在一个 Maven 项目上工作，但无权在我们公司的 Nexus 中部署（这是由 CI 工具完成的）。但是，在配置部署时，我想测试“mvn clean deploy”实际部署的内容。

问：有没有办法运行部署但不向 Nexus 存储库发送任何内容？

我期望 2 个选项中的 1 个：

为此目的部署了某种试运行选项
有一个选项可以将部署重定向到充当 Nexus 存储库的某个本地文件夹（因此可以查看将部署的内容）

注意：我的项目是多模块的。

deployment maven

Juh*_*uh_

2020 05-26

3
推荐指数

1
解决办法

5041
查看次数

SortedSet到seq保留(排序)顺序

我有一个SortedSet,我需要将它转换为Seq保留顺序(因为我需要map使用seq输出调用).

REPL中的几个测试显示toSeq保持订单以及toIndexedSeq但我需要确定:是否保证保持订单？

否则我可以使用,.toSeq.sorted但严重矫枉过正...

scala sortedset seq

Juh*_*uh_

2016 02-24

2
推荐指数

1
解决办法

180
查看次数

当rdd项很大时,为什么rdd.map(identity).cache会变慢？

我发现当.map( identity ).cache在rdd上使用时,如果物品很大,它会变得很慢.虽然它几乎是瞬间的.

注意:这可能与这个问题有关,但在这里我提供了一个非常精确的例子(可以直接在spark-shell中执行):

// simple function to profile execution time (in ms)
def profile[R](code: => R): R = {
  val t = System.nanoTime
  val out = code
  println(s"time = ${(System.nanoTime - t)/1000000}ms")
  out
}

// create some big size item
def bigContent() = (1 to 1000).map( i => (1 to 1000).map( j => (i,j) ).toMap )

// create rdd
val n = 1000 // size of the rdd

val rdd = sc.parallelize(1 to n).map( k …

Run Code Online (Sandbox Code Playgroud)

performance caching apache-spark

Juh*_*uh_

2017 05-23

2
推荐指数

1
解决办法

2126
查看次数