小编elg*_*oog的帖子

Intellij Scala类定义格式

如何让Intellij格式化我的Scala类定义如下:

sealed class Traffic(
    private[this] val javaTraffic: Traffic.JavaTraffic,
    private[this] val sanitizer: Sanitizer)
  extends Serializable with Logger {
Run Code Online (Sandbox Code Playgroud)

基本上每行的成员声明有4个缩进,类继承有2个缩进.

scala code-formatting intellij-idea

12
推荐指数
1
解决办法
439
查看次数

Python字符串连接速度

我通过将字符串表示从1连接到一个大数字(在我的情况下,20000000)来测试不同速度连接方法的速度.我正在测试的三种方法是:

import cProfile

count = 20000000

def profileWrapper(f):
    def wrapper(*args, **argv):
        pr = cProfile.Profile()
        pr.enable()
        string = f(*args, **argv)
        pr.create_stats()
        pr.print_stats()
        return string
    return wrapper

@profileWrapper
def naiveConcat():
    global count
    string = ''
    for i in xrange(count):
        string += `i`
    return string

@profileWrapper
def improvedConcat():
    global count
    string = []
    for i in xrange(count):
        string.append(`i`)
    return ''.join(string)

@profileWrapper
def fastestConcat():
    global count
    return ''.join([`i` for i in xrange(count)])

print 15 * "=", "naiveConcat", 15 * "="
naiveConcat()
print 15 * …
Run Code Online (Sandbox Code Playgroud)

python performance

5
推荐指数
1
解决办法
483
查看次数

Spark:缓存要在另一个作业中使用的RDD

我正在运行一个带有输入的spark作业,该输入由同一个上一个作业生成.现在,作业将结果输出到HDFS以便下次运行读入,有没有办法将每个作业的输出缓存到spark中,以便以下运行不必从HDFS读取?

更新:或者是否可以在不同的应用程序之间共享RDD?

apache-spark rdd

4
推荐指数
2
解决办法
955
查看次数