小编dfr*_*kow的帖子

在emacs 23中将python缩进设置为2个空格？

我在Ubuntu 10.04上使用emacs 23.1.1.我希望使用2空格缩进在Python中编程.emacs看起来有python的默认模式(python.el？).

我把以下内容放在我的.emacs中:

    ;; Only spaces, no tabs
    (setq indent-tabs-mode nil)

    ;; Always end a file with a newline
    (setq require-final-newline nil)

    ;; Don't know which of these might work
    (setq-default tab-width 2)
    (setq-default python-indent 2)
    (setq-default py-indent-offset 2)

Run Code Online (Sandbox Code Playgroud)

当我编辑Python文件时,它使用4空格缩进.当我尝试Ch v python-indent时,它说:

    python-indent's value is 4
    Local in buffer webpage_cache.py; global value is 2

        This variable is safe as a file local variable if its value
        satisfies the predicate `integerp'.

    Documentation:
    Number of columns for a unit of indentation …

Run Code Online (Sandbox Code Playgroud)

emacs python-mode

dfr*_*kow

lucky-day

20
推荐指数

3
解决办法

2万
查看次数

使用Google的Gson进行严格的JSON解析？

假设我使用Google的Gson库将JSON解析为Java数据结构.

如果存在没有相应JSON的Java字段,是否有一种简单的方法可以抛出异常？也就是说,我希望JSON拥有Java结构中的所有字段.

java serialization json gson

dfr*_*kow

2011 03-25

19
推荐指数

1
解决办法

2万
查看次数

Hive如何选择工作的减速器数量？

有几个地方说Hadoop作业中默认的减少器数是1.您可以使用mapred.reduce.tasks符号手动设置减速器的数量.

当我运行Hive作业时(在Amazon EMR,AMI 2.3.3上),它有一些大于1的减速器.看看工作设置,有些东西已经设置了mapred.reduce.tasks,我认为是Hive.它如何选择这个数字？

注意:这是运行Hive作业时的一些消息,应该是一个线索:

...
Number of reduce tasks not specified. Estimated from input data size: 500
In order to change the average load for a reducer (in bytes):
  set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
  set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
  set mapred.reduce.tasks=<number>
...

Run Code Online (Sandbox Code Playgroud)

hadoop hive

dfr*_*kow

2013 04-25

16
推荐指数

1
解决办法

2万
查看次数

为什么在Hive中计数(明显)慢于group by？

在Hive上,我相信count(不同)将比group-by更可能导致减速器的工作量不平衡,并最终导致一个悲伤的减速器磨损.下面的示例查询.

为什么？

示例查询:

select count(distinct user)
from some_table

Run Code Online (Sandbox Code Playgroud)

分组版本(建议更快):

select count(*) from
(select user
 from some_table
 group by user) q

Run Code Online (Sandbox Code Playgroud)

注意:本演示文稿的幻灯片26 描述了该问题.

performance hive aggregate-functions

dfr*_*kow

2018 11-22

16
推荐指数

1
解决办法

2万
查看次数

R CMD javareconf找不到jni.h

我正在尝试在基于debian(jessie)和Anaconda的docker容器中安装rJava.

作为根,我做到了

$ apt-get update  && apt-get install -y --no-install-recommends \
  default-jdk default-jre libicu-dev

Run Code Online (Sandbox Code Playgroud)

然后

$ R CMD javareconf 
Java interpreter : /usr/lib/jvm/jdk1.8.0_121/jre/bin/java
Java version     : 1.8.0_121
Java home path   : /usr/lib/jvm/jdk1.8.0_121
Java compiler    : /usr/lib/jvm/jdk1.8.0_121/bin/javac
Java headers gen.: /usr/lib/jvm/jdk1.8.0_121/bin/javah
Java archive tool: /usr/lib/jvm/jdk1.8.0_121/bin/jar

trying to compile and link a JNI program 
detected JNI cpp flags    : -I/usr/lib/jvm/java/include -I/usr/lib/jvm/java/include/linux
detected JNI linker flags : -L$(JAVA_HOME)/jre/lib/amd64/server -ljvm
gcc -std=gnu99 -I/opt/conda/lib/R/include -DNDEBUG -I/usr/lib/jvm/java/include -I/usr/lib/jvm/java/include/linux -I/opt/conda/include    -fpic  -I/opt/conda/include  -c conftest.c -o conftest.o
conftest.c:1:17: …

Run Code Online (Sandbox Code Playgroud)

java r rjava

dfr*_*kow

lucky-day

16
推荐指数

4
解决办法

1万
查看次数

如何以编程方式告诉 ggplot 有多少个方面？

下面是代码和图表。

该图具有三个方面。the_plot我在哪里可以找到它具有三个方面？是的，我可以从mtcars数据框中得到它，或者the_plot$data，但我不想重新创建数据分析。相反，我想检查的图形元素the_plot，因此我不必在多个地方复制应用程序逻辑。 the_plot$facet没有显示任何我认识的东西，其他绘图变量也没有显示。

我正在使用 tidyverse 1.3.0。

library(tidyverse)
data(mtcars)
the_plot<-ggplot(mtcars, aes(mpg, disp, group=cyl)) + facet_wrap(~cyl) + geom_point()
the_plot

Run Code Online (Sandbox Code Playgroud)

r ggplot2

dfr*_*kow

lucky-day

16
推荐指数

2
解决办法

463
查看次数

Python有同步吗？

该同步手册页说:

sync()导致对文件元数据和数据的所有缓冲修改都写入底层文件系统.

Python有调用来做这个吗？

PS不是fsync,我明白了.

python linux sync

dfr*_*kow

2013 04-13

15
推荐指数

3
解决办法

1万
查看次数

你如何使用Ruby CSV转换器？

假设您有以下文件:

textfield,datetimefield,numfield
foo,2008-07-01 17:50:55.004688,1
bar,2008-07-02 17:50:55.004688,2

Run Code Online (Sandbox Code Playgroud)

读取.csv的Ruby代码如下:

#!/usr/bin/env ruby

require 'csv'

csv = CSV($stdin, :headers => true, :converters => :all)
csv.each do |row|
  print "#{row}"
  the_date = row['datetimefield'].to_date
end

Run Code Online (Sandbox Code Playgroud)

该代码提供此错误消息:

./foo2.rb:8:in `block in <main>': undefined method `to_date' for "2008-07-01 17:50:55.004688":String (NoMethodError)

Run Code Online (Sandbox Code Playgroud)

是什么赋予了？

我已经阅读了文档,但我没理解.

编辑:是的,我可以单独解析字段.这个问题的关键是我想学习如何使用记录的转换器功能.

ruby csv

dfr*_*kow

2012 01-19

14
推荐指数

2
解决办法

1万
查看次数

如何忽略heredoc中的flake8“行太长”错误

假设我有一个带有长行的定界文档的文件：

    some_string = '''
very long lines here, 20 lines each of length 500
'''

Run Code Online (Sandbox Code Playgroud)

如何忽略该定界文档中的所有 flake8“行太长”错误，而不排除整个文件的检查？

这个答案描述了# noqa一行，但我不能把它放在heredoc中。该手册似乎没有描述忽略一段代码。

python flake8

dfr*_*kow

lucky-day

14
推荐指数

1
解决办法

1万
查看次数

从Google Collections中查找Multiset中的前N个元素？

甲谷歌集合多重集是一组元素的每一个都具有一个计数(即可能存在多次).

我不能告诉你我想做多少次以下事情

制作直方图(完全是Multiset)
从直方图中按计数获取前N个元素

示例:前10个URL(按提到的#次),前10个标签(按#次应用),...

鉴于Google Collections Multiset,做#2的规范方法是什么？

这是一篇关于它的博客文章,但该代码并不是我想要的.首先,它返回所有内容,而不仅仅是前N个.其次,它会复制(是否可以避免复制？).第三,我通常想要一种确定性的排序,即如果计数相等则是抢七.其他尼特:它不是静止的等等.

java multiset guava

dfr*_*kow

2010 06-13

13
推荐指数

1
解决办法

2673
查看次数

标签统计

java ×3

hive ×2

python ×2

r ×2

aggregate-functions ×1

csv ×1

emacs ×1

flake8 ×1

ggplot2 ×1

gson ×1

guava ×1

hadoop ×1

json ×1

linux ×1

multiset ×1

performance ×1

python-mode ×1

rjava ×1

ruby ×1

serialization ×1

sync ×1

标签 统计

小编dfr_kow的帖子

标签统计