小编luc*_*one的帖子

评估HIVE集合陈述中的表达

在我的hive查询中,我设置了一些变量.

但是我意识到hive记住了表达而不是值,例如:

set a=1 ;
set b=2 ;
set c= ${hiveconf:a} + ${hiveconf:b} ;
set c ;
-- the command above returns
-- c=1 + 2

Run Code Online (Sandbox Code Playgroud)

为什么Hive不评估价值？有没有办法设置配置单元,以便在我之前的示例中set c ;返回c= 3？

variables hadoop hive set

luc*_*one

lucky-day

9
推荐指数

1
解决办法

1032
查看次数

R devtools:创建html和pdf的晕影

我已经为我的一个软件包编写了一个小插图形式的教程.

它工作正常,但它只创建小插图的html版本.有没有办法可以创建我的插图的html和pdf版本？

我试图在我的.Rmd文件的输出字段中附加rmarkdown :: pdf,但它没有用.

html pdf vignette r r-markdown

luc*_*one

lucky-day

9
推荐指数

1
解决办法

1101
查看次数

我可以在与活动分支不同的分支中打开文件吗？

假设我的git存储库中有一个分支"work"和一个分支"ideas".

我通常在"work"分支中处理我的marvelous_file.cpp,但有时我想同时打开我的"ideas"分支中的marvelous_file.cpp.

我不想看到这两个文件之间的区别,而是从"ideas"分支中获取代码片段,然后将它们复制并传递到"work"分支中的文件中.

这可能吗？如果没有,我可以将"想法"中的文件签入"工作",但使用不同的名称吗？

git

luc*_*one

2012 10-27

6
推荐指数

1
解决办法

63
查看次数

Python numpy.nan和逻辑函数：错误的结果

当尝试对可能包含nan值（如numpy中定义）的数据求逻辑表达式时，我得到一些令人惊讶的结果。

我想了解为什么会出现这种结果以及如何实施正确的方法。

我不明白的是为什么这些表达式求值的价值：

from numpy import nan

nan and True
>>> True
# this is wrong.. I would expect to evaluate to nan

True and nan
>>> nan
# OK

nan and False
>>> False
# OK regardless the value of the first element 
# the expression should evaluate to False

False and nan
>>> False
#ok

Run Code Online (Sandbox Code Playgroud)

同样适用于or：

True or nan
>>> True #OK

nan or True
>>> nan #wrong the expression is True

False or …

Run Code Online (Sandbox Code Playgroud)

python boolean numpy nan python-2.7

luc*_*one

2013 06-24

6
推荐指数

1
解决办法

2521
查看次数

R如何在加载时使变量可用于命名空间

在我的一个包中,我使用.onAttach钩子来运行一些R代码,然后使用它assign来使值可用作包变量之一.我这样做是因为variable取决于某个文件的内容,它可以在一个会话和另一个会话之间切换.我使用的代码如下:

.onAttach <- function(libname, pkgname) {
   variable <- some_function()
   assign("variable", variable, envir = as.environment("package:MyRPackage"))
}

Run Code Online (Sandbox Code Playgroud)

当我附上包装时library(MyRpackage)我可以使用variable.

然而,不可能做类似的事情MyRPackage::variable(除非我已经附上了包library(MyRpackage).

我知道这是因为我应该将该代码放在.onLoad钩子中,但是我无法进行赋值以使其工作.

我试过了

.onLoad <- function(libname, pkgname) {
   variable <- some_function()
   assign("variable", variable, envir = as.environment("namesoace:MyRPackage"))
}

Run Code Online (Sandbox Code Playgroud)

和

.onLoad <- function(libname, pkgname) {
   variable <- some_function()
   assign("variable", variable, envir = asNamespace("MyRPackage"))
}

Run Code Online (Sandbox Code Playgroud)

但是当我在MyRPackage:::variable不使用library附加包的情况下运行时,它们都会失败并出现一些错误.

在.onLoad钩子中进行赋值的正确方法是什么？

r devtools r-package

luc*_*one

2018 03-03

6
推荐指数

2
解决办法

614
查看次数

git:如何列出给定提交中存在的所有文件？

我想得到一个给定点git中存在的所有文件的列表.

我试过发布类似的东西:

git show --pretty="format:" --name-only f21b25e76d146

Run Code Online (Sandbox Code Playgroud)

这仅显示添加的文件,而不是在该特定提交的工作目录中存在的所有文件.有办法吗？

非常感谢提前.

git list show

luc*_*one

2012 03-14

5
推荐指数

1
解决办法

428
查看次数

C++ 如何检查一个函数是否正在接收一个无符号整数？

我有一个函数声明为：

void foo(unsigned int x)

Run Code Online (Sandbox Code Playgroud)

如何检查 foo() 没有收到负数？我希望如果我调用 foo(-1) 会抛出异常，但当然由于 x 会自动转换为无符号，因此我无法检查其正性，例如：

if not(x>=0){ do_something();};

Run Code Online (Sandbox Code Playgroud)

或类似的检查。

c++ int unsigned

luc*_*one

2012 09-16

5
推荐指数

1
解决办法

4229
查看次数

如何从配置单元查询创建制表符分隔的文件？

我正在尝试从配置单元查询创建一个制表符分隔值。

根据 Apache Hive wiki，我将查询编写为：

INSERT OVERWRITE LOCAL DIRECTORY '/home/luca/query_results/'
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY  '\t' ESCAPED BY '"' LINES TERMINATED BY '\n' 
STORED AS TEXTFILE
SELECT * FROM mytable ;

Run Code Online (Sandbox Code Playgroud)

（请注意，真正的查询非常复杂，我知道我可以hive -e "Select * from mytable > output在这个简单的情况下使用）。

该查询似乎有效，但在 query_results 目录中我找到一个带有.snappy扩展名的文件，当我打开它时，它似乎是一个二进制文件，而不是文本文件。

我的查询有什么问题？如何在格式良好的文本文件中获取查询结果（我想编写一个返回多个此类文件的配置单元脚本。如果我什至可以从配置单元中指定文件的名称，那就太好了）。

csv hive insert save create-table

luc*_*one

lucky-day

5
推荐指数

1
解决办法

3万
查看次数

solr根据分布得到结果

有没有办法synopsis根据其中一个索引字段的某些分布来获得结果？

例如,假设我有一个书籍目录"synopsis""publication_year"和"genre".我想构建一个查询,根据"概要"返回最相关的结果,有利于最近出版的书籍.然而,在最终结果中(假设为1000)我希望根据某些给定的分布尽可能地分布该类型,例如:50%的科幻小说,25%的非小说,10%的政治等等. .

我知道我可以得到一个大的结果集,并做一些加权的水库采样,以获得最终的1000本书在solr之外,但我正在寻找一个只有solr的解决方案.

这可能吗？如果没有,您对如何解决这个问题有任何建议吗？

solr distribution

luc*_*one

2019 05-21

5
推荐指数

1
解决办法

58
查看次数

在IntelliJ中使用Scala工作表很难

我正在遵循Scala中的函数编程原理课程，但是在IntelliJ中使用Scala工作表进行快速测试时遇到了很多问题。

例如，我建立了一个新的Scala项目，在其中创建了一个名为lecture5（位于文件中）的包对象。src/main/scala/lecture5/package.scala

该文件的内容为：

package object lecture5 {

  def last[T](xs:List[T]): T =  xs match {
    case List() => throw new Error("empty list")
    case List(x) => x
    case x :: y => last(y)
  }

  /* init should return all elements but last */
  def init[T](xs: List[T]): List[T] = xs match {
    case List() => throw new Error("List is empty")
    case List(x) => List[T]()
    case y :: ys => y :: init(ys)
  }

  def concat[T](xs: List[T], ys: List[T]): List[T] = …

Run Code Online (Sandbox Code Playgroud)

scala intellij-idea

luc*_*one

lucky-day

5
推荐指数

1
解决办法

154
查看次数