小编jan*_*cki的帖子

在滚动连接上按引用添加列

问题标题中描述了主要问题.直接进入下面的例子.

我有两个数据集:

library(data.table)
dt1 <- data.table(date = as.Date("2015-06-28")+c(0L,3L,5L,7L),
                  key="date")
dt2 <- data.table(date = as.Date("2015-06-30")+c(0:1,4L),
                  val = letters[7:9],
                  dummy = rep(NA,3),
                  key="date")

Run Code Online (Sandbox Code Playgroud)

我希望将val列dt2添加到dt1使用滚动连接.
以下语句将产生与预期的类似的输出:

dt2[dt1, roll=TRUE]
#          date val dummy
# 1: 2015-06-28  NA    NA
# 2: 2015-07-01   h    NA
# 3: 2015-07-03   h    NA
# 4: 2015-07-05   i    NA

Run Code Online (Sandbox Code Playgroud)

这个陈述有两个问题:
1.我不想要第 2 dummy列
.我想通过引用来做到这一点:

address(dt1)
# [1] "0x3b57540"
address(dt2[dt1, roll=TRUE])
# [1] "0x3b4e1f0"

Run Code Online (Sandbox Code Playgroud)

所以,我在寻找轧参加并通过我引用添加列dt1和dt2,预期输出:

#          date val
# 1: …

Run Code Online (Sandbox Code Playgroud)

r data.table

jan*_*cki

lucky-day

5
推荐指数

1
解决办法

128
查看次数

将SQL插入脚本转换为CSV格式

我正在寻找一个awk命令或类似工具,将标准格式良好的SQL插入脚本转换为csv文件.
按标准我的意思是任何地方都没有数据库供应商特定的东西
格式良好我指的是sql脚本的每一行都有一个完整的列设置要插入的情况,即使有NULL.插入的字段顺序也是相同的.
示例输入SQL脚本:

INSERT INTO tbl VALUES (1, 'asd', 923123123, 'zx');
INSERT INTO tbl VALUES (1, NULL, 923123123, 'zxz');
INSERT INTO tbl VALUES (3, 'asd3', 923123123, NULL);

Run Code Online (Sandbox Code Playgroud)

可选:

INSERT INTO tbl (colA, colB, colC, colD) VALUES (1, 'asd', 923123123, 'zx');

Run Code Online (Sandbox Code Playgroud)

预期输出应该是csv文件:

1,'asd',923123123,'zx'
1,,923123123,'zxz'
3,'asd3',923123123,

Run Code Online (Sandbox Code Playgroud)

寻找性能高效的解决方案.

sql csv awk sed export-to-csv

jan*_*cki

lucky-day

5
推荐指数

2
解决办法

841
查看次数

xaringan：带有嵌套格式代码的生成表

在 xaringan 如何创建表格，其中一些单元格被格式化为代码。
在降价中，我会以下列方式声明这样的表：

header1 | header2 | header3
---------------------------
`fun1` | `code1` | text not formatted as code
`fun2` | `code2` | another
`fun3` | `code3` | and again

Run Code Online (Sandbox Code Playgroud)

当然，除了语法高亮，我不会。

我能够用来knitr::kable(, format="html")生成表格，但不能使它用于将单元格格式化为代码。尝试添加<pre><code>fun1</code></pre>，没有帮助。

r knitr r-markdown xaringan

jan*_*cki

lucky-day

5
推荐指数

1
解决办法

470
查看次数

将两个 YV12 图像缓冲区合并为一个并排图像 Java/Android

这个问题在 C++ 中有答案。有没有办法做同样的事情或从 Java/Android 端调用代码？

将两个 YV12 图像缓冲区合并为一个并排图像

java/kotlin 中的这段代码类似物是什么？

BYTE* source = buffer;
BYTE* destination = convertBuffer3D;

Run Code Online (Sandbox Code Playgroud)

这个 memcpy 函数（取自 c++ 参考memcopy）有什么类似的吗？

void * memcpy ( void * destination, const void * source, size_t num );

Run Code Online (Sandbox Code Playgroud)

java android image kotlin

Kir*_*tov

2020 06-23

5
推荐指数

1
解决办法

112
查看次数

如何在R中用复数绘制函数？

我想在R中绘制以下函数

f(w) = 1/(1-5*e^(-iw))

Run Code Online (Sandbox Code Playgroud)

其中i是-1的平方根.R可以在绘图中处理复数吗？

plot r complex-numbers

use*_*291

2019 09-12

4
推荐指数

1
解决办法

4722
查看次数

RStudio HiDPI支持

RStudio是R开发的理想IDE.我想知道是否有任何方法可以很好地支持HiDPI分辨率？
我目前拥有13英寸显示屏和3200x1800分辨率,甚至很难读取RStudio选项来调整更合适的设置.
这当然不是RStudio问题,而是与高分辨率显示有关的一般问题,需要HiDPI支持才能使其合理使用.
将其作为问题发布在此处,因为RStudio仍然不允许在github上填写问题/问题.

r rstudio

jan*_*cki

lucky-day

4
推荐指数

2
解决办法

2639
查看次数

替换引用的参数

寻找一种在引用语言对象上使用替换作为表达式的方法.
substitute期望得到懒惰的表达expr.
要目标是代替.expr在expr.template其中是基于元数据动态地生成一个语言对象.

## data
expr = quote(x <- f(10))
expr.template = quote(g(.expr, flag = TRUE))

## expected output
quote(g(x <- f(10), flag = TRUE))
#g(x <- f(10), flag = TRUE)

## current workaround
h = function(expr, expr.template){
    eval(substitute(
        substitute(
            .expr.template,
            list(.expr = expr)
        ),
        list(.expr.template = expr.template)
    ))
}
h(expr = expr, expr.template = expr.template)
#g(x <- f(10), flag = TRUE)

Run Code Online (Sandbox Code Playgroud)

如果没有更多的规范方法来处理它,我会感到惊讶.基础R溶液是优选的.

jan*_*cki

lucky-day

4
推荐指数

1
解决办法

66
查看次数

使用python datatable按组排名前N行

在python datatable中按组查询前N行的正确方法是什么？
例如获得具有最大的前2行v3的值id2, id4组,我会做熊猫下列方式表达:

df.sort_values('v3', ascending=False).groupby(['id2','id4']).head(2)

Run Code Online (Sandbox Code Playgroud)

在R中使用data.table:

DT[order(-v3), head(v3, 2L), by=.(id2, id4)]

Run Code Online (Sandbox Code Playgroud)

或在R中使用dplyr:

DF %>% arrange(desc(v3)) %>% group_by(id2, id4) %>% filter(row_number() <= 2L)

Run Code Online (Sandbox Code Playgroud)

使用pandas的示例数据和预期输出:

import datatable as dt
dt = dt.Frame(id2=[1, 2, 1, 2, 1, 2], id4=[1, 1, 1, 1, 1, 1], v3=[1, 3, 2, 3, 3, 3])
df = dt.to_pandas()
df.sort_values('v3', ascending=False).groupby(['id2','id4']).head(2)
#   id2  id4  v3
#1    2    1   3
#3    2    1   3
#4    1    1   3
#2 …

Run Code Online (Sandbox Code Playgroud)

python datatable r h2o

jan*_*cki

2019 01-31

4
推荐指数

1
解决办法

177
查看次数

r中data.table中的部分滚动总和

我正在寻找一种在大型数据库上实现滚动总和的快速方法。我想要的是一个支持左（和右）对齐和最小观察论证的快速函数。

本质上，即使样本大小小于指定的宽度，我也想计算滚动总和。在下面的示例中，只要有下 5 个值可用，我就想要下 5 个值的总和，并且如果前导值的大小小于 5，则对剩余的所有值求和。

例子： x <- seq(1:10)

期望的输出：

15 20 25 30 35 40 34 27 19 10

我知道这rollapply(x,5, sum, align = "left", partial=1)会产生所需的输出，但我正在寻找更快的解决方案。

frollsum来自包 data.table 的速度很快，但似乎没有对最小观察的争论。roll_sum从包装卷也很快，并接受最小观察值，但不支持左对齐。

提前致谢。

r data.table rolling-computation

lov*_*low

2020 04-04

4
推荐指数

1
解决办法

345
查看次数

为什么输出h2o.kmeans函数中没有集群对象？

我想h2o.kmeans从h2o包中使用函数.这是我的代码

clust <- h2o.kmeans(data = waterM, centers = 30,  key = "kmeansKey", iter.max = 1000, normalize = T, init = "none", dropNACols = F );
summary(clust@model);

Run Code Online (Sandbox Code Playgroud)

输出是

            Length Class  Mode   
params           6  -none- list   
centers      25560  -none- numeric
withinss        30  -none- numeric
tot.withinss     1  -none- numeric
size            30  -none- numeric
iter             1  -none- numeric

Run Code Online (Sandbox Code Playgroud)

为什么没有cluster包含整数向量的对象(从1:k),它表示每个点被分配到的簇？

r k-means h2o

Fed*_*ina

2016 08-28

3
推荐指数

1
解决办法

1683
查看次数

travis-ci R建议包

在我的R包中,我有几个建议的包,我在示例中使用.如ROracle,RPostgreSQL,RODBC.保持它们的建议允许跳过它们的测试,但它似乎不适用于travis-ci - 最近language: r.

我试过多个案例:
env: _R_CHECK_FORCE_SUGGESTS_=false

env: global: - _R_CHECK_FORCE_SUGGESTS_=false

没有任何帮助,我的包尝试安装建议的包除了我设置的选项,并导致生成错误.的种类:

** package ‘ROracle’ successfully unpacked and MD5 sums checked
configure: error: OCI libraries not found
ERROR: configuration failed for package ‘ROracle’
1: In utils::install.packages(deps, dependencies = NA, Ncpus = threads) :
  installation of package ‘RODBC’ had non-zero exit status
2: In utils::install.packages(deps, dependencies = NA, Ncpus = threads) :
  installation of package ‘ROracle’ had non-zero exit status
The command "Rscript -e 'options(repos = "http://cran.rstudio.com"); tryCatch({   deps …

Run Code Online (Sandbox Code Playgroud)

r devtools travis-ci

jan*_*cki

lucky-day

2
推荐指数

1
解决办法

462
查看次数

在rmarkdown/knitr中使用.Last.value

拥有和Rmd文件的内容如下:

```{r}
data.frame(a=1)
str(.Last.value)
```

Run Code Online (Sandbox Code Playgroud)

它渲染data.frame但渲染str(.Last.value)产生## NULL.
是否有任何编织选项或技巧可以让它按预期工作？
第二个预期的输出

## 'data.frame':    1 obs. of  1 variable:
##  $ a: num 1

Run Code Online (Sandbox Code Playgroud)

r knitr r-markdown

jan*_*cki

lucky-day

2
推荐指数

1
解决办法

174
查看次数

ClickHouse查询行顺序行为

SQL 本质上是无序的。
ClickHouse 在这方面的表现如何？我们是否可以期望相同的查询在后续执行中以相同的顺序返回行？它是否取决于表引擎，例如ENGINE = Memory()？如果是这样，请详细说明可能影响订单的引擎情况。
如果无法保证订单结果，那么最便宜的方法是什么？ORDER BY主键/排序键？

clickhouse

jan*_*cki

lucky-day

1
推荐指数

1
解决办法

4465
查看次数