初始数据框mergedDf是
PROD_CODE
1 PRD0900033,PRD0900135,PRD0900220,PRD0900709
2 PRD0900097,PRD0900550
3 PRD0900121
4 PRD0900353
5 PRD0900547,PRD0900614
Run Code Online (Sandbox Code Playgroud)
打电话后
mergedDf<-data.frame(do.call('rbind', strsplit(as.character(mergedDf$PROD_CODE),',',fixed=TRUE)))
Run Code Online (Sandbox Code Playgroud)
输出变为
X1 X2 X3 X4
1 PRD0900033 PRD0900135 PRD0900220 PRD0900709
2 PRD0900097 PRD0900550 PRD0900097 PRD0900550
3 PRD0900121 PRD0900121 PRD0900121 PRD0900121
4 PRD0900353 PRD0900353 PRD0900353 PRD0900353
5 PRD0900547 PRD0900614 PRD0900547 PRD0900614
Run Code Online (Sandbox Code Playgroud)
似乎多余的行正在重新填充.
我尝试使用bind_rows(),rbind_all()但这些需要将拆分的更改为data.frame,这是我无法做到的.我也尝试使用rbindlist()哪个也需要data.frame作为参数.
我需要输出.这些职位并不重要.
X1 X2 X3 X4
1 PRD0900033 PRD0900135 PRD0900220 PRD0900709
2 PRD0900097 PRD0900550 NA NA
3 PRD0900121 NA NA NA
4 PRD0900353 NA NA NA …Run Code Online (Sandbox Code Playgroud) 我当然知道可重现的示例和代码段,但对于这个问题,我必须(我不能以其他方式)晦涩难懂。
我正在尝试连接 R 和Impala。撇开问题不谈(“正式”,我无法在这台 PC 上安装软件......但我使用了 R 和 RStudio 的便携式版本)
我试过RImpala包。
rimpala.connect(IP = myip,
port = the port where Impala sees,
principal = maybe this is not clear)
Run Code Online (Sandbox Code Playgroud)
我很确定我的问题的原因是principal争论,我不清楚文档。无论如何,我已经尝试了文档所说的应该放在那里的几种组合。
在任何情况下,我都会收到相同的错误:
.jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, 中的错误:java.lang.IllegalArgumentException:Kerberos 主体应该有 3 个部分:10.60.10.22:8888/impala/@tempuser
我在网上搜索过这个错误,它似乎与一些 java 的东西有关,但我对该语言的了解为零。
知道我无法访问我的 PC 会很有用,例如,我无法安装任何软件或执行只有管理员才能执行的操作。
我知道这个问题写得不好,但正如我这次所说的那样,不可能有一个可重复的例子。
现在想起来了,我IP用我在浏览器导航栏中看到的地址来填充参数,以连接到 Hue。我猜它是一样的,但也许我在这一点上也做错了,因为我已经说过我很确定错误不是由于这个原因。
我有以下数据(这是一个模拟版本),我正在使用R.
ID m
1 m1
1 m2
1 m3
2 m1
2 m2
3 m1
3 m2
3 m3
3 m4
4 m1
Run Code Online (Sandbox Code Playgroud)
每个ID都有一个m1行,其余的m在ID中是可变长度的.我想保留m1值和每个ID对应的最后一个值.理想的输出看起来像这样:
ID m
1 m1
1 m3
2 m1
2 m2
3 m1
3 m4
4 m1
Run Code Online (Sandbox Code Playgroud)
非常感谢你提前.
我有一个矩阵,其元素是0,1,2,NA!
我想删除其colsums等于0或NA的列!我想从原始矩阵中删除这些列,并为这些列创建一个新矩阵(非零colsums)!(我认为在计算colsums时我考虑了na.rm = True并删除colsum = 0的colums,因为如果我认为na.rm = False,我的colsums的所有值都得到NA)
这是我的矩阵格式:
mat[1:6,1:6]
1:11059017 1:11088817 1:11090640 1:11099385 1:1109967 1:111144756
0 0 0 0 NA 0
0 0 0 0 0 NA
1 NA 2 0 NA 0
0 0 0 1 0 2
2 0 0 0 0 0
0 0 NA 0 0 0
Summat <- colSums(mat,na.rm = TRUE)
head(summat)
1:11059017 1:11088817 1:11090640 1:11099385 1:1109967 1:111144756
[,1] 3 0 2 1 0 2
Run Code Online (Sandbox Code Playgroud)
第2列和第5列有colsum = 0所以我应该从met中删除它们并将其余列保留在另一个矩阵中.
我的输出应该如下:
met-nonzero
1:11059017 1:11090640 1:11099385 1:111144756 …Run Code Online (Sandbox Code Playgroud) 我有一个数据集,我需要删除三个文本列之间的所有空格,并用一个逗号替换.我尝试了gsub的一些选项,但没有任何效果.我想在R中这样做
gsub("^ *|(?<= ) | *$", ",", all_data, perl=T)
Run Code Online (Sandbox Code Playgroud)
所有间距下面的样本在文件中是不同的大小(数字只是一个行号)
> [1] Pig Piggy 2
> [2] Chicken Chick 7
> [3] Cow Calf 3
Run Code Online (Sandbox Code Playgroud)
期望的输出:
猪,小猪,2
鸡,小鸡,7
牛,小牛,3
提前致谢.