我正在使用一个包含1900列和大约280,000行的data.table.
目前,数据完全是"整数",但我希望它们明确地"数字",所以我可以稍后将它传递给bigcor()函数.显然,bigcor()只能处理"数字"而不是"整数".
我试过了:
full.bind <- full.bind[,sapply(full.bind, as.numeric), with=FALSE]
Run Code Online (Sandbox Code Playgroud)
不幸的是,我收到错误:
Error in `[.data.table`(full.bind, , sapply(full.bind, as.numeric), with = FALSE) :
j out of bounds
Run Code Online (Sandbox Code Playgroud)
所以,我尝试使用data.table set()函数,但是我得到了错误:
Error in set(full.bind, value = as.numeric(full.bind)) :
(list) object cannot be coerced to type 'double'
Run Code Online (Sandbox Code Playgroud)
我创建了一个简单的可重现的例子.请记住,实际列不是"a","b"或"c"; 它们是非常复杂的列名,因此不可能单独引用列.
dt <- data.table(a=1:10, b=1:10, c=1:10)
Run Code Online (Sandbox Code Playgroud)
所以,我最后的问题是:
1)为什么我的sapply技术不起作用?(什么是"j out of bounds"错误?)2)为什么set()技术不是?(为什么data.table不能被强制转换为数字?)3)bigcor()函数是否需要数字对象,还是存在其他问题?
在461认证考试中,有几个问题需要:
The code must NOT use any object delimiters
Run Code Online (Sandbox Code Playgroud)
知道这意味着什么吗?
谢谢
为什么网上没有关于在 tableau 中复制 R 的基本 cor() 函数的教程。我能找到的只是按维度可视化值的相关性的教程。我只是想看看数据中的所有变量如何相互关联。
感谢您的支持@user1036719
我目前正在优化我们的 ETL 流程,并且希望能够看到处理数据时使用的现有集群配置。这样,我可以随着时间的推移跟踪我应该使用哪些工作节点大小。
是否有一个命令可以在 python 中返回集群工作线程 # 和大小,以便我可以将其写入数据帧?
我想使用R中的模式表达式来查找匹配的目录中的文件"ReportName*.HTML".这意味着我只想查找具有特定文件名和扩展名的文件,但之间存在动态字符.
这是一个例子:我想找到所有以"2016 Operations"开头但以扩展名".HTML"结尾的报告.目前我正在尝试:
files.control <- dir(path, pattern="^2016 Operations*.HTML$")
Run Code Online (Sandbox Code Playgroud)
为什么这不起作用?我喜欢一行代码; 它很简单.
r ×3
azure ×1
correlation ×1
data.table ×1
databricks ×1
python ×1
regex ×1
sql ×1
sql-server ×1
tableau-api ×1