这是一个后续问题这一个.将.xlsx
文件读入R 的最快方法是什么?
我library(xlsx)
用来读取36个.xlsx
文件的数据.有用.然而,问题在于这非常耗时(超过30分钟),尤其是在考虑每个文件中的数据不是那么大时(每个文件中的矩阵大小为3*3652).为此,请问有更好的处理这样的问题吗?还有另一种快速阅读.xlsx
R的方法吗?或者我可以快速将36个文件放入单个csv文件然后读入R?
而且,我才意识到readxl
不能写xlsx.是否有对应的处理写作而不是阅读?
"对那些投票反对的人的回应":
这个问题是关于事实,而不是所谓的"自以为是的答案和垃圾邮件",因为速度是时间和时间是事实但不是意见.
进一步更新:
或许可以用简单的语言向我们解释为什么某些方法的工作速度比其他方法快得多.我当然对此感到困惑.
我正在尝试将我的 excel 数据集链接到 R 进行统计分析。我在 OSX Sierra (10.12.6) 上运行 R studio (1.0.153) 和 Java 8 (update 144)。
一周前,函数“read_excel”能够打开我的 excel 文档。当我将 excel 和 R 文档一起移动到另一个文件夹时,它不再起作用。重新加载库没有任何效果。经过多次尝试(并重新启动 R Studio 和计算机),终于找到了一些东西,但不再找到函数“lmer”。重新加载库“lme4”后,“read_excel”不再起作用!
我也试过使用“read.xlsx”和“readWorksheet(loadWorkbook(...))”,但没有用。“read.csv”也无法正常工作,因为逗号正在创建杂乱无章的列,而我正在处理一个更大的 Excel 工作簿,并且正在进行更改。
在堆栈上阅读,问题将 .xlsx 文件导入 R并没有解决我的问题!请帮忙!
加载的库:
library(multcomp)
library(nlme)
library(XLConnect)
library(XLConnectJars)
library(lme4)
library(car)
library(rJava)
library(xlsx)
library(readxl)
Run Code Online (Sandbox Code Playgroud)
R数据文件:
Dataset <- read_excel("Example.xlsx",sheet="testing")
#alternative line: Dataset <- read.xlsx("~/Desktop/My Stuff/Sample/Example.xlsx", sheet=7)
Dataset$AAA <- as.factor(Dataset$AAA)
Dataset$BBB <- as.factor(Dataset$BBB)
Dataset$CCC <- as.numeric(Dataset$CCC)
Dataset$DDD <- as.numeric(Dataset$DDD)
Dataset_lme = lmer(CCC ~ AAA + BBB + (1|DDD), data=Dataset)
Run Code Online (Sandbox Code Playgroud) 我的数据集看起来完全像这样(只有更多的观察值和属性):
我希望每个属性都有一个二进制变量,如果PersonX拥有它,则值为1,否则为0,但是每个人还必须包括其他人的属性。它应该看起来像这样,当然,如果Person1也具有与Person2相同的属性,则不应再次生成该变量:
ID Class_Label A469 T593 K022K A835 Z935 U83F W5326
Person1 TRUE 1 1 1 0 0 0 0
Person2 FALSE 0 1 0 1 1 0 0
Person3 FALSE 0 0 1 0 0 1 1
Run Code Online (Sandbox Code Playgroud)
如您所见,Person1和Person3具有以下属性:公共属性K022K和Person1和Person2 T593。有什么办法解决这个问题吗?
我使用的是R版3.0.3.我无法安装库(xlsx).错误信息:
Loading required package: rJava
Error : .onLoad failed in loadNamespace() for 'rJava', details:
call: inDL(x, as.logical(local), as.logical(now), ...)
error: unable to load shared object 'C:/Program Files/R/R-3.0.3/library/rJava/libs/x64/rJava.dll':
LoadLibrary failure: The specified module could not be found.
Run Code Online (Sandbox Code Playgroud)
然后我尝试自己安装rjava
.得到以下错误消息:
library("rJava",lib.loc ="C:/ Program Files/R/R-3.0.3/library")错误:.onLoad在'rJava'的loadNamespace()中失败,详情:call:inDL(x, as.logical(local),as.logical(now),...)错误:无法加载共享对象'C:/ Program Files/R/R-3.0.3/library/rJava/libs/x64/rJava. dll':LoadLibrary失败:找不到指定的模块.
是否有另一种方法在R中加载excel文件?
谢谢,
我试图将一个 excel 文件读入 R。它是关于我的 cwd 中的以下文件:
> list.files()
[1] "Keuren_Op_Afspraak.xlsx"
Run Code Online (Sandbox Code Playgroud)
我安装了 XLConnect 并执行以下操作:
library(XLConnect)
demoExcelFile <- system.file("Keuren_Op_Afspraak.xlsx", package = "XLConnect")
wb <- loadWorkbook(demoExcelFile)
Run Code Online (Sandbox Code Playgroud)
但这给了我错误:
Error: FileNotFoundException (Java): File '' could not be found - you may specify to automatically create the file if not existing.
Run Code Online (Sandbox Code Playgroud)
但我不明白这是从哪里来的。有什么想法吗?
如何将Excel工作表中的数据保存到R中的.RData文件?我想使用R中的一个包并将我的数据集作为数据(数据集)加载我认为我必须将数据保存为.RData文件,然后将其加载到包中.我的数据目前在Excel电子表格中.
我的Excel工作表有列名,如x,y,time.lag.我已将其保存为.csv然后我使用:x = read.csv('filepath',header = T,)然后我说数据(x),它显示数据集'x'未找到
我正在尝试用 IMF 的数据制作一些条形图。我试图用 read.table() 读取 xls 文件:
base <- read.table("http://www.imf.org/external/pubs/ft/weo/2017/02/weodata/WEOOct2017all.xls", header=TRUE, sep="\t", fill=TRUE)
Run Code Online (Sandbox Code Playgroud)
但是,数据保存为列表:
typeof(base)
[1] "list"
Run Code Online (Sandbox Code Playgroud)
而且我不知道如何提取数据来制作条形图。例如,我想为国家“ARG”和 2010-2019 年(excel 中的第 40-49 列)绘制变量“NGDP_RPCH”。
我试过这个,但没有用:
graph <- base[which((base[2]=="ARG")&(base[3]=='NGDP_RPCH')),40:49]
graph
[1] X2010 X2011 X2012 X2013 X2014 X2015 X2016 X2017 X2018 X2019
<0 rows> (or 0-length row.names)
Run Code Online (Sandbox Code Playgroud)
我想知道如何将数据保存为数据框,或者如何从列表中提取数据向量,以便我可以运行:
barplot(graph).
Run Code Online (Sandbox Code Playgroud)