我是R新手,想知道如何使用行名和列名将Excel数据导入到R中.具体来说,我需要一个excel文件中的许多工作表中的数据子集.我可以使用行名和列名来识别和提取某些数据单元到R吗?
Worksheet 1
----------
* X Y Z
A 1 2 2
B 1 1 1
C 1 3 4
D 4 2 2
E 2 2 2
----------
Worksheet 2
----------
* X Y1 Z1
A 1 2 2
B 1 2 3
C 1 3 4
D 4 1 1
E 2 1 1
Run Code Online (Sandbox Code Playgroud)
例如,在上述的电子表格我怎么能提取数据(2,2,2,2)在工作表1使用行和列名(d,Y)(d,Z)(E,Y)(E,Z)
如何使用工作表2中的行和列名称(D,Y1)(D,Z1)(E,Y1)(E,Z1)提取数据(1,1,1,1)?
感谢您提供的任何帮助
巴里
具体来说,我正在尝试使用dput()创建一个具有[1376,6]维度的data.frame的可重现示例,但在输出窗口中用尽空间来复制和粘贴结果.
有没有办法增加输出窗口的缓冲区大小或者有人可以在这里提出替代方法吗?
谢谢
巴里
我试图通过使用下面的代码找到(然后提取)重复的短语.我要求以"大约"开头并以"关闭"结尾的短语.
例如,"总资产约为1.629亿美元,总存款为1.445亿美元"
str_locate(x,"(\b[Aa]pproximately\b)(.*)(\b[Cc]losed\b)")
str_extract(x,"(\b[Aa]pproximately\b)(.*)(\b[Cc]losed\b)")
Run Code Online (Sandbox Code Playgroud)
上面的代码返回短语开始和结束点的NA.以下是短语所在的字符向量的示例(它是公开的FDIC信息的网页)
"206-4662".\ r \n\r \n 12月\ r \n\r \n\r \n \n西部国家银行,亚利桑那州凤凰城,总资产约为1.629亿美元,总存款为1.445亿美元.华盛顿州西雅图联邦,已同意承担除某些经纪存款以外的所有存款.\ r \n(PR-195-2011)\ r \n\r \n\r \n\r \n \n翡翠海岸的高级社区银行佛罗里达州克雷斯特维尤,总资产约1.26亿美元,总存款1.121亿美元已经关闭.佛罗里达州巴拿马城北领地银行已同意承担所有存款.\ r \n(PR-194-2011)"
我可能正在使用reg表达错误,因为我是新手,所以任何建议都非常感激.