我有非结构化数据,如下所示:
data <- c("24-March-2017 product 1 color 1",
"March-2017-24 product 2 color 2",
"2017-24-March product 3 color 3")
Run Code Online (Sandbox Code Playgroud)
我想计算每行的日期和第一个字符(产品列)之间的空格数.如示例数据所示,日期格式可能会有所不同.此信息将用于将数据置于结构化格式.
在R中执行此操作的最佳方法是什么?我相信gsub
在这种情况下可以使用,只是不确定如何应用于只计算每行开头的空格数.
我有一个名为"pipel"的表,其中包含10,000多行.我想添加一个ID列来为每一行分配一个唯一的ID.唯一ID必须为30位数字,并以"AKM_CC_Test_"开头.我使用下面的代码作为起点但不知道如何格式化它以添加前缀并使其长达30位.
id <- rownames(pipel)
pipel <- cbind(id=id, pipel)
Run Code Online (Sandbox Code Playgroud)
例如,第一行ID需要看起来像这样AKM_CC_Test_000000000000000001
我需要能够在 R 中反转单词。例如,将“这是我的文本”转换为“我的文本是这个”。我尝试使用 stringr 包中的 word 函数,如下所示,但没有用,只有“”
word("this is my text", -1,1)
[1] ""
Run Code Online (Sandbox Code Playgroud)
任何建议为什么上述方法不起作用或任何其他方式来反转单词?
我有一个超过10,000行的文本文件,每行有一个单词,以CDID_开头,后跟10个字符,没有空格,如下所示:
a <- c("Test CDID_1254WE_1023 Sky","CDID_1254XE01478 Blue","This File named as CDID_ZXASWE_1111")
Run Code Online (Sandbox Code Playgroud)
我想提取以CDID_开头的单词,使上面的行看起来像这样:
CDID_1254WE_1023
CDID_1254XE01478
CDID_ZXASWE_1111
Run Code Online (Sandbox Code Playgroud)