我有一个示例数据集,看起来类似于下面的数据集:
d= data.frame(a = c(1,5,56,4,9),
b = c(0,0,NA,0,NA),
c = c(98,67,NA,3,7),
d = c(0,0,0,0,0),
e = c(NA,NA,NA,NA,NA))
Run Code Online (Sandbox Code Playgroud)
这将是:
| a | b | c | d | e |
|----|:--:|---:|---|----|
| 1 | 0 | 98 | 0 | NA |
| 5 | 0 | 67 | 0 | NA |
| 56 | NA | NA | 0 | NA |
| 4 | 0 | 3 | 0 | NA |
| 9 | NA | 7 …Run Code Online (Sandbox Code Playgroud) 我有一个非常大的数据集,并且其中的一个样本看起来类似于以下内容:
| Id | Name | Start_Date | End_Date |
|----|---------|------------|------------|
| 10 | Mark | 4/2/1999 | 7/5/2018 |
| 10 | | 1/1/2000 | 9/24/2018 |
| 25 | | 5/3/1968 | 6/3/2000 |
| 25 | | 6/6/2009 | 4/23/2010 |
| 25 | Anthony | 2/20/2010 | 7/21/2016 |
| 25 | | 9/12/2014 | 11/26/2019 |
Run Code Online (Sandbox Code Playgroud)
我需要Name根据它们的名称来解析列中的名称,以Id使输出表如下所示:
| Id | Name | Start_Date | End_Date |
|----|---------|------------|------------|
| 10 | Mark …Run Code Online (Sandbox Code Playgroud) 我有一个带有名称列的数据集,其中包含姓氏和名字。我需要将它们交换为名字和姓氏。这是我的数据集:
df=data.frame(Id=c("10","50"), Name=c("NAGAR MAYANK","PETER MARK"), Street= c("Newark Ave","Grant Ave"),Country=c("NJ","TX"))
Run Code Online (Sandbox Code Playgroud)
我已经尝试过下面的代码可以工作:
sub("(\\w+),\\s(\\w+)","\\2\\1", dummy$Name)
Run Code Online (Sandbox Code Playgroud)
然而,这给了我原来的名字,即“NAGAR MAYANK”和“PETER MARK”。
我需要如下输出:
| Id | Name | Street | State |
|----|---------------|------------|-------|
| 10 | MAYANK NAGAR | Newark Ave | NJ |
| 50 | MARK PETER | Grant Ave | TX |
Run Code Online (Sandbox Code Playgroud)