问题:
如何使用 R 快速高效地从数据框中删除所有特殊字符?
进步:
这篇 SO文章详细介绍了如何删除特殊字符。我可以将 gsub 函数应用于单列(图像 1 和 2),但不能应用于整个数据帧。
问题:
我的数据帧由 100 多列整数、字符串等组成。当我尝试在数据帧上运行 gsub 时,它不会返回我想要的输出。相反,我得到了图 3 中所示的内容。
df <- read.csv("C:/test.csv")
dfa <- gsub("[[:punct:]]", "", df$a) #this works on a single column
dfb <- gsub("[[:punct:]]", "", df$b) #this works on a single column
df_all <- gsub("[[:punct:]]", "", df) #this does not work on the entire df
View(df_all)
Run Code Online (Sandbox Code Playgroud)
df - 这是原始数据框:
dfa - 这是应用于 b 列的 gsub。好的!
df_all - 这是应用于整个数据帧的 gsub。坏的!
概括:
有没有办法 gsub 整个数据帧?否则,应该使用 apply 函数吗?
问题:
我的时间戳以科学记数法显示.我想显示没有科学记数法的列,并创建第二列格式为长日期,yyyy/mm/dd hh:mm:ss.
采取的步骤:
我已经将列从UNIX Epoch(1960)时间戳转换为SAS时间(1970)时间戳.但科学记数仍然存在.我试过date20.也没有做到这一点.
我当前的代码不足,无法将时间戳列格式化为日期.
proc print data=heart._23a;
format timestamp date9.;
run;
Run Code Online (Sandbox Code Playgroud)
结果:
它导致没有错误,但它将我的矩阵重新设置为1x3.我需要获得相同维度的矩阵,只需重新格式化时间戳.我感谢任何帮助,但请保持简单,我在未知领域!
Rpubs非常适合共享和发布 R 演示文稿。有没有类似的 python 网站,或者更具体地说是 Jupyter 笔记本?