小编Piz*_*ode的帖子

从 R 中的整个数据框中删除特殊字符

问题:

如何使用 R 快速高效地从数据框中删除所有特殊字符?

进步:

这篇 SO文章详细介绍了如何删除特殊字符。我可以将 gsub 函数应用于单列(图像 1 和 2),但不能应用于整个数据帧。

问题:

我的数据帧由 100 多列整数、字符串等组成。当我尝试在数据帧上运行 gsub 时,它不会返回我想要的输出。相反,我得到了图 3 中所示的内容。

df <- read.csv("C:/test.csv")
dfa <- gsub("[[:punct:]]", "", df$a) #this works on a single column
dfb <- gsub("[[:punct:]]", "", df$b) #this works on a single column
df_all <- gsub("[[:punct:]]", "", df) #this does not work on the entire df
View(df_all)
Run Code Online (Sandbox Code Playgroud)

df - 这是原始数据框:

原始数据框

dfa - 这是应用于 b 列的 gsub。好的!

gsub 应用于 b 列

df_all - 这是应用于整个数据帧的 gsub。坏的!

gsub 应用于整个数据帧

概括:

有没有办法 gsub 整个数据帧?否则,应该使用 apply 函数吗?

r data-cleaning data-science

5
推荐指数
2
解决办法
2万
查看次数

SAS时间戳从科学记数法到yyyy/mm/dd hh:mm:ss

问题:

我的时间戳以科学记数法显示.我想显示没有科学记数法的列,并创建第二列格式为长日期,yyyy/mm/dd hh:mm:ss.

采取的步骤:

我已经将列从UNIX Epoch(1960)时间戳转换为SAS时间(1970)时间戳.但科学记数仍然存在.我试过date20.也没有做到这一点.

科学记数法中的时间戳

我当前的代码不足,无法将时间戳列格式化为日期.

proc print data=heart._23a;
    format timestamp date9.;
run;
Run Code Online (Sandbox Code Playgroud)

结果:

它导致没有错误,但它将我的矩阵重新设置为1x3.我需要获得相同维度的矩阵,只需重新格式化时间戳.我感谢任何帮助,但请保持简单,我在未知领域!

sql database sas

4
推荐指数
1
解决办法
335
查看次数

Python 的 Rpubs 等效项

Rpubs非常适合共享和发布 R 演示文稿。有没有类似的 python 网站,或者更具体地说是 Jupyter 笔记本?

python markdown r jupyter jupyter-notebook

3
推荐指数
1
解决办法
1373
查看次数