小编use*_*432的帖子

与%相反的百分比

数据帧D1中的分类变量V1可以具有由A到Z的字母表示的值.我想创建子集D2,其排除一些值,例如B,N和T.基本上,我想要一个命令,即相反的 %in%

D2 = subset(D1, V1 %in% c('B','N',T'))
Run Code Online (Sandbox Code Playgroud)

r

226
推荐指数
8
解决办法
24万
查看次数

分数太多的散点图

我试图绘制两个变量,其中N = 700K.问题是重叠太多,因此情节大部分都是黑色的固体块.是否有任何方法可以使用灰度"云",其中图的黑暗是区域中点数的函数?换句话说,我不希望显示单个点,而是希望绘图为"云",区域中的点数越多,该区域越暗.

r scatter-plot

119
推荐指数
7
解决办法
7万
查看次数

R:注释掉代码块

可能重复:
R:多行注释解决方法?

我想在R中注释掉几行代码.有没有办法做到这一点而不必在每行之前放一个# - 有点像/* blocked out code */在SAS中?

comments r

76
推荐指数
3
解决办法
31万
查看次数

用rm()删除多个对象

我的记忆被一堆中间文件阻塞(称为temp1,temp2等).是否有可能在没有做的情况下将它们从内存中删除rm(temp1),rm(temp2)一次一个?我试过了rm(list(temp1, temp2, etc.)),但这似乎不起作用.

r

75
推荐指数
3
解决办法
10万
查看次数

将数据框中所有字符变量中的所有值从小写转换为大写

我有一个混合的字符和数字变量数据框.

city,hs_cd,sl_no,col_01,col_02,col_03
Austin,1,2,,46,Female
Austin,1,3,,32,Male
Austin,1,4,,27,Male
Austin,1,5,,20,Female
Austin,2,2,,42,Female
Austin,2,1,,52,Male
Austin,2,3,,25,Male
Austin,2,4,,22,Female
Austin,3,3,,30,Female
Austin,3,1,,65,Female
Run Code Online (Sandbox Code Playgroud)

我想将数据框中的所有小写字符转换为大写.有没有办法一次性完成这一操作,而不是在每个字符变量上重复这样做?

string r uppercase

72
推荐指数
6
解决办法
19万
查看次数

取消列出数据框列表

这可能是一个非常简单的问题.我有一个数据帧列表(df1,df2 .... dfn),即列表的每个元素都是一个数据帧.所以基本上,列表是这样创建的:

mylist = list(df1, df2,...., dfn)
Run Code Online (Sandbox Code Playgroud)

但是我该怎么做反过来,即unlist,以便df1,df2等单独驻留在工作区中?

r

42
推荐指数
2
解决办法
2万
查看次数

使用Awk从分隔文件中提取特定列

对不起,如果这太基础了.我有一个csv文件,其中列有一个标题行(v1,v2等).我知道要提取第1列和第2列,我必须这样做:awk -F "," '{print $1 "," $2}' infile.csv > outfile.csv.但是,如果我必须提取1到10,20到25和30,33列呢?作为附录,有没有办法直接提取标题名称而不是列号?

unix csv awk

33
推荐指数
2
解决办法
13万
查看次数

R:xtable标题(或评论)

我想在我打印的表格下面发表评论,xtable.我认为最好的选择是使用"标题"选项:xtable(tablename, caption="This is a caption").但这是以某种方式自动放入"表1",因此输出如下:

表1:这是一个标题.

是否有任何方法可以抑制这种或任何更简单的方式将注释简单地作为表中的附加最后一行?

r xtable

14
推荐指数
1
解决办法
8437
查看次数

通过R中变量的模糊匹配进行合并

我有两个数据帧(x和y),其中ID是student_name,father_namemother_name.由于印刷错误("n"而不是"m",随机白色空间等),我有大约60%的值没有对齐,尽管我可以关注数据并看到它们应该.有没有办法以某种方式降低不匹配的级别,以便手动编辑,因为至少可行?数据帧有大约700K的观测值.

R最好.我知道一点python,以及一些基本的unix工具.PS我读过agrep(),但不明白它如何对实际数据集起作用,特别是当匹配超过一个变量时.


更新(已发布奖金的数据):

是两个示例数据框,sites_asites_b.他们可以在数字列匹配latlon以及在sitename列.知道如何在a)只是lat+ lon,b)sitename或c)两者上完成这将是有用的.

您可以获取文件test_sites.R,该文件作为要点发布.

理想情况下,答案将以此结束

merge(sites_a, sites_b, by = **magic**)
Run Code Online (Sandbox Code Playgroud)

unix linux r

14
推荐指数
2
解决办法
2959
查看次数

R:删除多个空字符变量列

我有一个数据框,其中所有变量都是字符类型.许多列都是空的,即只有变量头,但没有值.有没有办法对空列进行子集化?

r isnullorempty is-empty

14
推荐指数
4
解决办法
2万
查看次数

标签 统计

r ×9

unix ×2

awk ×1

comments ×1

csv ×1

is-empty ×1

isnullorempty ×1

linux ×1

scatter-plot ×1

string ×1

uppercase ×1

xtable ×1