数据帧D1中的分类变量V1可以具有由A到Z的字母表示的值.我想创建子集D2,其排除一些值,例如B,N和T.基本上,我想要一个命令,即相反的 %in%
D2 = subset(D1, V1 %in% c('B','N',T'))
Run Code Online (Sandbox Code Playgroud) 我试图绘制两个变量,其中N = 700K.问题是重叠太多,因此情节大部分都是黑色的固体块.是否有任何方法可以使用灰度"云",其中图的黑暗是区域中点数的函数?换句话说,我不希望显示单个点,而是希望绘图为"云",区域中的点数越多,该区域越暗.
可能重复:
R:多行注释解决方法?
我想在R中注释掉几行代码.有没有办法做到这一点而不必在每行之前放一个# - 有点像/* blocked out code */在SAS中?
我的记忆被一堆中间文件阻塞(称为temp1,temp2等).是否有可能在没有做的情况下将它们从内存中删除rm(temp1),rm(temp2)一次一个?我试过了rm(list(temp1, temp2, etc.)),但这似乎不起作用.
city,hs_cd,sl_no,col_01,col_02,col_03
Austin,1,2,,46,Female
Austin,1,3,,32,Male
Austin,1,4,,27,Male
Austin,1,5,,20,Female
Austin,2,2,,42,Female
Austin,2,1,,52,Male
Austin,2,3,,25,Male
Austin,2,4,,22,Female
Austin,3,3,,30,Female
Austin,3,1,,65,Female
Run Code Online (Sandbox Code Playgroud)
我想将数据框中的所有小写字符转换为大写.有没有办法一次性完成这一操作,而不是在每个字符变量上重复这样做?
这可能是一个非常简单的问题.我有一个数据帧列表(df1,df2 .... dfn),即列表的每个元素都是一个数据帧.所以基本上,列表是这样创建的:
mylist = list(df1, df2,...., dfn)
Run Code Online (Sandbox Code Playgroud)
但是我该怎么做反过来,即unlist,以便df1,df2等单独驻留在工作区中?
对不起,如果这太基础了.我有一个csv文件,其中列有一个标题行(v1,v2等).我知道要提取第1列和第2列,我必须这样做:awk -F "," '{print $1 "," $2}' infile.csv > outfile.csv.但是,如果我必须提取1到10,20到25和30,33列呢?作为附录,有没有办法直接提取标题名称而不是列号?
我想在我打印的表格下面发表评论,xtable.我认为最好的选择是使用"标题"选项:xtable(tablename, caption="This is a caption").但这是以某种方式自动放入"表1",因此输出如下:
表1:这是一个标题.
是否有任何方法可以抑制这种或任何更简单的方式将注释简单地作为表中的附加最后一行?
我有两个数据帧(x和y),其中ID是student_name,father_name和mother_name.由于印刷错误("n"而不是"m",随机白色空间等),我有大约60%的值没有对齐,尽管我可以关注数据并看到它们应该.有没有办法以某种方式降低不匹配的级别,以便手动编辑,因为至少可行?数据帧有大约700K的观测值.
R最好.我知道一点python,以及一些基本的unix工具.PS我读过agrep(),但不明白它如何对实际数据集起作用,特别是当匹配超过一个变量时.
更新(已发布奖金的数据):
这是两个示例数据框,sites_a和sites_b.他们可以在数字列匹配lat和lon以及在sitename列.知道如何在a)只是lat+ lon,b)sitename或c)两者上完成这将是有用的.
您可以获取文件test_sites.R,该文件作为要点发布.
理想情况下,答案将以此结束
merge(sites_a, sites_b, by = **magic**)
Run Code Online (Sandbox Code Playgroud) 我有一个数据框,其中所有变量都是字符类型.许多列都是空的,即只有变量头,但没有值.有没有办法对空列进行子集化?