小编Peu*_*tch的帖子

R:用NA替换多列数据帧中的多个值

我试图实现类似于这个问题的东西,但是必须用NA替换多个值,并且在大型数据集中.

df <- data.frame(name = rep(letters[1:3], each = 3), foo=rep(1:9),var1 = rep(1:9), var2 = rep(3:5, each = 3))
Run Code Online (Sandbox Code Playgroud)

生成此数据帧:

df
  name foo var1 var2
1    a   1    1    3
2    a   2    2    3
3    a   3    3    3
4    b   4    4    4
5    b   5    5    4
6    b   6    6    4
7    c   7    7    5
8    c   8    8    5
9    c   9    9    5
Run Code Online (Sandbox Code Playgroud)

我想用NA替换所有出现的,例如3和4,但仅在以"var"开头的列中.

我知道我可以使用[]运算符的组合来实现我想要的结果:

df[,grep("^var[:alnum:]?",colnames(df))][ 
        df[,grep("^var[:alnum:]?",colnames(df))] == 3 | …
Run Code Online (Sandbox Code Playgroud)

replace r multiple-columns dataframe

14
推荐指数
3
解决办法
2万
查看次数

按组(在data.table中)对多个列进行加权

这个问题跟随另一个关于群体加权平均值的问题:我想用data.table.创建加权群内平均值.与初始问题的不同之处在于,要求平均的变量名称是在字符串向量中指定的.

数据:

df <- read.table(text= "
          region    state  county  weights y1980  y1990  y2000
             1        1       1       10     100    200     50
             1        1       2        5      50    100    200
             1        1       3      120    1000    500    250
             1        1       4        2      25    100    400
             1        1       4       15     125    150    200
             2        2       1        1      10     50    150
             2        2       2       10      10     10    200
             2        2       2       40      40    100     30
             2        2       3       20     100    100     10 …
Run Code Online (Sandbox Code Playgroud)

r data.table

6
推荐指数
1
解决办法
4165
查看次数

Stata中do文件的路径

当我启动一个 do-file 以将 do-file 的路径恢复为变量时,是否有可能?

我正在与合著者共享一个项目(通过 Dropbox)。因此,文件夹(数据、日志等)的结构在两侧是相同的。

但是文件夹在我和我的合著者的文件系统上的位置不同。因此,编写与文件夹路径等无关的 do-file 对我们很有帮助。

我们希望我们的项目的路径不要被硬编码。

谢谢!

stata

5
推荐指数
1
解决办法
1万
查看次数

Stata:将回归系数存储在csv文件中

我想保存回归系数,以便在不同的软件中绘制它们(LaTeX 下的 pgfplots,请参阅此示例)。

更具体地说,我试图绘制因子变量的估计系数的条形图,例如:

use http://www.stata-press.com/data/r14/cholesterol.dta, clear
reg chol i.agegrp
Run Code Online (Sandbox Code Playgroud)

我想将每个年龄组和相关的回归系数存储在 .csv 文件中,以便我可以使用 pgfplot 将它们绘制在条形图中。如果可能的话,我什至希望保存的系数集仅限于此处的因子变量的系数i.agegrp(并且不包括其他系数,例如_cons)。

我看到了 outreg2 的选项text,但没有设法获得平面文件。还有其他解决办法吗?

stata export-to-csv

5
推荐指数
1
解决办法
3905
查看次数

R:在删除之前评估对象名称

我想删除一个对象,其名称包含在字符串对象中.

a <- 1
b <- "a"
Run Code Online (Sandbox Code Playgroud)

我试着这样做:

> rm(get(b))
Error in rm(get(b)) : ... must contain names or character strings
> remove(eval(b))
Error in remove(eval(b)) : ... must contain names or character strings
Run Code Online (Sandbox Code Playgroud)

如何让R删除其名称包含在字符串中的对象b(即此处a)?

variables r

2
推荐指数
1
解决办法
877
查看次数

Stata:检索宏中的变量标签

我正在使用 do 文件生成多个变量的图表,我希望能够检索变量标签(以便我可以将其用作图表标题)。

在我的梦里,有类似这样的事情:

sysuse auto, replace
local pricelabel = varlab(price)
display "Label for price variable is `pricelabel'"
Run Code Online (Sandbox Code Playgroud)

这将(在我的梦想中)产生:

Label for price variable is Price
Run Code Online (Sandbox Code Playgroud)

我查看了描述、总结以及标签部分的文档,但似乎找不到解决方案。

variables label stata

1
推荐指数
1
解决办法
5400
查看次数