小编gia*_*iac的帖子

基于配对数据的额外列(变异)

我有一个配对数据的数据集(同一家庭的成员).

Id是个人标识符,householdid是合作伙伴的标识符(反之亦然).

我需要的是为他/她的伴侣的每个id添加一个额外的列(职业).

我的数据看起来像这样

dta = rbind( c(1013661,101366, 'Never worked'), 
   c(1013662, 101366, 'Intermediate occs'), 
   c(1037552, 103755, 'Managerial & professional occs'), 
   c(1037551, 103755, 'Intermediate occs')
)

colnames(dta) = c('idno', 'householdid', 'occup')
dta

 idno      householdid occup                           
"1013661" "101366"    "Never worked"                  
"1013662" "101366"    "Intermediate occs"             
"1037552" "103755"    "Managerial & professional occs"
"1037551" "103755"    "Intermediate occs"

Run Code Online (Sandbox Code Playgroud)

我需要的应该是这样的

 idno      householdid occup                            occupPartner                    
"1013661" "101366"    "Never worked"                   "Intermediate occs"             
"1013662" "101366"    "Intermediate occs"              "Never worked"                  
"1037552" "103755"    "Managerial & professional occs" …

Run Code Online (Sandbox Code Playgroud)

merge r dplyr

gia*_*iac

2015 06-06

5
推荐指数

1
解决办法

99
查看次数

R - 在不使用循环的情况下循环遍历不同的矩阵!帮助简单的代码

所以我有两个独立的矩阵(mat1和mat2),我需要仔细检查它们才能进行检查.我需要将结果存储到第三个矩阵中.

我觉得我的代码很长.

我想提出一些建议来避免循环.

所以我的第一个矩阵看起来像这样(dput到底)

  wit5.001 wit5.002 wit5.003 wit5.004 wit5.005 wit5.006 wit5.007 wit5.008 wit5.009 wit5.010
 [1,]        1        1        1        1        1        1        1            1        1        1
 [2,]        1        1        1        1        1        1        1        1        1        1
 [3,]        1        1        1        1        1        1        1        1        1        1
 [4,]        1        1        1        1        1        1        1        1        1        1
 [5,]        1        1        1        1        1        1        1        0        1        1
 [6,]        1        1        1        1        1        1        1        0        0        0 …

Run Code Online (Sandbox Code Playgroud)

loops r matrix tapply

gia*_*iac

2015 06-20

5
推荐指数

1
解决办法

79
查看次数

R - 日期和断线的快捷方式 # -----

我无意中按下了一个快捷键，日期中出现了一条非常漂亮的断线。

它看起来像

# 23 Jun 2010 --------------------

Run Code Online (Sandbox Code Playgroud)

有人知道有问题的快捷方式吗？

（我在 Mac 上工作！）

在 RStudio 中！

keyboard-shortcuts r rstudio

gia*_*iac

2015 07-03

4
推荐指数

1
解决办法

482
查看次数

R - 根据模式重新排列数据

我想根据特定的简单模式重新排序我的数据。

我只想重新排列我的数据，其中一行Female，一行Male，依次保留householdid。

数据如下：

  householdid.x    idno   isex iage
1        101366 1013661 FEMALE   29
2        101366 1013662   MALE   36
3        102481 1024812   MALE   39
4        102481 1024811 FEMALE   29
5        103755 1037552   MALE   36
6        103755 1037551 FEMALE   31

Run Code Online (Sandbox Code Playgroud)

我不知道该怎么做。

让我们说这FEMALE是第一位的。我正在寻找的输出很简单：

  householdid.x    idno   isex iage
1        101366 1013661 FEMALE   29
2        101366 1013662   MALE   36
4        102481 1024811 FEMALE   29
3        102481 1024812   MALE   39
6        103755 1037551 FEMALE   31
5        103755 1037552   MALE …

Run Code Online (Sandbox Code Playgroud)

sorting r

gia*_*iac

lucky-day

4
推荐指数

1
解决办法

867
查看次数

R - 哪个和哪个.max融合

我有一个简单的问题,我如何使用which,并which.max在同一时间.

我想选择epnum行的最大值id == B13639J2.我需要进行检索,row number因为我需要对变量进行一些手动更改.

所以epnum行的最大值id == 'B13639J2'

           id   epnum start
95528 B13639J2     1     0
95529 B13639J2     2   860
95530 B13639J2     3  1110
95531 B13639J2     4  1155
95532 B13639J2     5  1440

Run Code Online (Sandbox Code Playgroud)

我想知道我怎么能做一些像

dta[which(dta$id == 'B13639J2' & which.max(dta$epnum)), ]

Run Code Online (Sandbox Code Playgroud)

最后,我需要删除斑点行.

谢谢.

数据

dta = structure(list(id = c("B13639J1", "B13639J1", "B13639J1", "B13639J1", 
"B13639J1", "B13639J1", "B13639J1", "B13639J1", "B13639J2", "B13639J2", 
"B13639J2", "B13639J2", "B13639J2"), epnum = c(4, 5, 6, 7, 8, 
9, 10, …

Run Code Online (Sandbox Code Playgroud)

gia*_*iac

2015 07-29

4
推荐指数

1
解决办法

193
查看次数

R - 观星者 4 星截止

我想用 4 star.cutoffs-- c(0.1, 0.05, 0.01, 0.001)-- using stargazer.

library(stargazer) 

m1 = lm(disp ~ mpg, data = mtcars) 
stargazer(m1, type = 'text', star.cutoffs = c(0.1, 0.05, 0.01, 0.001), digits = 2)

Run Code Online (Sandbox Code Playgroud)

看来只能获得3星的晋级了。

有什么想法可以减掉4次吗？

regression r stargazer

gia*_*iac

lucky-day

4
推荐指数

1
解决办法

3039
查看次数

R - hist3D序列颜色和标签问题

所以我有一个5行20列的数据集.我试图hist3D从plot3D包中绘制一个.

dt = structure(c(1, 1, 1, 3, 1, 2, 1, 0, 2, 1, 2, 1, 0, 1, 1, 0, 1, 
0, 2, 2, 1, 1, 1, 1, 4, 4, 1, 1, 2, 3, 8, 1, 1, 2, 1, 10, 0, 
1, 2, 1, 9, 0, 2, 4, 0, 4, 0, 5, 2, 2, 2, 0, 1, 2, 4, 1, 1, 3, 
2, 6, 8, 1, 2, 2, 4, 10, 0, 2, 2, 4, 7, 0, 7, …

Run Code Online (Sandbox Code Playgroud)

3d r sequence histogram

gia*_*iac

2016 07-12

3
推荐指数

1
解决办法

3013
查看次数

R - 合并和更新主数据集

所以,我有两个表示旧地址和当前地址的数据集.

> main
idspace   id  x  y move
    198 1238 33  4 stay
    641 1236 36 12 move
    1515 1237 30 28 move

> move
idspace   id x y move
      4 1236 4 1 move

Run Code Online (Sandbox Code Playgroud)

我需要的是将新数据(move)与旧(main)main合并,并在合并后更新.

我想知道它是否可以在一次操作中使用它？

更新基于id,是个人标识符.

idspace,x,y现在的位置ID.

所以,我需要的输出是

> main
  idspace   id   x  y move
       198 1238 33  4 stay
       4   1236 4   1 move # this one is updated 
       1515 1237 30 28 move …

Run Code Online (Sandbox Code Playgroud)

merge r sql-update

gia*_*iac

2016 08-22

3
推荐指数

1
解决办法

127
查看次数

R - grep 删除大写行

我想删除所有包含大写单词的行。

我的数据如下所示：

                                      dt
1        TRAVEL AND UNSPECIFIED TIME USE
2                      TRAVEL BY PURPOSE
3 Travel related to unspecified time use
4    Travel related to personal business

Run Code Online (Sandbox Code Playgroud)

我不明白为什么这不起作用

dt[-c(grep('[A-Z]', dt$dt)) , ]

Run Code Online (Sandbox Code Playgroud)

因为，奇怪的是，当我生成这样的随机数据时它会起作用mtcars：

l = sample( c(letters[1:16], LETTERS[1:16]) ) 
mtcars$code = l
mtcars[-c( grep('[A-Z]', mtcars$code) ) , ]

Run Code Online (Sandbox Code Playgroud)

有人能帮我吗？

dt = c("TRAVEL AND UNSPECIFIED TIME USE", 
"TRAVEL BY PURPOSE", 
"Travel related to unspecified time use",
"Travel related to personal business") 
dt = as.data.frame(dt)
dt$dt = as.character(dt$dt)

Run Code Online (Sandbox Code Playgroud)

regex r

gia*_*iac

2020 08-06

3
推荐指数

1
解决办法

1776
查看次数

使用 dplyr 汇总多列 - 分类版本

以下这个问题，并且这一次，我想知道是总结在一个数据集分类变量的最佳选择。

我有一个数据集，例如

# A tibble: 10 <U+00D7> 4
    empstat_couple     nssec7_couple3  nchild07 age_couple
              <chr>             <fctr>    <fctr>      <dbl>
1         Neo-Trad   Lower Managerial    1child         39
2         Neo-Trad  Higher Managerial    1child         31
3         Neo-Trad Manual and Routine    1child         33
4             Trad  Higher Managerial    1child         43

Run Code Online (Sandbox Code Playgroud)

前 3 个变量是分类变量（字符或因子），最后一个是数字变量。

我想要的是类似（输出）

                  var n   p
1:           Neo-Trad 6 0.6
2:    OtherArrangment 2 0.2
3:               Trad 2 0.2
4:  Higher Managerial 4 0.4
5:   Lower Managerial 5 0.5
6: Manual …

Run Code Online (Sandbox Code Playgroud)

r summary count dplyr data.table

gia*_*iac

2017 05-23

3
推荐指数

1
解决办法

1339
查看次数