我有一个配对数据的数据集(同一家庭的成员).
Id是个人标识符,householdid是合作伙伴的标识符(反之亦然).
我需要的是为他/她的伴侣的每个id添加一个额外的列(职业).
我的数据看起来像这样
dta = rbind( c(1013661,101366, 'Never worked'),
c(1013662, 101366, 'Intermediate occs'),
c(1037552, 103755, 'Managerial & professional occs'),
c(1037551, 103755, 'Intermediate occs')
)
colnames(dta) = c('idno', 'householdid', 'occup')
dta
idno householdid occup
"1013661" "101366" "Never worked"
"1013662" "101366" "Intermediate occs"
"1037552" "103755" "Managerial & professional occs"
"1037551" "103755" "Intermediate occs"
Run Code Online (Sandbox Code Playgroud)
我需要的应该是这样的
idno householdid occup occupPartner
"1013661" "101366" "Never worked" "Intermediate occs"
"1013662" "101366" "Intermediate occs" "Never worked"
"1037552" "103755" "Managerial & professional occs" …Run Code Online (Sandbox Code Playgroud) 所以我有两个独立的矩阵(mat1和mat2),我需要仔细检查它们才能进行检查.我需要将结果存储到第三个矩阵中.
我觉得我的代码很长.
我想提出一些建议来避免循环.
所以我的第一个矩阵看起来像这样(dput到底)
wit5.001 wit5.002 wit5.003 wit5.004 wit5.005 wit5.006 wit5.007 wit5.008 wit5.009 wit5.010
[1,] 1 1 1 1 1 1 1 1 1 1
[2,] 1 1 1 1 1 1 1 1 1 1
[3,] 1 1 1 1 1 1 1 1 1 1
[4,] 1 1 1 1 1 1 1 1 1 1
[5,] 1 1 1 1 1 1 1 0 1 1
[6,] 1 1 1 1 1 1 1 0 0 0 …Run Code Online (Sandbox Code Playgroud) 我无意中按下了一个快捷键,日期中出现了一条非常漂亮的断线。
它看起来像
# 23 Jun 2010 --------------------
Run Code Online (Sandbox Code Playgroud)
有人知道有问题的快捷方式吗?
(我在 Mac 上工作!)
在 RStudio 中!
我想根据特定的简单模式重新排序我的数据。
我只想重新排列我的数据,其中一行Female,一行Male,依次保留householdid。
数据如下:
householdid.x idno isex iage
1 101366 1013661 FEMALE 29
2 101366 1013662 MALE 36
3 102481 1024812 MALE 39
4 102481 1024811 FEMALE 29
5 103755 1037552 MALE 36
6 103755 1037551 FEMALE 31
Run Code Online (Sandbox Code Playgroud)
我不知道该怎么做。
让我们说这FEMALE是第一位的。我正在寻找的输出很简单:
householdid.x idno isex iage
1 101366 1013661 FEMALE 29
2 101366 1013662 MALE 36
4 102481 1024811 FEMALE 29
3 102481 1024812 MALE 39
6 103755 1037551 FEMALE 31
5 103755 1037552 MALE …Run Code Online (Sandbox Code Playgroud) 我有一个简单的问题,我如何使用which,并which.max在同一时间.
我想选择epnum行的最大值id == B13639J2.我需要进行检索,row number因为我需要对变量进行一些手动更改.
所以epnum行的最大值id == 'B13639J2'
id epnum start
95528 B13639J2 1 0
95529 B13639J2 2 860
95530 B13639J2 3 1110
95531 B13639J2 4 1155
95532 B13639J2 5 1440
Run Code Online (Sandbox Code Playgroud)
我想知道我怎么能做一些像
dta[which(dta$id == 'B13639J2' & which.max(dta$epnum)), ]
Run Code Online (Sandbox Code Playgroud)
最后,我需要删除斑点行.
谢谢.
数据
dta = structure(list(id = c("B13639J1", "B13639J1", "B13639J1", "B13639J1",
"B13639J1", "B13639J1", "B13639J1", "B13639J1", "B13639J2", "B13639J2",
"B13639J2", "B13639J2", "B13639J2"), epnum = c(4, 5, 6, 7, 8,
9, 10, …Run Code Online (Sandbox Code Playgroud) 我想用 4 star.cutoffs-- c(0.1, 0.05, 0.01, 0.001)-- using stargazer.
library(stargazer)
m1 = lm(disp ~ mpg, data = mtcars)
stargazer(m1, type = 'text', star.cutoffs = c(0.1, 0.05, 0.01, 0.001), digits = 2)
Run Code Online (Sandbox Code Playgroud)
看来只能获得3星的晋级了。
有什么想法可以减掉4次吗?
所以我有一个5行20列的数据集.我试图hist3D从plot3D包中绘制一个.
dt = structure(c(1, 1, 1, 3, 1, 2, 1, 0, 2, 1, 2, 1, 0, 1, 1, 0, 1,
0, 2, 2, 1, 1, 1, 1, 4, 4, 1, 1, 2, 3, 8, 1, 1, 2, 1, 10, 0,
1, 2, 1, 9, 0, 2, 4, 0, 4, 0, 5, 2, 2, 2, 0, 1, 2, 4, 1, 1, 3,
2, 6, 8, 1, 2, 2, 4, 10, 0, 2, 2, 4, 7, 0, 7, …Run Code Online (Sandbox Code Playgroud) 所以,我有两个表示旧地址和当前地址的数据集.
> main
idspace id x y move
198 1238 33 4 stay
641 1236 36 12 move
1515 1237 30 28 move
> move
idspace id x y move
4 1236 4 1 move
Run Code Online (Sandbox Code Playgroud)
我需要的是将新数据(move)与旧(main)main合并,并在合并后更新.
我想知道它是否可以在一次操作中使用它?
更新基于id,是个人标识符.
idspace,x,y现在的位置ID.
所以,我需要的输出是
> main
idspace id x y move
198 1238 33 4 stay
4 1236 4 1 move # this one is updated
1515 1237 30 28 move …Run Code Online (Sandbox Code Playgroud) 我想删除所有包含大写单词的行。
我的数据如下所示:
dt
1 TRAVEL AND UNSPECIFIED TIME USE
2 TRAVEL BY PURPOSE
3 Travel related to unspecified time use
4 Travel related to personal business
Run Code Online (Sandbox Code Playgroud)
我不明白为什么这不起作用
dt[-c(grep('[A-Z]', dt$dt)) , ]
Run Code Online (Sandbox Code Playgroud)
因为,奇怪的是,当我生成这样的随机数据时它会起作用mtcars:
l = sample( c(letters[1:16], LETTERS[1:16]) )
mtcars$code = l
mtcars[-c( grep('[A-Z]', mtcars$code) ) , ]
Run Code Online (Sandbox Code Playgroud)
有人能帮我吗 ?
dt = c("TRAVEL AND UNSPECIFIED TIME USE",
"TRAVEL BY PURPOSE",
"Travel related to unspecified time use",
"Travel related to personal business")
dt = as.data.frame(dt)
dt$dt = as.character(dt$dt)
Run Code Online (Sandbox Code Playgroud) 以下这个问题,并且这一次,我想知道是总结在一个数据集分类变量的最佳选择。
我有一个数据集,例如
# A tibble: 10 <U+00D7> 4
empstat_couple nssec7_couple3 nchild07 age_couple
<chr> <fctr> <fctr> <dbl>
1 Neo-Trad Lower Managerial 1child 39
2 Neo-Trad Higher Managerial 1child 31
3 Neo-Trad Manual and Routine 1child 33
4 Trad Higher Managerial 1child 43
Run Code Online (Sandbox Code Playgroud)
前 3 个变量是分类变量(字符或因子),最后一个是数字变量。
我想要的是类似(输出)
var n p
1: Neo-Trad 6 0.6
2: OtherArrangment 2 0.2
3: Trad 2 0.2
4: Higher Managerial 4 0.4
5: Lower Managerial 5 0.5
6: Manual …Run Code Online (Sandbox Code Playgroud)