我有一个csv文件,它有两行,每行对应一个单词列表.我把这个csv文件读成2*2000矩阵,如下所示:
termlist = as.matrix(read.csv("termlist.csv",sep=",",header=FALSE))
Run Code Online (Sandbox Code Playgroud)
现在,我想知道这两行的以下信息,即第一行和第二行的交集列表; 从第二行中减去此交集列表后的剩余列表.
我想使用datatable的frank函数按id排列日期列.但是,我的排名似乎只考虑了日期列而不是与之对应的id.我还收到其中6个我不确定的警告:
1 ..... 6:In [.data.table(dups ,, :=(rank,frank(dups,date,ties.method ="average")),:RHS 1长度为10(大于第6组的大小(1))最后9个元素将被丢弃.
dups <- data.table (id = c('11', '11', '11', '22','22',
'88', '99','44','44', '55'),
date = mdy(c("1-01-2016", "1-02-2016", "1-02-2016","2-01-2016",
"2-02-2016")))
so.sample <- dups[, rank := frank(dups, date, ties.method = "average"), by = id]
Run Code Online (Sandbox Code Playgroud)
例如,id = 11和date = 2016-01-01应该排名为1而不是1.5,因为该组合只有一个id和date.
请求帮助
假设数字向量x <- c(-3,2,1,-2, 4,-1,-5)
Min非负值in x是1索引/位置/答案应该是3.
我们怎样才能使用任何功能呢?
(注意:which.min在上面的例子中,函数给出的答案/索引7是最小的(但不是非负的))
从字符串中提取单词并在R中创建一个列表
str <- "qwerty keyboard"
result <- strsplit(str,"[[:space:]]")
Run Code Online (Sandbox Code Playgroud)
我得到的是......(下面)
result
[[1]]
[1] "qwerty" "keyboard"
Run Code Online (Sandbox Code Playgroud)
我需要的是......(下面)
result
[[1]]
[1] "qwerty"
[[2]]
[1] "keyboard"
Run Code Online (Sandbox Code Playgroud)
[要么]
result
[[1]]
[1] "qwerty"
[2] "keyboard"
Run Code Online (Sandbox Code Playgroud)
我正在寻找解决方案,如果有人知道,请在此处发布您的解决方案.提前致谢..
我有两个数据框列表.我们称之为list_A和list_B.
df1 = data.frame(matrix(rnorm(4), nrow=2))
df2 = data.frame(matrix(rnorm(4), nrow=2))
df3 = data.frame(matrix(rnorm(4), nrow=2))
df4 = data.frame(matrix(rnorm(4), nrow=2))
list_A <- list(df1,df2)
list_B <- list(df3,df4)
Run Code Online (Sandbox Code Playgroud)
我现在如何以元素方式在列表上应用一些自定义函数?例如,将df1与df3相乘,df2与df4相乘.然后,函数应该获取列表的前两个数据帧,将它们定义为矩阵并将它们相乘.我非常感谢任何帮助!
目前,我的应用程序的逻辑是,当用户的密码在例如30天后过期时,即使用户正在做某事,用户也将被重定向到"更改密码"屏幕.这是错的.只应在下次登录时提示用户更改密码.
我创建了一个CheckAfterLoginFilter,它扩展了逻辑所在的OncePerRequestFilter.但是,这会在每个请求中进行过滤,以便用户在会话中注销.如果可能的话,我不确定如何在这里实现所需的逻辑.
我的登录表单jsp使用j_security_check.我的第一个想法是将逻辑从CheckAfterLoginFilter移动到LoginController,但j_security_check似乎重定向到它自己的东西,我不知道或在哪里找到.
一些帮助将不胜感激!
谢谢
我正在开展一个项目,我需要根据人们的投票方式对数据进行排序.我找不到一个功能,我可以根据满足的某些条件删除重复的行.
我正在寻找一个函数,它将根据一个具有重复值的列和另一个满足特定条件的列来删除重复的行.
例如,在下表中,我想删除在三次不同选举中投票的选民.保罗需要从此数据框中删除.
df <- data.frame(Name=c("Paul","Paul","Mary","Bill","Jane","Paul","Mary","John",
"Bill","John"),ElectionDay=c("November 2010","November 2014",
"November 2010","November 2010","November 2014","November 2006",
"November 2014","November 2010","November 2014","November 2014"))
df
# Name ElectionDay
# 1 Paul November 2010
# 2 Paul November 2014
# 3 Mary November 2010
# 4 Bill November 2010
# 5 Jane November 2014
# 6 Paul November 2006
# 7 Mary November 2014
# 8 John November 2010
# 9 Bill November 2014
# 10 John November 2014
Run Code Online (Sandbox Code Playgroud)
以下是我正在寻找的结果示例:
Name ElectionDay
1 Mary November 2010 …Run Code Online (Sandbox Code Playgroud) 我正在处理一个包含名为"JobSatisfaction"的变量的数据集,该变量显示为int [1,2,3,4].为了继续进行数据分析,我需要将此变量转换为序数变量.
JobSatisfaction应该有四个级别:低,中,高,非常高
之后我需要进行线性回归.
我有一个与R相关的noob问题.我有以下数据表:
Receiver_id Sender_id Gender_receiver
1 2 Male
2 3 Female
3 4 Male
4 2 Female
5 3 Female
Run Code Online (Sandbox Code Playgroud)
receiver_id表示接收消息的人的id_number,而inviter_id表示发送消息的人的id_number.在这种情况下,人2向人发送内容1. gender_receiver指的是接收者的性别.但是,基于此,应该可以通过创建名为Gender_sender的新列来指示发件人的性别.不幸的是,我无法这样做.我使用了以下代码但没有任何成功:
dt[, Gender_sender := dt$Gender_receiver, by=Sender_id]
Run Code Online (Sandbox Code Playgroud)
我没有得到正确的性别分配.
有人知道我应该做什么,我认为它相对简单,但我无法弄清楚.
在此先感谢,阿曼达
我有一个数据帧df:
df <- structure(list(page = c(12, 6, 9, 65),
text = structure(c(4L,2L, 1L, 3L),
.Label = c("I just bought a brand new AudiA6", "Get 2 years engine replacement warranty on BMW X6",
"Volkswagen is the parent company of BMW", "ToyotaCorolla is offering new car exchange offers"),
class = "factor")), .Names = c("page","text"), row.names = c(NA, -4L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)
另外,我有一个单词列表:
wordlist <- c("Audi", "BMW", "extended", "engine", "replacement", "Volkswagen", "company", "Toyota","exchange", "brand")
Run Code Online (Sandbox Code Playgroud)
我通过取消列出文本和使用grepl来查找wordlist中的单词是否存在于列文本中.
library(data.table)
setDT(df)[, match := paste(wordlist[unlist(lapply(wordlist, function(x) grepl(x, text, …Run Code Online (Sandbox Code Playgroud) 我有以下向量:
v <- c(2L, 2L, NA, NA, NA, NA, 8L, NA)
Run Code Online (Sandbox Code Playgroud)
如何使用前一个系列的值+ 1替换缺失值,使其变为:
c(2L, 2L, 3L, 3L, 3L, 3L, 8L, 9L)
Run Code Online (Sandbox Code Playgroud)