我试图总结所有路径,通过一个树,从根到最低的孩子,每个级别扩展1到10倍.我的函数遍历所有孩子,但我遇到的问题是,当我尝试创建节点列表并在列表中执行此列表时,我成为列表列表的List ...列表.我认为我的问题是组合步骤我尝试制作模式匹配方法,但是当它成为列表列表时应该比较列表的方法,并且应该创建新列表并比较它们,如果它只是一种方式(符合列表)使用节点而不是带列表的列表)不起作用.
数据:-
df=data.frame(Name=c("John","John","Stacy","Stacy","Kat","Kat"),Year=c(2016,2015,2014,2016,2006,2006),Balance=c(100,150,65,75,150,10))
Name Year Balance
1 John 2016 100
2 John 2015 150
3 Stacy 2014 65
4 Stacy 2016 75
5 Kat 2006 150
6 Kat 2006 10
Run Code Online (Sandbox Code Playgroud)
码:-
aggregate(cbind(Year,Balance)~Name,data=df,FUN=max )
Run Code Online (Sandbox Code Playgroud)
输出: -
Name Year Balance
1 John 2016 150
2 Kat 2006 150
3 Stacy 2016 75
Run Code Online (Sandbox Code Playgroud)
我想使用Year和Balance这两个列来汇总/汇总上面的数据框.我使用基函数聚合来做到这一点.我需要最近一年/最近一年的最大余额.在输出的第一行,约翰有最新的一年(2016),但是(2015)的余额,这不是我需要的,它应该输出100而不是150.我在哪里错了?
我正在R中使用dplyr进行简单的操作,并出现“期望单个值”错误
test <- data.frame(a=rep("item",3),b=c("step1","step2","step3"))
test%>%group_by(a)%>%(summarize(seq=paste0(b))
Run Code Online (Sandbox Code Playgroud)
我见过类似的线程,但是那些用例更加复杂,我不知道为什么这两行不起作用。
作为我的最后一年项目,我正在使用"AUTOMATIC TEXT SUMMARIZER(语言学方法)".我收集了足够多的研究论文并完成了它们.我仍然不太清楚'如何去做'的事情.基本上我发现"AUTOMATIC TEXT SUMMARIZER(基于统计)"并发现与我的项目相比它更容易.我的项目指南告诉我不要选择这个(基于统计)并选择基于语言的.
任何曾经研究过甚至听过这类项目的人都会知道,总结任何文件只不过是对每个句子进行评分(通过一些涉及某些特定算法的方法),然后选择得分高于阈值分数的句子.现在,该项目最困难的部分是选择适当的评分算法并在以后实施.
我有适度的编程技巧,并希望在JAVA中编码(因为我会得到很多API,导致较少的开销).现在我想知道,对于我的项目,我应该采用什么方法和算法.还有如何实现它们.
我是plyr的新手,想要在类中取值的加权平均值来重塑多个变量的数据帧.使用以下代码,我知道如何为一个变量执行此操作,例如x2:
set.seed(123)
frame <- data.frame(class=sample(LETTERS[1:5], replace = TRUE),
x=rnorm(20), x2 = rnorm(20), weights=rnorm(20))
ddply(frame, .(class),function(x) data.frame(weighted.mean(x$x2, x$weights)))
Run Code Online (Sandbox Code Playgroud)
但是,我希望代码为x和x2(以及框架中的任何数量的变量)创建新的数据框.有人知道怎么做这个吗?谢谢
我下面有一个示例数据框。
eg_data <- data.frame(
time = c("1", "1", "2","2"),
type = c("long", "short","long", "short"),
size=c(200,50, 500, 150 ))
Run Code Online (Sandbox Code Playgroud)
我需要创建行来汇总每个时间段的大小值。我已经查看了aggregate 和by 的组合,但我无法让它正常工作。
我尝试过的一个例子:
rbind(eg_data, data.frame(time="1 + 2", type="long", size=by(eg_data$size,
eg_data$time=="long", sum)))
Run Code Online (Sandbox Code Playgroud)
我希望最终数据框的示例如下:
eg_data <- data.frame(
time = c("1", "1", "2","2", "1 + 2", "1 + 2"),
type = c("long", "short","long", "short", "long", "short"),
size=c(200, 50, 500, 150, 700, 200))
Run Code Online (Sandbox Code Playgroud)
任何帮助都是值得赞赏的,带有基本 R 的解决方案将非常感激。
我有一些异常情况,我目前无法将第三方软件包下载到我的R设置中.以此为约束,有没有办法总结以下餐厅位置数据和关闭/打开状态?
一个count(business,vars=c("city","open"))在我的数据给了我这样的事情:
"City" "Open" "Frequency"
Wickenburg False 2
Wickenburg True 26
Wittmann True 2
Wittmann False 2
Youngtown True 7
Yuma True 1
Run Code Online (Sandbox Code Playgroud)
这是一个频率表,显示在给定城市中有多少餐厅都是开放式和封闭式的.
我想按组找到百分比.示例输出看起来像这样
"City" "Open" "Frequency" "Pct of City"
Wickenburg False 2 7.7
Wickenburg True 26 92.3
Wittmann True 2 50.0
Wittmann False 2 50.0
Youngtown True 7 100.0
Yuma True 1 100.0
Run Code Online (Sandbox Code Playgroud)
在香草R中最简单的方法是什么?
我想pyrouge在Microsoft Windows上使用python包.该软件包未提供有关如何在Microsoft Windows上安装它的任何说明.我怎么能这样做?
有没有办法给重载运算符提供等效的方法摘要?
即我有一个重载+运算符和自定义方法的以下对象:
CustomObject objectA = new CustomObject();
CustomObject objectB = new CustomObject();
objectA.MyInt = 10;
objectA.MyString = "hello";
objectB.MyInt = 55;
objectB.MyString = "apple";
objectA.CustomMethod(34);
objectA += objectB;
Run Code Online (Sandbox Code Playgroud)
如果这个对象在库中并且我正在使用它,我可以将鼠标悬停在自定义方法上以查看创建者编写的摘要以查看该方法的作用.是否有类似的方法来查看重载运算符的效果?
在此示例中,您不知道它将对值或字符串执行什么操作.总和和附加?最大和替换?乘以并忽略?
我正在尝试dplyr用不同条形图中人们饮酒记录的假设数据集(链接到pastebin)来练习R 包:
bar_name,person,drink_ordered,times_ordered,liked_it
Moe’s Tavern,Homer,Romulan ale,2,TRUE
Moe’s Tavern,Homer,Scotch whiskey,1,FALSE
Moe’s Tavern,Guinan,Romulan ale,1,TRUE
Moe’s Tavern,Guinan,Scotch whiskey,3,FALSE
Moe’s Tavern,Rebecca,Romulan ale,2,FALSE
Moe’s Tavern,Rebecca,Scotch whiskey,4,TRUE
Cheers,Rebecca,Budweiser,1,TRUE
Cheers,Rebecca,Black Hole,1,TRUE
Cheers,Bender,Budweiser,1,FALSE
Cheers,Bender,Black Hole,1,TRUE
Cheers,Krusty,Budweiser,1,TRUE
Cheers,Krusty,Black Hole,1,FALSE
The Hip Joint,Homer,Scotch whiskey,3,FALSE
The Hip Joint,Homer,Corona,1,TRUE
The Hip Joint,Homer,Budweiser,1,FALSE
The Hip Joint,Krusty,Romulan ale,3,TRUE
The Hip Joint,Krusty,Black Hole,4,FALSE
The Hip Joint,Krusty,Corona,1,TRUE
The Hip Joint,Rebecca,Corona,2,TRUE
The Hip Joint,Rebecca,Romulan ale,4,FALSE
The Hip Joint,Bender,Corona,1,TRUE
Ten Forward,Bender,Romulan ale,1,
Ten Forward,Bender,Black Hole,,FALSE
Ten Forward,Guinan,Romulan ale,2,TRUE
Ten Forward,Guinan,Budweiser,,FALSE
Ten Forward,Krusty,Budweiser,1,
Ten Forward,Krusty,Black …Run Code Online (Sandbox Code Playgroud) summarization ×10
r ×6
aggregate ×2
dplyr ×2
nlp ×2
c# ×1
dataframe ×1
group-by ×1
haskell ×1
linguistics ×1
overloading ×1
plyr ×1
python ×1
reshape ×1
text ×1
tree-search ×1
windows ×1