标签: summarization

Haskell总结了树中的所有路径

我试图总结所有路径,通过一个树,从根到最低的孩子,每个级别扩展1到10倍.我的函数遍历所有孩子,但我遇到的问题是,当我尝试创建节点列表并在列表中执行此列表时,我成为列表列表的List ...列表.我认为我的问题是组合步骤我尝试制作模式匹配方法,但是当它成为列表列表时应该比较列表的方法,并且应该创建新列表并比较它们,如果它只是一种方式(符合列表)使用节点而不是带列表的列表)不起作用.

haskell summarization tree-search

3
推荐指数
1
解决办法
975
查看次数

R中的聚合函数同时使用两列

数据:-

df=data.frame(Name=c("John","John","Stacy","Stacy","Kat","Kat"),Year=c(2016,2015,2014,2016,2006,2006),Balance=c(100,150,65,75,150,10))

   Name Year Balance
1  John 2016     100
2  John 2015     150
3 Stacy 2014      65
4 Stacy 2016      75
5   Kat 2006     150
6   Kat 2006      10
Run Code Online (Sandbox Code Playgroud)

码:-

aggregate(cbind(Year,Balance)~Name,data=df,FUN=max )
Run Code Online (Sandbox Code Playgroud)

输出: -

   Name Year Balance
1  John 2016     150
2   Kat 2006     150
3 Stacy 2016      75
Run Code Online (Sandbox Code Playgroud)

我想使用Year和Balance这两个列来汇总/汇总上面的数据框.我使用基函数聚合来做到这一点.我需要最近一年/最近一年的最大余额.在输出的第一行,约翰有最新的一年(2016),但是(2015)的余额,这不是我需要的,它应该输出100而不是150.我在哪里错了?

aggregate r summarization

3
推荐指数
1
解决办法
497
查看次数

R错误:期望单个值是什么意思?

我正在R中使用dplyr进行简单的操作,并出现“期望单个值”错误

test <- data.frame(a=rep("item",3),b=c("step1","step2","step3"))
test%>%group_by(a)%>%(summarize(seq=paste0(b))
Run Code Online (Sandbox Code Playgroud)

我见过类似的线程,但是那些用例更加复杂,我不知道为什么这两行不起作用。

r summarization dataframe dplyr

3
推荐指数
1
解决办法
8399
查看次数

关于"AUTOMATIC TEXT SUMMARIZER(基于语言)"

作为我的最后一年项目,我正在使用"AUTOMATIC TEXT SUMMARIZER(语言学方法)".我收集了足够多的研究论文并完成了它们.我仍然不太清楚'如何去做'的事情.基本上我发现"AUTOMATIC TEXT SUMMARIZER(基于统计)"并发现与我的项目相比它更容易.我的项目指南告诉我不要选择这个(基于统计)并选择基于语言的.

任何曾经研究过甚至听过这类项目的人都会知道,总结任何文件只不过是对每个句子进行评分(通过一些涉及某些特定算法的方法),然后选择得分高于阈值分数的句子.现在,该项目最困难的部分是选择适当的评分算法并在以后实施.

我有适度的编程技巧,并希望在JAVA中编码(因为我会得到很多API,导致较少的开销).现在我想知道,对于我的项目,我应该采用什么方法和算法.还有如何实现它们.

text nlp linguistics summarization

2
推荐指数
1
解决办法
3294
查看次数

如何使用ddply获取数据帧中类的加权平均值?

我是plyr的新手,想要在类中取值的加权平均值来重塑多个变量的数据帧.使用以下代码,我知道如何为一个变量执行此操作,例如x2:

set.seed(123)
frame <- data.frame(class=sample(LETTERS[1:5], replace = TRUE),
                    x=rnorm(20), x2 = rnorm(20), weights=rnorm(20))
ddply(frame, .(class),function(x) data.frame(weighted.mean(x$x2, x$weights)))       
Run Code Online (Sandbox Code Playgroud)

但是,我希望代码为x和x2(以及框架中的任何数量的变量)创建新的数据框.有人知道怎么做这个吗?谢谢

r summarization weighted-average plyr reshape

2
推荐指数
1
解决办法
1649
查看次数

将行添加到数据框中,并包含组内数据的总和

我下面有一个示例数据框。

eg_data <- data.frame(
time = c("1", "1", "2","2"), 
type = c("long", "short","long", "short"), 
size=c(200,50, 500, 150 ))
Run Code Online (Sandbox Code Playgroud)

我需要创建行来汇总每个时间段的大小值。我已经查看了aggregate 和by 的组合,但我无法让它正常工作。

我尝试过的一个例子:

rbind(eg_data, data.frame(time="1 + 2", type="long", size=by(eg_data$size, 
eg_data$time=="long", sum)))   
Run Code Online (Sandbox Code Playgroud)

我希望最终数据框的示例如下:

eg_data <- data.frame(
time = c("1", "1", "2","2", "1 + 2", "1 + 2"), 
type = c("long", "short","long", "short", "long", "short"), 
size=c(200, 50, 500, 150, 700, 200))
Run Code Online (Sandbox Code Playgroud)

任何帮助都是值得赞赏的,带有基本 R 的解决方案将非常感激。

group-by r summarization

2
推荐指数
1
解决办法
1370
查看次数

不使用第三方软件包,有没有办法计算分类数据计数的行百分比?

我有一些异常情况,我目前无法将第三方软件包下载到我的R设置中.以此为约束,有没有办法总结以下餐厅位置数据和关闭/打开状态?

一个count(business,vars=c("city","open"))在我的数据给了我这样的事情:

"City"       "Open"   "Frequency"
Wickenburg   False    2
Wickenburg   True     26
Wittmann     True     2
Wittmann     False    2
Youngtown    True     7
Yuma         True     1
Run Code Online (Sandbox Code Playgroud)

这是一个频率表,显示在给定城市中有多少餐厅都是开放式和封闭式的.

我想按组找到百分比.示例输出看起来像这样

"City"       "Open"   "Frequency"    "Pct of City"
Wickenburg   False    2               7.7
Wickenburg   True     26              92.3
Wittmann     True     2               50.0
Wittmann     False    2               50.0
Youngtown    True     7               100.0
Yuma         True     1               100.0
Run Code Online (Sandbox Code Playgroud)

在香草R中最简单的方法是什么?

aggregate r data-manipulation summarization

1
推荐指数
1
解决办法
81
查看次数

如何在Microsoft Windows上安装Python包pyrouge?

我想pyrouge在Microsoft Windows上使用python包.该软件包未提供有关如何在Microsoft Windows上安装它的任何说明.我怎么能这样做?

python windows nlp summarization

1
推荐指数
1
解决办法
2754
查看次数

有没有办法显示特定自定义重载运算符的作用?

有没有办法给重载运算符提供等效的方法摘要?

即我有一个重载+运算符和自定义方法的以下对象:

CustomObject objectA = new CustomObject();
CustomObject objectB = new CustomObject();

objectA.MyInt = 10;
objectA.MyString = "hello"; 

objectB.MyInt = 55;
objectB.MyString = "apple";

objectA.CustomMethod(34);

objectA += objectB; 
Run Code Online (Sandbox Code Playgroud)

如果这个对象在库中并且我正在使用它,我可以将鼠标悬停在自定义方法上以查看创建者编写的摘要以查看该方法的作用.是否有类似的方法来查看重载运算符的效果?

在此示例中,您不知道它将对值或字符串执行什么操作.总和和附加?最大和替换?乘以并忽略?

c# overloading summarization

1
推荐指数
1
解决办法
86
查看次数

R:使用dplyr嵌套分组摘要?

我正在尝试dplyr用不同条形图中人们饮酒记录的假设数据集(链接到pastebin)来练习R 包:

bar_name,person,drink_ordered,times_ordered,liked_it
Moe’s Tavern,Homer,Romulan ale,2,TRUE
Moe’s Tavern,Homer,Scotch whiskey,1,FALSE
Moe’s Tavern,Guinan,Romulan ale,1,TRUE
Moe’s Tavern,Guinan,Scotch whiskey,3,FALSE
Moe’s Tavern,Rebecca,Romulan ale,2,FALSE
Moe’s Tavern,Rebecca,Scotch whiskey,4,TRUE
Cheers,Rebecca,Budweiser,1,TRUE
Cheers,Rebecca,Black Hole,1,TRUE
Cheers,Bender,Budweiser,1,FALSE
Cheers,Bender,Black Hole,1,TRUE
Cheers,Krusty,Budweiser,1,TRUE
Cheers,Krusty,Black Hole,1,FALSE
The Hip Joint,Homer,Scotch whiskey,3,FALSE
The Hip Joint,Homer,Corona,1,TRUE
The Hip Joint,Homer,Budweiser,1,FALSE
The Hip Joint,Krusty,Romulan ale,3,TRUE
The Hip Joint,Krusty,Black Hole,4,FALSE
The Hip Joint,Krusty,Corona,1,TRUE
The Hip Joint,Rebecca,Corona,2,TRUE
The Hip Joint,Rebecca,Romulan ale,4,FALSE
The Hip Joint,Bender,Corona,1,TRUE
Ten Forward,Bender,Romulan ale,1,
Ten Forward,Bender,Black Hole,,FALSE
Ten Forward,Guinan,Romulan ale,2,TRUE
Ten Forward,Guinan,Budweiser,,FALSE
Ten Forward,Krusty,Budweiser,1,
Ten Forward,Krusty,Black …
Run Code Online (Sandbox Code Playgroud)

r summarization dplyr

0
推荐指数
1
解决办法
215
查看次数