标签: aggregation

linux中的列聚合

我有这种格式的大文本文件:

aaa bbb 1      
aaa ccc 2      
aaa ddd 3      
bbb ww 1      
bbb kio 3

Run Code Online (Sandbox Code Playgroud)

我想聚合它,结果应该是:

aaa bbb 1/6  
aaa ccc 2/6  
aaa ddd 3/6  
bbb ww 1/4  
bbb kio 3/4

Run Code Online (Sandbox Code Playgroud)

第3列 - 概率p(y | x)

我应该怎么用awk,sed呢？

bash awk sed file aggregation

Ivr*_*vri

2012 01-24

2
推荐指数

1
解决办法

188
查看次数

如何在perl中的每个类方法之后启动特定的回调子例程？

让我们假设我已经拥有了包含几个子程序的Child包和Parent包.这两个包通过聚合组合在一起,就像在perltoot:

use warnings;
use strict;

package Child;

sub new {
    my ($class, %arg) = @_;
    return bless { %arg }, $class;
}

sub method_x {
    warn 'call method x';
}

sub method_y {
    warn 'call method y';
}

sub method_z {
    warn 'call method z';
}

1;


package Parent;

sub new {
    my ($class, %arg) = @_;
    return bless {
        child => undef,
        %arg,
    }, $class;
}

sub child { shift->{child} }
sub x …

Run Code Online (Sandbox Code Playgroud)

oop perl callback aggregation

ern*_*nix

lucky-day

2
推荐指数

1
解决办法

113
查看次数

如何使用 C# 聚合重复记录并求和

我想创建一个列表，其中包含多个代理以及他们拨打的电话数量，如下所示：

public class Agent
{
    public string Agent_ID{ get; set; }
    public string Name { get; set; }
    public int Calls { get; set; }

}

var list = new List<Agent>() // To create a list to hold the data
{ 
    new Agent() { Agent_ID = "TK_J", Name = "James", Calls = 10 },
    new Agent() { Agent_ID = "TK_K", Name = "Kurtis", Calls = 10 },
    new Agent() { Agent_ID = "TK_R", Name = "Rebecca", Calls = 5 }, …

Run Code Online (Sandbox Code Playgroud)

c# linq aggregation

Jam*_*Lee

lucky-day

2
推荐指数

1
解决办法

3077
查看次数

elasticsearch aggs 返回错误的计数数字

我正在尝试进行一些聚合查询并遇到一些问题。

GET /my_index/_search
{
"size" : 0,
"aggs":{
   "group_by":{
       "terms": {
            "field" : "category"
       }
   }
  }
  }

Run Code Online (Sandbox Code Playgroud)

这让我回来了：

"hits": {
  "total": 180,
  "max_score": 0,
  "hits": []
 },
"aggregations": {
  "group_by": {
     "doc_count_error_upper_bound": 0,
     "sum_other_doc_count": 1,
     "buckets": [
        {
           "key": "pf_rd_m",
           "doc_count": 139
        },
        {
           "key": "other",
           "doc_count": 13
        },
        {
           "key": "_encoding",
           "doc_count": 12
        },
        {
           "key": "ie",
           "doc_count": 10
        },
        {
           "key": "cadeaux",
           "doc_count": 2
        },
        {
           "key": "cartes",
           "doc_count": 2
        },
        {
           "key": "cheques",
           "doc_count": 2
        }, …

Run Code Online (Sandbox Code Playgroud)

aggregation elasticsearch

Dan*_*y M

lucky-day

2
推荐指数

1
解决办法

5976
查看次数

ElasticSearch 对聚合进行过滤，而不影响聚合计数

我们使用 ElasticSearch 根据 5 个字段查找报价，例如一些“自由文本”、报价状态和客户名称。我们还需要聚合客户名称和报价状态这两个字段。因此，当有人输入一些自由文本时，我们发现 10 个文档的状态为关闭，8 个文档的状态为打开，“状态过滤器”应包含 close(10) 和 open(8)。

现在的问题是，当我选择状态“关闭”包含在过滤器中时，打开的聚合结果更改为0。我希望它保持为8。那么如何防止聚合上的过滤器影响聚合本身？

这是第一个查询，搜索“java”：

{
    "query": {
        "bool": {
            "filter": [
            ],
            "must": {
                "simple_query_string": {
                    "query" : "java"
                }
            }
        }
    },
    "aggs": {
        "OFFER_STATE_F": {
            "terms": {
                "size": 0,
                "field": "offer_state_f",
                "min_doc_count": 0
            }
        }
    },
    "from": 0,
    "size": 1,
    "fields": ["offer_id_ft", "offer_state_f"]
}

Run Code Online (Sandbox Code Playgroud)

结果是这样的：

{
  "hits": {
    "total": 960,
    "max_score": 0.89408284000000005,
    "hits": [
      {
        "_type": "offer",
        "_index": "select",
        "_id": "40542",
        "fields": {
          "offer_id_ft": [
            "40542"
          ],
          "offer_state_f": [ …

Run Code Online (Sandbox Code Playgroud)

filter aggregation elasticsearch

Joi*_*ort

2016 02-23

2
推荐指数

1
解决办法

2399
查看次数

方法参数的 UML 图

假设我有以下代码：

class A {
public:
    void doSomething(B* b);
}

class B {
}

Run Code Online (Sandbox Code Playgroud)

我将如何在 UML 图中描述这一点？我的第一个想法是 A 使用 B，所以从 A 到 B 应该有一条虚线。但是在一些学校论文中（这是学校作业报告中很小的一部分），他们似乎使用了聚合符号（空菱形和实线）。

这对我来说似乎不对——如果 A 实际上包含一个指向 B 的指针作为成员，那似乎是对的。但是当只有某些方法使用指向 B 的指针，并且不将其存储在任何成员变量中时，这似乎是错误的。

这里有什么？

（我可以问我的老师，但他们通常需要很长时间才能回答此类问题……老实说，我更信任 Stackoverflow 的集体智囊团 :)）

c++ uml class-diagram aggregation

Mag*_*s W

lucky-day

2
推荐指数

1
解决办法

1203
查看次数

以编程方式区分组合和聚合

我正在通过以下链接找出组合和聚合之间的区别。

https://www.geeksforgeeks.org/association-composition-aggregation-java/

我能够理解，组合意味着一种关系，其中孩子不能独立于父母而存在，而聚合意味着一种关系，其中孩子可以独立于父母而存在。但无法理解如何以编程方式区分。下面是链接中给出的聚合和组合的示例。在这两种情况下，除了 Student 和 Department 类有一个额外的变量“name”外，这两种类的结构相同。如在组合中“子不能独立于父而存在”，但是在这里，我可以创建一个单独的 Book 对象并使用它，而无需将其添加到 Library。

聚合

// student class
class Student 
{
    String name;
    int id ;
    String dept;

    Student(String name, int id, String dept) 
    { 
        this.name = name;
        this.id = id;
        this.dept = dept;
    }
}



/* Department class contains list of student
Objects. It is associated with student
class through its Object(s). */
class Department 
{
    String name;
    private List<Student> students;

    Department(String name, List<Student> students) 
    {
        this.name = name;
        this.students = students;    
    } …

Run Code Online (Sandbox Code Playgroud)

java oop composition aggregation

var*_*ava

2018 05-01

2
推荐指数

1
解决办法

778
查看次数

在 spark 中迭代每一列并找到最大长度

我是spark scala的新手，我有以下情况我在集群上有一个表“TEST_TABLE”（可以是hive表）我正在将它转换为数据帧：

scala> val testDF = spark.sql("select * from TEST_TABLE limit 10")

Run Code Online (Sandbox Code Playgroud)

现在可以将 DF 视为

scala> testDF.show()

COL1|COL2|COL3  
----------------
abc|abcd|abcdef 
a|BCBDFG|qddfde 
MN|1234B678|sd

Run Code Online (Sandbox Code Playgroud)

我想要一个像下面这样的输出

COLUMN_NAME|MAX_LENGTH
       COL1|3
       COL2|8
       COL3|6

Run Code Online (Sandbox Code Playgroud)

在 spark scala 中这样做是否可行？

scala maxlength aggregation apache-spark

A8H*_*8H1

lucky-day

2
推荐指数

1
解决办法

2973
查看次数

使用 $lookup 和 let 和管道在 MongoDB 中声明变量

我正在尝试向我的网站添加类似功能。我用以下模式制作了一个喜欢的集合。我使用自定义 _id 来避免创建额外的索引。

{
  _id: {
    postId: ObjectId,
    userId: ObjectId
  }
}

Run Code Online (Sandbox Code Playgroud)

我的服务器上有一个路由，它使用 MongoDB聚合搜索帖子集合。我正在尝试向当前管道添加一个$lookup阶段，以便添加一个带有布尔类型的喜欢属性，指示用户是否喜欢该帖子。这里的$查找未工作阶段（喜欢返回一个空数组全偶的时候有一个相应的像文件）：

{ $lookup: { from: 'likes', let: { likedPostId: '$_id.postId', likerUserId: '$_id.userId' }, pipeline: [ { $match: { $expr: { $and: [ { $eq: [ '$$likerUserId', ObjectId('12345') ]}, { $eq: [ '$$likedPostId', '$_id' ]} ] } } } } ], as: 'liked' } }
Run Code Online (Sandbox Code Playgroud)
我认为问题在于变量实际上并不包含我期望的值。有没有办法解决这个问题？另外，如果您知道一种更简单的方法来实现这一点，如果您与我分享，我将不胜感激。

我尝试比较两个相同的ObjectId()实例以确保可以使用$eq …

lookup aggregation mongoose mongodb aggregation-framework

Ami*_*k88

2019 06-19

2
推荐指数

1
解决办法

4900
查看次数

如何 $push 聚合中的所有文档而不是特定字段

我在聚合管道的第一阶段使用以下方法得到了这组结果$match：

[ { a: 1, b: 2 }, { a: 3, b: 4 } ]
Run Code Online (Sandbox Code Playgroud)
现在我想对所有 A 和 B 求和，并且仍然保留它们，因此我将得到如下结果：

{ total_sum: 10, items: [...] // first and second objects ofcourse }
Run Code Online (Sandbox Code Playgroud)
我尝试过$group，$push但是，push 只从对象中推送特定字段，我需要命名 A 和 B，而不是解析所有它们。

我该怎么做？

aggregation mongodb nosql aggregation-framework

Raz*_*Raz

2022 10-27

2
推荐指数

1
解决办法

2430
查看次数

标签统计

aggregation ×10

aggregation-framework ×2

elasticsearch ×2

mongodb ×2

oop ×2

apache-spark ×1

awk ×1

bash ×1

c# ×1

c++ ×1

callback ×1

class-diagram ×1

composition ×1

file ×1

filter ×1

java ×1

linq ×1

lookup ×1

maxlength ×1

mongoose ×1

nosql ×1

perl ×1

scala ×1

sed ×1

uml ×1

标签 统计

标签统计