标签: aggregation

使用优先级聚合SQL行

我有一张桌子,里面摆满了不同来源的物品.一些来源可能具有相同的位置(在我的示例中,不同的BBC新闻源将是不同的来源,但它们都来自BBC).每个项目都有一个"唯一"ID,可用于从同一位置识别它.这意味着与网站上相同新闻报道相关但在不同Feed下发布的项目将具有相同的"唯一ID",但这不一定是全球唯一的.

问题是我希望在显示时删除重复项,以便(根据您看到的哪些Feed)您最多只能获得每个故事的一个版本,即使您的两个或三个Feed可能包含指向它的链接.

我有一个sources表格,其中包含有关每个来源location_idlocation_precedence字段的信息.然后,我有一个items包含每个项目,它的表unique_id,source_idcontent.具有相同unique_id和来源的项目location_id最多应出现一次,最高来源location_precedence获胜.

我原以为是这样的:

SELECT `sources`.`name` AS `source`,
       `items`.`content`,
       `items`.`published`
FROM `items` INNER JOIN `sources`
  ON `items`.`source_id` = `sources`.`id` AND `sources`.`active` = 1
GROUP BY `items`.`unique_id`, `sources`.`location_id`
ORDER BY `sources`.`location_priority` DESC
Run Code Online (Sandbox Code Playgroud)

会做的伎俩,但似乎忽略了位置优先级字段.我错过了什么?


示例数据:

CREATE TABLE IF NOT EXISTS `sources` (
  `id` int(10) unsigned NOT NULL auto_increment,
  `location_id` int(10) unsigned NOT NULL,
  `location_priority` int(11) NOT NULL,
  `active` tinyint(1) unsigned NOT NULL …
Run Code Online (Sandbox Code Playgroud)

mysql sql group-by aggregation

0
推荐指数
1
解决办法
2349
查看次数

SQL查询问题 - 是否需要枢轴?

鉴于以下数据:

CardholderID   Source                                   DateTime
-------------- ---------------------------------------- -----------------------
3              2nd_Flr_Ramp_Out_Reader                  2010-06-30 13:58:42.410
3              2nd_Flr_Ramp_In_Reader                   2010-06-30 13:44:22.417
3              2nd_Flr_Ramp_Out_Reader                  2010-06-30 13:41:30.510
3              Lobby_To_Office_Reader                   2010-06-30 13:27:51.407
3              2nd_Flr_Ramp_Out_Reader                  2010-06-30 13:27:31.313
3              2nd_Flr_Ramp_In_Reader                   2010-06-30 13:27:23.203
3              2nd_Flr_Ramp_Out_Reader                  2010-06-29 12:03:04.413
3              2nd_Flr_Ramp_In_Reader                   2010-06-29 09:18:16.417
3              2nd_Flr_Ramp_Out_Reader                  2010-06-28 17:51:08.507
3              2nd_Flr_Ramp_In_Reader                   2010-06-28 12:52:28.403
3              2nd_Flr_Ramp_Out_Reader                  2010-06-28 12:04:36.407
3              2nd_Flr_Ramp_In_Reader                   2010-06-28 09:17:20.407
4              1St_Flr_To_Stairs_Reader                 2010-08-02 09:41:14.403
4              1St_Flr_Door_In_Reader                   2010-08-02 09:41:12.403
4              1St_Flr_Door_Out_Reader                  2010-07-30 18:24:36.400
4              1St_Flr_To_Stairs_Reader                 2010-07-30 14:09:54.403
4              1St_Flr_Door_In_Reader                   2010-07-30 14:09:48.403
4              1St_Flr_Door_Out_Reader                  2010-07-30 13:25:24.407
Run Code Online (Sandbox Code Playgroud)

如何获取"In"源的最短时间以及每个cardholderId的"Out"源的最长时间. …

t-sql sql-server pivot aggregation

0
推荐指数
1
解决办法
81
查看次数

Maven继承和聚合

I'm just curious, what happens if there are used both inheritance and aggregation in the same maven application? This is the application structure:

my-project-app

  • my-project-jar
  • my-project-war

Now, in app's pom.xml, I declare jar and war projects as modules, and in the same time the the poms from both modules declare the app pom as their parent. It is create some kind of redundancy here, isn't it?

What is the best solution for this case?

java inheritance aggregation maven

0
推荐指数
1
解决办法
1475
查看次数

使用R中的ffdfdply函数进行聚合

我尝试使用'ffbase'包使用ffdfdplyR中的函数对大型数据集进行聚合.
假设我有三个变量叫做Date,Item和sales.在这里,我想使用sum函数聚合Date和Item上的销售额.你能指导我在R中使用一些正确的语法吗?
我试过这样:

grp_qty <- ffdfdply(x=data[c("sales","Date","Item")], split=as.character(data$sales),FUN = function(data)  

summaryBy(Date+Item~sales, data=data, FUN=sum)).
Run Code Online (Sandbox Code Playgroud)

我很感激您的解决方案.

grouping r aggregation bigdata ffbase

0
推荐指数
1
解决办法
1462
查看次数

将模板生成的类分配给具有相同布局的C结构

如果我理解正确,那么对象'A'定义如下:

typedef struct {
    int n;
    float *p;
} myStruct;
myStruct A;
Run Code Online (Sandbox Code Playgroud)

是一个聚合,其内存布局与对象'B'完全相同,定义如下:

template <typename T> class myTemplateClass
{
public:
    int n;
    T*  p;
};
myTemplateClass<float> B;
Run Code Online (Sandbox Code Playgroud)

那么,是否有更优雅的分配方式

A = B;
Run Code Online (Sandbox Code Playgroud)

而不是写

A = *(reinterpret_cast< myStruct *>(&B));
Run Code Online (Sandbox Code Playgroud)

每次?

我的理由是我必须调用一个库函数,该函数使用"myStruct"形式的参数公开一个接口,从代码中以myTemplateClass的形式保存我的数据是非常自然的.

c c++ templates aggregation data-structures

0
推荐指数
1
解决办法
124
查看次数

Elastic Search 聚合如何在电子商务网站中更新

电子商务网站有多个聚合,如果用户选择一个过滤器,其他聚合如何更新?无论是为每个聚合还是单个请求发送单个请求都将处理所有聚合更新。

例子:

品牌:
abc(100)
xyz(50)

颜色:
红色(110)
白色(40)

尺寸:
中(60)
小(40)
大(50)

如果用户选择“红色”和“中等”,是否会发送对“颜色”聚合和“大小”聚合的单独请求?解释这在实时电子商务网站中是如何发生的

aggregation elasticsearch

0
推荐指数
1
解决办法
1021
查看次数

Python Pandas:聚合大型列的子集而不明确地输入它们

我正在尝试对我的数据帧进行聚合.问题是我需要聚合超过一百列.现在我把它们全部打印出来

df_grouped = df.groupby(['Column1'])['Column2','Column3','Column4','Column5'].sum()
Run Code Online (Sandbox Code Playgroud)

直到最后一栏.如果必须进行更改,则非常烦人且难以维护.有没有办法在没有明确输入的情况下引用这些列?

python subset aggregation dataframe pandas

0
推荐指数
1
解决办法
246
查看次数

Spark 中的累积乘积?

我尝试在 Spark scala 中实现一个累积产品,但我真的不知道如何实现。我有以下数据框:

Input data:
+--+--+--------+----+
|A |B | date   | val|
+--+--+--------+----+
|rr|gg|20171103| 2  |
|hh|jj|20171103| 3  |
|rr|gg|20171104| 4  |
|hh|jj|20171104| 5  |
|rr|gg|20171105| 6  |
|hh|jj|20171105| 7  |
+-------+------+----+
Run Code Online (Sandbox Code Playgroud)

我想要以下输出

Output data:
+--+--+--------+-----+
|A |B | date   | val |
+--+--+--------+-----+
|rr|gg|20171105| 48  | // 2 * 4 * 6
|hh|jj|20171105| 105 | // 3 * 5 * 7
+-------+------+-----+
Run Code Online (Sandbox Code Playgroud)

如果您对如何做有任何想法,那将非常有帮助:)

非常感谢

scala aggregation apache-spark apache-spark-sql

0
推荐指数
1
解决办法
1551
查看次数

Python中的聚合(OOP概念)是否限制子对象被其他对象拥有?

我读到这样一句话:“当对象有自己的生命周期并且子对象只能与一个父对象关联时,就会发生聚合”。但是,它对我的​​代码运行良好:-

class Country:
    def __init__(self, name=None, population=0):
        self.name = name
        self.population = population

    def printDetails(self):
        print("Country Name:", self.name)
        print("Country Population", self.population)


class Person:
    def __init__(self, name, country):
        self.name = name
        self.country = country

    def printDetails(self):
        print("Person Name:", self.name)
        self.country.printDetails()

class Man:
    def __init__(self, name, country):
        self.name = name
        self.country = country

    def printDetails(self):
        print("Person Name:", self.name)
        self.country.printDetails()



c = Country("Wales", 1500)
p = Person("Joe", c)
m = Man('John', c);
p.printDetails()
m.printDetails()

c.printDetails()
Run Code Online (Sandbox Code Playgroud)

python oop class aggregation python-3.x

0
推荐指数
1
解决办法
75
查看次数