检测重复记录,仅选择第一个并使用LINQ/C进行计数#

Nic*_*ick 7 c# linq duplicates

我正在寻找一些帮助,使用C#/ LINQ设计查询以满足以下要求:

我有一个公司列表: -

Id  Name                Email       Address

1   Company A         a@a.com       abc

2   Company B         b@b.com       abc

3   Company C         c@c.com       abc

4   Company D         d@d.com       abc

5   Company A         a@a.com       abc
Run Code Online (Sandbox Code Playgroud)

我的目标是根据两个字段检测重复项目,在此示例中为"名称"和"电子邮件".

期望的输出是如下所示的客户列表:

  1. 重复的客户只需显示一次
  2. 应显示类似记录的数量.

所需的重复清单: -

Id  Qty Name        Email       Address

1   2   Company A       a@a.com     abc (Id/details of first)

2   1   Company B       b@b.com     abc

3   1   Company C       c@c.com     abc

4   1   Company D       d@d.com     abc
Run Code Online (Sandbox Code Playgroud)

Raw*_*ing 9

如果您明确要在每组重复项中使用最低ID记录,则可以使用

var duplicates = companies
    .GroupBy(c => new { c.Name, c.Email })
    .Select(g => new { Qty = g.Count(), First = g.OrderBy(c => c.Id).First() } )
    .Select(p => new
        {
            Id = p.First.Id,
            Qty = p.Qty,
            Name = p.First.Name,
            Email = p.First.Email,
            Address = p.First.Address
        });
Run Code Online (Sandbox Code Playgroud)

如果您不关心使用哪个记录的值,或者您的源已按ID(升序)排序,则可以放弃OrderBy呼叫.