如何使用COUNT()来解析nvarchar字段中的单个单词?

Jui*_*ice 0 t-sql sql-server

所以我的查询:

SELECT Tags, COUNT(Tags) AS Listings
FROM Job
WHERE datepart(year, dateposted)=2013
GROUP BY Tags
ORDER BY Listings DESC
Run Code Online (Sandbox Code Playgroud)

输出:

+----------------------+----------+
|         Tags         | Listings |
+----------------------+----------+
| java c++             |       41 |
| software development |       41 |
| java c++ c#          |       31 |
|                      |       25 |
| sysadmin             |       25 |
| see jd               |       24 |
| java c++ ood         |       23 |
| java                 |       23 |
+----------------------+----------+
Run Code Online (Sandbox Code Playgroud)

我希望它像这样出来:

+----------------------+----------+
|         Tags         | Listings |
+----------------------+----------+
| java                 |       118|
| c++                  |       95 |
| ood                  |       23 |
| see                  |       24 |
| jd                   |       24 |
| software development |       41 |
| sysadmin             |       25 |
| c#                   |       31 |
+----------------------+----------+
Run Code Online (Sandbox Code Playgroud)

如何计算字段中的每个单词而不是整个字段?标签列是nvarchar.

Tar*_*ryn 8

首先,你的表结构很糟糕.将数据存储在这样的列表中会让您感到头疼,类似于您现在尝试做的事情.

分割功能的问题是你不知道什么software development或其他多字标签 - 是一个字还是两个?

我认为解决这个问题的唯一方法是使用您的标记创建一个表或使用类似于以下内容的派生表:

;with cte (tag) as
(
  select 'java' union all
  select 'c++' union all
  select 'software development' union all
  select 'sysadmin' union all
  select 'ood' union all
  select 'jd' union all
  select 'see' union all
  select 'c#'
)
select c.tag, count(j.tags) listings
from cte c
inner join job j
  on j.tags like '%'+c.tag+'%'
group by c.tag
Run Code Online (Sandbox Code Playgroud)

请参阅SQL Fiddle with Demo.使用它你可以得到一个结果:

|                  TAG | LISTINGS |
|                 java |        9 |
|                  c++ |       10 |
| software development |        4 |
|             sysadmin |        2 |
|                  ood |        6 |
|                   jd |        3 |
|                  see |        2 |
|                   c# |        1 |
Run Code Online (Sandbox Code Playgroud)

注释中指出的上述问题是如何确定您是否有标记,software并且development这些标记将与上述查询匹配.

您将遇到此问题的最佳解决方案是将标记存储在一个单独的表中,类似于:

create table tags
(
  tag_id int,
  tag_name varchar(50)
);
Run Code Online (Sandbox Code Playgroud)

然后,您可以使用JOIN表将作业连接到标记:

create table tag_job
(
  job_id int,
  tag_id int
);
Run Code Online (Sandbox Code Playgroud)

一旦你有类似的设置,那么查询你的数据会变得容易得多:

select t.tag_name,
  count(tj.tag_id) listings
from tags t
inner join tag_job tj
  on t.tag_id = tj.tag_id
group by t.tag_name
Run Code Online (Sandbox Code Playgroud)

See demo