小编Sto*_*leg的帖子

按字段分割的频率分布

一些背景： 我有一个样本人口数据文件。数据文件中的每条记录都有一个频率权重（FIELD NAME: wgt），指示需要复制多少次记录才能获得真正的总体。数据在 Microsoft SQL 2008 R2 中设置。生成权重的频率分布以查看某种特定类型的记录是否以任何方式过度表示通常是一种很好的做法 - 从而帮助识别趋势/异常值。这个任务在 SQL 中很简单：

SELECT wgt, COUNT(*) FROM tablename 
GROUP BY wgt

Run Code Online (Sandbox Code Playgroud)

挑战： 我想根据其他值进一步分离这些频率。假设不同家庭规模的权重频率分布。实现此目的的一种方法是在上述语句中使用不同的 where 条件：

SELECT wgt, COUNT(*) FROM tablename 
WHERE household_size=x --x being the desired segment
GROUP BY wgt

Run Code Online (Sandbox Code Playgroud)

但是有没有办法用所有不同的段创建一个表？像这样的东西：

WGT |   SIZE1       SIZE2       SIZE3       SIZE4 
--------------------------------------------------
1   |    2,034      1,025       502         234 
2   |    215        253         142         23 
3   |    31         25          21          34 
4   |    7          1           3           7 
5   |    5          NULL        2           5 
6 …

Run Code Online (Sandbox Code Playgroud)

sql-server stored-procedures statistics view

sri*_*amn

2013 06-12

5
推荐指数

1
解决办法

1万
查看次数