tem*_*ber 6 sql-server data-warehouse dimensional-modeling
我有一个DimPlace维度,其中包含该地点的名称(由用户手动输入)以及该地点的纬度和经度(自动捕获).由于手动输入地点,因此可以在多个时间使用不同名称的同一地点,另外,两个不同的地方可能彼此非常接近.
我们希望能够分析两个"位置"之间的MPG,但我们希望将它们分组以形成更大的区域 - 即使用lat和long将一个位置的所有各种拼写,以及不同但非常接近的位置,一个记录.
我打算为此制作一个新的维度 - 像DimPlaceGeozone.我正在寻找一个资源来帮助加载映射到...的所有lat和long值?也许邮政编码或城市名称?有时候你可以找到一个加载常见维度的脚本(比如DimTime) - 我会喜欢类似于北美的lat和long值的东西吗?
我过去也做过类似的事情……我前面遇到的一个绊脚石是,跨越边界的两个位置可能比位于同一区域的两个位置在物理上距离更近。
我通过创建一个“双网格”系统来解决这个问题,该系统使每个位置分为 4 个区域。这样,共享至少 1 个“区域”的 2 个位置就知道它们在彼此的范围内。
这是一个覆盖美国大部分地区的例子......
IF OBJECT_ID('tempdb..#LatLngAreas', 'U') IS NOT NULL
DROP TABLE #LatLngAreas;
GO
WITH
cte_Lat AS (
SELECT
t.n,
BegLatRange = -37.9 + (t.n / 10.0),
EndLatRange = -37.7 + (t.n / 10.0)
FROM
dbo.tfn_Tally(1030, 0) t
),
cte_Lng AS (
SELECT
t.n,
BegLngRange = -159.7 + (t.n / 10.0),
EndLngRange = -159.5 + (t.n / 10.0)
FROM
dbo.tfn_Tally(3050, 0) t
)
SELECT
Area_ID = ROW_NUMBER() OVER (ORDER BY lat.n, lng.n),
lat.BegLatRange,
lat.EndLatRange,
lng.BegLngRange,
lng.EndLngRange
INTO #LatLngAreas
FROM
cte_Lat lat
CROSS JOIN cte_Lng lng;
SELECT
b3.Branch_ID,
b3.Name,
b3.Lat,
b3.Lng,
lla.Area_ID
FROM
dbo.ContactBranch b3 -- replace with DimPlace
JOIN #LatLngAreas lla
ON b3.Lat BETWEEN lla.BegLatRange AND lla.EndLatRange
AND b3.lng BETWEEN lla.BegLngRange AND lla.EndLngRange;
Run Code Online (Sandbox Code Playgroud)
HTH,杰森