背景- 我有一组客户数据,并使用字符串匹配算法来比较所有记录的相似性。然后,我需要对直接或通过关联相互关联的结果进行分组,并为每个组应用唯一的 ID。
问题- 我想不出一种将记录链接在一起并为每个组应用唯一 ID 的方法
例子
目前已找到的匹配数据如下所示(MatchScore 与此处的问题无关,但用于演示数据的来源)。
+-------------+-------------+------------+
| CustomerID1 | CustomerID2 | MatchScore |
+-------------+-------------+------------+
| 2021000 | 2707799 | 0.075 |
| 2021000 | 3856308 | 0.082 |
| 774062 | 774063 | 0.041 |
| 998328 | 2278386 | 0.063 |
| 998328 | 998329 | 0.058 |
| 998329 | 2278386 | 0.030 |
+-------------+-------------+------------+
Run Code Online (Sandbox Code Playgroud)
底部 3 条记录都是链接的,因此我希望它们具有相同的关联 ID。
这就是我想要的数据的样子
+----+-------------+-------------+------------+
| ID | CustomerID1 | CustomerID2 | MatchScore | …Run Code Online (Sandbox Code Playgroud) 我一直在努力让数据工厂部署通过VSTS工作,我主要在那里工作,但由于触发器需要被禁用而被覆盖,我才会失败.错误信息如下:
Remove-AzureRmDataFactoryV2Trigger : HTTP Status Code: BadRequest
Error Code: TriggerEnabledCannotUpdate
Error Message: Cannot update enabled Trigger; it needs to be disabled first.
Request Id: <id number here>
Timestamp (Utc):06/17/2018 21:31:49
At line:1 char:1
+ Remove-AzureRmDataFactoryV2Trigger -ResourceGroupName "ResourceGroupName" -Data ...
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+ CategoryInfo : CloseError: (:) [Remove-AzureRmDataFactoryV2Trigger], ErrorResponseException
+ FullyQualifiedErrorId : Microsoft.Azure.Commands.DataFactoryV2.RemoveAzureDataFactoryTriggerCommand
Run Code Online (Sandbox Code Playgroud)
尝试执行直接部署时,以及手动运行PowerShell脚本以删除触发器时,我都会收到此错误
Remove-AzureRmDataFactoryV2Trigger -ResourceGroupName "ResourceGroupName" -DataFactoryName "DataFactoryName" -Name "TriggerName"
Run Code Online (Sandbox Code Playgroud)
我找不到通过PowerShell或在发布期间禁用触发器的方法.任何人都可以帮我找到解决方法吗?没有它,我无法与数据工厂进行持续集成发布.
谢谢
powershell azure-powershell azure-data-factory azure-devops azure-data-factory-2