小编yoe*_*sef的帖子

模糊逻辑匹配

所以,我正在考虑在我的公司实现模糊逻辑匹配,并且无法获得良好的结果.对于初学者,我试图将公司名称与其他公司提供的名单上的名称相匹配.
我的第一次尝试是使用soundex,但看起来soundex只比较公司名称中的前几个声音,因此较长的公司名称太容易相互混淆.
我现在正在使用levenstein距离比较进行第二次尝试.它看起来很有希望,特别是如果我先删除标点符号.但是,我仍然无法在没有太多误报的情况下找到重复项.
我遇到的一个问题是像widgetsco vs widgets inc这样的公司.所以,如果我比较短名称长度的子串,我也会收到像BBC大学和CBC大学校园这样的东西.我怀疑使用距离和最长公共子串的组合得分可能是解决方案.
有没有人设法建立一个与有限误报匹配的算法?

sql t-sql sql-server string-matching sql-server-2012

5
推荐指数
1
解决办法
609
查看次数

SSIS - SSIS 挂起时的最佳实践

昨晚我的 SSIS 挂了。我不太确定为什么。今天早上,我根据输出确定了哪个包挂起。我正在查看sp_who2,但看不到在运行作业的用户下运行的任何进程。
我想知道当我的 SSIS 挂起时我应该做什么。它当前仍在运行,但似乎没有运行任何东西。

sql-server logging ssis etl ssis-2012

1
推荐指数
1
解决办法
3272
查看次数

目标组件没有任何可用的输入用于创建路径

在此输入图像描述我正在使用传统的tsql代码输出到txt文件.出于安全考虑,我正在用SSIS包替换这些输出.我已经让他们中的大多数人工作了,但是一个特别的人给了我以下错误:

标题:Microsoft Visual Studio

无法创建连接器.目标组件没有任何可用的输入用于创建路径.

数据流本身非常简单.OLE DB Source运行SQL命令,然后输出到flatfile源,该源指向由TSQL创建的现有txtfile.

任何人都知道错误对可用输入的意义吗?

ssis

0
推荐指数
1
解决办法
7198
查看次数