小编CRS*_*ser的帖子

MetaPhone功能(如SoundEx)功能并在R中使用?

我想使用MetaPhone,Double Metaphone,Caverphone,MetaPhone3,SoundEx,如果有人在'R'中完成了NameX功能,那么我可以对数值进行分类和汇总,以便在分析之前最大限度地减少数据清理操作.

我充分意识到每种算法都有自己的优点和缺点,并且非常希望不使用SoundEx,但如果我找不到替代品,它仍然可以工作; 正如在这篇文章中提到的那样, Harper将与SoundEx下的任何不相关名称列表匹配,但不应该在Metaphone中以获得更好的结果匹配.

虽然我不确定哪个会最好地服务于我的目的,同时仍然保留一些灵活性,所以这就是我想要对它们中的几个进行刺穿以及在查看值之前生成如下表格的原因.

在此输入图像描述

表源链接

姓氏不是我初步分析的主题,但认为这是一个很好的例子,因为我想有效地考虑所有像'听起来'的单词被视为相同的值真的是我试图用简单地调用的东西作为值被评估.

我已经看过的一些事情:

  • 我知道可以使用RCpp编写和调用C包,并且在SE上甚至有针对SoundEx的 C解决方案,但我之前没有编写R包并且希望避免重新发明轮子,如果有更简单的方法直接在R中执行,还是存在具有该功能的包?
  • 我知道RecordLinkage和现在的stringdist包具有SoundEx功能,但不具有任何形式的MetaPhone功能.

所以我特意寻找答案是如何在R中运行MetaPhone/Caverphone并知道"值",以便我可以按它们对数据值进行分组?

另外需要注意的是,我仍然认为自己是R的新手,因为我不是每天的用户.

soundex r metaphone

7
推荐指数
2
解决办法
2255
查看次数

用于格式化 SQLFormat.org 之类的 SQL 查询的本地 JavaScript 函数无需网络调用即可执行?

目前,我可以通过POSThttp://sqlformat.org/api/v1/format API发出请求来以编程方式格式化我的 SQL 查询;但是这里提到的单个 IP 每小时可以提供 500 个请求的限制http://sqlformat.org/api/#usage

在此处输入图片说明

我想知道是否有Javascript可用的本地或其他机制,通过它我可以在不访问网络的情况下在本地获得与从 SQLFormat.org 网站获得的结果相同的结果?

javascript sql format

5
推荐指数
1
解决办法
2459
查看次数

通过 T-SQL 将 SQL Server 日期时间格式化为 %Y-%m-%d %H:%M:%OS4 %z 格式?

供应商要求我将 SQL ServerDateTime值转换为以下特定时间戳格式%Y-%m-%d %H:%M:%OS4 %z。该查询将被放入他们的软件中以查询我的数据库。

所需的输出似乎可能与R 中的posixct 问题模糊相关;但这是关于 SQL Server 中的输出。除了该字段在他们的软件中显示为空白之外,我没有收到任何具体错误,但它在我的 SQL 界面中有效。

我从 SQL 得到的输出如下:

2016-03-16 00:00:00.000
Run Code Online (Sandbox Code Playgroud)

像这样的另一列的输出没有问题varchar(30)2016-03-16 11:34:36因为它只是在映射到字符串字段时将其视为字符串......但要使其处理它需要采用引用的%Y-%m-%d %H:%M:%OS4 %z格式。

除了数据类型之外,这些差异似乎很微妙,但即使映射到字符串字段,它也无法将 SQL 本机输出映射到其字段中。

我已经尝试过例如

cast(convert(datetime, tn.last_settled, 126) as Varchar(30))
Run Code Online (Sandbox Code Playgroud)

datetime结果Jan 1 1990 12:00AM不是所需的格式。

如何将所需的字符串2016-03-16 11:34:36和日期时间格式从 T-SQL 中的 SQL Server格式2016-03-16 00:00:00.000转换为所需的格式?%Y-%m-%d %H:%M:%OS4 %zdatetime

t-sql sql-server datetime sql-server-2012

1
推荐指数
1
解决办法
6459
查看次数