我想使用MetaPhone,Double Metaphone,Caverphone,MetaPhone3,SoundEx,如果有人在'R'中完成了NameX功能,那么我可以对数值进行分类和汇总,以便在分析之前最大限度地减少数据清理操作.
我充分意识到每种算法都有自己的优点和缺点,并且非常希望不使用SoundEx,但如果我找不到替代品,它仍然可以工作; 正如在这篇文章中提到的那样, Harper将与SoundEx下的任何不相关名称列表匹配,但不应该在Metaphone中以获得更好的结果匹配.
虽然我不确定哪个会最好地服务于我的目的,同时仍然保留一些灵活性,所以这就是我想要对它们中的几个进行刺穿以及在查看值之前生成如下表格的原因.

姓氏不是我初步分析的主题,但认为这是一个很好的例子,因为我想有效地考虑所有像'听起来'的单词被视为相同的值真的是我试图用简单地调用的东西作为值被评估.
我已经看过的一些事情:
所以我特意寻找答案是如何在R中运行MetaPhone/Caverphone并知道"值",以便我可以按它们对数据值进行分组?
另外需要注意的是,我仍然认为自己是R的新手,因为我不是每天的用户.
目前,我可以通过POST向http://sqlformat.org/api/v1/format API发出请求来以编程方式格式化我的 SQL 查询;但是这里提到的单个 IP 每小时可以提供 500 个请求的限制http://sqlformat.org/api/#usage。
我想知道是否有Javascript可用的本地或其他机制,通过它我可以在不访问网络的情况下在本地获得与从 SQLFormat.org 网站获得的结果相同的结果?
供应商要求我将 SQL ServerDateTime值转换为以下特定时间戳格式%Y-%m-%d %H:%M:%OS4 %z。该查询将被放入他们的软件中以查询我的数据库。
所需的输出似乎可能与R 中的posixct 问题模糊相关;但这是关于 SQL Server 中的输出。除了该字段在他们的软件中显示为空白之外,我没有收到任何具体错误,但它在我的 SQL 界面中有效。
我从 SQL 得到的输出如下:
2016-03-16 00:00:00.000
Run Code Online (Sandbox Code Playgroud)
像这样的另一列的输出没有问题varchar(30),2016-03-16 11:34:36因为它只是在映射到字符串字段时将其视为字符串......但要使其处理它需要采用引用的%Y-%m-%d %H:%M:%OS4 %z格式。
除了数据类型之外,这些差异似乎很微妙,但即使映射到字符串字段,它也无法将 SQL 本机输出映射到其字段中。
我已经尝试过例如
cast(convert(datetime, tn.last_settled, 126) as Varchar(30))
Run Code Online (Sandbox Code Playgroud)
但datetime结果Jan 1 1990 12:00AM不是所需的格式。
如何将所需的字符串2016-03-16 11:34:36和日期时间格式从 T-SQL 中的 SQL Server格式2016-03-16 00:00:00.000转换为所需的格式?%Y-%m-%d %H:%M:%OS4 %zdatetime
datetime ×1
format ×1
javascript ×1
metaphone ×1
r ×1
soundex ×1
sql ×1
sql-server ×1
t-sql ×1