是否可以使用BigQuery进行近似字符串匹配/模糊字符串搜索?

And*_* P. 3 google-bigquery

感谢Google提供BigQuery,这太棒了!
是否可以使用BigQuery进行近似字符串匹配/模糊字符串搜索?
Google是否计划将此功能添加到BigQuery?

当然,Google专有的近似字符串匹配算法可用于向BigQuery提供此功能,同时仍保留Google知识产权.我们搜索了所有BigQuery文档和Stack Overflow问题.当然,有很多算法可以做到这一点,但如何与BigQuery集成?

我们的需求很简单,比较两个大致相同的字符串虽然可能略有不同.例如:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC".  
Run Code Online (Sandbox Code Playgroud)

从我们的BigQuery测试中可以看出,两个字符串需要完全匹配BigQuery才能加入它们,甚至是每个字符串中的尾随空格数.将非常感谢添加此功能或与BigQuery集成的指南.这是对位于威斯康星州密尔沃基市的区域性,创新型,分数喷气式飞机所有权公司Milwaukee Jets的支持.再次感谢Google提供BigQuery.

非常感谢和最诚挚的问候,Andrew Paullin(414)212-5372

Jor*_*ani 5

遗憾的是,不支持近似字符串匹配.您可以获得的最接近的是使用正则表达式.你最好的选择可能是在数据进入BigQuery之前对数据进行规范化 - 即将"Rhodes USA"和"Rhodes,USA."转换为相同的字符串.但是,我会为此支持添加一个功能请求错误.