postgres unaccent 函数 vs RoR 音译

Rub*_*bow 5 postgresql ruby-on-rails unaccent

在我们的 RoR 项目中,我们使用 postgres unaccent 函数来检索我们的模型名称属性之一的非重音版本。name 属性可以包含来自各种语言的任何重音字符。然后我们将其保存为 unaccent_name 属性。我不喜欢这个解决方案,因为我们需要确保已经安装并可以访问 postgres 扩展 UNACCENT(在测试、移动/清理数据库等时)。

在 RoR 中有 ActiveSupport::Inflector.transliterate 方法,它应该做一些非常相似的事情。

我发现它主要以相同的方式翻译重音字符,但也有一些区别:

相同的结果:

SELECT unaccent('?š??žý') AS unaccent_name;
=> "lsctzy"
ActiveSupport::Inflector.transliterate('?š??žý')
=> "lsctzy"
Run Code Online (Sandbox Code Playgroud)

不同的结果:

SELECT unaccent('ß') AS unaccent_name;
=> "S"
ActiveSupport::Inflector.transliterate('ß')
=> "ss"
Run Code Online (Sandbox Code Playgroud)

我知道这两种方法都可以接受带有自定义字母替换的字典,但我只对它们的一般/默认用法感兴趣。

音译方法的主要目的是否与 postgres unaccent 函数相同?我们可以用它作为替代品吗?

小智 3

很旧的帖子,但我正在解决类似于OP的问题。我们希望能够搜索姓名并进行音译以提供更好的结果。然而,在我们的 Postgres 和 Rails 版本中,该字符音译为 \'ss\'。

\n\n

只是想分享我的发现,以防它对偶然发现这篇文章的其他人有用。

\n\n

在 Rails 5.2 中:

\n\n
irb(main):001:0> ActiveSupport::Inflector.transliterate(\'\xc3\x9f\')\n=> "ss"\n
Run Code Online (Sandbox Code Playgroud)\n\n

在 postgres 9.6 中我得到:

\n\n
db-test=# SELECT unaccent(\'\xc3\x9f\') AS unaccent_name;\n unaccent_name \n---------------\n ss\n(1 row)\n
Run Code Online (Sandbox Code Playgroud)\n