在哪里可以找到 PHP 音译器 (Intl) 的 ID 或规则列表?

nic*_*ass 3 php transliteration intl

Transliterator::listIDs() 将列出 ID,但显然它不是一个完整的列表。

此页面示例中,ID 如下所示:

Any-Latin; NFD; [:Nonspacing Mark:] Remove; NFC; [:Punctuation:] Remove; Lower();
Run Code Online (Sandbox Code Playgroud)

这有点奇怪,因为 ID 应该是唯一的。这看起来更像是一条规则,但如果我将它传递给createFromRules方法,它就不起作用:)

无论如何,我正在尝试从字符串中删除任何标点符号,但破折号 ( -) 或特定列表中的字符除外。

你知道这可能吗?或者是否有一些文档可以更好地解释音译器的语法?

Art*_*cto 5

作为Transliterator::listIDs()“基本ID”的ID。您给出的示例是“化合物 ID”。您可以在此查看ICU 文档

您还可以使用Transliterator::createFromRules().

你可以看看预设的规则:

<?php
$a = new ResourceBundle(NULL, sprintf('icudt%dl-translit', INTL_ICU_VERSION), true);

foreach ($a['RuleBasedTransliteratorIDs'] as $name => $v) {
    $file = @$v['file'];
    if (!$file) {
        $file = $v['internal'];
        echo $name, " (direction $file[direction]; internal)\n";
    } else { 
        echo $name, " (direction: $file[direction])\n";
        echo $file['resource'];
    }
    echo "\n--------------\n";
}
Run Code Online (Sandbox Code Playgroud)

格式化后,结果如下所示