nic*_*ass 3 php transliteration intl
Transliterator::listIDs() 将列出 ID,但显然它不是一个完整的列表。
Any-Latin; NFD; [:Nonspacing Mark:] Remove; NFC; [:Punctuation:] Remove; Lower();
Run Code Online (Sandbox Code Playgroud)
这有点奇怪,因为 ID 应该是唯一的。这看起来更像是一条规则,但如果我将它传递给createFromRules方法,它就不起作用:)
无论如何,我正在尝试从字符串中删除任何标点符号,但破折号 ( -) 或特定列表中的字符除外。
你知道这可能吗?或者是否有一些文档可以更好地解释音译器的语法?
作为Transliterator::listIDs()“基本ID”的ID。您给出的示例是“化合物 ID”。您可以在此查看ICU 文档。
您还可以使用Transliterator::createFromRules().
你可以看看预设的规则:
<?php
$a = new ResourceBundle(NULL, sprintf('icudt%dl-translit', INTL_ICU_VERSION), true);
foreach ($a['RuleBasedTransliteratorIDs'] as $name => $v) {
$file = @$v['file'];
if (!$file) {
$file = $v['internal'];
echo $name, " (direction $file[direction]; internal)\n";
} else {
echo $name, " (direction: $file[direction])\n";
echo $file['resource'];
}
echo "\n--------------\n";
}
Run Code Online (Sandbox Code Playgroud)
格式化后,结果如下所示。
| 归档时间: |
|
| 查看次数: |
2870 次 |
| 最近记录: |