UCA +自然分选

Ali*_*xel 6 php sorting unicode natural-sort

我最近了解到PHP已经通过intl扩展支持Unicode Collat​​ion算法:

$array = array
(
    'al', 'be',
    'Alpha', 'Beta',
    'Álpha', 'Àlpha', 'Älpha',
    '????',
    'img10.png', 'img12.png',
    'img1.png', 'img2.png',
);

if (extension_loaded('intl') === true)
{
    collator_asort(collator_create('root'), $array);
}

Array
(
    [0] => al
    [2] => Alpha
    [4] => Álpha
    [5] => Àlpha
    [6] => Älpha
    [1] => be
    [3] => Beta
    [11] => img1.png
    [9] => img10.png
    [8] => img12.png
    [10] => img2.png
    [7] => ????
)
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,即使使用混合大小写字符串,这似乎也能完美运行!到目前为止我遇到的唯一缺点是没有对自然排序的支持,我想知道解决这个问题的最佳方法是什么,这样我就可以合并两个世界中最好的一个.

我试图指定Collator::SORT_NUMERIC排序标志,但结果更加混乱:

collator_asort(collator_create('root'), $array, Collator::SORT_NUMERIC);

Array
(
    [8] => img12.png
    [7] => ????
    [9] => img10.png
    [10] => img2.png
    [11] => img1.png
    [6] => Älpha
    [5] => Àlpha
    [1] => be
    [2] => Alpha
    [3] => Beta
    [4] => Álpha
    [0] => al
)
Run Code Online (Sandbox Code Playgroud)

但是,如果我只使用img*.png值运行相同的测试,我会得到理想的输出:

Array
(
    [3] => img1.png
    [2] => img2.png
    [1] => img10.png
    [0] => img12.png
)
Run Code Online (Sandbox Code Playgroud)

任何人都可以想到一种在添加自然排序功能的同时保留Unicode排序的方法吗?

Ali*_*xel 5

在文档中深入研究之后,我找到了解决方案:

if (extension_loaded('intl') === true)
{
    if (is_object($collator = collator_create('root')) === true)
    {
        $collator->setAttribute(Collator::NUMERIC_COLLATION, Collator::ON);
        $collator->asort($array);
    }
}
Run Code Online (Sandbox Code Playgroud)

输出:

Array
(
    [0] => al
    [3] => Alpha
    [5] => Álpha
    [6] => Àlpha
    [7] => Älpha
    [1] => be
    [4] => Beta
    [10] => img1.png
    [11] => img2.png
    [8] => img10.png
    [9] => img12.png
    [2] => ????
)
Run Code Online (Sandbox Code Playgroud)