PHP 删除重音符号 - 使用 COMBINING ACUTE ACCENT

use*_*441 4 php encoding diacritics

我正在尝试使用 php.ini 批量重命名(删除重音)我的文件。但我遇到了一个奇怪的问题。

\n\n

我有两个(可能更多)不同的字符,它们在大多数字体中看起来都相同。但是当我将其转换为二进制时,我得到了不同的结果。第一个是“\xc3\xa1”,它是标准 uft 字符,第二个(奇怪的)是“a\xcc\x81”。我的文件名中有这些,但我无法删除它们。

\n\n

我什至在 UFT-36 表中都没有找到这个。我猜它可能与 MacOS 有关,因为上传此文件的人使用 mac。

\n\n

我已经尝试过 iconv 但它在此字符上失败(返回 false)。我发现以下数组可与 str_replace 一起使用,但它不包含这些字符。我也许能够在非常痛苦的情况下精心挑选它们并将它们添加到数组中。

\n\n

有谁知道这是什么以及如何摆脱它们?

\n\n
$invalid = array(\n        \'\xc3\x80\'=>\'A\', \'\xc3\x81\'=>\'A\', \'\xc3\x82\'=>\'A\', \'\xc3\x83\'=>\'A\', \'\xc4\x80\'=>\'A\', \'\xc4\x82\'=>\'A\', \'\xc8\xa6\'=>\'A\', \'\xc3\x84\'=>\'A\', \'\xe1\xba\xa2\'=>\'A\', \'\xc3\x85\'=>\'A\', \'\xc7\x8d\'=>\'A\', \'\xc8\x80\'=>\'A\', \'\xc8\x82\'=>\'A\', \'\xc4\x84\'=>\'A\', \'\xe1\xba\xa0\'=>\'A\', \'\xe1\xb8\x80\'=>\'A\', \'\xe1\xba\xa6\'=>\'A\', \'\xe1\xba\xa4\'=>\'A\', \'\xe1\xba\xaa\'=>\'A\', \'\xe1\xba\xa8\'=>\'A\', \'\xe1\xba\xb0\'=>\'A\', \'\xe1\xba\xae\'=>\'A\', \'\xe1\xba\xb4\'=>\'A\', \'\xe1\xba\xb2\'=>\'A\', \'\xc7\xa0\'=>\'A\', \'\xc7\x9e\'=>\'A\', \'\xc7\xba\'=>\'A\', \'\xe1\xba\xac\'=>\'A\', \'\xe1\xba\xb6\'=>\'A\',\n        \'\xc3\x86\'=>\'AE\', \'\xc7\xbc\'=>\'AE\', \'\xc7\xa2\'=>\'AE\', \n        \'\xe1\xb8\x82\'=>\'B\', \'\xc6\x81\'=>\'B\', \'\xe1\xb8\x84\'=>\'B\', \'\xe1\xb8\x86\'=>\'B\', \'\xc6\x82\'=>\'B\', \'\xc6\x84\'=>\'B\', \'\xc3\x9e\'=>\'B\',\n        \'\xc4\x88\'=>\'C\', \'\xc4\x8a\'=>\'C\', \'\xc4\x8c\'=>\'C\', \'\xc6\x87\'=>\'C\', \'\xc3\x87\'=>\'C\', \'\xe1\xb8\x88\'=>\'C\',\n        \'\xe1\xb8\x8a\'=>\'D\', \'\xc6\x8a\'=>\'D\', \'\xe1\xb8\x8c\'=>\'D\', \'\xe1\xb8\x8e\'=>\'D\', \'\xe1\xb8\x90\'=>\'D\', \'\xe1\xb8\x92\'=>\'D\', \'\xc4\x8e\'=>\'D\',\n        \'\xc4\x90\'=>\'Dj\', \'\xc6\x89\'=>\'Dj\',\n        \'\xc3\x88\'=>\'E\', \'\xc3\x89\'=>\'E\', \'\xc3\x8a\'=>\'E\', \'\xe1\xba\xbc\'=>\'E\', \'\xc4\x92\'=>\'E\', \'\xc4\x94\'=>\'E\', \'\xc4\x96\'=>\'E\', \'\xc3\x8b\'=>\'E\', \'\xe1\xba\xba\'=>\'E\', \'\xc4\x9a\'=>\'E\', \'\xc8\x84\'=>\'E\', \'\xc8\x86\'=>\'E\', \'\xe1\xba\xb8\'=>\'E\', \'\xc8\xa8\'=>\'E\', \'\xc4\x98\'=>\'E\', \'\xe1\xb8\x98\'=>\'E\', \'\xe1\xb8\x9a\'=>\'E\', \'\xe1\xbb\x80\'=>\'E\', \'\xe1\xba\xbe\'=>\'E\', \'\xe1\xbb\x84\'=>\'E\', \'\xe1\xbb\x82\'=>\'E\', \'\xe1\xb8\x94\'=>\'E\', \'\xe1\xb8\x96\'=>\'E\', \'\xe1\xbb\x86\'=>\'E\', \'\xe1\xb8\x9c\'=>\'E\', \'\xc6\x8e\'=>\'E\', \'\xc6\x90\'=>\'E\', \n        \'\xe1\xb8\x9e\'=>\'F\', \'\xc6\x91\'=>\'F\', \n        \'\xc7\xb4\'=>\'G\', \'\xc4\x9c\'=>\'G\', \'\xe1\xb8\xa0\'=>\'G\', \'\xc4\x9e\'=>\'G\', \'\xc4\xa0\'=>\'G\', \'\xc7\xa6\'=>\'G\', \'\xc6\x93\'=>\'G\', \'\xc4\xa2\'=>\'G\', \'\xc7\xa4\'=>\'G\', \n        \'\xc4\xa4\'=>\'H\', \'\xe1\xb8\xa6\'=>\'H\', \'\xc8\x9e\'=>\'H\', \'\xc7\xb6\'=>\'H\', \'\xe1\xb8\xa4\'=>\'H\', \'\xe1\xb8\xa8\'=>\'H\', \'\xe1\xb8\xaa\'=>\'H\', \'\xc4\xa6\'=>\'H\',\n        \'\xc3\x8c\'=>\'I\', \'\xc3\x8d\'=>\'I\', \'\xc3\x8e\'=>\'I\', \'\xc4\xa8\'=>\'I\', \'\xc4\xaa\'=>\'I\', \'\xc4\xac\'=>\'I\', \'\xc4\xb0\'=>\'I\', \'\xc3\x8f\'=>\'I\', \'\xe1\xbb\x88\'=>\'I\', \'\xc7\x8f\'=>\'I\', \'\xe1\xbb\x8a\'=>\'I\', \'\xc4\xae\'=>\'I\', \'\xc8\x88\'=>\'I\', \'\xc8\x8a\'=>\'I\', \'\xe1\xb8\xac\'=>\'I\', \'\xc6\x97\'=>\'I\', \'\xe1\xb8\xae\'=>\'I\', \n        \'\xc4\xb2\'=>\'IJ\',\n        \'\xc4\xb4\'=>\'J\',\n        \'\xe1\xb8\xb0\'=>\'K\', \'\xc7\xa8\'=>\'K\', \'\xe1\xb8\xb4\'=>\'K\', \'\xc6\x98\'=>\'K\', \'\xe1\xb8\xb2\'=>\'K\', \'\xc4\xb6\'=>\'K\', \'\xc4\xb9\'=>\'L\', \'\xe1\xb8\xba\'=>\'L\', \'\xe1\xb8\xb6\'=>\'L\', \'\xc4\xbb\'=>\'L\', \'\xe1\xb8\xbc\'=>\'L\', \'\xc4\xbd\'=>\'L\', \'\xc4\xbf\'=>\'L\', \'\xc5\x81\'=>\'L\', \'\xe1\xb8\xb8\'=>\'L\', \n        \'\xe1\xb8\xbe\'=>\'M\', \'\xe1\xb9\x80\'=>\'M\', \'\xe1\xb9\x82\'=>\'M\', \'\xc6\x9c\'=>\'M\', \'\xc3\x91\'=>\'N\', \'\xc7\xb8\'=>\'N\', \'\xc5\x83\'=>\'N\', \'\xc3\x91\'=>\'N\', \'\xe1\xb9\x84\'=>\'N\', \'\xc5\x87\'=>\'N\', \'\xc5\x8a\'=>\'N\', \'\xc6\x9d\'=>\'N\', \'\xe1\xb9\x86\'=>\'N\', \'\xc5\x85\'=>\'N\', \'\xe1\xb9\x8a\'=>\'N\', \'\xe1\xb9\x88\'=>\'N\', \'\xc8\xa0\'=>\'N\',\n        \'\xc3\x92\'=>\'O\', \'\xc3\x93\'=>\'O\', \'\xc3\x94\'=>\'O\', \'\xc3\x95\'=>\'O\', \'\xc5\x8c\'=>\'O\', \'\xc5\x8e\'=>\'O\', \'\xc8\xae\'=>\'O\', \'\xc3\x96\'=>\'O\', \'\xe1\xbb\x8e\'=>\'O\', \'\xc5\x90\'=>\'O\', \'\xc7\x91\'=>\'O\', \'\xc8\x8c\'=>\'O\', \'\xc8\x8e\'=>\'O\', \'\xc6\xa0\'=>\'O\', \'\xc7\xaa\'=>\'O\', \'\xe1\xbb\x8c\'=>\'O\', \'\xc6\x9f\'=>\'O\', \'\xc3\x98\'=>\'O\', \'\xe1\xbb\x92\'=>\'O\', \'\xe1\xbb\x90\'=>\'O\', \'\xe1\xbb\x96\'=>\'O\', \'\xe1\xbb\x94\'=>\'O\', \'\xc8\xb0\'=>\'O\', \'\xc8\xaa\'=>\'O\', \'\xc8\xac\'=>\'O\', \'\xe1\xb9\x8c\'=>\'O\', \'\xe1\xb9\x90\'=>\'O\', \'\xe1\xb9\x92\'=>\'O\', \'\xe1\xbb\x9c\'=>\'O\', \'\xe1\xbb\x9a\'=>\'O\', \'\xe1\xbb\xa0\'=>\'O\', \'\xe1\xbb\x9e\'=>\'O\', \'\xe1\xbb\xa2\'=>\'O\', \'\xc7\xac\'=>\'O\', \'\xe1\xbb\x98\'=>\'O\', \'\xc7\xbe\'=>\'O\', \'\xc6\x86\'=>\'O\', \'\xc5\x92\'=>\'OE\',\n        \'\xe1\xb9\x94\'=>\'P\', \'\xe1\xb9\x96\'=>\'P\', \'\xc6\xa4\'=>\'P\',\n        \'\xc5\x94\'=>\'R\', \'\xe1\xb9\x98\'=>\'R\', \'\xc5\x98\'=>\'R\',   \'\xc8\x90\'=>\'R\', \'\xc8\x92\'=>\'R\', \'\xe1\xb9\x9a\'=>\'R\', \'\xc5\x96\'=>\'R\', \'\xe1\xb9\x9e\'=>\'R\', \'\xe1\xb9\x9c\'=>\'R\', \'\xc6\xa6\'=>\'R\',\n        \'\xc5\x9a\'=>\'S\', \'\xc5\x9c\'=>\'S\', \'\xe1\xb9\xa0\'=>\'S\', \'\xc5\xa0\'=>\'S\', \'\xe1\xb9\xa2\'=>\'S\', \'\xc8\x98\'=>\'S\', \'\xc5\x9e\'=>\'S\', \'\xe1\xb9\xa4\'=>\'S\', \'\xe1\xb9\xa6\'=>\'S\', \'\xe1\xb9\xa8\'=>\'S\',\n        \'\xe1\xb9\xaa\'=>\'T\', \'\xc5\xa4\'=>\'T\', \'\xc6\xac\'=>\'T\', \'\xc6\xae\'=>\'T\', \'\xe1\xb9\xac\'=>\'T\', \'\xc8\x9a\'=>\'T\', \'\xc5\xa2\'=>\'T\', \'\xe1\xb9\xb0\'=>\'T\', \'\xe1\xb9\xae\'=>\'T\', \'\xc5\xa6\'=>\'T\', \n        \'\xc3\x99\'=>\'U\', \'\xc3\x9a\'=>\'U\', \'\xc3\x9b\'=>\'U\', \'\xc5\xa8\'=>\'U\', \'\xc5\xaa\'=>\'U\', \'\xc5\xac\'=>\'U\', \'\xc3\x9c\'=>\'U\', \'\xe1\xbb\xa6\'=>\'U\', \'\xc5\xae\'=>\'U\', \'\xc5\xb0\'=>\'U\', \'\xc7\x93\'=>\'U\', \'\xc8\x94\'=>\'U\', \'\xc8\x96\'=>\'U\', \'\xc6\xaf\'=>\'U\', \'\xe1\xbb\xa4\'=>\'U\', \'\xe1\xb9\xb2\'=>\'U\', \'\xc5\xb2\'=>\'U\', \'\xe1\xb9\xb6\'=>\'U\', \'\xe1\xb9\xb4\'=>\'U\',   \'\xe1\xb9\xb8\'=>\'U\', \'\xe1\xb9\xba\'=>\'U\', \'\xc7\x9b\'=>\'U\', \'\xc7\x97\'=>\'U\', \'\xc7\x95\'=>\'U\', \'\xc7\x99\'=>\'U\', \'\xe1\xbb\xaa\'=>\'U\',   \'\xe1\xbb\xa8\'=>\'U\', \'\xe1\xbb\xae\'=>\'U\', \'\xe1\xbb\xac\'=>\'U\', \'\xe1\xbb\xb0\'=>\'U\',\n        \'\xe1\xb9\xbc\'=>\'V\', \'\xe1\xb9\xbe\'=>\'V\', \'\xc6\xb2\'=>\'V\',\n        \'\xe1\xba\x80\'=>\'W\', \'\xe1\xba\x82\'=>\'W\', \'\xc5\xb4\'=>\'W\', \'\xe1\xba\x86\'=>\'W\', \'\xe1\xba\x84\'=>\'W\', \'\xe1\xba\x88\'=>\'W\',\n        \'\xe1\xba\x8a\'=>\'X\', \'\xe1\xba\x8c\'=>\'X\',\n        \'\xe1\xbb\xb2\'=>\'Y\', \'\xc3\x9d\'=>\'Y\', \'\xc5\xb6\'=>\'Y\', \'\xe1\xbb\xb8\'=>\'Y\', \'\xc8\xb2\'=>\'Y\', \'\xe1\xba\x8e\'=>\'Y\', \'\xc5\xb8\'=>\'Y\', \'\xe1\xbb\xb6\'=>\'Y\', \'\xc6\xb3\'=>\'Y\', \'\xe1\xbb\xb4\'=>\'Y\',\n        \'\xc5\xb9\'=>\'Z\', \'\xe1\xba\x90\'=>\'Z\', \'\xc5\xbb\'=>\'Z\', \'\xc5\xbd\'=>\'Z\', \'\xc8\xa4\'=>\'Z\', \'\xe1\xba\x92\'=>\'Z\', \'\xe1\xba\x94\'=>\'Z\', \'\xc6\xb5\'=>\'Z\',\n        \'\xc3\xa0\'=>\'a\', \'\xc3\xa1\'=>\'a\', \'\xc3\xa2\'=>\'a\', \'\xc3\xa3\'=>\'a\', \'\xc4\x81\'=>\'a\', \'\xc4\x83\'=>\'a\', \'\xc8\xa7\'=>\'a\', \'\xc3\xa4\'=>\'a\', \'\xe1\xba\xa3\'=>\'a\', \'\xc3\xa5\'=>\'a\', \'\xc7\x8e\'=>\'a\', \'\xc8\x81\'=>\'a\', \'\xc4\x85\'=>\'a\', \'\xe1\xba\xa1\'=>\'a\', \'\xe1\xb8\x81\'=>\'a\', \'\xe1\xba\x9a\'=>\'a\', \'\xe1\xba\xa7\'=>\'a\', \'\xe1\xba\xa5\'=>\'a\', \'\xe1\xba\xab\'=>\'a\', \'\xe1\xba\xa9\'=>\'a\', \'\xe1\xba\xb1\'=>\'a\', \'\xe1\xba\xaf\'=>\'a\', \'\xe1\xba\xb5\'=>\'a\', \'\xe1\xba\xb3\'=>\'a\', \'\xc7\xa1\'=>\'a\', \'\xc7\x9f\'=>\'a\', \'\xc7\xbb\'=>\'a\', \'\xe1\xba\xad\'=>\'a\', \'\xe1\xba\xb7\'=>\'a\', \n        \'\xc3\xa6\'=>\'ae\', \'\xc7\xbd\'=>\'ae\', \'\xc7\xa3\'=>\'ae\', \n        \'\xe1\xb8\x83\'=>\'b\', \'\xc9\x93\'=>\'b\', \'\xe1\xb8\x85\'=>\'b\', \'\xe1\xb8\x87\'=>\'b\', \'\xc6\x80\'=>\'b\', \'\xc6\x83\'=>\'b\', \'\xc6\x85\'=>\'b\', \'\xc3\xbe\'=>\'b\',\n        \'\xc4\x87\'=>\'c\', \'\xc4\x89\'=>\'c\', \'\xc4\x8b\'=>\'c\', \'\xc4\x8d\'=>\'c\', \'\xc6\x88\'=>\'c\', \'\xc3\xa7\'=>\'c\', \'\xe1\xb8\x89\'=>\'c\',\n        \'\xe1\xb8\x8b\'=>\'d\', \'\xc9\x97\'=>\'d\', \'\xe1\xb8\x8d\'=>\'d\', \'\xe1\xb8\x8f\'=>\'d\', \'\xe1\xb8\x91\'=>\'d\', \'\xe1\xb8\x93\'=>\'d\', \'\xc4\x8f\'=>\'d\', \'\xc4\x91\'=>\'d\', \'\xc6\x8c\'=>\'d\', \'\xc8\xa1\'=>\'d\',\n        \'\xc4\x91\'=>\'dj\',\n        \'\xc3\xa8\'=>\'e\', \'\xc3\xa9\'=>\'e\', \'\xc3\xaa\'=>\'e\', \'\xe1\xba\xbd\'=>\'e\', \'\xc4\x93\'=>\'e\', \'\xc4\x95\'=>\'e\', \'\xc4\x97\'=>\'e\', \'\xc3\xab\'=>\'e\', \'\xe1\xba\xbb\'=>\'e\', \'\xc4\x9b\'=>\'e\', \'\xc8\x85\'=>\'e\', \'\xc8\x87\'=>\'e\', \'\xe1\xba\xb9\'=>\'e\', \'\xc8\xa9\'=>\'e\', \'\xc4\x99\'=>\'e\', \'\xe1\xb8\x99\'=>\'e\', \'\xe1\xb8\x9b\'=>\'e\', \'\xe1\xbb\x81\'=>\'e\', \'\xe1\xba\xbf\'=>\'e\',           \'\xe1\xbb\x85\'=>\'e\', \'\xe1\xbb\x83\'=>\'e\', \'\xe1\xb8\x95\'=>\'e\', \'\xe1\xb8\x97\'=>\'e\', \'\xe1\xbb\x87\'=>\'e\', \'\xe1\xb8\x9d\'=>\'e\', \'\xc7\x9d\'=>\'e\', \'\xc9\x9b\'=>\'e\', \n        \'\xe1\xb8\x9f\'=>\'f\', \'\xc6\x92\'=>\'f\', \n        \'\xc7\xb5\'=>\'g\', \'\xc4\x9d\'=>\'g\', \'\xe1\xb8\xa1\'=>\'g\', \'\xc4\x9f\'=>\'g\', \'\xc4\xa1\'=>\'g\', \'\xc7\xa7\'=>\'g\', \'\xc9\xa0\'=>\'g\', \'\xc4\xa3\'=>\'g\', \'\xc7\xa5\'=>\'g\',\n        \'\xc4\xa5\'=>\'h\', \'\xe1\xb8\xa3\'=>\'h\', \'\xe1\xb8\xa7\'=>\'h\', \'\xc8\x9f\'=>\'h\', \'\xc6\x95\'=>\'h\', \'\xe1\xb8\xa5\'=>\'h\', \'\xe1\xb8\xa9\'=>\'h\', \'\xe1\xb8\xab\'=>\'h\', \'\xe1\xba\x96\'=>\'h\', \'\xc4\xa7\'=>\'h\',\n        \'\xc3\xac\'=>\'i\', \'\xc3\xad\'=>\'i\', \'\xc3\xae\'=>\'i\', \'\xc4\xa9\'=>\'i\', \'\xc4\xab\'=>\'i\', \'\xc4\xad\'=>\'i\', \'\xc4\xb1\'=>\'i\', \'\xc3\xaf\'=>\'i\', \'\xe1\xbb\x89\'=>\'i\', \'\xc7\x90\'=>\'i\', \'\xe1\xbb\x8b\'=>\'i\', \'\xc4\xaf\'=>\'i\', \'\xc8\x89\'=>\'i\', \'\xc8\x8b\'=>\'i\', \'\xe1\xb8\xad\'=>\'i\',  \'\xc9\xa8\'=>\'i\', \'\xe1\xb8\xaf\'=>\'i\',\n        \'\xc4\xb3\'=>\'ij\',\n        \'\xc4\xb5\'=>\'j\', \'\xc7\xb0\'=>\'j\', \n        \'\xe1\xb8\xb1\'=>\'k\', \'\xc7\xa9\'=>\'k\', \'\xe1\xb8\xb5\'=>\'k\', \'\xc6\x99\'=>\'k\', \'\xe1\xb8\xb3\'=>\'k\', \'\xc4\xb7\'=>\'k\',\n        \'\xc4\xba\'=>\'l\', \'\xe1\xb8\xbb\'=>\'l\', \'\xe1\xb8\xb7\'=>\'l\', \'\xc4\xbc\'=>\'l\', \'\xe1\xb8\xbd\'=>\'l\', \'\xc4\xbe\'=>\'l\', \'\xc5\x80\'=>\'l\', \'\xc5\x82\'=>\'l\', \'\xc6\x9a\'=>\'l\', \'\xe1\xb8\xb9\'=>\'l\', \'\xc8\xb4\'=>\'l\', \n        \'\xe1\xb8\xbf\'=>\'m\', \'\xe1\xb9\x81\'=>\'m\', \'\xe1\xb9\x83\'=>\'m\', \'\xc9\xaf\'=>\'m\', \n        \'\xc7\xb9\'=>\'n\', \'\xc5\x84\'=>\'n\', \'\xc3\xb1\'=>\'n\', \'\xe1\xb9\x85\'=>\'n\', \'\xc5\x88\'=>\'n\', \'\xc5\x8b\'=>\'n\', \'\xc9\xb2\'=>\'n\', \'\xe1\xb9\x87\'=>\'n\', \'\xc5\x86\'=>\'n\', \'\xe1\xb9\x8b\'=>\'n\', \'\xe1\xb9\x89\'=>\'n\', \'\xc5\x89\'=>\'n\', \'\xc6\x9e\'=>\'n\', \'\xc8\xb5\'=>\'n\',\n        \'\xc3\xb2\'=>\'o\', \'\xc3\xb3\'=>\'o\', \'\xc3\xb4\'=>\'o\', \'\xc3\xb5\'=>\'o\', \'\xc5\x8d\'=>\'o\', \'\xc5\x8f\'=>\'o\', \'\xc8\xaf\'=>\'o\', \'\xc3\xb6\'=>\'o\', \'\xe1\xbb\x8f\'=>\'o\', \'\xc5\x91\'=>\'o\', \'\xc7\x92\'=>\'o\', \'\xc8\x8d\'=>\'o\', \'\xc8\x8f\'=>\'o\', \'\xc6\xa1\'=>\'o\', \'\xc7\xab\'=>\'o\', \'\xe1\xbb\x8d\'=>\'o\', \'\xc9\xb5\'=>\'o\', \'\xc3\xb8\'=>\'o\', \'\xe1\xbb\x93\'=>\'o\', \'\xe1\xbb\x91\'=>\'o\', \'\xe1\xbb\x97\'=>\'o\', \'\xe1\xbb\x95\'=>\'o\', \'\xc8\xb1\'=>\'o\', \'\xc8\xab\'=>\'o\', \'\xc8\xad\'=>\'o\', \'\xe1\xb9\x8d\'=>\'o\', \'\xe1\xb9\x8f\'=>\'o\', \'\xe1\xb9\x91\'=>\'o\', \'\xe1\xb9\x93\'=>\'o\', \'\xe1\xbb\x9d\'=>\'o\', \'\xe1\xbb\x9b\'=>\'o\', \'\xe1\xbb\xa1\'=>\'o\', \'\xe1\xbb\x9f\'=>\'o\', \'\xe1\xbb\xa3\'=>\'o\', \'\xc7\xad\'=>\'o\', \'\xe1\xbb\x99\'=>\'o\', \'\xc7\xbf\'=>\'o\', \'\xc9\x94\'=>\'o\', \n        \'\xc5\x93\'=>\'oe\',\n        \'\xe1\xb9\x95\'=>\'p\', \'\xe1\xb9\x97\'=>\'p\', \'\xc6\xa5\'=>\'p\', \n        \'\xc5\x95\'=>\'r\', \'\xe1\xb9\x99\'=>\'r\', \'\xc5\x99\'=>\'r\', \'\xc8\x91\'=>\'r\', \'\xc8\x93\'=>\'r\', \'\xe1\xb9\x9b\'=>\'r\', \'\xc5\x97\'=>\'r\', \'\xe1\xb9\x9f\'=>\'r\', \'\xe1\xb9\x9d\'=>\'r\',\n        \'\xc5\x9b\'=>\'s\', \'\xc5\x9d\'=>\'s\', \'\xe1\xb9\xa1\'=>\'s\', \'\xc5\xa1\'=>\'s\', \'\xe1\xb9\xa3\'=>\'s\', \'\xc8\x99\'=>\'s\', \'\xc5\x9f\'=>\'s\', \'\xe1\xb9\xa5\'=>\'s\', \'\xe1\xb9\xa7\'=>\'s\', \'\xe1\xb9\xa9\'=>\'s\', \'\xc5\xbf\'=>\'s\', \'\xe1\xba\x9b\'=>\'s\',\n        \'\xc3\x9f\'=>\'Ss\',          \n        \'\xe1\xb9\xab\'=>\'t\', \'\xe1\xba\x97\'=>\'t\', \'\xc5\xa5\'=>\'t\', \'\xc6\xad\'=>\'t\', \'\xca\x88\'=>\'t\', \'\xc6\xab\'=>\'t\', \'\xe1\xb9\xad\'=>\'t\', \'\xc8\x9b\'=>\'t\', \'\xc5\xa3\'=>\'t\', \'\xe1\xb9\xb1\'=>\'t\', \'\xe1\xb9\xaf\'=>\'t\', \'\xc5\xa7\'=>\'t\', \'\xc8\xb6\'=>\'t\',\n        \'\xc3\xb9\'=>\'u\', \'\xc3\xba\'=>\'u\', \'\xc3\xbb\'=>\'u\', \'\xc5\xa9\'=>\'u\', \'\xc5\xab\'=>\'u\', \'\xc5\xad\'=>\'u\', \'\xc3\xbc\'=>\'u\', \'\xe1\xbb\xa7\'=>\'u\', \'\xc5\xaf\'=>\'u\', \'\xc5\xb1\'=>\'u\', \'\xc7\x94\'=>\'u\', \'\xc8\x95\'=>\'u\', \'\xc8\x97\'=>\'u\', \'\xc6\xb0\'=>\'u\', \'\xe1\xbb\xa5\'=>\'u\', \'\xe1\xb9\xb3\'=>\'u\', \'\xc5\xb3\'=>\'u\', \'\xe1\xb9\xb7\'=>\'u\', \'\xe1\xb9\xb5\'=>\'u\', \'\xe1\xb9\xb9\'=>\'u\', \'\xe1\xb9\xbb\'=>\'u\', \'\xc7\x9c\'=>\'u\', \'\xc7\x98\'=>\'u\', \'\xc7\x96\'=>\'u\', \'\xc7\x9a\'=>\'u\', \'\xe1\xbb\xab\'=>\'u\', \'\xe1\xbb\xa9\'=>\'u\', \'\xe1\xbb\xaf\'=>\'u\', \'\xe1\xbb\xad\'=>\'u\', \'\xe1\xbb\xb1\'=>\'u\', \n        \'\xe1\xb9\xbd\'=>\'v\', \'\xe1\xb9\xbf\'=>\'v\', \n        \'\xe1\xba\x81\'=>\'w\', \'\xe1\xba\x83\'=>\'w\', \'\xc5\xb5\'=>\'w\', \'\xe1\xba\x87\'=>\'w\', \'\xe1\xba\x85\'=>\'w\', \'\xe1\xba\x98\'=>\'w\', \'\xe1\xba\x89\'=>\'w\',\n        \'\xe1\xba\x8b\'=>\'x\', \'\xe1\xba\x8d\'=>\'x\', \n        \'\xc3\xbd\'=>\'y\', \'\xc3\xbd\'=>\'y\', \'\xe1\xbb\xb3\'=>\'y\', \'\xc3\xbd\'=>\'y\', \'\xc5\xb7\'=>\'y\', \'\xc8\xb3\'=>\'y\', \'\xe1\xba\x8f\'=>\'y\', \'\xc3\xbf\'=>\'y\', \'\xc3\xbf\'=>\'y\', \'\xe1\xbb\xb7\'=>\'y\', \'\xe1\xba\x99\'=>\'y\', \'\xc6\xb4\'=>\'y\', \'\xe1\xbb\xb5\'=>\'y\',\n        \'\xc5\xba\'=>\'z\', \'\xe1\xba\x91\'=>\'z\', \'\xc5\xbc\'=>\'z\', \'\xc5\xbe\'=>\'z\', \'\xc8\xa5\'=>\'z\', \'\xe1\xba\x93\'=>\'z\', \'\xe1\xba\x95\'=>\'z\', \'\xc6\xb6\'=>\'z\',\n        \'\xe2\x84\x96\'=>\'No\',\n        \'\xc2\xba\'=>\'o\',\n        \'\xc2\xaa\'=>\'a\',\n        \'\xe2\x82\xac\'=>\'E\',\n        \'\xc2\xa9\'=>\'C\',\n        \'\xe2\x84\x97\'=>\'P\',\n        \'\xe2\x84\xa2\'=>\'tm\',\n        \'\xe2\x84\xa0\'=>\'sm\',\n        \'\xe2\x80\x99\' => \'\',\n        \'_\'=>\'-\',\n        \'%20\'=>\'-\'\n    );\n
Run Code Online (Sandbox Code Playgroud)\n\n

编辑:我发现它更像是两个字符十一。当您复制粘贴它并按退格键时,它首先删除重音而不是字符本身。

\n\n

EDIT2:它的字符带有组合急性口音。可以使用 PHP 类 Normalizer 进行规范化。

\n

use*_*441 6

就像@Casimir et Hippolyte 指出的那样:

\n\n
\n

有两种方法可以在 UTF-8 中表示 \xc3\xa1 等重音字母:第一种使用单个 unicode 点:U+00E1: LATIN SMALL LETTER A with ACUTE,第二种使用两个 unicode 点:U+0061: LATIN小写字母 A 和组合字符:U+0301:组合尖锐重音。使用 intl 包,您可以在可能的情况下强制字符串对所有字形使用唯一的代码点

\n
\n\n

可以使用 PHP Normalizer 类http://php.net/normalizer对它们进行规范化。

\n\n

所以首先我需要将它们标准化,而不是替换。

\n\n

感谢所有试图提供帮助的人。

\n