如何可靠地删除破坏代码的隐形字符?

Ste*_* Lu 6 javascript unicode utf-8

我正在尝试构建一个bookmarklet并且遇到了这个问题,我只能弄清楚:一个\u8203角色,Chrome在我的代码块中无助地告诉我(在粘贴到JS控制台时)是一个"无效的角色ILLEGAL ".

幸运的是Safari是那个告诉我它的人\u8203.

我正在编辑Sublime Text 2编辑器中的代码,并以某种方式复制进出它(我也试过TextEdit)无法删除它.

是否有某种网站会删除除ASCII以外的所有字符?

当我尝试保存为ISO 8859时,它会将其保存为UTF-8"因为不支持的字符".

......是的 这才是重点.摆脱我不受支持的邪恶角色.

我应该做些什么?在十六进制编辑器中编辑我的文件?

仅供参考我实际上是通过重新输入代码来解决的(顺便说一下,这个代码来自这个网站).

Esa*_*ija 12

是否有某种网站会删除除ASCII以外的所有字符?

你可以使用这个网站

您可以使用以下代码重新创建网站:

<!DOCTYPE html>
<html>

    <head>
        <meta http-equiv="content-type" content="text/html; charset=UTF-8">
        <title>- jsFiddle demo</title>
        <script type="text/javascript" src="https://ajax.googleapis.com/ajax/libs/jquery/1.7.2/jquery.min.js"></script>
        <link rel="stylesheet" type="text/css" href="/css/normalize.css">
        <link rel="stylesheet" type="text/css" href="/css/result-light.css">
        <style type="text/css">
            textarea {
                width: 800px;
                height: 480px;
                outline: none;
                font-family: Monaco, Consolas, monospace;
                border: 0;
                padding: 15px;
                color: hsl(0, 0%, 27%);
                background-color: #F6F6F6;
            }
        </style>
        <script type="text/javascript">
            //<![CDATA[ 
            $(function () {
                $("button").click(function () {
                    $("textarea").val(
                             $("textarea").val().replace(/[^\u0000-\u007E]/g, "")
                    );
                    $("textarea").focus()[0].select();
                });
            }); //]]>
        </script>
    </head>

    <body>
        <textarea></textarea>
        <button>Remove</button>
    </body>

</html>
Run Code Online (Sandbox Code Playgroud)

  • 故事的寓意是不要从jsfiddle中的Javascript缓冲区复制.他们使用隐形字符在那里做奇怪的事情. (2认同)

Mat*_*Kim 5

您可以使用正则表达式过滤 0-127 中的所有内容。例如在 javascript 中:

text.replace(/[^\x00-\x7F]/g, "")
Run Code Online (Sandbox Code Playgroud)

x00 = 0, x7f = 127


Adi*_*Adi 4

好吧,我能想到的最简单的方法是使用sed

sed -i 's/[^[:print:]]//g' your_script.js
//            ^^^^^ this can also be 'ascii'
Run Code Online (Sandbox Code Playgroud)

或使用tr

tr -cd '\11\12\15\40-\176' < old_script.js > new_script.js
Run Code Online (Sandbox Code Playgroud)