标签: non-printing-characters

HTML中字符串的隐形分隔符

我需要一种方法来识别HTML标记中的某些字符串.我知道字符串是什么,但它们可能是文档中其他字符串的子字符串.为了找到它们,我输出一个特殊的分隔符(当前正在使用\032).在页面加载时,我们浏览HTML并记录字符串的位置,并删除分隔符.

不幸的是,大多数浏览器都会显示分隔符,直到我们可以找到并删除所有分隔符.如果可能的话,我想避免这种情况.是否有一个字符或字符串将保留在HTML内容中(因此注释不起作用)但对用户不可见?它也需要是一个不太可能出现在字符串旁边的东西,所以类似的东西 也不起作用.

编辑:对不起,我忘了提到字符串将属于属性,所以任何类型的标签都不会工作.

html non-printing-characters

54
推荐指数
2
解决办法
8万
查看次数

java中的可打印字符

有谁知道如何检测java中的可打印字符?

过了一会儿(试用/错误)我得到了这个方法:

    public boolean isPrintableChar( char c ) {
        Character.UnicodeBlock block = Character.UnicodeBlock.of( c );
        return (!Character.isISOControl(c)) &&
                c != KeyEvent.CHAR_UNDEFINED &&
                block != null &&
                block != Character.UnicodeBlock.SPECIALS;
    }
Run Code Online (Sandbox Code Playgroud)

我通过KeyListener获取输入,然后Ctr-'key'打印出一个正方形.有了这个功能似乎还不够.

我在这里错过了一些炭火吗?

java unicode non-printing-characters

33
推荐指数
2
解决办法
2万
查看次数

如何替换不可打印的unicode字符(Javascript)

我已经浪费了很多时间处理字符串(由其他来源生成),我发现问题是字符串具有不可打印的字符.今天我正在处理javascript.有谁知道如何在javascript中替换不可打印的unicode字符?

我发现类似的东西:

如何在Java中替换不可打印的Unicode字符?

my_string.replaceAll("\\p{C}", "?");

和这里:

添加的非ascii字符仅在Safari浏览器中输入

filename.replace(/[^a-z0-9\.]+/gi, "");

最后一个选项替换括号中没有的所有字符.无论我正在使用什么语言,这总是让我在后端咬我的东西,我已经厌倦了弄清楚什么字符弄乱了我的代码.出于这个原因,我希望能够将所有那些不可见的字符替换为可见的东西,以便我以后可以完全删除它们.

javascript regex unicode non-printing-characters

18
推荐指数
2
解决办法
3万
查看次数

序列化ArrayList Java

我想序列化类型的Arraylist,ArrayList<Class> 该类包含两个原始类型的Arraylist

public class Keyword {

    private long id;
    private long wid;
    private String name;
    private ArrayList<Integer> rank;
    private int month;
    private float avg;
    private ArrayList<String> date;
        ... and so on
}
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?

非常感谢提前

java serialization arraylist non-printing-characters

8
推荐指数
2
解决办法
4万
查看次数

如何删除ruby中不可打印/不可见的字符?

有时我在字符串中间有邪恶的不可打印字符.这些字符串是用户输入,所以我必须让我的程序接收它,而不是尝试更改问题的来源.

例如,它们可以在字符串的中间具有零宽度的无中断空间.例如,在解析文件时,一个有问题的部分是文件中间的字符串.虽然一切看起来都是正确的,但用展示检查它:.po"he is a man of god"irb

 "he is a man of god".codepoints
 => [104, 101, 32, 105, 115, 32, 97, 32, 65279, 109, 97, 110, 32, 111, 102, 32, 103, 111, 100] 
Run Code Online (Sandbox Code Playgroud)

我相信我知道它BOM是什么,我甚至可以很好地处理它.但是有时我在文件的中间有这样的字符,所以它不是BOM.

我目前的做法是以一种非常臭的方式删除所有我发现邪恶的角色:

text = (text.codepoints - CODEPOINTS_BlACKLIST).pack("U*")
Run Code Online (Sandbox Code Playgroud)

我得到的最接近的是关注这篇帖子,这让我:print:选择了regexp.然而这对我没有好处:

"m".scan(/[[:print:]]/).join.codepoints
 => [65279, 109] 
Run Code Online (Sandbox Code Playgroud)

所以问题是:如何从ruby中的字符串中删除所有不可打印的字符?

ruby encoding non-printing-characters

7
推荐指数
1
解决办法
9137
查看次数

什么是“ M-表示法”,在哪里记录?

猫的手册页 说:

-v, --show-nonprinting
    use ^ and M- notation, except for LFD and TAB 
Run Code Online (Sandbox Code Playgroud)

M标记是什么,在哪里记录?

例:

$cat log -A
wrote 262144 bytes from file test.x in 9.853947s (25.979 KiB/s)^M$
^M> ^H^H  ^H^H>
Run Code Online (Sandbox Code Playgroud)

什么意思^M^H

cat non-printing-characters

7
推荐指数
1
解决办法
2397
查看次数

如何匹配python正则表达式中的不可打印字符?

如何匹配python正则表达式中的不可打印字符?在我的情况下,我有一个字符串,其中包含可打印和不可打印的字符组合.

Example String: "Det 3 @ NYY 5 ?7" where the ? is either 0x7f or 0x80.
Run Code Online (Sandbox Code Playgroud)

在上面的例子中,我需要匹配0x7f或0x80.如何在python正则表达式中指定它?

python regex non-printing-characters

6
推荐指数
1
解决办法
8440
查看次数

R从数据框中删除特殊字符

我有一个包含字符串"Energyper m"的矩阵.在'm'是带有问号的菱形符号之前 - 我不知道它是什么.

我试图通过在矩阵的列上使用它来摆脱它:

a=gsub('Energy per ?m','',a) 
Run Code Online (Sandbox Code Playgroud)

[和使用复制/粘贴的GSUB的第一项],但它不工作.[意想不到的符号"A =代表(5,能源每".当我尝试提取从原来的矩阵grepl我得到的东西:

46: In grepl("ref. value", raw$parameter) :
input string 15318 is invalid in this locale
Run Code Online (Sandbox Code Playgroud)

我该怎样摆脱所有这些迹象?我想只有0-9,AZ,az,/和'.其余的可能会被破坏.

regex grep r gsub non-printing-characters

6
推荐指数
1
解决办法
2万
查看次数

如何在 WPF 文本框中显示 Unicode 控制字符?

我的用户进行了大量的双向文本编辑,他们在文本中撒上一些从左到右和/或从右到左的标记并不罕见。有时他们想查看这些标记在文本中的位置,以便移动或删除它们。
Windows 窗体中的控件TextBox提供了一个默认上下文菜单,其中包含一些与 Unicode 相关的条目,其中之一是“显示 Unicode 控制字符”

启用此选项将强制控件为那些不可打印的字符绘制在相应字体中定义的字形。

例如,如果我将控件Text的属性设置TextBox"Hello \u200E World!"并启用此选项,我将使用字体文件中定义的字形呈现 LRM 字符(使用的字体是 Segoe UI)。

如果我们在字体编辑软件(我使用 FontForge)中打开 Segoe UI 字体,我们可以看到确实有为 LRMRLM代码点定义的字形。

我还发现StringFormatFlags枚举可用于控制这些字符在 GDI+ 中的呈现方式,特别是通过DisplayFormatControlStringFormat对象提供标志:

private void Form_Paint(object sender, PaintEventArgs e)
{
    var text = "Hello \u200E World!";
    var g = e.Graphics;

    // Will draw LRM symbol with its representative glyph
    var fmt = new StringFormat(StringFormatFlags.DisplayFormatControl); …
Run Code Online (Sandbox Code Playgroud)

c# unicode wpf fonts non-printing-characters

5
推荐指数
0
解决办法
1985
查看次数

如何在 Visual Studio Code 中显示 ascii 不可打印字符?

我使用的是 Visual Studio Code 1.51.1 版,想知道在查看文件时是否有任何方法可以显示所有的 ascii 不可打印字符。我曾经使用 Notepad++,它有一个可以打开的功能,可以显示文件中的每个字符,包括不可打印的字符。

例如,这是在 Notepad++ 中打开的文件的屏幕截图,我BEL通过按插入了不可打印的字符ALT + 007。您还可以在行尾看到回车/换行符:

在此处输入图片说明

这是我所指的字符列表(我在这里找到了这个列表):

在此处输入图片说明

所以我要问的是有一个扩展我可以安装到 Visual Studio Code 或我可以配置的设置将显示所有 ascii 字符,包括可打印和不可打印,类似于 Notepad++ 如何做到这一点,如截图所示我假如?提前致谢。

ascii non-printing-characters visual-studio-code vscode-settings

5
推荐指数
1
解决办法
622
查看次数