标签: control-characters

从Word粘贴+创建XML文档 - >十六进制值0x0C,是无效字符(.Net)

我有一个接受用户HTML输入的网页.使用System.Xml命名空间将输入转换为xml文档,如下所示:

var doc = new XmlDocument();
doc.AppendChild(doc.CreateElement("root"));
doc.DocumentElement.SetAttribute("BodyHTML", theTextBox.Text);
Run Code Online (Sandbox Code Playgroud)

然后System.Xml.Xsl.XslCompiledTransform对数据使用Xsl转换().

用户倾向于使用项目符号,引号等在Microsoft Word中编写文本.粘贴到我的页面时,其文本包含无效字符,如0x0C,0x03等.使用xsl转换时,会出现此错误"十六进制值0x0C,是无效字符".

到目前为止,我的修复方法是消除我发现的令人反感的字符,使用循环和String.Replace:0到31之间的所有字符,除了9,10和13都被替换为String.Empty.

我正在寻找的是一种更好的方法.内置的.Net方法?或者只是一个非法unicode字符的完整列表.

c# xml unicode control-characters

3
推荐指数
1
解决办法
5952
查看次数

为什么"\n"是Javascript中的数字"NaN"

在Chrome和Firefox上的JavaScript中:

isNaN( "\n" )给出false
parseFloat ( "\n" )NaN

同样是产生了\t,\r\f".

  • \n 是一个数字
  • 解析\n给你不是数字.
  • 转义字符,如NULL字节\0,\\并按\"预期工作.
  • 我们知道这NaN是一个数字,只是不能代表任何其他价值
  • \n数字也是如此,这是不可表示的.

为什么浏览器会这样实现?

javascript parsing nan control-characters

3
推荐指数
1
解决办法
230
查看次数

使用ASCII 31字段分隔符作为Postgresql COPY分隔符

我们将Postgres 9.3中的数据导出到文本文件中以供Spark使用.

我们希望使用ASCII 31字段分隔符作为分隔符而不是\ t,以便我们不必担心转义问题.

我们可以在这样的shell脚本中这样做:

#!/bin/bash
DELIMITER=$'\x1F'
echo "copy ( select * from table limit 1) to STDOUT WITH DELIMITER '${DELIMITER}'" | (psql ...) > /tmp/ascii31
Run Code Online (Sandbox Code Playgroud)

但是我们想知道,是否有可能在"纯"postgres中指定一个不可打印的字形作为分隔符?

编辑:我们试图按照http://www.postgresql.org/docs/9.3/static/sql-syntax-lexical.html使用postgres转义约定

warehouse=> copy ( select * from table limit 1) to STDOUT WITH DELIMITER '\x1f';
Run Code Online (Sandbox Code Playgroud)

并收到

ERROR:  COPY delimiter must be a single one-byte character
Run Code Online (Sandbox Code Playgroud)

postgresql ascii escaping control-characters delimiter

3
推荐指数
2
解决办法
3680
查看次数

如何自动转义 Python 字符串中的控制字符

我有包含控制字符的字符串,我想让它们可见(例如,用于打印它们的文档)。

例如,我有

dialect = csv.sniffer().sniff(csvfile.read(1024))
Run Code Online (Sandbox Code Playgroud)

我想打印的内容

dialect.lineterminator
Run Code Online (Sandbox Code Playgroud)

这显然包含控制字符。通过在它们前面粘贴“\”,它们不会变得可打印。我希望看到 \n \r 或两者,视情况而定。

由于我使用的是 Python 3,因此使用 str.encode 提出了类似的问题,例如

    dialect.lineterminator.encode('unicode-escape')
Run Code Online (Sandbox Code Playgroud)

但如果我打印这个,我会得到

    b'\\r\\n'
Run Code Online (Sandbox Code Playgroud)

尽管它的外观,它只是两个字节。我想要一个 unicode 字符串,例如

    "\\r\\n"
Run Code Online (Sandbox Code Playgroud)

这是一个 4 个字符的字符串。我不是在 unicode 编码之后,而是在转义序列之后。

python escaping control-characters

3
推荐指数
1
解决办法
1万
查看次数

C# 字符串中控制字符的转义码

我想找到 Microsoft Word 中使用的以下控制字符的代码。

在此处输入图片说明

我找到了其中的一些。如果我错了,请纠正我。我已经为他们浏览了网络。但我无法找到一些代码。

c# ms-word control-characters

3
推荐指数
1
解决办法
3665
查看次数

这个 Delphi 语法有什么作用?“一些AnsiChar := ^H;”

我正在将一个非常旧的组件转换为 Delphi 12,并且偶然发现了我不记得以前见过的语法。代码有点像这样:

someBoolean := key in [^H, #32..#255];
Run Code Online (Sandbox Code Playgroud)

我知道它正在测试key指定的 ANSI 字符集是否匹配或在范围内,但到底是什么^HH如果我更改为A, , BDelphi似乎很乐意编译该行C或 ,1。该行在 Delphi 12 和 Delphi 7 下编译。我似乎找不到任何有关此的信息。这似乎是一个非常古老的语法,可能来自 Pascal 时代。有人能解释一下吗?

我在 Delphi 7 中准备了这个测试代码:

procedure TForm1.Button1Click(Sender: TObject);
var
  c1, c2, c3, c4, c5, c6, c7, c8, c9, c10, c11, c12, c13, c14, c15: AnsiChar;
begin
  c1 := ^A;
  c2 := ^B;
  c3 := ^C;
  c4 := ^D;
  c5 := ^E;
  c6 := ^F;
  c7 …
Run Code Online (Sandbox Code Playgroud)

delphi char control-characters

3
推荐指数
1
解决办法
164
查看次数

在Oracle XDB中转义控制字符

我对Oracle XDB完全陌生,特别是使用它来从数据库表生成XML输出,并且正在开发从9i(Oracle9i企业版9.2.0.5.0版-生产)到11g(Oracle)的应用程序数据库11g企业版11.2.0.2.0版-64位生产)。这是一个小的测试用例,它说明了我遇到的问题:

select xmlelement("test", test) from (select 'a' test from dual);
Run Code Online (Sandbox Code Playgroud)

这有效并给我:

<test>a</test>
Run Code Online (Sandbox Code Playgroud)

但是在11g中,如果我将'a'换成无效字符(例如U + 0013),则会出现以下错误:

ORA-31061: XDB error: special char to escaped char conversion failed.
Run Code Online (Sandbox Code Playgroud)

在9i下,同一件事可以成功运行,没有错误。

显然,理想的答案是进行适当的验证,以防止控制字符进入我要转换为XML的简单字符数据中,但是不幸的是,这超出了我的工作范围。

这是其他任何人都经历过的吗?如果是,我可以对我的XML生成脚本进行简单的更改吗?还是需要进行其他某种清理?或者只是在极少数情况下手动解决问题(对于我的需求,这将是一个非常合理的选择)。

非常感谢。

xml oracle control-characters

2
推荐指数
1
解决办法
2万
查看次数

在MySQL中查找控制字符

在MySQL中查找字符串中控制字符的最佳方法是什么?我有一个表,想要获取包含控制字符的所有记录.就像是

SELECT * FROM Customer WHERE Name = *ControlCharFilter*;
Run Code Online (Sandbox Code Playgroud)

在C#中它会是

Customer.Where(x => x.Name.Any(y => char.IsControl(y));
Run Code Online (Sandbox Code Playgroud)

mysql string control-characters

2
推荐指数
1
解决办法
1445
查看次数

包含控制字符的字符串文字

我正在创建一种类似于以下内容的交互式教程:

echo "What do you press if you want to move one word backwords in bash?"
read ans
if [ "$ans" == "ESCb" ]; then
  echo RIGHT!
else
  echo WRONG!
fi
Run Code Online (Sandbox Code Playgroud)

现在,如何在字符串文字中输入ESC字符(ASCII 27十进制)?ESC当然是行不通的。

我了解我可能最好使用另一种语言,但这是一项作业,必须使用bash脚本。

bash control-characters

2
推荐指数
1
解决办法
628
查看次数

Unicode 中是否有“标题结束”或“传输开始”字符?

Unicode 具有START OF HEADING(\xe2\x90\x81 U+0001)、START OF TEXT(\xe2\x90\x82 U+0002)、END OF TEXT(\xe2\x90\x83 U+0003) 和END OF TRANSMISSION(\xe2\x90\x84 U+0004) 字符。令人困惑的是,虽然有START OF HEADING字符,但没有END OF HEADING字符,而虽然有END OF TRANSMISSION字符,却没有START OF TRANSMISSION字符。

\n

这些缺失的字符在哪里?

\n

我应该如何使用 Unicode 来表示传输的开始或标题的结束?

\n

如果答案是“只是使用START OF HEADING代替”,那么如果我的“传输”没有“标题”START OF TRANSMISSION我该怎么办?

\n

如果答案的第二部分是“仅使用START OF TEXT代替”,如果标题和文本之间END OF HEADING有东西会发生什么?\xe2\x80\xa0

\n

\xe2\x80\xa0 我无法想象这种情况经常发生(如果有的话),但我问是为了以防万一有人试图在标题末尾和文本开头之间添加一些内容。

\n
\n

Stack Exchange …

unicode binary transmission control-characters eof

2
推荐指数
1
解决办法
675
查看次数