为什么单引号时 PyYAML 和 ruamel.yaml 会转义特殊字符?

eri*_*rip 4 yaml escaping pyyaml python-3.x ruamel.yaml

我有一个 YAML 文件,想限制某个字段不包含空格。

这是一个演示我尝试的脚本:

测试文件

#!/usr/bin/env python3

import os
from ruamel import yaml

def read_conf(path_to_config):
    if os.path.exists(path_to_config):
        conf = open(path_to_config).read()
        return yaml.load(conf)
    return None

if __name__ == "__main__":
    settings = read_conf("hello.yaml")
    print("type of name: {0}, repr of name: {1}".format(type(
             settings['foo']['name']), repr(settings['foo']['name'])))
    if any(c.isspace() for c in settings['foo']['name']):
        raise Exception("No whitespace allowed in name!")
Run Code Online (Sandbox Code Playgroud)

这是我对 YAML 文件的第一次剪辑:

你好.yaml

foo:
    name: "hello\t"
Run Code Online (Sandbox Code Playgroud)

在上面的 YAML 文件中,正确引发了异常:

type of name: <class 'str'>, repr of name: 'hello\t'
Traceback (most recent call last):
  File "./test.py", line 16, in <module>
    raise Exception("No whitespace allowed in name!")
Exception: No whitespace allowed in name!
Run Code Online (Sandbox Code Playgroud)

但是,如果我将双引号更改为单引号,则不会引发异常:

08:23 $ ./test.py 
type of name: <class 'str'>, repr of name: 'hello\\t'
Run Code Online (Sandbox Code Playgroud)

使用ruamel.yaml==0.11.11和时都会发生此行为PyYAML=3.11

为什么在这些 Python YAML 解析器中单引号和双引号之间存在差异,据我所知,它们在 YAML 规范中没有功能差异?如何防止特殊字符被转义?

Ant*_*hon 6

YAML 规范在单引号和双引号字符串之间存在巨大差异。在单引号标量中,您只能转义单引号:

单引号样式由周围的“'”指示符指定。因此,在单引号标量中,此类字符需要重复。这是在单引号标量中执行的唯一转义形式。

因此\in 'hello\t'没有特殊功能,标量由字母h, e, l(2x), 组成o\t

反斜杠转义仅在双引号 YAML 标量中受支持。