相关疑难解决方法(0)

在Python中处理字符串中的转义序列

有时当我从文件或用户那里获得输入时,我会得到一个包含转义序列的字符串.我想以与Python处理字符串文字中的转义序列相同的方式处理转义序列.

例如,假设myString定义为:

>>> myString = "spam\\neggs"
>>> print(myString)
spam\neggs

Run Code Online (Sandbox Code Playgroud)

我想要一个函数(我会称之为process)这样做:

>>> print(process(myString))
spam
eggs

Run Code Online (Sandbox Code Playgroud)

重要的是该函数可以处理Python中的所有转义序列(在上面链接的表中列出).

Python有功能吗？

python string escaping

dln*_*385

2019 02-20

93
推荐指数

4
解决办法

8万
查看次数

如何修复Python中的"<string> DeprecationWarning:无效转义序列"？

我在Python中收到很多这样的警告:

DeprecationWarning: invalid escape sequence \A
  orcid_regex = '\A[0-9]{4}-[0-9]{4}-[0-9]{4}-[0-9]{3}[0-9X]\Z'

DeprecationWarning: invalid escape sequence \/
  AUTH_TOKEN_PATH_PATTERN = '^\/api\/groups'

DeprecationWarning: invalid escape sequence \
  """

DeprecationWarning: invalid escape sequence \.
  DOI_PATTERN = re.compile('(https?://(dx\.)?doi\.org/)?10\.[0-9]{4,}[.0-9]*/.*')

<unknown>:20: DeprecationWarning: invalid escape sequence \(

<unknown>:21: DeprecationWarning: invalid escape sequence \(

Run Code Online (Sandbox Code Playgroud)

他们的意思是什么？我该如何解决它们？

python python-3.x python-3.6

Sea*_*ond

lucky-day

21
推荐指数

1
解决办法

7853
查看次数

在运行时删除 Python 中的反斜杠

我需要一种方法让我的函数在运行时接收一个字符串并删除反斜杠，同时保留它前面的字符。所以对于 \a 我必须得到一个。这也必须适用于像 \e -> e 这样的非转义字符。

我已经在互联网上寻找解决此问题的一般解决方案，但似乎没有。我发现的最佳解决方案是使用字典从头开始构建字符串，例如：如何防止 Python 中的特殊字符自动转义

escape_dict={'\a':r'\a',
         '\b':r'\b',
         '\c':r'\c',
         '\f':r'\f',
         '\n':r'\n',
         '\r':r'\r',
         '\t':r'\t',
         '\v':r'\v',
         '\'':r'\'',
         '\"':r'\"',
         '\0':r'\0',
         '\1':r'\1',
         '\2':r'\2',
         '\3':r'\3',
         '\4':r'\4',
         '\5':r'\5',
         '\6':r'\6',
         '\7':r'\7',
         '\8':r'\8',
         '\9':r'\9'}
def raw(text):
    """Returns a raw string representation of the string"""
    new_string=''
    for char in text:
        try: 
            new_string += escape_dict[char]
        except KeyError: 
            new_string += char
    return new_string

Run Code Online (Sandbox Code Playgroud)

然而，由于转义数字和转义字母之间的冲突，这通常会失败。使用像 \001 而不是 \1 这样的 3 位数字也会失败，因为输出中会有额外的数字，这违背了目的。我应该简单地删除反斜杠。其他基于编码的建议解决方案，例如在 Python 中处理字符串中的转义序列

也不起作用，因为这只是将转义字符转换为十六进制代码。\a 被转换为 \x07。即使以某种方式删除它，字符 a 仍然丢失。

python string character-encoding

Mat*_*eex

2020 07-14

6
推荐指数

1
解决办法

124
查看次数