相关疑难解决方法(0)

正则表达式\ p {L}和\ p {N}

我是正则表达式的新手,并且给出了以下正则表达式:

(\p{L}|\p{N}|_|-|\.)*
Run Code Online (Sandbox Code Playgroud)

我知道*的意思和| 意思是"或"而那个\逃脱.

但我不知道是什么\p{L}\p{N}意味着什么.我搜索了Google,没有结果......

有人能帮我吗?

regex xml character-class

94
推荐指数
2
解决办法
9万
查看次数

Unicode中的汉字完整范围是什么?

U + 4E00..U + 9FFF是整套的一部分,但不是全部

unicode cjk

83
推荐指数
4
解决办法
9万
查看次数

从python字符串中删除日语字符之间的下划线

我需要帮助从某些字符串中删除下划线。这并不难,困难在于字符串确实包含日语字符。

\n

例如,我有这些字符串(数十万个其他字符串):

\n
str1 = "3F_\xe3\x81\x86_\xe3\x81\x8c_LOW_\xe3\x81\xbe\xe3\x81\x84_\xe3\x81\x8c"\nstr2 = "A5_BB_\xe5\x90\x88_\xe3\x82\x89"\nstr3 = "C1_\xe3\x81\xa0_\xe3\x81\xa8_\xe6\x80\x9d"\n
Run Code Online (Sandbox Code Playgroud)\n

我想要得到的最终结果是这样的:

\n
strFinal1 = "3F_\xe3\x81\x86\xe3\x81\x8c_LOW_\xe3\x81\xbe\xe3\x81\x84\xe3\x81\x8c"\nstrFinal2 = "A5_BB_\xe5\x90\x88\xe3\x82\x89"\nstrFinal3 = "C1_\xe3\x81\xa0\xe3\x81\xa8\xe6\x80\x9d\n
Run Code Online (Sandbox Code Playgroud)\n

所以本质上我只想删除两个日语字符之间的下划线。\n我如何在 python 中做到这一点?

\n

python string python-3.x

5
推荐指数
1
解决办法
590
查看次数

UTF-8中的中文字符的上限和下限是多少?

我想在python中创建一个包含所有ord()中文字符的集合:

对于英语,相当于:

english = set(range(ord('a'),ord('z') + 1 ) +
              range(ord('A'),ord('Z') + 1 ))
Run Code Online (Sandbox Code Playgroud)

python cjk

3
推荐指数
1
解决办法
2040
查看次数

标签 统计

cjk ×2

python ×2

character-class ×1

python-3.x ×1

regex ×1

string ×1

unicode ×1

xml ×1