我是正则表达式的新手,并且给出了以下正则表达式:
(\p{L}|\p{N}|_|-|\.)*
Run Code Online (Sandbox Code Playgroud)
我知道*的意思和| 意思是"或"而那个\逃脱.
但我不知道是什么\p{L}和\p{N}意味着什么.我搜索了Google,没有结果......
有人能帮我吗?
我需要帮助从某些字符串中删除下划线。这并不难,困难在于字符串确实包含日语字符。
\n例如,我有这些字符串(数十万个其他字符串):
\nstr1 = "3F_\xe3\x81\x86_\xe3\x81\x8c_LOW_\xe3\x81\xbe\xe3\x81\x84_\xe3\x81\x8c"\nstr2 = "A5_BB_\xe5\x90\x88_\xe3\x82\x89"\nstr3 = "C1_\xe3\x81\xa0_\xe3\x81\xa8_\xe6\x80\x9d"\nRun Code Online (Sandbox Code Playgroud)\n我想要得到的最终结果是这样的:
\nstrFinal1 = "3F_\xe3\x81\x86\xe3\x81\x8c_LOW_\xe3\x81\xbe\xe3\x81\x84\xe3\x81\x8c"\nstrFinal2 = "A5_BB_\xe5\x90\x88\xe3\x82\x89"\nstrFinal3 = "C1_\xe3\x81\xa0\xe3\x81\xa8\xe6\x80\x9d\nRun Code Online (Sandbox Code Playgroud)\n所以本质上我只想删除两个日语字符之间的下划线。\n我如何在 python 中做到这一点?
\n我想在python中创建一个包含所有ord()中文字符的集合:
对于英语,相当于:
english = set(range(ord('a'),ord('z') + 1 ) +
range(ord('A'),ord('Z') + 1 ))
Run Code Online (Sandbox Code Playgroud)