小编hil*_*ssu的帖子

Python:从非BMP unicode char中查找等效的代理项对

这里给出了答案:如何在Python中使用代理对?告诉你如何转换代理对,例如'\ud83d\ude4f'转换为单个非BMP unicode字符(答案是"\ud83d\ude4f".encode('utf-16', 'surrogatepass').decode('utf-16')).我想知道如何反过来这样做.我如何使用Python从非BMP字符中找到等效的代理对,将'\U0001f64f'()转换回'\ud83d\ude4f'.我找不到明确的答案.

python unicode encoding surrogate-pairs emoji

8
推荐指数
1
解决办法
1920
查看次数

R:从字符串中修剪除空格以外的其他字符

在R中,如果要从字符串末尾修剪所有空白字符,则可以进行修剪(to.be.trimmed,“ right”),如下所示:

> trimws("nauris        ", "right")
[1] "nauris"
Run Code Online (Sandbox Code Playgroud)

如果我不想修剪空格字符,而是要修剪句点(或其他字符)怎么办?在Python中,您可以这样做string.rstrip(char)。这是一些所需的输出:

> rstrip("nauris", "s")
[1] "nauri"
> rstrip("nauris.", ".")
[1] "nauris"
> rstrip("nauris....", ".")
[1] "nauris"
> rstrip("stack", "c")
[1] "stack"
Run Code Online (Sandbox Code Playgroud)

将上述句点作为最后一个参数不起作用,因为它仅返回一个空字符串:

trimws("nauris.", "right", ".")
[1] ""
Run Code Online (Sandbox Code Playgroud)

r

1
推荐指数
1
解决办法
83
查看次数

标签 统计

emoji ×1

encoding ×1

python ×1

r ×1

surrogate-pairs ×1

unicode ×1