来自Perl的土地,我可以做类似以下的事情来测试特定unicode块中字符串的成员资格:
# test if string has any katakana script characters
my $japanese = "????";
if ($japanese =~ /\p{InKatakana}/) {
print "string has katakana"
}
Run Code Online (Sandbox Code Playgroud)
我已经读过Python不支持unicode块(是吗?) - 那么手动实现这一点的最佳方法是什么?例如,{InKatakana}的上述unicode块范围应为U + 30A0 ... U + 30FF.如何在Python中测试unicode范围?其他推荐的解决方案?
我宁愿不使用像Ponyguruma这样的外部包装来限制推出/维护的依赖数量.
python中是否有一种方法可以获取给定字符的技术信息,例如在Unicode表中显示的那样?(请参阅https://unicode-table.com/en/)
示例:对于字母“?”
我真正需要的是获取任何Unicode数字(例如U + 0204)对应的名称(带Double Grave的拉丁大写字母E)和小写版本(此处为“?”)。
大致来说:
输入= Unicode数字
输出=对应信息
我能够找到的最接近的东西是fontTools库,但是我似乎找不到任何有关如何使用它的教程/文档。
谢谢。