相关疑难解决方法(0)

删除Python unicode字符串中重音的最佳方法是什么?

我在Python中有一个Unicode字符串,我想删除所有的重音符号(变音符号).

我在Web上发现了一种在Java中执行此操作的优雅方法:

  1. 将Unicode字符串转换为长标准化形式(字母和变音符号使用单独的字符)
  2. 删除Unicode类型为"变音符号"的所有字符.

我是否需要安装pyICU等库?或者只使用python标准库?那python 3怎么样?

重要说明:我想避免代码使用重音字符到非重音符号的显式映射.

python unicode diacritics python-2.x python-3.x

462
推荐指数
12
解决办法
23万
查看次数

Python:如何检查字符串是否是有效的IRI?

是否有标准功能来检查IRI,检查URL显然我可以使用:

parts = urlparse.urlsplit(url)  
    if not parts.scheme or not parts.netloc:  
        '''apparently not an url'''
Run Code Online (Sandbox Code Playgroud)

我使用包含Unicode字符的URL尝试了上述内容:

import urlparse
url = "http://fdasdf.fdsfî??îs.fss/?î?î"
parts = urlparse.urlsplit(url)
if not parts.scheme or not parts.netloc:  
    print "not an url"
else:
    print "yes an url"
Run Code Online (Sandbox Code Playgroud)

而我得到的是yes an url.这是否意味着我对这个有效IRI的测试很好?还有另外一种方法吗?

python url urlparse python-2.7

14
推荐指数
1
解决办法
9154
查看次数