小编ric*_*hie的帖子

如何获取正则表达式将非ASCII字符识别为字母？

我正在从瑞典语的网页中提取信息.此页面使用的字符如下:öäå.

我的问题是,当我打印信息时,öäå已经消失了.

我正在使用Beautiful Soup提取信息.我认为问题在于我在提取的字符串上做了一堆正则表达式,例如location = re.sub(r'([^\w])+', '', location)删除除字母之外的所有内容.在此之前,我猜美丽的汤编码了字符串,以便öäå变成/ x02 /,十六进制值.

所以,如果我是正确的,那么正则表达式正在移除öäå,对,我的意思是在正则表达式之后,唯一应该留下的十六进制字符是x,但是在我的页面上没有x而不是öäå,所以这小理论可能不正确？无论如何,如果是对或错,你如何解决这个问题？当我稍后将提取的信息打印到我的网页时,我在谷歌应用引擎中使用self.response.out.write()(不知道是否有帮助解决问题)

编辑:瑞典网站上的编码是utf-8,我的网站上的编码也是utf-8.EDIT2:您可以使用ISO-8859-10 for Swedish,但根据谷歌浏览器,此特定网站上的编码为Unicode(utf-8)

python regex ascii utf-8 character-encoding

ric*_*hie

2012 04-16

4
推荐指数

1
解决办法

5153
查看次数

两个数组迭代之间的区别

我只是想知道这些数组迭代之间的区别,以及为什么第二个似乎真的很少使用,它有什么问题呢？

var items = [ /*...*/ ]
for (var i = 0; i < items.length; i++) {
    var item = items[i];
    // Do some stuff with the item
}

Run Code Online (Sandbox Code Playgroud)

第二种方式:

var items = [ /*...*/ ]
for (var i, item; item = items[i]; i++) {
    // Do some stuff with the item
}

Run Code Online (Sandbox Code Playgroud)

javascript for-loop

ric*_*hie

2012 10-19

4
推荐指数

1
解决办法

89
查看次数

如何删除vim中2 char或更长的所有空格？

我想删除vim中打开的文件中的每个双空格,这是怎么做的？

例如,在这里删除空格

a  a

Run Code Online (Sandbox Code Playgroud)

但要保持这里的空间

a a

Run Code Online (Sandbox Code Playgroud)

vim

ric*_*hie

2012 03-26

2
推荐指数

1
解决办法

121
查看次数

标签统计

ascii ×1

character-encoding ×1

for-loop ×1

javascript ×1

python ×1

regex ×1

utf-8 ×1

vim ×1

如何获取正则表达式将非ASCII字符识别为字母？

两个数组迭代之间的区别

如何删除vim中2 char或更长的所有空格？

标签 统计

小编ric_hie的帖子

标签统计