小编CS_*_*oob的帖子

如何将unicode文本转换为普通文本

我正在学习Python中的美丽汤.

我试图解析一个包含书籍列表的简单网页.

例如

<a href="https://www.nostarch.com/carhacking">The Car Hacker’s Handbook</a>

Run Code Online (Sandbox Code Playgroud)

我使用下面的代码.

import requests, bs4
res = requests.get('http://nostarch.com')
res.raise_for_status()
nSoup = bs4.BeautifulSoup(res.text,"html.parser")
elems = nSoup.select('.product-body a')

#elems[0] gives
<a href="https://www.nostarch.com/carhacking">The Car Hacker\u2019s Handbook</a>

Run Code Online (Sandbox Code Playgroud)

和

#elems[0].getText() gives
u'The Car Hacker\u2019s Handbook'

Run Code Online (Sandbox Code Playgroud)

但我想要的是正确的文字,

s = elems[0].getText()
print s
>>>The Car Hacker’s Handbook

Run Code Online (Sandbox Code Playgroud)

如何修改我的代码以便给出"The Car Hacker's Handbook"输出而不是"u'The Car Hacker\u2019s Handbook"？

请帮助.

python unicode ascii beautifulsoup web-scraping

CS_*_*oob

2016 05-29

6
推荐指数

1
解决办法

1300
查看次数

标签统计

ascii ×1

beautifulsoup ×1

python ×1

unicode ×1

web-scraping ×1

如何将unicode文本转换为普通文本

标签 统计

小编CS__oob的帖子

标签统计