使用撇号的Python XPath解析标记

Sta*_*nov 7 python xpath parsing apostrophe

我是XPath的新手.我正在尝试使用XPath解析页面.我需要从标签中获取信息,但是标题中的撇号撇开了一切.

对于解析我使用Grab.

来自源代码:

<img src='somelink' border='0' alt='commission:Alfred\'s misadventures' title='commission:Alfred\'s misadventures'>
Run Code Online (Sandbox Code Playgroud)

实际XPath:

g.xpath('.//tr/td/a[3]/img').get('title')
Run Code Online (Sandbox Code Playgroud)

返回

commission:Alfred\\
Run Code Online (Sandbox Code Playgroud)

有没有什么办法解决这一问题?

谢谢

Way*_*ett 5

垃圾进垃圾出.您的输入格式不正确,因为它不正确地逃脱了单引号字符.许多编程语言(包括Python)使用反斜杠字符来转义字符串文字中的引号.XML没有.你应该1)用双引号包围属性的值; 或2)用于&apos;包含单引号.

XML规范:

要允许属性值包含单引号和双引号,撇号或单引号字符(')可以表示为" &apos;",双引号字符(")表示为" &quot;".