Rav*_*aid 2 python web-scraping pyquery
我的问题是我必须抓取一个具有以下内容的网站:
<div class="xyz tab"> blah blah </div>
Run Code Online (Sandbox Code Playgroud)
同一网站中的另一个 div 如下:
<div class="xyz">blah blah</div>
Run Code Online (Sandbox Code Playgroud)
要抓取没有空间的网站,我可以使用这个
pyquery('.xyz').text()
Run Code Online (Sandbox Code Playgroud)
但是对于空间我该怎么办???
如果您需要检查xyz和tab类,您可以使用.xyz.tab:
>>> from pyquery import PyQuery as pq
>>> data = """
... <div>
... <div class="xyz tab">test1</div>
... <div class="xyz">test2</div>
... </div>
... """
>>> d = pq(data)
>>> print d('.xyz.tab')
<div class="xyz tab">test1</div>
Run Code Online (Sandbox Code Playgroud)