嘿,我想用YQL从我的博客中搜集一些数据:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']"
Run Code Online (Sandbox Code Playgroud)
如何在查询中使用不同的xpath位?我可以这样做:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']" AND xpath ="//div[@class='title']"
Run Code Online (Sandbox Code Playgroud)
假设我想获得帖子和标题?我想我可以接受所有的HTML,但我宁愿只接受我需要的东西,因为速度是一个问题.
一旦我有了HTML,我想从标记中提取文本,是否可以使用PHP正则表达式?
我也理解你可以使用CSS语法,如果你有使用YQL的经验并且可以指导我如何编写类似的查询到上面的那个但是在CSS而不是XPATH我会很感激!
谢谢.