如何使用 PHP Simple HTML DOM Parser 在 javascript 标签中获取文本

Chi*_*rck 1 php simple-html-dom web-scraping

例子 :

<script>
var TEST = { "contextData" :
{id:01,title:one},{id:02,title:two},{id:03,title:three}}
</script>
Run Code Online (Sandbox Code Playgroud)

如何获得所有标题?使用 PHP Simple HTML DOM Parser,我只是不知道这样做。

Eni*_*say 6

以下内容未经测试,但应该可以工作:

  • 使用脚本获取 $script = $html->find('script', 0);
  • 按照preg_match_all@pguardiario 的建议,使用以下模式来获取 titles 值:/title\s*:\s*([^}]+)/

DEMO

编辑:

并获得所有标题和描述(与 qwerty 不同)将模式修改为: /(title|desc)\s*:\s*(?!qwerty)([^},]+)/

DEMO