小编Ste*_*ock的帖子

(PHP5)使用PHP DOM或Regex从HTML中提取标题标记和RSS源地址

我想从给定的URL获取标题标记和RSS提要地址(如果有的话),但到目前为止我使用的方法根本不起作用.我已经设法通过使用preg_match和正则表达式来获取标题标签,但我似乎无法获得RSS源地址.

($ webContent保存网站的HTML)

我已将我的代码复制到下面以供参考......

`//获取标题标签preg_match('@(.*)@ i',$ webContent,$ titleTagArray);

// If the title tag has been found, assign it to a variable
if($titleTagArray && $titleTagArray[3])
 $webTitle = $titleTagArray[3];

// Get the RSS or Atom feed address
preg_match('@<link(.*)rel="alternate"(.*)href="(.*)"(.*)type="application/rss+xml"\s/>@i',$webContent,$feedAddrArray);

// If the feed address has been found, assign it to a variable
if($feedAddrArray && $feedAddrArray[2])
 $webFeedAddr = $feedAddrArray[2];`
Run Code Online (Sandbox Code Playgroud)

我一直在读这里使用正则表达式不是最好的方法吗?希望有人可以帮我一把:-)

谢谢.

php regex rss dom

4
推荐指数
1
解决办法
1452
查看次数

标签 统计

dom ×1

php ×1

regex ×1

rss ×1