相关疑难解决方法(0)

如何在PHP中解析和处理HTML/XML？

如何解析HTML/XML并从中提取信息？

php xml parsing html-parsing xml-parsing

Rob*_*itt

2019 04-15

2071
推荐指数

28
解决办法

40万
查看次数

如何使用PHP从html中提取img src,title和alt？

我想创建一个页面,其中所有驻留在我网站上的图像都列有标题和替代表示.

我已经给我写了一个程序来查找和加载所有HTML文件,但现在我被困在如何提取src,title并alt从这个HTML:

<img src="/image/fluffybunny.jpg" title="Harvey the bunny" alt="a cute little fluffy bunny" />

Run Code Online (Sandbox Code Playgroud)

我想这应该用一些正则表达式完成,但由于标签的顺序可能会有所不同,而且我需要所有这些,我真的不知道如何以优雅的方式解析它(我可以通过char方式,但这很痛苦).

html php regex html-parsing html-content-extraction

Sam*_*Sam

2015 05-27

143
推荐指数

7
解决办法

31万
查看次数

用于提取标记属性的正则表达式

我正在尝试提取锚标记(<a>)的属性.到目前为止,我有这样的表达:

(?<name>\b\w+\b)\s*=\s*("(?<value>[^"]*)"|'(?<value>[^']*)'|(?<value>[^"'<> \s]+)\s*)+

Run Code Online (Sandbox Code Playgroud)

适用于字符串之类的

<a href="test.html" class="xyz">

Run Code Online (Sandbox Code Playgroud)

和(单引号)

<a href='test.html' class="xyz">

Run Code Online (Sandbox Code Playgroud)

但不是没有引号的字符串:

<a href=test.html class=xyz>

Run Code Online (Sandbox Code Playgroud)

如何修改我的正则表达式使其适用于没有引号的属性？或者有更好的方法吗？

谢谢!

更新: 感谢您提供的所有好评和建议.有一件事我没有提到:遗憾的是我必须修补/修改我自己编写的代码.没有时间/金钱可以自下而上重写这些东西.

html regex

spl*_*tne

2019 07-26

47
推荐指数

8
解决办法

9万
查看次数

PHP从<a>标签中提取链接

可能重复:
PHP String Manipulation:提取hrefs

我正在使用php并且具有content =的字符串

<a href="www.something.com">Click here</a>

我需要摆脱除"www.something.com"之外的一切我认为这可以用正则表达式来完成.任何帮助表示赞赏!谢谢

php string extract href hyperlink

5et*_*5et

2017 05-23

12
推荐指数

2
解决办法

5万
查看次数

在PHP中使用regex查找图像src

如何image src从仅包含img标签的文本中提取？顺便说一下,src有时双引号和单引号.

php regex

Are*_*geh

2015 08-15

1
推荐指数

1
解决办法

1560
查看次数

标签统计

php ×4

regex ×3

html ×2

html-parsing ×2

extract ×1

href ×1

html-content-extraction ×1

hyperlink ×1

parsing ×1

string ×1

xml ×1

xml-parsing ×1

如何在PHP中解析和处理HTML/XML？

如何使用PHP从html中提取img src,title和alt？

用于提取标记属性的正则表达式

PHP从<a>标签中提取链接

在PHP中使用regex查找图像src

标签 统计

标签统计