相关疑难解决方法(0)

如何使用PHP从html中提取img src,title和alt?

我想创建一个页面,其中所有驻留在我网站上的图像都列有标题和替代表示.

我已经给我写了一个程序来查找和加载所有HTML文件,但现在我被困在如何提取src,titlealt从这个HTML:

<img src="/image/fluffybunny.jpg" title="Harvey the bunny" alt="a cute little fluffy bunny" />
Run Code Online (Sandbox Code Playgroud)

我想这应该用一些正则表达式完成,但由于标签的顺序可能会有所不同,而且我需要所有这些,我真的不知道如何以优雅的方式解析它(我可以通过char方式,但这很痛苦).

html php regex html-parsing html-content-extraction

143
推荐指数
7
解决办法
31万
查看次数

用php获取字符串中的第一个图像

我正在尝试从每个帖子中获取第一张图片.如果我只有一个图像,下面这段代码很有用.但如果我有一个以上它给了我一个图像,但并不总是第一个.

我真的只想要第一张图片.很多时候第二个图像是下一个按钮

$texthtml = 'Who is Sara Bareilles on Sing Off<br>
<img alt="Sara" title="Sara" src="475993565.jpg"/><br>
<img alt="Sara" title="Sara two" src="475993434343434.jpg"/><br>';

preg_match_all('/<img.+src=[\'"]([^\'"]+)[\'"].*>/i', $texthtml, $matches);
$first_img = $matches [1] [0];
Run Code Online (Sandbox Code Playgroud)

现在我可以把这个"$ first_img"放在简短描述的前面

<img alt="Sara" title="Sara" src="<?php echo $first_img;?>"/>
Run Code Online (Sandbox Code Playgroud)

php image preg-match-all

26
推荐指数
3
解决办法
3万
查看次数

如何解析图像标记的HTML字符串以获取SRC信息?

目前我使用.Net WebBrowser.Document.Images()来做到这一点.它需要Webrowser加载文档.它很乱,占用资源.

根据这个问题, XPath优于正则表达式.

任何人都知道如何在C#中做到这一点?

.net html c# regex xpath

25
推荐指数
2
解决办法
4万
查看次数

从文本中提取图像src?

我有一个变量$ content,包含这种形式的一些文本和图像(未知数量的图像):

    text text text text <img src="path/to/image/1">text text text text
    <img src="path/to/image/2">
text text text text text text text text text text text text text text text text <img src="path/to/image/3"><img src="path/to/image/4">text text text text 
<img src="path/to/image/5">
Run Code Online (Sandbox Code Playgroud)

我想提取所有图像src并使用php将它们存储在数组中,如下所示:

array(
[1]="path/to/image/1"
[2]="path/to/image/2"
[3]="path/to/image/3"
[4]="path/to/image/4"
[5]="path/to/image/5"
.
.
.
)
Run Code Online (Sandbox Code Playgroud)

做这样的事情的最佳方法是什么.我已经尝试过爆炸功能,但这种方式似乎效率低下.

php

2
推荐指数
1
解决办法
4029
查看次数