使用 Puppeteer 获取 HTML 属性的值

GTS*_*Joe 13 javascript node.js ecmascript-6 puppeteer

使用 Puppeteer,我选择了一些 HTML 元素:

await page.$$( 'span.styleNumber' );
Run Code Online (Sandbox Code Playgroud)

我可以使用以下方法获取元素的文本:

console.log( await ( await styleNumber.getProperty( 'innerText' ) ).jsonValue() );
Run Code Online (Sandbox Code Playgroud)

如何获取元素的 data-Color 属性的值?

这是我的脚本:

HTML

<span class="styleNumber" data-Color="Blue">SG1000</span>
<span class="styleNumber" data-Color="Green">SG2000</span>
<span class="styleNumber" data-Color="Red">SG3000</span>
Run Code Online (Sandbox Code Playgroud)

傀儡师

const puppeteer = require( 'puppeteer' );

( async() => {
    const browser = await puppeteer.launch();

    const page = await browser.newPage();

    await page.goto( 'http://www.example.com/sample.php' );

    // Get a list of all elements.
    var styleNumbers = await page.$$( 'span.styleNumber' );

    // Print the style numbers.
    for( let styleNumber of styleNumbers ) {
        try {
            console.log( await ( await styleNumber.getProperty( 'innerText' ) ).jsonValue() );
        }
        catch( e ) {
            console.log( `Could not get the style number:`, e.message );
        }
    }

    await browser.close();
} )();
Run Code Online (Sandbox Code Playgroud)

上面的代码将打印:

SG1000
SG2000
SG3000
Run Code Online (Sandbox Code Playgroud)

如何获取 data-Color 属性的值?例如:

console.log( await ( await styleNumber.getAttribute( 'data-Color' ) ) ); // Blue
Run Code Online (Sandbox Code Playgroud)

Abd*_*urt 32

您可以使用evaluate方法获取属性值。

await page.evaluate('document.querySelector("span.styleNumber").getAttribute("data-Color")')
Run Code Online (Sandbox Code Playgroud)

第二种方式

$$eval也可以使用方法。也称为来自变量的数组的属性

const attr = await page.$$eval("span.styleNumber", el => el.map(x => x.getAttribute("data-Color")));
Run Code Online (Sandbox Code Playgroud)

输出将是

["Blue", "Green", "Red"]
Run Code Online (Sandbox Code Playgroud)

您的解决方案

const styleNumbers = await page.$$("span.styleNumber");

for( let styleNumber of styleNumbers ) {
    const attr = await page.evaluate(el => el.getAttribute("data-Color"), styleNumber);
}
Run Code Online (Sandbox Code Playgroud)

  • 对于那些喜欢将 page.evaluate 的参数写为 JS 的人: `await page.evaluate(() =&gt; document.querySelector("span.styleNumber").getAttribute("data-Color") ) ` (8认同)