相关疑难解决方法(0)

什么是匹配URL的好正则表达式?

目前我有一个输入框,可以检测URL并解析数据.

所以现在,我正在使用:

var urlR = /^(?:([A-Za-z]+):)?(\/{0,3})([0-9.\-A-Za-z]+)
           (?::(\d+))?(?:\/([^?#]*))?(?:\?([^#]*))?(?:#(.*))?$/;
var url= content.match(urlR);
Run Code Online (Sandbox Code Playgroud)

问题是,当我输入一个URL时www.google.com,它不起作用.当我进入时http://www.google.com,它正在工作.

我的正则表达式不是很流利.谁能帮我?

javascript regex

323
推荐指数
5
解决办法
55万
查看次数

如何使用puppeteer js抓取多级链接?

我正在使用Puppeteer抓取网站页面的表行。我有代码来抓取内容并将它们分配给表中的每个对象。在每个表行中,我都需要在新页面中打开一个链接(伪造者),然后为特定元素抓取,然后将其分配给同一对象,并使用新的键将整个对象返回伪造者。用木偶戏怎么可能?

async function run() {
    const browser = await puppeteer.launch({
        headless: false
    })
    const page = await browser.newPage()

    await page.goto('https://tokenmarket.net/blockchain/', {waitUntil: 'networkidle0'})
    await page.waitFor(5000)
    var onlink = ''
    var result = await page.$$eval('table > tbody tr .col-actions a:first-child', (els) => Array.from(els).map(function(el) {

        //running ajax requests to load the inner page links.
     $.get(el.children[0].href, function(response) {
            onlink = $(response).find('#page-wrapper > main > div.container > div > table > tbody > tr > td:nth-child(2)').text()
        })



        return {
            icoImgUrl: el.children[0].children[0].children[0].currentSrc,
            icoDate: el.children[2].innerText.split('\n').shift() === 'To …
Run Code Online (Sandbox Code Playgroud)

node.js web-scraping puppeteer

2
推荐指数
1
解决办法
3182
查看次数

标签 统计

javascript ×1

node.js ×1

puppeteer ×1

regex ×1

web-scraping ×1