小编Far*_*rth的帖子

使用 playwright-python 下载 pdf 文件

我正在尝试使用 (Python) 下载在浏览器中呈现的 PDF 文件（未显示为弹出窗口或下载）playwright。没有公开 URL，因此您不能简单地抓取链接并使用requests.get("file_url").

我试过了：

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        page = await browser.newPage(acceptDownloads=True)
    
        await page.goto("www.some_landing_page.com")
            
        async with page.expect_download() as download_info:
            await page.click("a")     # selector to a pdf file
        
        download = download_info.value
        path = download.path()

Run Code Online (Sandbox Code Playgroud)

我也尝试过page.expect_popup()，但没有运气。我的理解是，这不能使用来完成pyppeteer，但如果可能的话，也欢迎这种方式的解决方案。

python-3.x pyppeteer playwright playwright-python

Far*_*rth

2021 05-13

6
推荐指数

1
解决办法

3642
查看次数

Python3 线程组合 .start() 不会创建 join 属性

这工作正常：

def myfunc():
    print('inside myfunc')

t = threading.Thread(target=myfunc)
t.start()
t.join()
print('done')

Run Code Online (Sandbox Code Playgroud)

然而，这显然是正确创建和执行线程的：

def myfunc():
    print('inside myfunc')

t = threading.Thread(target=myfunc).start()
t.join()
print('done')

Run Code Online (Sandbox Code Playgroud)

当它命中 join() 时生成以下致命错误：

AttributeError: 'NoneType' 对象没有属性 'join'

我会认为这些陈述是等效的。有什么不同吗？

python python-multithreading python-3.x

Far*_*rth

lucky-day

2
推荐指数

1
解决办法

1953
查看次数

标签统计

python-3.x ×2

playwright ×1

playwright-python ×1

pyppeteer ×1

python ×1

python-multithreading ×1

使用 playwright-python 下载 pdf 文件

Python3 线程组合 .start() 不会创建 join 属性

标签 统计

小编Far_rth的帖子

标签统计