小编Far*_*rth的帖子

使用 playwright-python 下载 pdf 文件

我正在尝试使用 (Python) 下载在浏览器中呈现的 PDF 文件(未显示为弹出窗口或下载)playwright。没有公开 URL,因此您不能简单地抓取链接并使用requests.get("file_url").

我试过了:

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        page = await browser.newPage(acceptDownloads=True)
    
        await page.goto("www.some_landing_page.com")
            
        async with page.expect_download() as download_info:
            await page.click("a")     # selector to a pdf file
        
        download = download_info.value
        path = download.path()
Run Code Online (Sandbox Code Playgroud)

我也尝试过page.expect_popup(),但没有运气。我的理解是,这不能使用 来完成pyppeteer,但如果可能的话,也欢迎这种方式的解决方案。

python-3.x pyppeteer playwright playwright-python

6
推荐指数
1
解决办法
3642
查看次数

Python3 线程组合 .start() 不会创建 join 属性

这工作正常:

def myfunc():
    print('inside myfunc')

t = threading.Thread(target=myfunc)
t.start()
t.join()
print('done')
Run Code Online (Sandbox Code Playgroud)

然而,这显然是正确创建和执行线程的:

def myfunc():
    print('inside myfunc')

t = threading.Thread(target=myfunc).start()
t.join()
print('done')
Run Code Online (Sandbox Code Playgroud)

当它命中 join() 时生成以下致命错误:

AttributeError: 'NoneType' 对象没有属性 'join'

我会认为这些陈述是等效的。有什么不同吗?

python python-multithreading python-3.x

2
推荐指数
1
解决办法
1953
查看次数