小编seb*_*ebk的帖子

Selenium (Chrome) 打开空白页面并返回 <html><head></head><body></body></html>

如果我使用 Selenium 打开网站(无头或无头),则会打开一个空白页面,输出为:

<html><head></head><body></body></html>
Run Code Online (Sandbox Code Playgroud)

如果我在浏览器中手动打开页面,网站加载正常。我用 time.sleep(10) 尝试过,删除了随机数,然后使用了不同的参数,例如:

options.add_argument('--remote-debugging-port=9222')
options.add_argument("--no-sandbox")
...
Run Code Online (Sandbox Code Playgroud)

即使重新安装 chromedriver 也没有帮助。

到目前为止还没有成功。

这是我的代码:

url = "https://www.arket.com/de_de/men/knitwear/product.alpaca-blend-jumper-grey.0937502001.html"
options = Options()
ua = UserAgent()
userAgent = ua.random
options.add_argument(f'user-agent={userAgent}')
#options.add_argument("headless")
driver = webdriver.Chrome('/path/to/chromedriver', options=options)
time.sleep(5)
driver.get(url)
time.sleep(5)

soup = BeautifulSoup(driver.page_source, 'html.parser')
time.sleep(0.5)
driver.quit()

soup
Run Code Online (Sandbox Code Playgroud)

有谁知道如何解决这个问题?

值得注意的是,页面有时会使用 selenium 正确加载,但通常不会。

昨天代码的输出有所不同:

<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body></body></html>
Run Code Online (Sandbox Code Playgroud)

html selenium w3c web selenium-webdriver

5
推荐指数
1
解决办法
1973
查看次数

如何在熊猫中放置2个不同的数据框

我想合并2个具有不同顺序的文件:

我想在file1和file2下面合并:

文件1:

col1   col2   col3
A001   B001   C001
A002   B002   C002
A003   B003   C003
A004   B004   C004
A005   B005   C005
A006   B006   C006
Run Code Online (Sandbox Code Playgroud)

文件2:

col1   col2
A001   8
A002   2
A003   4
A004   1
A005   8
A006   3
B001   7
B002   4
B003   10
B004   11
B005   8
B006   3
C001   2
C002   9
C003   8
C004   1
C005   7
C006   6
Run Code Online (Sandbox Code Playgroud)

得到以下内容:

col1   col2   col3  col4  col5  col6
A001   8      B001  7     C001  2
A002   2      B002  4 …
Run Code Online (Sandbox Code Playgroud)

python merge join dataframe pandas

3
推荐指数
1
解决办法
41
查看次数

标签 统计

dataframe ×1

html ×1

join ×1

merge ×1

pandas ×1

python ×1

selenium ×1

selenium-webdriver ×1

w3c ×1

web ×1