如果我使用 Selenium 打开网站(无头或无头),则会打开一个空白页面,输出为:
<html><head></head><body></body></html>
Run Code Online (Sandbox Code Playgroud)
如果我在浏览器中手动打开页面,网站加载正常。我用 time.sleep(10) 尝试过,删除了随机数,然后使用了不同的参数,例如:
options.add_argument('--remote-debugging-port=9222')
options.add_argument("--no-sandbox")
...
Run Code Online (Sandbox Code Playgroud)
即使重新安装 chromedriver 也没有帮助。
到目前为止还没有成功。
这是我的代码:
url = "https://www.arket.com/de_de/men/knitwear/product.alpaca-blend-jumper-grey.0937502001.html"
options = Options()
ua = UserAgent()
userAgent = ua.random
options.add_argument(f'user-agent={userAgent}')
#options.add_argument("headless")
driver = webdriver.Chrome('/path/to/chromedriver', options=options)
time.sleep(5)
driver.get(url)
time.sleep(5)
soup = BeautifulSoup(driver.page_source, 'html.parser')
time.sleep(0.5)
driver.quit()
soup
Run Code Online (Sandbox Code Playgroud)
有谁知道如何解决这个问题?
值得注意的是,页面有时会使用 selenium 正确加载,但通常不会。
昨天代码的输出有所不同:
<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body></body></html>
Run Code Online (Sandbox Code Playgroud) 我想合并2个具有不同顺序的文件:
我想在file1和file2下面合并:
文件1:
col1 col2 col3
A001 B001 C001
A002 B002 C002
A003 B003 C003
A004 B004 C004
A005 B005 C005
A006 B006 C006
Run Code Online (Sandbox Code Playgroud)
文件2:
col1 col2
A001 8
A002 2
A003 4
A004 1
A005 8
A006 3
B001 7
B002 4
B003 10
B004 11
B005 8
B006 3
C001 2
C002 9
C003 8
C004 1
C005 7
C006 6
Run Code Online (Sandbox Code Playgroud)
得到以下内容:
col1 col2 col3 col4 col5 col6
A001 8 B001 7 C001 2
A002 2 B002 4 …Run Code Online (Sandbox Code Playgroud)