Dav*_*rit 3 python authentication python-requests
这是一个网站http://pro.wialon.com/我想使用 python requests 模块登录。登录和通过是演示。
import requests
with requests.Session()as c:
url = 'http://pro.wialon.com/'
payload = dict(user='demo',
passw='demo',
login_action='login')
r = c.post(url, data=payload, allow_redirects=True)
print(r.text)
Run Code Online (Sandbox Code Playgroud)
坦率地说,我想获得报告(在报告选项卡上)作为响应。但我不知道如何登录。
发布网址不正确,并且您缺少表单数据,您还需要执行初始请求,发布到正确的网址,然后获取 http://pro.wialon.com/service.html:
data = {"user": "demo",
"passw": "demo",
"submit": "Enter",
"lang": "en",
"action": "login"}
head = {"User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"}
with requests.Session() as c:
c.get('http://pro.wialon.com/')
url = 'http://pro.wialon.com/login_action.html'
c.post(url, data=data, headers=head)
print(c.get("http://pro.wialon.com/service.html").content)
Run Code Online (Sandbox Code Playgroud)
您可以在 chrome 开发工具的网络选项卡下看到该帖子:
此外,post 或 get 请求的默认设置是允许重定向,因此您无需在此处指定它。
您可以在登录页面源代码中看到表单操作:
<form class="login_bg_form" id="login_form" action="login_action.html" method="POST">
Run Code Online (Sandbox Code Playgroud)
我们可以使用bs4从表单中解析路径,而不是对路径进行硬编码:
import requests
from bs4 import BeautifulSoup
from urlparse import urljoin
data = {"user": "demo",
"passw": "demo",
"submit": "Enter",
"lang": "en",
"action": "login"}
head = {"User-Agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"}
with requests.Session()as c:
soup = BeautifulSoup(c.get('http://pro.wialon.com/').content)
redir = soup.select_one("#login_form")["action"]
url = 'http://pro.wialon.com/login_action.html'
c.post(url, data=data, headers=head)
print(c.get(urljoin("http://pro.wialon.com/", redir)).content)
Run Code Online (Sandbox Code Playgroud)
现在唯一的问题是数据大部分是使用 ajax 请求填充的,因此如果您想抓取数据,则需要模仿请求。
| 归档时间: |
|
| 查看次数: |
12591 次 |
| 最近记录: |