如何将 Firefox cookie 导入 python 请求

Ond*_*rej 7 cookies firefox session-cookies python-3.x python-requests

我登录了Firefox 的某个页面,我想获取cookie并尝试使用python-requests浏览网页。问题是在将 cookie 导入到请求会话后什么也没有发生(就像根本没有 cookie)。请求生成的 cookie 的结构也与 Firefox 不同。是否可以加载 FF cookie 并在请求会话中使用它?

到目前为止我的代码:

import sys
import sqlite3
import http.cookiejar as cookielib
import requests
from requests.utils import dict_from_cookiejar

def get_cookies(final_cookie, firefox_cookies):
    con = sqlite3.connect(firefox_cookies)
    cur = con.cursor()
    cur.execute("SELECT host, path, isSecure, expiry, name, value FROM moz_cookies")
    for item in cur.fetchall():
        if item[0].find("mydomain.com") == -1:
            continue
        c = cookielib.Cookie(0, item[4], item[5],
            None, False,
            item[0], item[0].startswith('.'), item[0].startswith('.'),
            item[1], False,
            item[2],
            item[3], item[3]=="",
            None, None, {})
        final_cookie.set_cookie(c)



cookie = cookielib.CookieJar()
input_file = ~/.mozilla/firefox/myprofile.default/cookies.sqlite
get_cookies(cookie, input_file)

#print cookie given from firefox
cookies = dict_from_cookiejar(cookie)
for key, value in cookies.items():
    print(key, value)


s = requests.Session()
payload = {
"lang" : "en",
'destination': '/auth',
'credential_0': sys.argv[1],
'credential_1': sys.argv[2],
'credential_2': '86400',
}
r = s.get("mydomain.com/login", data = payload)
#print cookie from requests
cookies = dict_from_cookiejar(s.cookies)
for key, value in cookies.items():
    print(key, value)
Run Code Online (Sandbox Code Playgroud)

firefox cookie 的结构是:

_gid GA1.3.2145214.241324
_ga GA1.3.125598754.422212
_gat_is4u 1
Run Code Online (Sandbox Code Playgroud)

来自请求的 cookie 结构是:

UISTestAuth tesskMpA8JJ23V43a%2FoFtdesrtsszpw
Run Code Online (Sandbox Code Playgroud)

毕竟,当尝试将 FF 中的 cookie 分配给 session.cookies 时,请求有效,因为我什么都不导入。

Ond*_*rej 8

看起来 Firefox 中有两种类型的 cookie - requestresponse。在页面检查器 > 网络 > 登录(发布)> Cookies 时可以看到:

Response cookies:   
    UISAuth 
        httpOnly   true
        path       /
        secure     true
        value      tesskMpA8JJ23V43a%2FoFtdesrtsszpw
Request cookies:    
    _ga            GA1.3.125598754.422212
    _gat_is4u      1
    _gid           GA1.3.2145214.241324
Run Code Online (Sandbox Code Playgroud)

请求的cookie存储在cookies.sqlite在文件

~/.mozilla/firefox/*.default/cookies.sqlite
Run Code Online (Sandbox Code Playgroud)

并且可以通过更多方式加载到python对象,例如:

import sqlite3
import http.cookiejar

def get_cookies(cj, ff_cookies):
    con = sqlite3.connect(ff_cookies)
    cur = con.cursor()
    cur.execute("SELECT host, path, isSecure, expiry, name, value FROM moz_cookies")
    for item in cur.fetchall():
        c = cookielib.Cookie(0, item[4], item[5],
            None, False,
            item[0], item[0].startswith('.'), item[0].startswith('.'),
            item[1], False,
            item[2],
            item[3], item[3]=="",
            None, None, {})
        print c
        cj.set_cookie(c)
Run Code Online (Sandbox Code Playgroud)

其中 cj 是 CookieJar 对象, ff_cookies 是 Firefox cookies.sqlite 的路径。取自本页

使用 session 加载 cookie 并导入到 python 请求的整个代码如下所示:

 import requests
 import sys

 cj = http.cookiejar.CookieJar()
 ff_cookies = sys.argv[1] #pass path to the cookies.sqlite as an argument to the script
 get_cookies(cj, ff_cookies)
 s = requests.Session()
 s.cookies = cj
Run Code Online (Sandbox Code Playgroud)

响应cookie 基本上是会话 ID,它通常在会话结束(或某些超时)时过期,因此不会存储它们。


saa*_*aaj 5

PyPi 上有一个包browser-cookie3,它就是这样做的。

import browser_cookie3
import requests

cookiejar = browser_cookie3.firefox(domain_name='signed-in-website.tld')
resp = requests.get('https://signed-in-website.tld/path/', cookies=cookiejar)
print(resp.content)
Run Code Online (Sandbox Code Playgroud)

browser_cookie3.firefox() 将 Firefox cookie 作为 cookiejar 检索,域名作为可选参数。