python mechanize.browser submit()相关问题

pau*_*aul 6 python mechanize

我用mechanize.browser模块制作一些脚本.

其中一个问题是所有其他的东西都可以,但是当提交()表单时,它不起作用,

所以我发现了一些怀疑来源部分.

在html源代码中我被发现如下.

<form method="post" onsubmit="return loginCheck(this)" name="FRMLOGIN"/>
Run Code Online (Sandbox Code Playgroud)

即时通讯思考,loginCheck(this)提交表单时出现问题.

但是如何用机械化模块处理这种javascript函数,所以我可以

成功提交表格并可以收到结果?

folloing是我目前的脚本来源.

如果有人可以帮助我..很欣赏!!

# -*- coding: cp949-*-
import sys,os
import mechanize, urllib
import cookielib
from BeautifulSoup import BeautifulSoup,BeautifulStoneSoup,Tag
import datetime, time, socket
import re,sys,os,mechanize,urllib,time


br = mechanize.Browser()
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)

# Browser options
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)

# Follows refresh 0 but not hangs on refresh > 0
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)

# Want debugging messages?
br.set_debug_http(True)
br.set_debug_redirects(True)
br.set_debug_responses(True)

# User-Agent (this is cheating, ok?)
br.addheaders = [('User-agent', 'Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.0.6')]
br.open('http://user.buddybuddy.co.kr/Login/LoginForm.asp?URL=')
html = br.response().read()
print html

br.select_form(name='FRMLOGIN')
print br.viewing_html()
br.form['ID']='zero1zero2'
br.form['PWD']='012045'
br.submit()

print br.response().read()
Run Code Online (Sandbox Code Playgroud)

ale*_*lex 1

您需要使用未维护的模块DOMForm和 Spidermonkey ( http://pypi.python.org/pypi/python-spidermonkey ) 来处理 javascript。或者你弄清楚loginCheck()正在做什么,并在Python中提交表单之前执行它的工作。如果 loginCheck() 只是检查登录数据的明显有效性,那应该很容易。请注意,指定表单标签的操作参数丢失。它可能在 javascript 部分给出。

根据您的意图,仅使用 urllib2 可能会更容易。您可能会假设该网页的静态外观,并仅使用 urllib2 的方法发布数据并使用它获取结果。