- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在用 python 编写一个网络爬虫程序,但无法使用 mechanize 登录。网站上的表格如下所示:
<form method="post" action="PATLogon">
<h2 align="center"><img src="/myaladin/images/aladin_logo_rd.gif"></h2>
<!-- ALADIN Request parameters -->
<input type=hidden name=req value="db">
<input type=hidden name=key value="PROXYAUTH">
<input type=hidden name=url value="http://eebo.chadwyck.com/search">
<input type=hidden name=lib value="8">
<table>
<tr><td><b>Last Name:</b></td>
<td><input name=LN size=20 maxlength=26></td>
<tr><td><b>University ID or Library Barcode:</b></td>
<td><input type=password name=BC size=20 maxlength=21></td>
<tr><td><b>Institution:</b></td>
<td><select name="INST">
<option value="??">Select University ----</option>
<option value="AU">American</option>
<option value="CU">Catholic</option>
<option value="DC">District of Columbia</option>
<option value="GA">Gallaudet</option>
<option value="GM">George Mason</option>
<option value="GW">George Washington</option>
<option value="GT">Georgetown</option>
<option value="MU">Marymount</option>
<option value="TR">Trinity</option>
</select>
<input type="submit" value="GO">
</td></tr></table></form>
因此,我可以适本地设置所有内容,但在提交表单并尝试打印响应时出现错误。我的代码如下:
import mechanize
import time
br = mechanize.Browser()
br.set_handle_robots(False)
def connect():
# connection information
url = "https://www.aladin.wrlc.org/Z-WEB/Aladin?req=db&key=PROXYAUTH&lib=8&\url=http://eebo.chadwyck.com/search"
br.open(url)
time.sleep(0.5)
br.select_form(nr=0)
br["LN"] = "Reese"
br["BC"] = "myPassword"
br["INST"] = ["AU"]
response = br.submit()
print response.getheaders()
我在这里得到的错误是:
>>> eebolib.connect()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "eebolib.py", line 28, in connect
print response.read()
File "build/bdist.macosx-10.5-fat3/egg/mechanize/_response.py", line 190, in read
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/socket.py", line 349, in read
data = self._sock.recv(rbufsize)
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/httplib.py", line 553, in read
if self.length is not None:
File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/httplib.py", line 1282, in read
if amt is None or amt > self._line_left:
AssertionError
如果有人可以提供一些帮助,我将不胜感激。
最佳答案
这是我找到的解决方案:
import mechanize,urllib,ClientForm,cookielib,re,os,time
from BeautifulSoup import BeautifulSoup
cookies = mechanize.CookieJar()
opener = mechanize.build_opener(mechanize.HTTPCookieProcessor(cookies))
headers = [("Accept","text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"),\
("Accept-Charset","ISO-8859-1,utf-8;q=0.7,*;q=0.7"),\
("Accept-Encoding","gzip, deflate"),\
("Accept-Language","en-us,en;q=0.5"),\
("Connection","keep-alive"),\
("Host","www.aladin.wrlc.org"),\
("Referer","https://www.aladin.wrlc.org/Z-WEB/Aladin?req=db&key=PROXYAUTHlib=8url=http://eebo.chadwyck.com/search"),\
("User-Agent","Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:5.0) Gecko/20100101 Firefox/5.0")]
opener.addheaders = headers
mechanize.install_opener(opener)
params = urllib.urlencode({'LN':'myLN','BC':'myBC','INST':'myINST',\
'req':'db','key':'PROXYAUTH','lib':'8',\
'url':'http://eebo.chadwyck.com/search'})
mechanize.urlopen("https://www.aladin.wrlc.org/Z-WEB/PATLogon",params)
希望有一天这可以帮助别人:)
关于python - 尝试 .read() 时,Mechanze 表单提交会导致响应 'Assertion Error',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6573526/
我在 mongodb 中的玩家和锦标赛之间存在多对多关系。 我希望能够一次将许多玩家添加到锦标赛中。如果没有 ajax,这很简单,但我们有一个包含数千名玩家的数据库,因此表单选择变得巨大。 我们想为此
这个问题已经有答案了: When should I use html's and when spring's in Spring MVC web app? (3 个回答) 已关闭 6 年前。 我正
我正在 C++ Builder XE4 上使用 VCL。 我有以下组件。 FormMain 具有 TButton *B_select; FormSelect(或DialogSelect)具有 TCom
如何在不影响表单控件的情况下更改表单的 alphablend? 德尔福XE7 最佳答案 此问题的一个解决方案是使用多设备应用程序(如果无法使用VCL)。 如果您需要保留透明的TForm,只需更改属性T
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我正在尝试扩展 Django 注册以包含我自己的注册表单。原则上这是相当简单的。我只需要编写自己的表单( CustomRegistrationForm ),它是原始表单( RegistrationFo
我正在尝试为我的网站实现聊天功能。为了做到这一点,我遵循了以下教程:https://channels.readthedocs.io/en/latest/tutorial/ 然后我稍微更改了代码以实现它
有一个问题,我需要用一个 html 表单提交两个相互关联的模型表单。我知道如何提交两个单独的表格,但是在相关模型表格的情况下外键让我发疯。 问题是,第二个表单应该用外键填充字段到第一个表单的实例。 在
我正在创建一个工具,允许某人输入食谱,然后将其保存为 XML 文件,我已经创建了 XSD,但我想知道如何在我的网页上制作一个表单以允许用户输入他们的食谱并遵守模式。我一直在研究 Ajax 和 Jque
在 .net win 表单(如 asp.net web 表单)中是否有可用的验证控件? 因为很难为我的每个控件设置正确的条件,所以我的表单中也有很多重复的代码。 正确的做法是什么? 最佳答案 看看这个
我有一个简短的问题。我正在学习如何使用 javascript 制作注册表,发现此链接非常有用。 http://www.w3resource.com/javascript/form/javascript
我正在开发一个项目,该项目将使用循环将许多表单添加到 mysql 数据库中。在 javascript 部分中,我无法让 var i 在函数 updatesum() 中工作。有人可以帮我吗? 我试图避免
在我的应用程序上有一个包含 2 个字段和一个保存按钮的表单。 在我的 onClick 结束时我需要什么来将光标返回到第一个字段。 我有这个来清除它们 txtData.setText("
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
<input type="text" name="textfield" onKeyPress="javascript:alert(event.
我正在构建的网站有一个登录表单,作为所有其他模板扩展的 base.html 模板的一部分;因此,我需要以某种方式处理每个页面上的登录/注销逻辑。 目前每个页面都在单独的 View 中加载,那么实现它的
我有一个表单类,看起来像.. #forms.py class ExampleForm(forms.Form): color = forms.CharField(max_length=25)
有没有办法在表单定义中给表单一个特殊的错误渲染函数?在 customizing-the-error-list-format 下的文档中它展示了如何为表单提供特殊的错误呈现函数,但似乎您必须在实例化表单
我正在处理由多个页面组成的表单,我想解决验证问题。 当我点击提交按钮时,当前页面上的所有字段都会在下方显示错误消息,但是如果我更改页面,那么我需要再次点击提交,因为这些字段未设置为已触摸。 如果我可以
是否可以附加到继承表单的 exclude 或 widgets 变量? 到目前为止,我有以下设置。 class AddPropertyForm(forms.ModelForm): num_mon
我是一名优秀的程序员,十分优秀!