- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试提交表单并检索一些数据使用 dryscrape 但当我执行程序时,出现错误:
Traceback (most recent call last):
File "easyjettest.py", line 22, in <module>
originairport_field.set(originairport)
AttributeError: 'NoneType' object has no attribute 'set'
我真的不知道问题出在哪里。我已阅读文档并在网上尽可能多地进行搜索。
代码如下:
import dryscrape
import sys
if 'linux' in sys.platform:
# start xvfb in case no X is running. Make sure xvfb
# is installed, otherwise this won't work!
dryscrape.start_xvfb()
originairport = 'Cyprus (Larnaca) LCA'
destinationairport = 'London Gatwick LGW'
odate = '16/08/2016'
adate = '18/08/2016'
adults = '1'
sess = dryscrape.Session(base_url = 'http://www.easyjet.com/en/')
sess.set_attribute('auto_load_images', False)
sess.visit('/')
originairport_field = sess.at_xpath('.//*[@id="acOriginAirport"]')
originairport_field.set(originairport)
destinationairport_field = sess.at_xpath('.//* [@id="acDestinationAirport"]')
destinationairport_field.set(destinationairport)
odate_field = sess.at_xpath('.//*[@id="oDate"]')
odate_field.set(odate)
rdate_field = session.at_xpath('.//*[@id="rDate"]')
rdate_field.set(rdate)
adults_field = session.at_xpath('.//*[@id="numberOfAdults"]')
adults_field.set(adults)
originairport_field.form().submit()
# extract all links
for link in session.xpath('//a[@href]'):
print link['href']
最佳答案
检查发生错误的行,可能是变量 originairport_field
、destinationairport_field
、odate_field
、rdate_field
,adults_field
未指定任何值。
顺便问一下,您设置 rdate_field
和 adults_field
值的行中的 session
来自哪里?这不是sess
编辑:
根据您更新的错误信息,可能 sess.at_xpath('.//*[@id="acOriginAirport"]')
不会返回任何内容。
关于python - Dryscrape 形式和抓取问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38979513/
我正在尝试提交表单并检索一些数据使用 dryscrape 但当我执行程序时,出现错误: Traceback (most recent call last): File "easyjettest.
我正在尝试在 Mac 上进行 dryscrape session 。我尝试运行的代码如下: import dryscrape session = dryscrape.Session(base_url
我正在尝试使用 pip 在我的 Windows 10 labtop 上安装 dryscrape,我有 python 3.5。 我从……开始 C:\Users\Nick L>pip install dr
我正在使用 dryscrape/webkit_server 来抓取启用 javascript 的网站。 进程 webkit_server 的内存使用似乎随着每次调用 session.visit() 而
我正在尝试使用 Drcscrape 登录 Facebook,但出现此错误。 我正在使用 OSX Traceback (most recent call last): File "/Users/no
我正在尝试从 Yahoo 抓取一些数据。我写了一个有效的脚本 - 有时。有时当我运行脚本时,我能够下载完整的页面 - 其他时候,页面只加载了部分 - 数据部分丢失。 更令人困惑的是,当我在浏览器中导航
我有很多活跃的公共(public)代理,我想用来抓取一些页面。 谁能给我一个示例,说明如何在 dryscrape 中设置代理? https://github.com/niklasb/dryscrape
我想从站点获取一些数据,这需要登录。 我通过请求登录 url = "http://example.com" response = requests.get(url, {"email":"a@gmail
我正在尝试从网页中使用 javascript 更新的表中获取数据 ( http://www.madrid.org/wpad_pub/run/j/MostrarFichaCentro.icm?cdCen
我正在尝试抓取 http://apps2.eere.energy.gov/wind/windexchange/economics_tools.asp 上的 table enter image desc
我正在 python3 中使用 dryscrape 编写一个scraper。我试图在 __scraping __session 期间访问数百个不同的 url,并在每个 url 上单击大约 10 个 a
我需要为 python 安装 dryscrape,但出现错误,这是什么问题? C:\Users\parvij\Anaconda3\Scripts>pip install dryscrape 我明白了:
我是一名优秀的程序员,十分优秀!