- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
以下是代码:
import cookielib
import urllib2
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:30.0) Gecko/20100101 Firefox/30.0'}
url='http://scholar.google.co.in/scholar_setprefs?sciifh=1&scisig=AAGBfm0AAAAAU9jcmEN2h2yuBuZqQK8Es5dQG3ksjutw&inststart=0&num=10&scis=yes&scisf=4&hl=en&lang=all&instq=&save='
filename = "cookies.txt"
request = urllib2.Request(url, None, headers)
cookies = cookielib.MozillaCookieJar(filename, None, None)
cookies.load()
cookie_handler= urllib2.HTTPCookieProcessor(cookies)
redirect_handler= urllib2.HTTPRedirectHandler()
opener = urllib2.build_opener(redirect_handler,cookie_handler)
response = opener.open(request)
print response.read()
输出错误:
C:\Python27\lib\_MozillaCookieJar.py:109: UserWarning: cookielib bug!
Traceback (most recent call last):
File "C:\Python27\lib\_MozillaCookieJar.py", line 71, in _really_load
line.split("\t")
ValueError: need more than 1 value to unpack
_warn_unhandled_exception()
Traceback (most recent call last):
File "C:\Users\new user\Desktop\pythonprac\working\googlescholar.py", line 10, in <module>
cookies.load()
File "C:\Python27\lib\cookielib.py", line 1763, in load
self._really_load(f, filename, ignore_discard, ignore_expires)
File "C:\Python27\lib\_MozillaCookieJar.py", line 111, in _really_load
(filename, line))
cookielib.LoadError: invalid Netscape format cookies file 'cookies.txt': '.scholar.google.com TRUE / FALSE 2147483647 GSP ID=353e8f974d766dcd:CF=2'
这段代码来自网络,我正在尝试将谷歌学者bibtex数据中的数据下载到txt文件中。为此,我需要将用户设置保存到 cookie 中。我正在将数据写入cookie.txt。但我收到上述错误。请指导如何处理此 cookie 错误以及如何使用 cookie 保存 google.scolar.com 的用户定义的首选项。
最佳答案
我可以建议使用另一组库吗?
from bs4 import BeautifulSoup
import requests
url= 'http://scholar.google.co.in/scholar_setprefs?sciifh=1&' +\
'scisig=AAGBfm0AAAAAU9jcmEN2h2yuBuZqQK8Es5dQG3ksjutw' +\
'&inststart=0&num=10&scis=yes&scisf=4&hl=en&lang=all&instq=&save='
page = requests.get(url)
cookies = page.cookies
page = requests.get(url, cookies=cookies)
print page.content
使用cookies = page.cookies
,我检索cookie并将其保存到cookies
变量中。我重新请求传递该变量的同一页面。如果您有 cookies.txt
文件,则可以将其作为字典加载
如果您想使用标准库 urllib2 和 cookielib 来执行此操作,请确保 cookies.txt 文件中的第一行是
# Netscape HTTP Cookie File
否则 cookielib 将不会加载它:https://stackoverflow.com/a/11536599/1688590
关于python - 使用 cookie 从 Google Scholar(bibtex) 导入数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25197771/
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
假设我有 10 篇文章的 bibtex 数据。有没有办法在 jabref 中从中创建 10 个条目? 解决方案是打开 .bib 文件并将数据粘贴到其中。 最佳答案 选择构成多个数据条目的 BibTex
假设我有 10 篇文章的 bibtex 数据。有没有办法在 jabref 中从中创建 10 个条目? 解决方案是打开 .bib 文件并将数据粘贴到其中。 最佳答案 选择构成多个数据条目的 BibTex
Jabref 支持以不同格式导出选定的条目,但我想知道它是否真的可以导出为 bibtex 格式。选择一些引用文献来创建一个较小的数据库很有用,例如,仅包含某些主题的引用文献或您在特定论文中引用的引用文
我编辑了一个 BibteX 文件,到目前为止,它显示了我需要的所有信息。 FUNCTION {electronic} { output.bibitem format.btitle "title"
(我不确定这个问题是否属于meta网站,但是我们开始吧) 我想在正在撰写的研究论文的书目中添加stackoverflow,并想知道是否有任何bibTeX代码可以这样做。我已经为gnuplot做过 我在
有没有办法从 Google Scholar 或其他地方批量下载 bibtex 数据? 我尝试了一些 GS Scraper,例如, https://github.com/gimoya/theBioBuc
我正在使用 multibib 在附录中创建文章列表。 %Preamble... %Create new macros for citation in "lit" group \newcites{lit
在我的论文中,我使用了以下 latex 模板。但即使在模板中,库也无法正常工作。 https://github.com/MichaelGrupp/TTT 使用 BibTeX 命令后出现以下消息: Pr
我想将引用书目中的一些字母显示为大写。例如: @misc{libsvm, abstract = {LIBSVM is an implbmentation of Support vector mach
好的,这不是一个正确的编程问题,但也许答案会对其他人有所帮助。我一直在尝试为 gnuplot 找到合适的 BibTeX 条目,以包含在科学出版物中。我只是不想引用任何指南,而是引用实际的软件。 有没有
在我的论文中,我使用了以下 latex 模板。但即使在模板中,库也无法正常工作。 https://github.com/MichaelGrupp/TTT 使用 BibTeX 命令后出现以下消息: Pr
是否有任何 python 包来解析 Bibtex 文件,并使用 html/xhtml 格式输出结果,并具有可自定义的样式? 最好用python,不然PHP用的最多的是什么? 最佳答案 Pybliogr
我在 BibTex 中使用三个字母的缩写来表示月份,但是当我编译我的文档时,月份名称是英文的。 我可以以某种方式更改输出语言吗? 我正在使用 natbib ,但如果需要,请不要介意切换回原版 BibT
我想在包含尖括号的 bibtex 引文中放置一个标题字段: @article{ title= { } } 但是当它编译时我会颠倒'!'和 '?'反而。如何摆脱尖括号? 最佳答案 主要的 TeX
我首选的 bibtex 样式文件通过作者的首字母引用。但是,有各种文本应以不同方式引用(例如,Elements Geometrie Algebrique 应始终引用为 [EGA])。我知道如何在 bi
默认情况下(使用 plain 样式)BibTeX 按字母顺序对引文进行排序。 如何按文档中出现的顺序对引文进行排序? 最佳答案 这个问题有三个很好的答案。 如果您对其格式感到满意,请使用 unsrt
我是 LaTeX 和 BibTeX 的新手,请原谅我的无知。我有以下条目: @Article{Hart, author = {P.E. Hart, N.J. Nilsson, B. Raphael},
我正在尝试解析以下 BibTeX 文件(bibliography.bib): @book{Lee2000a, abstract = {Abstract goes here}, author = {Le
我是一名优秀的程序员,十分优秀!