python - 使用 cookie 从 Google Scholar(bibtex) 导入数据-6ren

python - 使用 cookie 从 Google Scholar(bibtex) 导入数据

转载作者：行者123 更新时间：2023-12-01 05:05:08

25

4

以下是代码:

import cookielib
import urllib2 
from bs4 import  BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:30.0) Gecko/20100101 Firefox/30.0'}
url='http://scholar.google.co.in/scholar_setprefs?sciifh=1&scisig=AAGBfm0AAAAAU9jcmEN2h2yuBuZqQK8Es5dQG3ksjutw&inststart=0&num=10&scis=yes&scisf=4&hl=en&lang=all&instq=&save='

filename = "cookies.txt"
request = urllib2.Request(url, None, headers)
cookies = cookielib.MozillaCookieJar(filename, None, None)
cookies.load()
cookie_handler= urllib2.HTTPCookieProcessor(cookies)
redirect_handler= urllib2.HTTPRedirectHandler()
opener = urllib2.build_opener(redirect_handler,cookie_handler)
response = opener.open(request)
print response.read()

输出错误:

C:\Python27\lib\_MozillaCookieJar.py:109: UserWarning: cookielib bug!
Traceback (most recent call last):
  File "C:\Python27\lib\_MozillaCookieJar.py", line 71, in _really_load
    line.split("\t")
ValueError: need more than 1 value to unpack

  _warn_unhandled_exception()
Traceback (most recent call last):
  File "C:\Users\new user\Desktop\pythonprac\working\googlescholar.py", line 10, in <module>
    cookies.load()
  File "C:\Python27\lib\cookielib.py", line 1763, in load
    self._really_load(f, filename, ignore_discard, ignore_expires)
  File "C:\Python27\lib\_MozillaCookieJar.py", line 111, in _really_load
    (filename, line))
cookielib.LoadError: invalid Netscape format cookies file 'cookies.txt': '.scholar.google.com     TRUE    /       FALSE   2147483647      GSP     ID=353e8f974d766dcd:CF=2'

这段代码来自网络，我正在尝试将谷歌学者bibtex数据中的数据下载到txt文件中。为此，我需要将用户设置保存到 cookie 中。我正在将数据写入cookie.txt。但我收到上述错误。请指导如何处理此 cookie 错误以及如何使用 cookie 保存 google.scolar.com 的用户定义的首选项。

最佳答案

我可以建议使用另一组库吗？

from bs4 import BeautifulSoup
import requests

url= 'http://scholar.google.co.in/scholar_setprefs?sciifh=1&' +\
     'scisig=AAGBfm0AAAAAU9jcmEN2h2yuBuZqQK8Es5dQG3ksjutw' +\
     '&inststart=0&num=10&scis=yes&scisf=4&hl=en&lang=all&instq=&save='

page = requests.get(url)
cookies = page.cookies

page = requests.get(url, cookies=cookies)

print page.content

使用cookies = page.cookies，我检索cookie并将其保存到cookies变量中。我重新请求传递该变量的同一页面。如果您有 cookies.txt 文件，则可以将其作为字典加载

<小时/>

如果您想使用标准库 urllib2 和 cookielib 来执行此操作，请确保 cookies.txt 文件中的第一行是

# Netscape HTTP Cookie File

否则 cookielib 将不会加载它:https://stackoverflow.com/a/11536599/1688590

关于python - 使用 cookie 从 Google Scholar(bibtex) 导入数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25197771/

25

4

0

文章推荐： python - 在 Python 中漂亮地打印 JSON.dump 二维数组

文章推荐： python - 如何在 Ubuntu 14.04 安装后运行 Django

文章推荐： ember.js - 在 Ember.js 中的嵌套组件中触发操作

文章推荐： python - 如何在Python中使用队列处理线程中的异常？

bibtex - 将引用的文档作品转换为 bibtex 或尾注格式
关闭。这个问题需要更多focused .它目前不接受答案。想改善这个问题吗？更新问题，使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
bibtex - 保留 BibTeX 中的所有大写
已关闭。这个问题是 off-topic 。目前不接受答案。想要改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。已关闭10 年前。 Improve th
bibtex - 如何从 bibtex 数据在 Jabref 中创建多个条目？
假设我有 10 篇文章的 bibtex 数据。有没有办法在 jabref 中从中创建 10 个条目？解决方案是打开 .bib 文件并将数据粘贴到其中。最佳答案选择构成多个数据条目的 BibTex
bibtex - 如何从 bibtex 数据在 Jabref 中创建多个条目？
假设我有 10 篇文章的 bibtex 数据。有没有办法在 jabref 中从中创建 10 个条目？解决方案是打开 .bib 文件并将数据粘贴到其中。最佳答案选择构成多个数据条目的 BibTex
bibtex - 贾布雷夫 : export a subset in bibtex format?
Jabref 支持以不同格式导出选定的条目，但我想知道它是否真的可以导出为 bibtex 格式。选择一些引用文献来创建一个较小的数据库很有用，例如，仅包含某些主题的引用文献或您在特定论文中引用的引用文
BiBtex 换行符
我编辑了一个 BibteX 文件，到目前为止，它显示了我需要的所有信息。 FUNCTION {electronic} { output.bibitem format.btitle "title"
bibtex - bibTeX被引为stackoverflow
（我不确定这个问题是否属于meta网站，但是我们开始吧）我想在正在撰写的研究论文的书目中添加stackoverflow，并想知道是否有任何bibTeX代码可以这样做。我已经为gnuplot做过我在
bibtex - 批量下载bibtex数据？
有没有办法从 Google Scholar 或其他地方批量下载 bibtex 数据？我尝试了一些 GS Scraper，例如， https://github.com/gimoya/theBioBuc
latex - bibtex 使用哪个命令来创建引用书目标题？
我正在使用 multibib 在附录中创建文章列表。 %Preamble... %Create new macros for citation in "lit" group \newcites{lit
Latex BibTex 找不到数据库条目
在我的论文中，我使用了以下 latex 模板。但即使在模板中，库也无法正常工作。 https://github.com/MichaelGrupp/TTT 使用 BibTeX 命令后出现以下消息: Pr
latex - Bibtex 资本
我想将引用书目中的一些字母显示为大写。例如: @misc{libsvm, abstract = {LIBSVM is an implbmentation of Support vector mach
Gnuplot BibTeX 引文
好的，这不是一个正确的编程问题，但也许答案会对其他人有所帮助。我一直在尝试为 gnuplot 找到合适的 BibTeX 条目，以包含在科学出版物中。我只是不想引用任何指南，而是引用实际的软件。有没有
Latex BibTex 找不到数据库条目
在我的论文中，我使用了以下 latex 模板。但即使在模板中，库也无法正常工作。 https://github.com/MichaelGrupp/TTT 使用 BibTeX 命令后出现以下消息: Pr
python - 网页上的 Bibtex？
是否有任何 python 包来解析 Bibtex 文件，并使用 html/xhtml 格式输出结果，并具有可自定义的样式？最好用python，不然PHP用的最多的是什么？最佳答案 Pybliogr
latex - 如何让 BibTeX 以英语以外的其他语言显示月份？
我在 BibTex 中使用三个字母的缩写来表示月份，但是当我编译我的文档时，月份名称是英文的。我可以以某种方式更改输出语言吗？我正在使用 natbib ，但如果需要，请不要介意切换回原版 BibT
latex - 如何在 bibtex 中输入尖括号？
我想在包含尖括号的 bibtex 引文中放置一个标题字段: @article{ title= { } } 但是当它编译时我会颠倒'!'和 '？'反而。如何摆脱尖括号？最佳答案主要的 TeX
latex - 有没有办法覆盖特定条目的 bibtex 样式文件？
我首选的 bibtex 样式文件通过作者的首字母引用。但是，有各种文本应以不同方式引用(例如，Elements Geometrie Algebrique 应始终引用为 [EGA])。我知道如何在 bi
latex - 如何使用 BibTeX 按外观对引文进行排序？
默认情况下(使用 plain 样式)BibTeX 按字母顺序对引文进行排序。如何按文档中出现的顺序对引文进行排序？最佳答案这个问题有三个很好的答案。如果您对其格式感到满意，请使用 unsrt
latex - 如何在 BibTeX 中保留引号
我是 LaTeX 和 BibTeX 的新手，请原谅我的无知。我有以下条目: @Article{Hart, author = {P.E. Hart, N.J. Nilsson, B. Raphael},
perl - 动态解析 BibTeX 并创建哈希的哈希
我正在尝试解析以下 BibTeX 文件(bibliography.bib): @book{Lee2000a, abstract = {Abstract goes here}, author = {Le

首页

博学

6Ren·AI

商城

python - 使用 cookie 从 Google Scholar(bibtex) 导入数据