作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 Python 新手,我需要从科学文献中提取引用资料。以下是我正在使用的代码
from refextract import extract_references_from_file
import pandas as pd
references = extract_references_from_file('1503.07589.pdf')
dfref = pd.DataFrame(references)
dfref.to_excel('./refs.xlsx')
我一次只能使用此命令从单个文件中提取引用,但我需要从多个文件中提取引用。所以,请指导我是否有可能以及如何去做。非常感谢!
最佳答案
docs声称提取的引用作为 dict
返回.
Returns a dictionary with extracted references and stats.
list
的
dict
s 返回,
from refextract import extract_references_from_file
higgs_papers = ['1503.07589', '2008.05492']
references = []
for paper in higgs_papers:
references.extend(extract_references_from_file(f'/tmp/{paper}.pdf'))
现在你有一个更大的列表,
references
,你可以变成更大的
df
.
import glob
files = glob.glob('/tmp/*.pdf')
关于python - 如何在Refextract上同时运行多个文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63428294/
我是一名优秀的程序员,十分优秀!