gpt4 book ai didi

python - 我如何创建一个脚本来制作 MLA 引文?

转载 作者:太空宇宙 更新时间:2023-11-04 09:21:42 27 4
gpt4 key购买 nike

我有一个装满 Windows .URL 文件的文件夹。我想将它们翻译成我论文的 MLA 引用列表。

这是Python的一个很好的应用吗?我怎样才能得到页面标题?我在使用 Python 3.1.1 的 Windows XP 上。

最佳答案

这是 Python 的绝妙用途! .URL 文件格式的语法如下:

[InternetShortcut]
URL=http://www.example.com/
OtherStuff=irrelevant

要解析您的 .URL 文件,请从 ConfigParser 开始,它将读取此内容并创建一个 InternetShortcut 部分,您可以从中读取 URL。一旦你有了一个 URL 列表,你就可以使用 urlliburllib2 加载 URL,并使用一个愚蠢的正则表达式来获取页面标题(或 Alex 建议的 BeautifulSoup ).

一旦你有了它,你就有了一个 URL 和页面标题的列表......对于完整的 MLA 引用来说还不够,但应该足以让你开始,不是吗?

类似这样的事情(非常粗糙,在 SO 窗口中编码):

from glob import glob
from urllib2 import urlopen
from ConfigParser import ConfigParser
from re import search

# I use RE here, you might consider BeautifulSoup because RE can be stupid
TITLE = r"<title>([^<]+)</title>"

result = []
for file in glob("*.url"):
config = ConfigParser.ConfigParser()
config.read(file)
url = config.get("InternetShortcut", "URL")

# Get the title
page = urlopen(url).read()
try: title = search(TITLE, page).groups()[0]
except: title = "Couldn't find title"

result.append((url, title))

for url, title in result:
print "'%s' <%s>" % (title, url)

关于python - 我如何创建一个脚本来制作 MLA 引文?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1810405/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com