gpt4 book ai didi

Python 高效的网页抓取?

转载 作者:太空宇宙 更新时间:2023-11-04 09:55:12 24 4
gpt4 key购买 nike

<分区>

我是 Python 的新手,正在尝试为股票应用程序制作网络解析器。我实际上是在使用 urllib 为参数列表中的每只股票打开所需的网页,并阅读该页面的 html 代码的全部内容。然后我将其切片以找到我正在寻找的报价。我实现的方法有效,但我怀疑这是实现此结果的最有效方法。我花了一些时间研究其他可以更快地读取文件的潜在方法,但似乎没有一个与网络抓取有关。这是我的代码:

from urllib.request import urlopen

def getQuotes(stocks):
quoteList = {}
for stock in stocks:
html = urlopen("https://finance.google.com/finance?q={}".format(stock))
webpageData = html.read()
scrape1 = webpageData.split(str.encode('<span class="pr">\n<span id='))[1].split(str.encode('</span>'))[0]
scrape2 = scrape1.split(str.encode('>'))[1]
quote = bytes.decode(scrape2)
quoteList[stock] = float(quote)
return quoteList

print(getQuotes(['FB', 'GOOG', 'TSLA']))

提前谢谢大家!

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com