gpt4 book ai didi

python - 尝试使用 python 抓取网站时出错

转载 作者:行者123 更新时间:2023-12-01 08:10:37 26 4
gpt4 key购买 nike

我正在尝试从 this website 获取价格对于一些显示器。这是我的代码:

    def noteBooksBillgerParser(url):
headers = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.36'}
page = requests.get(url, headers=headers)
while True:
print ("test")
sleep(3)
try:
doc = html.fromstring(page.content)

XPATH_PRICE = '//div[@id="product_detail_price"]//content()'
RAW_PRICE = doc.xpath(XPATH_PRICE)
PRICE = ' '.join(''.join(RAW_PRICE).split()).strip() if RAW_PRICE else None

data = {
'PRICE': PRICE,
'URL': url,
}

return data
except Exception as e:
print
e


def ReadIDs():
# AsinList = csv.DictReader(open(os.path.join(os.path.dirname(__file__),"Asinfeed.csv")))
IDList = ['vp248qg',
'vz239he',
'vs247hr+164581'
]
extracted_data = []
for i in IDList:
url = "https://www.notebooksbilliger.de/asus+" + i
print("Processing: ", url)
extracted_data.append(noteBooksBillgerParser(url))
sleep(2)
f = open('notebooksbilliger.json', 'w')
json.dump(extracted_data, f, inde

nt=4)

我很确定大部分代码都可以工作,但我不确定如何将价格放入我的 XPATH_PRICE 变量中。我认为可能有一个错误。

最佳答案

这并不是将“价格放入我的 XPATH_PRICE 变量中”,而是将其放入您的 ROW_PRICE 变量中。如果您:

RAW_PRICE = doc.xpath('//div[@id="product_detail_price"]')[0].values()[4]

你的输出将是(随机选择IDList = vz239he):

156.99

其余部分应按预期进行处理。

关于python - 尝试使用 python 抓取网站时出错,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55275760/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com