gpt4 book ai didi

python - 无法根据来源内容写入日期

转载 作者:行者123 更新时间:2023-12-01 09:05:14 34 4
gpt4 key购买 nike

我用 python 结合 selenium 编写了一个脚本,用于解析网页中的一些动态内容,并将它们相应地写入 csv 文件。以下脚本可以毫无错误地完成此操作,除了一件事 the date

如果您查看该网站的内容,您会发现该表格数据中没有提到年份。

但是,当我单击Date下的任何单元格时输出文件中的列标题,excel 默认将其计为当前年份,而 the date应该是2004 。我怎样才能让这一年2004根据下图2所示的内容?

我正在尝试使用的脚本:

import csv
import datetime
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

url = "http://info.nowgoal.com/en/League/2004-2005/36.html"

def get_information(driver,link):
driver.get(link)
for items in wait.until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR,'table#Table3 tr')))[2:]:
try:
date = items.find_elements_by_css_selector("td")[1].text.split("\n")[0]
date = datetime.datetime.strptime(date, '%m-%d').strftime('%d-%B')
except Exception: date = ""
try:
match_name = items.find_elements_by_css_selector("td")[2].find_element_by_tag_name("a").text
except Exception: match_name = ""
writer.writerow([date,match_name])
print(date,match_name)

if __name__ == '__main__':
driver = webdriver.Chrome()
wait = WebDriverWait(driver,10)
with open("outputfile.csv","w",newline="") as infile:
writer = csv.writer(infile)
writer.writerow(['Date','Match name'])
try:
get_information(driver,url)
finally:
driver.quit()

这是日期在 csv 文件中的显示方式: enter image description here

这是您在该网页中可以看到的内容:

enter image description here

最佳答案

您可以将正确的年份添加到单元格中,如下所示:

import datetime

date = "05-15"
date = datetime.datetime.strptime(date, '%m-%d').replace(year=2004).strftime('%d-%B-%Y')

print(date)

这将显示:

15-May-2004

关于python - 无法根据来源内容写入日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52118182/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com