gpt4 book ai didi

python - 网页被阅读了吗?如何将其保存到 excel 文件?

转载 作者:太空宇宙 更新时间:2023-11-04 03:58:36 24 4
gpt4 key购买 nike

我想用Python将网页的文本内容保存到Excel文件中。作为一个新手,下面是目前我能算出来的,不知道对不对。

from bs4 import BeautifulSoup
from urllib2 import urlopen

html = urlopen("http://www.chicagoreader.com").read()
soup = BeautifulSoup(html, "lxml")

看起来还好吗?将文本内容自动保存到 Excel 文件中的下一步是什么?我已经安装了 xlutils,但不知道如何使用它。

有人可以帮我吗?谢谢。

最佳答案

为了使用python写入excel文件,你有几个包可以选择:

所以,这取决于它应该是什么类型的 excel 文件,xlsxlsx,是否需要格式化,速度是否重要等。

下面是一个关于如何使用 xlwt 将网页标题写入 (0,0) 单元格的示例:

import xlwt  
from bs4 import BeautifulSoup
from urllib2 import urlopen

html = urlopen("http://www.chicagoreader.com").read()
soup = BeautifulSoup(html, "lxml")

workbook = xlwt.Workbook()
sheet = workbook.add_sheet('test')

sheet.write(0, 0, soup.title.text)

workbook.save('output.xls')

希望对您有所帮助。

关于python - 网页被阅读了吗?如何将其保存到 excel 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16981911/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com