gpt4 book ai didi

python - 从抓取的 HTML 数据写入 CSV

转载 作者:太空宇宙 更新时间:2023-11-03 17:03:22 24 4
gpt4 key购买 nike

我能够使用以下代码从俄罗斯统计网站提取数据并创建 CSV 文件。但是,我有两个问题,首先,我不知道为什么在两个非空白行之间总是插入一个空白行。其次,我不知道如何编写一个漂亮的表格,其中同一个月的数据分布在不同的列中。现在,一切都在一个牢房里。谢谢。

from bs4 import BeautifulSoup
import lxml
import urllib2
import csv

f=csv.writer(open("Russia.csv","w"))
mainurl='http://www.gks.ru/bgd/free/B00_25/IssWWW.exe/Stg/d000/I000750R.HTM'
urlroot='http://www.gks.ru/bgd/free/B00_25/IssWWW.exe/Stg/d000/'

data = urllib2.urlopen(mainurl).read()
page = BeautifulSoup(data,'html.parser')

for link in page.findAll('a'):
page = urllib2.urlopen(urlroot+link.get('href'))
soup = BeautifulSoup(page, 'lxml')
years=soup.findAll('title',text=True)

table = soup.find('center').find('table')
for row in table.find_all('tr')[3:]:
cells = [cell.get_text(strip=True) for cell in row.find_all('td')]
f.writerow([cells])

最佳答案

您无意中在此处创建了列表列表:

cells = [cell.get_text(strip=True) for cell in row.find_all('td')]
f.writerow([cells])

相反,直接写入cells列表:

f.writerow(cells)

关于python - 从抓取的 HTML 数据写入 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34830082/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com