gpt4 book ai didi

python - 尝试打印网页中的所有 TR 元素和所有 TD 元素

转载 作者:行者123 更新时间:2023-11-28 22:16:34 26 4
gpt4 key购买 nike

我正在玩弄下面的脚本,并试图让它将网页中的所有 TR 元素和所有 TD 元素写入 CSV 文件。由于某些未知原因,我在 CSV 文件中根本没有得到任何数据。

from bs4 import BeautifulSoup
import requests
import pandas as pd
import csv

url = "https://my_url"
page = requests.get(url)
pagetext = page.text

soup = BeautifulSoup(pagetext, 'html.parser')

file = open("C:/my_path/test.csv", 'w')

for row in soup.find_all('tr'):
for col in row.find_all('td'):
print(col.text)

我正在使用 Python 3.6。

最佳答案

您的网址不是网站,因此无法找到任何内容。您只需要修复 url,然后重试。

我已经修复了代码,这样你就可以完成它了。它只会将列表中的第一行数据添加到 csv 文件中。

from bs4 import BeautifulSoup
import requests
import pandas as pd
import csv

url = "https://www.w3schools.com/html/html_tables.asp"
page = requests.get(url)
pagetext = page.text

soup = BeautifulSoup(pagetext, 'html.parser')

file = open("C:/Test/test2.csv", 'w')

for row in soup.find_all('tr'):
for col in row.find_all('td'):
info= col.text
print(info)


file.write(info)
file.close()

关于python - 尝试打印网页中的所有 TR 元素和所有 TD 元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52118862/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com