gpt4 book ai didi

python - 表格抓取中的不完整结果

转载 作者:行者123 更新时间:2023-11-28 21:00:20 25 4
gpt4 key购买 nike

我正在尝试抓取 http://bifr.nic.in/asp/list.asp这个页面有 beautifulsoup 并从中获取表格。以下是我的代码

from bs4 import BeautifulSoup
import urllib.request
base_url = "http://bifr.nic.in/asp/list.asp"

page = urllib.request.urlopen(base_url)
soup = BeautifulSoup(page, "html.parser")

table = soup.find("table",{"class":"forumline"})
tr = table.find_all("tr")
for rows in tr:
print(rows.get_text())

它没有显示错误,但是当我执行它时,我只能从表格中获取第一行内容。

List of Companies

Case
No
Company
Name









359 2000 A & F OVERSEAS LTD.





359 2000 A & F OVERSEAS LTD.
359 2000 A & F OVERSEAS LTD.

这是我得到的结果。我不明白发生了什么。

最佳答案

尝试从该表中获取所有数据:

from urllib.request import urlopen
from bs4 import BeautifulSoup

page = urlopen("http://bifr.nic.in/asp/list.asp")
soup = BeautifulSoup(page, "html5lib")
table = soup.select_one("table.forumline")
for items in table.select("tr")[4:]:
data = ' '.join([item.get_text(" ",strip=True) for item in items.select("td")])
print(data)

部分输出:

359 2000 A & F OVERSEAS LTD.
99 1988 A B C PRODUCTS LTD.
103 1989 A INFRASTRUCTURE LTD.
3 2006 A V ALLOYS LTD.
13 1988 A V J WIRES LTD.

关于python - 表格抓取中的不完整结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48594666/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com