gpt4 book ai didi

Python追加添加相同的数据

转载 作者:太空宇宙 更新时间:2023-11-03 13:27:08 25 4
gpt4 key购买 nike

我正在尝试从韩国网站提取股票价格和市值数据。

这是我的代码:

import requests
from bs4 import BeautifulSoup

response = requests.get('http://finance.naver.com/sise/sise_market_sum.nhn?sosok=0&page=1')
html = response.text
soup = BeautifulSoup(html, 'html.parser')

table = soup.find('table', { 'class': 'type_2' })
data = []
for tr in table.find_all('tr'):
tds = list(tr.find_all('td'))

for td in tds:
if td.find('a'):
company_name = td.find('a').text
price_now = tds[2].text
market_cap = tds[5].text
data.append([company_name, price_now, market_cap])


print(*data, sep = "\n")

这就是我得到的结果。 (对不起韩文字符)

['삼성전자', '43,650', '100']

['', '43,650', '100']

['SK하이닉스', '69,800', '5,000']

['', '69,800', '5,000']

结果中的第二行和第四行不应该存在。我只想要第一行和第三行。第二行和第四行来自哪里?我该如何摆脱它们?

最佳答案

我亲爱的 friend ,我认为问题是你应该检查 td.find('a').text 是否有值!

所以我将您的代码更改为这个并且它有效!

import requests
from bs4 import BeautifulSoup

response = requests.get(
'http://finance.naver.com/sise/sise_market_sum.nhn?sosok=0&page=1')
html = response.text
soup = BeautifulSoup(html, 'html.parser')

table = soup.find('table', {'class': 'type_2'})
data = []
for tr in table.find_all('tr'):
tds = list(tr.find_all('td'))

for td in tds:
# where magic happends!
if td.find('a') and td.find('a').text:
company_name = td.find('a').text
price_now = tds[2].text
market_cap = tds[5].text
data.append([company_name, price_now, market_cap])

print(*data, sep="\n")

关于Python追加添加相同的数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53370221/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com