gpt4 book ai didi

python - 从抓取结果中删除 "u'\n'"

转载 作者:太空宇宙 更新时间:2023-11-04 05:07:05 25 4
gpt4 key购买 nike

用下面的 python 代码抓取后,我的结果包含一些额外的 'u'\n 和更多种类的\xc2\xa0it ,如何摆脱这个?(我试过使用 strip,仍然没有用)

    age_stored=BeautifulSoup(req_final_page.text,'html5lib')
detail_content=page_stored.find('div', { 'class' : 'company-page-body body'})
details=[]
for content in detail_content:
details.append(content.string)

结果是:

u'\n', u'伟大的艺术家、设计师、作家和企业家有什么不同?他们能做什么别人做不到的事?他们看到其他人看不到的东西\xe2\x80\x99t。尚不存在的事物。更好的做事方式。其他人错过的模式和联系。 Milanote 也可以帮助任何人实现这一愿景,他们相信您\xe2\x80\x99 也将能够以不同的方式看待事物。', u'\n', u'Milanote 基于这样的理念,即每件伟大的作品背后是大量的研究、思考和计划,它们通常是困惑的、非结构化的并且需要时间来发展。这就是为什么 Milanote 比同类产品更具视觉效果、灵 active 和触感。他们\u2019ve\xc2\xa0真的试图重现在创意工作室的墙上工作的感觉。', u'\n'

最佳答案

这是因为unicode。你可以看到这个question .

要摆脱 u,请在添加到列表之前将其转换为 string

details = []
for content in detail_content:
details.append(str(content.string))

关于python - 从抓取结果中删除 "u'\n'",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44094654/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com