gpt4 book ai didi

python - 为什么我不能按空格分割?

转载 作者:行者123 更新时间:2023-11-28 20:10:04 24 4
gpt4 key购买 nike

这是字符串:

u'\u041a\u0440\u0430\u0441\u0438\u043b\u044c\u043d\u0438\u043a\u043e\u0432 \u0421\u0435\u0440\u0433\u0435\u0439 \u0410\u043b\u0435\u043a\u0441\u0430\u043d\u0434\u0440\u043e\u0432\u0438\u0447'

如果我尝试 .split() 那个,它不起作用 - 只返回一个部分。这里有什么问题?

更新。完整代码:

page = urllib.urlopen('http://www.rea.ru/Main.aspx?page=Krasil_nikov_Sergejj_Aleksandrovich')
soup = BeautifulSoup(page.read(), fromEncoding="utf-8")
full_name = soup.find('div', {'class': 'flagPageTitle'}).text.strip().split()
self.response.out.write(str(full_name) + '<br>')

最佳答案

啊。看,关键在于您在收到请求后才发布的信息。你的字符串不是它看起来的样子:

[u'\u041a\u0440\u0430\u0441\u0438\u043b\u044c\u043d\u0438\u043a\u043e\u0432&nbsp;\u0421\u0435\u0440\u0433\u0435\u0439&nbsp;\u0410\u043b\u0435\u043a\u0441\u0430\u043d\u0434\u0440\u043e\u0432\u0438\u0447']

其中不是空格,而是 " ",这是不间断空格字符。关于删除这些的最佳方法,有几个 stackoverflow 问题;我不知道哪个是最好的。

[IOW,搜索“BeautifulSoup nbsp”。]

关于python - 为什么我不能按空格分割?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9039335/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com