- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
这是我做的..
>>> soup = BeautifulSoup (html)
>>> soup
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xae' in position 96953: ordinal not in range(128)
>>>
>>> soup.find('div')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xae' in position 11035: ordinal not in range(128)
>>>
>>> soup.find('span')
<span id="navLogoPrimary" class="navSprite"><span>amazon.com</span></span>
>>>
我怎样才能简单地从 html
中删除麻烦的 unicode 字符?
或者有没有更清洁的解决方案?
最佳答案
试试这个方法:soup = BeautifulSoup (html.decode('utf-8', 'ignore'))
关于python UnicodeEncodeError > 我怎样才能简单地删除麻烦的 unicode 字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5236437/
我已经习惯了 hibernate ,但我时不时地跌跌撞撞,这是另一个。 我正在努力实现以下目标: @OneToMany @JoinTable(name = "inter_spec",
我的 CakePHP 网站几个月来一直运行良好,直到我今天尝试访问它时,出现以下错误: Warning: include(Cake/bootstrap.php): failed to open str
此代码对其他人有效吗?很长一段时间以来,添加事件监听器都不起作用。 Page Title window.onload = init(); function init
我试图在文本中只留下 a-zA-Z0-9._ : $new_pgname=preg_replace('|(^[a-zA-Z0-9_\.])|s','',$new_pgname); 但是你猜怎么着……对
html: [...][...] js [...]alert(document.getElementById("test").name);[...] 为什么我得到的是“undefined”而不是“te
我正在尝试创建一个实现 main 方法的驱动程序类。它必须创建并测试一个对象来演示所有程序功能。 我认为我已经创建了正确的驱动程序类,但我运行的测试证明我的代码中存在错误,这就是我到目前为止所拥有的。
我正在制作一款扑克游戏,但遇到了一个问题,几乎所有事情都可以按照交易按钮的 actionListener 进行。它应该删除交易按钮并添加一个新的 JTextArea (此文本只是一个占位符)。在那之前
我有一些编程经验,但我对 python 很陌生,我正在尝试弄清楚如何使用和导入 .py 文件中的类而不是 main 。我目前正在使用 netbeans,运行 CPython 3.2.1。 根据我现在的
好吧,我不知道发生了什么。我对 iOS 还比较陌生,所以我的调试技能还达不到他们需要的水平。我有一个文本字段工作得很好,直到我在我的应用程序中做了一些更改,这些更改与文本字段没有任何关系(至少我认为它
你好社区我有以下问题。 我的 list 文件如下所示。
我正在使用Drupal2Wordpress plugin将我的内容从 Drupal 传输到 WP,但我在尝试开始该过程时收到此错误:无法连接到 Drupal 数据库。 这是MySQL的日志: 1504
我有以下代码。它编译得很好,但它告诉我字符串是“E#^$$@$$$$$$$”。有什么想法吗? ifstream InFile(Filename); if (!InFile) return fa
我正在为类(class)的期末考试做准备,并且正在尝试重做作业问题。这是我第一次获得零学分的其中之一。 此练习的目标是创建一个 URL,该 URL 将指向包含以下 HTML 的页面,而不是显示预期的协
我开始研究套接字,但遇到了麻烦!我做错了什么? 服务器: /* server.c */ /* ############### INCLUDES ############### */ #include
我正在尝试制作一个逐行读取文件然后将读取的行放入链表的程序,我的问题是将字符串添加到列表中。看代码,在else测试中你可以看到我的问题。 #include #include struct list_e
我是 WordPress 新手,正在为 friend 编辑网站。我正在尝试向站点添加 RSS 提要,因此我编辑了 header.php 文件(这就是它的去向)。 我还编辑了 CSS,然后使用 File
我将向您展示 2 个场景(注意 d=damping factor=0.5) 第一种情况:假设有 4 个节点 A, B, C, D : B、C、D 链接到 A。 PageRank 是:PR(A)=0.5
我无法理解 mem_fun_ref。我必须承认,我通常将仿函数用于此类事情,因为它们可以内联以提高速度和利润。但是,这段代码不会成为瓶颈,所以我想尝试一下。 这是我想做的一个例子。我知道还有其他方法可
尝试使用 AudioClip 编译 applet 时出现预期标识符错误。我计划将其添加到 JFrame,并希望让 AudioClip 循环播放。 import java.applet.*; impor
我正在尝试开始使用 node.js,但我绝不是高级程序员。除了检查我的 ip,我从未使用过 cmd。 我的问题是我不知道将文件保存在哪里,以及如何使用 node.js 从 cmd 运行它们。我发现的教
我是一名优秀的程序员,十分优秀!