- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我在 python 中使用 scrapy,我在 python 项目管道中有这段代码
def process_item(self, item, spider):
import pdb; pdb.set_trace()
ID = str(uuid.uuid5(uuid.NAMESPACE_DNS, item['link']))
我遇到了这个错误:
Traceback (most recent call last):
File "C:\Python27\lib\site-packages\scrapy-0.20.2-py2.7.egg\scrapy\mid
dleware.py", line 62, in _process_chain
return process_chain(self.methods[methodname], obj, *args)
File "C:\Python27\lib\site-packages\scrapy-0.20.2-py2.7.egg\scrapy\uti
ls\defer.py", line 65, in process_chain
d.callback(input)
File "C:\Python27\lib\site-packages\twisted\internet\defer.py", line 3
82, in callback
self._startRunCallbacks(result)
File "C:\Python27\lib\site-packages\twisted\internet\defer.py", line 4
90, in _startRunCallbacks
self._runCallbacks()
--- <exception caught here> ---
File "C:\Python27\lib\site-packages\twisted\internet\defer.py", line 5
77, in _runCallbacks
current.result = callback(current.result, *args, **kw)
File "General_Spider_code_version_2\pipelines.py", line 7, in process_
item
ID = str(uuid.uuid5(uuid.NAMESPACE_DNS, item['link']))
File "C:\Python27\lib\uuid.py", line 549, in uuid5
hash = sha1(namespace.bytes + name).digest()
exceptions.UnicodeDecodeError: 'ascii' codec can't decode byte 0xa7 in p
osition 1: ordinal not in range(128)
我尝试调试 item['link']
这是结果
-> ID = str(uuid.uuid5(uuid.NAMESPACE_DNS, item['link']))
(Pdb) item['link']
u'http://dubai.dubizzle.com/property-for-rent/residential/apartmentflat/2014/4/6
/palm-jumeirah-abu-keibal-3-br-maid-partial-2/?back=ZHViYWkuZHViaXp6bGUuY29tL3By
b3BlcnR5LWZvci1yZW50L3Jlc2lkZW50aWFsL2FwYXJ0bWVudGZsYXQv&pos=1'
(Pdb)
如您所见,item['link']
是 unicode
当我将 item['link']
更改为任何其他属性(如 item['date']
时,代码可以完美运行
最佳答案
使用 .encode('utf-8')
将 unicode 字符串编码为字节字符串,它应该可以工作:
str(uuid.uuid5(uuid.NAMESPACE_DNS, item['link'].encode('utf-8')))
关于python异常.UnicodeDecodeError : 'ascii' codec can't decode byte 0xa7 in,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23944571/
使用此代码我无法获得 xa 或非 xa 的连接 DatabaseMetaData dbmd = con.getMetaData(); dbmd.getDriverName(); System.out.
我们可以在同一存储库类中使用 xa 和非 xa 资源的组合吗?如果可以的话,有人可以解释一下它的行为方式以及交易将如何进行吗?目前,我们在存储库中使用 2 个 xa 资源和 2 个非 xa 资源。我们
我试图了解 Java XA 数据源的使用。但我仍然不知道何时使用它,何时不使用它。 我读到当我们使用两个数据库时使用 XA 数据源。但我不确定两个数据库是什么意思。 例如: 我有两层类(Service
我们在不需要的情况下使用 XA JDBC 驱动程序(不参与分布式事务的只读工作)。 只是想知道是否有任何已知的性能提升必须切换到非 XA JDBC 驱动程序 - 如果没有,它可能不值得切换? FWIW
在我的 Spring Boot 应用程序中,我有以下场景: 从 JMS 队列读取消息 利用数据做一些事情。 对 Oracle 数据库执行 JDBC 插入 如果在任何阶段发生异常,我希望确保消息不会丢失
我对 XA 和非 XA 世界还很陌生。我的要求是从队列中读取一条消息,直到没有消息为止。对于队列中的每条消息,转到数据库并执行一些事务,例如选择、插入、更新。 是否可以使用非 XA 数据源实现此目的?
问题 我正在尝试使用geopandas绘制每个地区的犯罪数据。我已合并 shapefile 数据和犯罪数据: merged = merged[['geometry','Extortion']] mer
我使用两个单独的数据源。使用 EJB3.0,我使用的是 non-Xa-datasources。我遇到这样的错误:无法打开连接,状态感知对象。这是因为在一个无状态 bean 中我调用了第二个无状态 be
oracle.jdbc.xa.OracleXADataSource 和 oracle.jdbc.xa.client.OracleXADataSource 黑白有什么区别 ,我知道两者都是 XA 兼容的
在我们的新项目中,我们希望实现涉及 jpa (mysql) 和消息总线 (rabbitmq) 的事务 我们开始使用 mysql 和 rabbitmq(通过 spring amqp 模块)使用 spri
在 mysql 重新启动时提交 XA 待处理事务时,出现以下错误。请帮助我解决这个错误。 mysql> XA RECOVER CONVERT XID; +----------+------------
我将两个 XA 数据源用于 EAP7 和 MySQL。应用程序正在运行,但在调用驾驶舱后抛出了很多异常。 7.5 版中的 Camunda 两者的配置相同。 (由红帽 EAP Docker 镜像生成)
有谁知道为什么 Mysql 需要可序列化隔离级别来实现 XA 事务的 ACID 属性,或者如果使用可重复读取和 XA 会丢失什么? However, for a distributed transac
假设我们有一个数据库(例如 Oracle)和一个 JMS 提供者(例如 HornetQ)参与 XA 事务。一条消息被发送到一个 JMS 队列,并且一些数据在同一个分布式事务中保存在数据库中。事务提交后
我们认为这是一个相当常见的 XA 用例: 从队列中读取消息 将一些数据写入数据库 向出队列(与入队列不同)写入响应消息 然而,我们还需要一种方法来处理内部错误和有害消息。我们想到的控制流程是这样的:
我想在 2 个不同位置的数据库中分离 2 个表...因此 1 个 MySQL 数据库位于一个数据中心,另外 1 个位于另一个数据中心。 我在 Wildfly 中使用普通数据源,并使用 JPA 连接到
我的 Websphere 应用程序有 3 个数据源。其中两个是 XA,另一个是非 XA。 我通过使用 @transactional 注释对方法进行注释,使 Java 方法具有事务性。 在该方法中,执行
背景知识:我遇到了一个问题,我越深入地研究它,就越发现 XA 似乎是正确的解决方案。我有一个“缓存”,它基本上是一个内存数据结构(树形结构),用于保存一些处理过的信息。使用Spring,我们设置了数据
我有一个关于 this 的问题 假设我有一些联系 $conn_site = mysqli_connect("localhost", "us", "ps"); mysqli_select_db("sit
我在 Mint 18 上使用 MySQL 5.7.19-0ubuntu0.16.04.1。我发现当我准备 XA 事务时,然后服务器崩溃了。服务重启后,我就不能再碰交易了。它仍然锁定了 table 。
我是一名优秀的程序员,十分优秀!