gpt4 book ai didi

python - SQLalchemy 未知值重复条目错误

转载 作者:太空宇宙 更新时间:2023-11-03 19:05:47 25 4
gpt4 key购买 nike

我正在编写一个脚本来同步 Adwords 帐户和 Sqlalchemy 本地数据库。我遵循 Adwords API 的对象层次结构,因此我的第一个表是“广告系列”,第二个表是“广告组”

这是我如何定义两者的:

class Campaign(Base):

__tablename__ = 'aw_campaigns'

id = Column(Integer, primary_key=True)
name = Column(String(99))
impressions = Column(Integer)
serving_status = Column(String(99))
start_date = Column(String(99))
status = Column(String(99))

def __init__(self, id, name, impressions, serving_status, start_date, status):
self.id = id
self.name = name
self.impressions = impressions
self.serving_status = serving_status
self.start_date = start_date
self.status = status

class Adgroup(Base):

__tablename__ = 'aw_adgroups'

id = Column(Integer, primary_key=True) # , primary_key=True
name = Column(String(99))
camp_id = Column(Integer, ForeignKey('aw_campaigns.id')) # , ForeignKey('aw_campaigns.id')
camp_name = Column(String(99))
ctr = Column(Float)
cost = Column(Float)
impressions = Column(Integer)
clicks = Column(Integer)
status = Column(String(99))

def __init__(self, id, name, camp_id, camp_name, ctr, cost, impressions, clicks, status):
self.id = id
self.name = name
self.camp_id = camp_id
self.camp_name = camp_name
self.ctr = ctr
self.cost = cost
self.impressions = impressions
self.clicks = clicks
self.status = status

我查询 API,然后为 Adgroup 表中的行构建对象列表:

adgr_query = 'SELECT CampaignId, CampaignName, Clicks, Cost, Impressions, Ctr, Id, KeywordMaxCpc, Name, Settings, Status'
adgr_page = ad_group_serv.Query(adgr_query)[0]['entries']

adgr_ins = [Adgroup(i['id'],
i['name'],
i['campaignId'],
i['campaignName'],
i['stats']['ctr'],
i['stats']['cost']['microAmount'],
i['stats']['impressions'],
i['stats']['clicks'],
i['status']) for i in adgr_page if int(i['id']) not in adgr_exist]

但是当我提交时出现错误:

 (IntegrityError) (1062, "Duplicate entry '2147483647' for key 'PRIMARY'")

问题是我不知道该值来自哪里。

'2147483647' in [i['id'] for i in adgr_page]
>>> False
'2147483647' in str(adgr_page)
>>> False

我真的被这个问题困住了。

最佳答案

看起来你在某处有整数溢出。

症状:2147483647是2**31-1 - 表示使用32位来存储数字。

AdGroup.Id 字段的类型为 xsd:long其长度为 64 位。

Python本身对整数值的大小没有限制,但数据库可能有这样的限制。

简短的解决方案:

尝试使用BigInteger sqltype 类型 id = Column(BigInteger, Primary_key=True) 以及 Camp_id 和来自 AdWords API 的其余 xsd:long 值相同。 SQLAlchemy 有可能选择数据库特定的大整数列类型。或者您可以使用 String(64) 作为 id 的类型。但在这种情况下,您需要额外的步骤来生成主键。

您对 AdWords API 的查询返回了多少条条目?是否有超过 2**32 条记录?我对此表示怀疑 - 您的数据库不太可能能够处理约 42 亿条记录。

解决方案 2 - 长期

尽管我建议不要信任外部源的主键完整性,而是依赖数据库使用自动增量生成主键,并依赖 SQLAlchemy 根据数据库生成的主键处理外键填充:

class Adgroup(Base):
__tablename__ = 'aw_adgroups'
id = Column(Integer, Sequence('adgroup_seq'), primary_key=True) # , primary_key=True
adGroupId = Column(String(64))
campaignId = Column(Integer,ForeignKey('aw_campaigns.id'))
campaign = relationship("Campaign", backref = "adgroup")
...

class Campaign(Base):
__tablename__ = 'aw_campaigns'
id = Column(Integer, Sequence('adgroup_seq'), primary_key=True)
campaignId = Column(String(64))
...

看起来您可能还需要按 CampaignId 和 adGroupId 进行查找 - 这样您就可以在它们上添加索引。

然后创建 Campaign 和 AdGroup 对象并添加它们之间的关系。该代码将取决于您想要使用的关系类型 - 一对多或多对多。检查sqlalchemy relationship manual了解更多详情。

ag = AdGroup(**kwargs)
camp = Campaign(**kwargs)
ag.campaign = camp
session.add(ag)

关于python - SQLalchemy 未知值重复条目错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14757756/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com