gpt4 book ai didi

python - 将 pandas 表加载到 dynamoDb

转载 作者:行者123 更新时间:2023-12-05 09:36:55 24 4
gpt4 key购买 nike

我正在尝试将一个大的 Pandas 表加载到 dynamoDB。

我试过如下的for循环方法

for k in range(1000):
trans = {}
trans['Director'] = DL_dt['director_name'][k]
trans['Language'] = DL_dt['original_language'][k]
print("add :", DL_dt['director_name'][k] , DL_dt['original_language'][k])
table.put_item(Item=trans)

它有效,但非常耗时。有没有更快的加载方式? (相当于 sql 数据库的 to_sql)

我找到了 batchwriteitem 函数,但我不确定它是否有效,我也不知道如何使用它。

非常感谢。

最佳答案

您可以遍历数据帧行,将每一行转换为 json,然后使用 json.loads 将其转换为字典,这也将避免 numpy 数据类型错误。

你可以试试这个:

import json
from decimal import Decimal
DL_dt = DL_dt.rename(columns={
'director_name': 'Director',
'original_language': 'Language'
})
with table.batch_writer() as batch:
for index, row in DL_dt.iterrows():
batch.put_item(json.loads(row.to_json(), parse_float=Decimal))

关于python - 将 pandas 表加载到 dynamoDb,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64773557/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com