python - Pandas to_sql() 插入索引-6ren

python - Pandas to_sql() 插入索引

转载作者：太空狗更新时间：2023-10-29 21:18:07

27

4

我正在使用 Pandas 0.18.1，在摆弄这段代码时，

import pd

def getIndividualDf(item):
    var1 = []
    # ... populate this list of numbers
    var2 = []
    # ... populate this other list of numbers

    newDf = pd.DataFrame({'var1': var1, 'var2': var2})
    newDf['extra_column'] = someIntScalar
    yield newDf

dfs = []
for item in someList:
    dfs.append(getIndividualDf(item))

resultDf = pd.concat(dfs)
resultDf['segment'] = segmentId # this is an integer scalar

from sqlalchemy import create_engine
engine = create_engine('postgresql://'+user+':'+password+'@'+host+'/'+dbname)
resultDf.reset_index().to_sql('table_name', engine, schema="schema_name", if_exists="append", index=False)

我遇到了这个异常:

(psycopg2.ProgrammingError) column "index" of relation "table_name" does not exist

确实，表中没有这样的列，只是因为数据框中没有这样的显式列。这就是为什么它很奇怪。

运行

print(list(resultDf))

就在 to_sql() 调用之前，产生

['var1', 'var2', 'extra_column', 'segment']

从 to_sql() 调用中删除 index=False 会将错误更改为:

(psycopg2.ProgrammingError) column "level_0" of relation "table_name" does not exist

我很疑惑。如何删除 index 列？

更新
print(resultDf.head()) 产生了以下信息:

     var1       var2  extra_column  segment
0       8   0.101653    2077869737   201606
1       9   0.303694    2077869737   201606
2      10   0.493210    2077869737   201606
3      11   0.661064    2077869737   201606
4      12   0.820924    2077869737   201606

最佳答案

在写入 sql 之前不需要重置索引，例如:

resultDf.to_sql('table_name', engine, schema="schema_name", if_exists="append", index=False)

关于python - Pandas to_sql() 插入索引，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43942357/

27

4

0

文章推荐： python - 两个列表的组合(不是按元素的)

文章推荐： python - PIL : PNG image as watermark for a JPG image

文章推荐： c++ - 将 Google map 与 C++ 程序集成

文章推荐： c# - Autofac依赖注入(inject)实现

Pandas to_sql 使索引唯一
我已经阅读了有关不向数据库添加重复记录的 Pandas to_sql 解决方案。我正在处理日志的 csv 文件，每次我上传一个新的日志文件时，我都会读取数据并使用 Pandas 创建一个新的数据框进行
mysqldb中带有sqlAlchemy重复项的 Pandas to_sql
我正在将PANDAS与SQLAlchemy一起使用DataFrame.to_sql写入MYSQL DB。我喜欢打开'append' --> df.to_sql(con=con, name='table
python - to_sql 的数据透视表
我有一个看起来像这样的数据框 id_1 id_2 id_3 ... date_1 1 3 4 date_2 4
pandas.to_sql 将新列添加到现有表中，自动添加新列？
我想将数据帧写入现有的 sqlite(或 mysql)表，有时数据帧将包含数据库中尚不存在的新列。我需要做什么才能避免抛出错误？有没有办法告诉 pandas 或 sqlalchemy 使用潜在的新列自
django - Django中的 Pandas to_sql
我正在尝试使用Django的db连接变量将pandas数据帧插入Postgres数据库。我使用的代码是 df.to_sql('forecast',connection,if_exists='appen
python - Pandas to_sql 参数和性能
我目前正在尝试稍微调整一些脚本的性能，似乎瓶颈始终是使用 pandas to_sql 函数实际插入数据库(=MSSQL)。造成这种情况的一个因素是 mssql 的参数限制为 2100。我与 sql
python - Pandas to_sql 更改数据库表中的数据类型
有人经历过这种情况吗？我有一个包含“int”和“varchar”列的表 - 一个报告时间表。我正在尝试使用 python 程序将扩展名为“.xls”的 Excel 文件导入到该表中。我正在使用 p
python - Pandas to_sql 不创建文件
我正在尝试将 pandas 数据框保存为 SQL 文件我按照文档进行了尝试 from sqlalchemy import create_engine engine = create_engine('
python - DataFrame to_sql 使用错误的字符集进行替换
Panda 的 to_sql() 和 if_exists='replace' 为我的表设置了错误的字符集。为了将多个 csv 复制到 mysql 并忽略行上的错误(如重复错误)，我首先将 csv 读取
python - pandas to_sql 方法给出日期列错误
我有一个如下所示的数据框: df = pd.DataFrame(index= pd.date_range('2014-01-01', periods=10)) df['date'] = df.inde
python - Pandas to_sql 右截断错误
我正在尝试使用 Pandas to_sql 将 .csv 文件中的数据插入到 mssql 数据库中。不管我怎么看，我都会遇到这个错误: pyodbc.DataError: ('String data,
python - Pandas to_sql 插入忽略
我想不断将数据帧行添加到 MySQL 数据库中，避免任何重复的条目进入 MySQL。我目前通过使用 df.apply() 遍历每一行并调用 MySQL insert ignore(duplicate
python - Pandas to_sql() 更新数据库中的唯一值？
如何使用 df.to_sql(if_exists = 'append') 仅附加数据框和数据库之间的唯一值。换句话说，我想评估 DF 和 DB 之间的重复项，并在写入数据库之前删除这些重复项。这个有
python - Pandas to_sql 中行的排序
我有一个订购的 Pandas Dataframe。 a0 b0 c0 d0 370025442 370020440 370020436
Python Pandas to_sql 'append'
我正在尝试使用 Python 的 pandas to_sql 命令将月度数据发送到 MySQL 数据库。我的程序一次运行一个月的数据，我想将新数据附加到现有数据库中。然而，Python 给我一个错误:
python - pandas to_sql 截断了我的数据
我正在使用 df.to_sql(con=con_mysql, name='testdata', if_exists='replace', flavor='mysql') 将数据框导出到 mysql。但
python - 加速 Pandas to_sql()？
我有一个 1,000,000 x 50 Pandas DataFrame，我目前正在使用以下方法写入 SQL 表: df.to_sql('my_table', con, index=False) 这需
python - Pandas to_sql 设置列类型
我有一个字符串格式的数字列，我想将它作为 float 发送到 PostresSQL。如何确保 SQLAlchemy 将此列设置为 float ？ (请注意，列中可能是 NaN)。这是代码 import
python - Pandas to_sql 没有在我的表中插入任何数据
我想在我创建的表格中插入一些数据。我有一个如下所示的数据框: 我创建了一个表: create table online.ds_attribution_probabilities ( attributi
python - Pandas to_sql() 插入索引
我正在使用 Pandas 0.18.1，在摆弄这段代码时， import pd def getIndividualDf(item): var1 = [] # ... populate

首页

博学

6Ren·AI

商城

python - Pandas to_sql() 插入索引