gpt4 book ai didi

python - 如何在 Python/Pandas 中处理 "Object of type ' Timestamp' is not JSON Serialible”?

转载 作者:行者123 更新时间:2023-12-01 02:04:01 26 4
gpt4 key购买 nike

前言:Python 中的新手,但非常感谢您的帮助!

下面是一个代码片段,我在其中尝试对 MSSQL 服务器表执行 SQL 查询,并将其发布回 Google 表格。我能够检索数据和标题,并且我想我几乎已经弄清楚了。但是,我在某些列的日期时间格式方面遇到了一些问题。我收到的错误是:

Traceback (most recent call last):
File "modelhome.py", line 153, in <module>
valueInputOption=value_input_option, insertDataOption=insert_data_option, body=value_range_body)
File "C:\ProgramData\Anaconda3\lib\site-packages\googleapiclient\discovery.py", line 785, in method
actual_path_params, actual_query_params, body_value)
File "C:\ProgramData\Anaconda3\lib\site-packages\googleapiclient\model.py", line 151, in request
body_value = self.serialize(body_value)
File "C:\ProgramData\Anaconda3\lib\site-packages\googleapiclient\model.py", line 260, in serialize
return json.dumps(body_value)
File "C:\ProgramData\Anaconda3\lib\json\__init__.py", line 231, in dumps
return _default_encoder.encode(obj)
File "C:\ProgramData\Anaconda3\lib\json\encoder.py", line 199, in encode
chunks = self.iterencode(o, _one_shot=True)
File "C:\ProgramData\Anaconda3\lib\json\encoder.py", line 257, in iterencode
return _iterencode(o, 0)
File "C:\ProgramData\Anaconda3\lib\json\encoder.py", line 180, in default
o.__class__.__name__)
TypeError: Object of type 'Timestamp' is not JSON serializable

代码片段

"""Execute SQL Statement, create table, and append back to Google Sheet"""
# SQL Server Connection
server = '[SQLServerIP]'
database = '[SQLServerDatabase]'
username = '[SQLServerUsername]'
password = '[SQLServerPassword]'
cnxn = pyodbc.connect('Driver={ODBC Driver 13 for SQL Server};SERVER=' +
server+';DATABASE='+database+';UID='+username+';PWD='+password)

# Sample SQL Query to get Data
sql = 'select * from tblName'
cursor = cnxn.cursor()
cursor.execute(sql)
list(cursor.fetchall())

# Pandas reading values from SQL query, and building table
sqlData = pandas.read_sql_query(sql, cnxn)

# Pandas building dataframe, and exporting .xlsx copy of table
df = DataFrame(data=sqlData)

df.to_excel('tblName.xlsx',
header=True, index=False)
dfHeaders = df.columns.values.tolist()
dfHeadersArray = [dfHeaders]
dfData = df.values.tolist()
dfDataFormatted = [dfData]
"""Writing to Google Sheet Range"""
print(dfHeaders)
print(dfData)

# How the input data should be interpreted.
value_input_option = 'USER_ENTERED' # TODO: Update placeholder value.

# How the input data should be inserted.
insert_data_option = 'OVERWRITE' # TODO: Update placeholder value.

value_range_body = {
"majorDimension": "ROWS",
"values":
dfHeadersArray + dfDataFormatted
}

request = service.spreadsheets().values().append(spreadsheetId=spreadsheetId, range=SQLRangeName,
valueInputOption=value_input_option, insertDataOption=insert_data_option, body=value_range_body)
response = request.execute()

dfData中,普通字符串如下所示: enter image description here

datettime 条目显示如下: enter image description here

我的理解是,JSON 没有处理此数据类型的 native 方法,必须将其作为异常进行处理。有没有一种方法可以序列化数据集的所有时间戳部分,而不必指定哪些列是日期时间?

如果您能提供任何帮助/建议,我们将不胜感激。

谢谢!

最终解决方案更新 - 图片来源:@chrisheinze

为 datettime header 添加以下数据帧建模效果非常好。

# Pandas reading values from SQL query, and building table
sqlData = pandas.read_sql_query(sql, cnxn)

# Pandas building dataframe, and exporting .xlsx copy of table
df = DataFrame(data=sqlData)

# Google Sheets API can't handle date/time. Below converts certain headers to formatted text strings.
df['Date'] = df['Date'].dt.strftime('%m/%d/%Y')
df['DateTime'] = df['DateTime'].dt.strftime('%m/%d/%Y %H:%M:%S')
df['RDD'] = df['RDD'].dt.strftime('%m/%d/%Y')
df['DateTimeErrorTable'] = df['DateTimeErrorTable'].dt.strftime('%m/%d/%Y %H:%M:%S')
df['DateTimeSuccessTable'] = df['DateTimeSuccessTable'].dt.strftime('%m/%d/%Y %H:%M:%S')
df['WorkedOn'] = df['WorkedOn'].dt.strftime('%m/%d/%Y %H:%M:%S')
df['EmailSentOn'] = df['EmailSentOn'].dt.strftime('%m/%d/%Y %H:%M:%S')

希望对其他人有帮助!

最佳答案

Sheets API 不知道如何处理 Python 日期时间/时间戳。您需要将其转换 - 最有可能转换为 str。

要转换 pandas 系列,请使用 pd.Series.dt.strftime()

如果只是需要转换单个值,则使用日期时间的 strftime()

编辑以回答评论中的问题:

# To convert a datetime column to a str. 

df['date_column'] = df['date_column'].dt.strftime('%Y%m%d%H%M%S')

为了提供更多信息,strftime 表示“字符串格式日期时间”。这允许您将日期时间/时间戳值格式化为 str。 '%Y%m%d%H%M%S' 是您想要的输出。在我的示例中,您的日期结果将为“20180309152303”。另一个例子是 '%m/%d/%Y %H:%M:%S' ,它会给你“03/09/2018 15:23:03”。因此,将示例中的“date_column”替换为日期列的名称,它将转换为与 API 兼容并在 Google 表格中可以理解的格式的 str。

关于python - 如何在 Python/Pandas 中处理 "Object of type ' Timestamp' is not JSON Serialible”?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49243736/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com