gpt4 book ai didi

python - 读入 pandas 列作为 base64 字符串

转载 作者:行者123 更新时间:2023-12-04 12:30:15 24 4
gpt4 key购买 nike

我有一个已读入 Pandas 的 csv 文件。 csv 中的一列包含一个 base64 编码值,但 Pandas 将其作为字符串读取。我将如何将这个值(现在作为字符串读入)转换回可用的 base64 值。结构如下所示。

我这里有一个例子:

asset_id,asset_name,file_extension,concept_name,image_byte
204863410,7613287394927_H_enUK_1634104697919.jpg,jpg,Nestle Confectionery:Hazelnut,

我在这个文件中加载了一些示例以重现错误 here.

更新:

正如评论者指出的那样,我要转换的字符串已经是 base64,这确实是正确的。这就是问题所在!

该字符串已经进行了 base64 编码,但我不确定为什么它仍然被拒绝。我认为它可能试图读取开头和结尾带有 ' 的字符串,但失败了。当我尝试将字符串原样加载到 API 调用中时,我得到了这个

image=resources_pb2.Image(
TypeError: '/9j/4AAQSkZJRgABAQIAHAAcAAD/2wBDAAYEBQYFBAYGBQYHBwYIChAKCgkJChQODwwQFxQYGBcUFhYaHSUfGhsjHBYWICwgIyY has type str, but expected one of: bytes

这是我正在使用的代码块

post_inputs_response = stub.PostInputs(
service_pb2.PostInputsRequest(
inputs=[
resources_pb2.Input(
data=resources_pb2.Data(
image=resources_pb2.Image(
base64= img_byte_raw
)
)
)
]
),
metadata=metadata

)

这是我从 Clarifai 的链接文档中获得的 here

我将不胜感激

最佳答案

在您链接的四行 Book1.csv 中,前两个条目是有效的 base64 编码,但后两个不是。最后一行中的字符串很长,可能在某些时候被截断了。您收到的 TypeError 表示需要将 base64 编码的字符串数据转换回 bytes 对象。

下面是一个将 base64 字符串转换为字节对象的示例。我使用 Pillow (pip install Pillow) 来显示图像以验证它们确实被正确解码:

import pandas as pd
import base64
from PIL import Image
from io import BytesIO

def decode(s):
try:
return base64.b64decode(s)
except ValueError as e:
return e

df = pd.read_csv(r'downloads\book1.csv',encoding='utf-8-sig')
df['image_byte'] = df['image_byte'].apply(decode)
print(df)
Image.open(BytesIO(df.image_byte[0])).show()
Image.open(BytesIO(df.image_byte[1])).show()

输出:

    asset_id  ...                                         image_byte
0 204863410 ... b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x02...
1 204863409 ... b'\xff\xd8\xff\xe0\x00\x10JFIF\x00\x01\x01\x02...
2 204863134 ... Incorrect padding
3 204863133 ... Incorrect padding

[4 rows x 5 columns]

第一张图片:

First image example

关于python - 读入 pandas 列作为 base64 字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69610583/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com