gpt4 book ai didi

python - 如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档(.doc 和 .docx)文件内容?

转载 作者:太空宇宙 更新时间:2023-11-03 21:19:13 25 4
gpt4 key购买 nike

我的场景是,我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档(.doc 和 .docx)文件内容。下面是我使用的代码,我的问题是我可以获取文件名,但无法读取内容。

def lambda_handler(event, context):

file_contents = s3.Object(‘Bucketname’, 'sample.docx').get()['Body'].read().decode("unicode-escape")

return {
'File Name' : obj.key,
‘Content’ : file_contents
}

Response: { "errorMessage": "'unicodeescape' codec can't decode bytes in position 25818-25819: truncated \xXX escape", "errorType": "UnicodeDecodeError", "stackTrace": [ [ "/var/task/lambda_function.py", 76, "lambda_handler", "file_contents = s3.Object('Bucketname', 'sample.docx').get()['Body'].read().decode(\"unicode-escape\")" ] ] }

最佳答案

.docx 和 .doc 文件是二进制文件,因此简单的解码将无法工作,也许 docx2txt可能会有所帮助。

关于python - 如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档(.doc 和 .docx)文件内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54435388/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com