gpt4 book ai didi

python - 使用 Python 读取 Azure ADLS Gen2 文件(不带 ADB)

转载 作者:行者123 更新时间:2023-12-03 03:37:33 25 4
gpt4 key购买 nike

想要使用 python(不带 ADB)从 ADLS gen2 Azure 存储读取文件(csv 或 json)。

file  = DataLakeFileClient.from_connection_string(conn_str=conn_string,file_system_name="test", file_path="source")

with open("./test.csv", "r") as my_file:
file_data = file.read_file(stream=my_file)

错误:发生异常:AttributeError“DataLakeFileClient”对象没有属性“read_file”

我的尝试是从 ADLS gen2 读取 csv 文件并将其转换为 json。 Download.readall() 也会抛出 ValueError: This pipeline did not have the RawDeserializer policy;无法反序列化。

最佳答案

尝试下面的代码并查看是否可以解决该错误:

import os, uuid, sys
from azure.storage.filedatalake import DataLakeServiceClient

service_client = DataLakeServiceClient.from_connection_string("DefaultEndpointsProtocol=https;AccountName=***;AccountKey=*****;EndpointSuffix=core.windows.net")

file_system_client = service_client.get_file_system_client(file_system="test")

directory_client = file_system_client.get_directory_client("testdirectory")

file_client = directory_client.get_file_client("test.txt")

download=file_client.download_file()

downloaded_bytes = download.readall()

with open("./sample.txt", "wb") as my_file:
my_file.write(downloaded_bytes)
my_file.close()

另外,请引用这个Use Python to manage directories and files MSFT 文档了解更多信息。

关于python - 使用 Python 读取 Azure ADLS Gen2 文件(不带 ADB),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72812991/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com