作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
CSVS3DataSet
/HDFS3DataSet
/HDFS3DataSet
使用 boto3
,已知它不是线程安全的 https://boto3.amazonaws.com/v1/documentation/api/latest/guide/resources.html?highlight=multithreading#multithreading-multiprocessing
可以将这些数据集与 ParallelRunner 一起使用吗?
最佳答案
Kedro
使用 s3fs
,它使用 boto3
库来访问 S3。 Boto3
确实不是线程安全的,但前提是您尝试重用同一个 Session 对象。
所有 Kedro
S3 数据集都维护单独的 S3FileSystem
实例,这意味着单独的 boto session ,因此很安全。
就性能而言,它可能不是很好,如果您并行处理数百个 S3 数据集,或顺序处理数千个小型 S3 数据集 - 管道可能会运行很长,甚至会因连接错误而失败,但您完全可以几十个就安全了。
关于python - S3 Kedro 数据集线程安全吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58911398/
我是一名优秀的程序员,十分优秀!