- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这里是 Scala 2.11,尽管这涉及 AWS S3 Java client API所以这真的是一个 Java 问题。如果有人能在 Scala 中提供答案,那将是很棒的,但我很高兴接受任何有效的 Java 答案(我总是可以在我自己的时间用 Scala 化它).
我正在尝试使用 AWS S3 客户端库连接到 S3 上的存储桶,该存储桶下面是以下目录结构:
my-bucket/
3dj439fj9fj49j/
data.json
3eidi04d40d40d/
data.json
a874739sjsww93/
data.json
...
因此,存储桶下的每个直接子对象都是一个具有字母数字名称的目录。我将这些称为“ID 目录”。这些 ID 目录中的每一个都有一个全部名为data.json
的子对象。 .
我需要完成几件事:
Array<String>
或 Scala Array[String]
),其中包含 ID 目录的所有字母数字 ID(因此元素 0 是 "3dj439fj9fj49j"
,元素 1 是 "3eidi04d40d40d"
,等等.);和Array<Date>
或 Scala Array[Date]
),其中包含每个 ID 目录对应的 data.json
的上次修改时间戳文件。所以如果mybucket/3dj439fj9fj49j/data.json
上次修改日期/时间戳为 2017-05-29 11:19:24T,那么该日期时间将是第二个数组的第一个元素my-bucket
下面的第 5 个 ID 目录,我还可以访问第二个(日期)数组的第 4 个元素并获取第 5 个 ID 目录的 data.json
的上次修改时间戳子对象这些不一定必须是数组,它们可以是映射、元组等。如上所述,我只需要 1+ 个数据结构来保存此内容。
来自lib's Javadocs我看到一个ObjectMetadata#getLastModified
字段,但我没有看到任何用于读取给定 S3Object
的父目录路径的信息(意思是 data.json
的父 ID 目录)。总而言之,我最好的尝试是失败得很惨:
val s3Client = new AmazonS3Client(new BasicAWSCredentials(accessKey, secretKey))
val bucketRoot : S3Object = s3Client.getObject("myBucket","/")
// TODO: How to query 'bucketRoot' for all its child ID directories?
val idDirs : Array[S3Object] = ???
var dataMap : Map[String,Date] = null
idDirs.foreach(idDir ->
// TODO: getName() and getChildSomehow() don't exist...obviously
dataMap :+ idDir.getName() -> idDir.getChildSomehow("data.json").getObjectMetadata.getLastModified
)
那里有任何 S3 API 专家可以发现我哪里出错了,或者可以在此处将我推向正确的方向吗?提前致谢!
最佳答案
您可以调用AmazonS3#listObjects(String)
获取存储桶中的对象列表。响应将包含 S3ObjectSummary
对于找到的每个键。您可以调用S3ObjectSummary#getLastModified()
获取最后修改的日期/时间。
这是一个将它与一些 Scala 代码联系在一起的示例。
> aws s3 ls --recursive s3://<REDACTED>/
2017-08-02 13:45:12 0 3dj439fj9fj49j/
2017-08-02 13:45:28 0 3dj439fj9fj49j/data.json
2017-08-02 13:45:16 0 3eidi04d40d40d/
2017-08-02 13:45:33 0 3eidi04d40d40d/data.json
2017-08-02 13:45:19 0 a874739sjsww93/
2017-08-02 13:45:37 0 a874739sjsww93/data.json
import collection.JavaConverters._
import com.amazonaws.auth.AWSStaticCredentialsProvider
import com.amazonaws.auth.BasicAWSCredentials
import com.amazonaws.regions.Regions
import com.amazonaws.services.s3.AmazonS3ClientBuilder
val key = <REDACTED>
val secret = <REDACTED>
val bucketName = <REDACTED>
val region = <REDACTED>
val creds = new BasicAWSCredentials(key, secret)
val s3 = AmazonS3ClientBuilder.standard.withCredentials(new AWSStaticCredentialsProvider(creds)).withRegion(region).build
val objectSummaries = s3.listObjects(bucketName).getObjectSummaries.asScala
val dataFiles = objectSummaries.filter { _.getKey.endsWith("data.json") }
val dataDirectories = dataFiles.map(dataFile => {
val keyComponents = dataFile.getKey.split("/")
val parent = if (keyComponents.length > 1) keyComponents(keyComponents.length - 2) else "/"
(parent, dataFile.getLastModified)
})
dataDirectories.foreach(println)
(3dj439fj9fj49j,Wed Aug 02 13:45:28 PDT 2017)
(3eidi04d40d40d,Wed Aug 02 13:45:33 PDT 2017)
(a874739sjsww93,Wed Aug 02 13:45:37 PDT 2017)
首先,我们有一些 Bootstrap 来设置凭据和创建客户端。然后,我们发出 listObjects
,这会触发对 S3 服务的调用。我们将这些结果过滤
为仅以“data.json”结尾的键。然后,我们将结果映射
到由父路径名和对象的最后修改日期/时间组成的元组。为了确定父路径,我们在路径分隔符上split
并检索先前的路径组件。作为一种特殊情况,如果文件位于根目录中,则我们称其父级为 "/"
。
我选择将结果表示为元组,但如果您愿意,可以将其更改为其他数据结构。
请注意,对于包含大量对象的存储桶,您可能需要使用 AmazonS3#listObjects(String, String)
相反,这样您就可以将返回的结果限制为与特定前缀匹配的键。这将减少响应消耗的网络带宽量和响应数据所需的处理量。
要获得更多选项,您还可以考虑 AmazonS3#listObjects(ListObjectsRequest)
或 AmazonS3#listObjectsV2(ListObjectsV2Request)
.
关于scala - 使用 AWS S3 Java 客户端获取目录和对象元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45444653/
我正在为我的程序编写安装脚本,它应该在 Linux/Unix 操作系统上运行。以下文件的默认目录是什么: 可执行文件(程序)。程序应通过从命令行键入其名称来执行。 共享库。 第三方共享库(程序未开源,
我有一堆用户、组和应用程序注册,我的 MVC 应用程序使用 AAD 数据进行身份验证和授权。是否可以将 Azure Active Directory 从一个租户(目录)迁移到另一个租户(目录)?如果可
查看 cljsbuild 文档 https://github.com/emezeske/lein-cljsbuild :cljsbuild { :builds [{ ; The
忽略已经版本控制的文件 如果你不小心添加了一些应该被忽略的文件,你如何将它们从版本控制中去除而不会丢失它们?或许你有自己的IDE配置文件,不是项目的一部分,但将会花费很多时间使之按照自己的方式工作。
我想使用\tableofcontents 命令,但没有目录从新页面开始或在末尾创建新页面,并且所有内容都是单倍行距。我怎样才能做到这一点?我假设使用 tocloft,但有哪些选择? 谢谢 最佳答案 试
我有一些 javascript 菜单代码,可以在单独的目录中正常工作。但是,当我尝试从同一目录中调用相同的 .js 文件时,它不会看到这些文件。 以下内容来自另一个目录: script type="t
我有这样的路径: /my/path/to/important_folder 在同一级别上,我还有其他文件和文件夹想要在达到与 important_folder 相同的级别时列出。 我的文件夹可能更深,
1、获取文件路径实现 1.1 获取当前文件路径 ? 1
我正在使用最新版本的 NTEmacs。 我写了一个名为“.dir-locals.el”的文件,如下所示。 ((nil . ((tab-width . 8) (fill-column .
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
在我的 .vimrc 中有这些行 :set foldmethod=marker :set foldmarker=SECTION:,ENDSECTION: 用于自定义代码折叠。在我的文件中,相关语言的注
在 fish 中: for x in * echo $x end *这里包括所有目录和文件,如何只列出文件(或目录)? 最佳答案 fish 没有很多花哨的通配语法。但是,目录可以像这样迭代: f
这是我的目录结构: ├── src │ ├── helpers │ │ ├── __init__.py │ │ ├── foo.py │ │ └── bar.py │
我想递归重命名文件夹/目录名称并找到 this solution所以。但是这个命令没有效果 find . -type f -exec rename 's/old/new/' '{}' \; 这是一个正
我想在相册中创建一个文件夹,并希望将图像保存在创建的相册中。 这可能吗?有什么办法可以做到这一点吗? 我已经搜索过,大多数人都说这是不可能的。 感谢您的帮助。 最佳答案 您也许可以使用AssetsLi
如何在python中使用用户定义的名称创建临时文件/目录。我知道 tempfile .但是我看不到任何以文件名作为参数的函数。 注意:我需要这个来对包含临时文件的临时目录上的 glob(文件名模式匹配
我在项目中使用JaCoCo Gradle插件。 作为问题的一个示例,我的大部分代码都在com.me.mysoftware包下。 我正在使用代码生成器来生成build/generated/java/..
我正在尝试使用 Gradle 开始运行 jar 文件 我的任务如下所示: task startServer(type: Exec) { workingDir file("${buildDir}/a
如何在 Ant 中定义一个目录集,其中包括两个目录:项目的基目录和子目录“test”? 看起来您无法使用“/”、“.”或“”专门包含目录集的根目录。例如,这包括“./test”,但不包括“.”:
我正在使用 CTAGs 包,它使用 Sublime Text 2 生成两个文件 .tags 和 .tags_sorted_by_file。 那么当我进行项目搜索(CMD + SHIFT + F)时,如
我是一名优秀的程序员,十分优秀!