- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Java 和 HTTP 请求的新内容。
为什么这个问题不是重复的:我没有使用 AWS SDK 来生成任何预签名的 URL。我从外部 API 获取它。
这是我想要完成的:
第 1 步:读取文件的源 S3 存储桶(目前为 .xlsx
)
第 2 步:通过将此文件转换为 InputStreamReader 来解析此文件(我在这里需要帮助)
第 3 步:通过将 InputStreamReader 的内容传输到 OutputStreamWriter,在我已经从外部团队获得的预签名 S3 URL 上执行此文件的 HTTP PUT。该文件必须位于目标 S3 存储桶中,就像通过拖放手动上传文件一样。 (这里也需要帮助)
这是我尝试过的:
第 1 步:读取文件的 S3 存储桶
public class LambdaMain implements RequestHandler<S3Event, String> {
@Override
public String handleRequest(final S3Event event, final Context context) {
System.out.println("Create object was called on the S3 bucket");
S3EventNotification.S3EventNotificationRecord record = event.getRecords().get(0);
String srcBucket = record.getS3().getBucket().getName();
String srcKey = record.getS3().getObject().getUrlDecodedKey();
AmazonS3 s3Client = AmazonS3ClientBuilder.standard()
.withCredentials(DefaultAWSCredentialsProviderChain.getInstance())
.build();
S3Object s3Object = s3Client.getObject(new GetObjectRequest(
srcBucket, srcKey));
String presignedS3Url = //Assume that I have this by making an external API call
InputStreamReader inputStreamReader = parseFileFromS3(s3Object); #Step 2
int responseCode = putContentIntoS3URL(inputStreamReader, presignedS3Url); #Step 3
}
第 2 步:将文件解析为 InputStreamReader
以将其复制到 OutputStreamWriter
:
private InputStreamReader parseFileFromS3(S3Object s3Object) {
return new InputStreamReader(s3Object.getObjectContent(), StandardCharsets.UTF_8);
}
第 3 步:通过将内容从 InputStreamReader
复制到 OutputStreamWriter
进行 HTTP PUT 调用:
private int putContentIntoS3URL(InputStreamReader inputStreamReader, String presignedS3Url) {
URL url = null;
try {
url = new URL(presignedS3Url);
} catch (MalformedURLException e) {
e.printStackTrace();
}
HttpURLConnection httpCon = null;
try {
assert url != null;
httpCon = (HttpURLConnection) url.openConnection();
} catch (IOException e) {
e.printStackTrace();
}
httpCon.setDoOutput(true);
try {
httpCon.setRequestMethod("PUT");
} catch (ProtocolException e) {
e.printStackTrace();
}
OutputStreamWriter outputStreamWriter = null;
try {
outputStreamWriter = new OutputStreamWriter(
httpCon.getOutputStream());
} catch (IOException e) {
e.printStackTrace();
}
try {
IOUtils.copy(inputStreamReader, outputStreamWriter);
} catch (IOException e) {
e.printStackTrace();
}
try {
outputStreamWriter.close();
} catch (IOException e) {
e.printStackTrace();
}
try {
httpCon.getInputStream();
} catch (IOException e) {
e.printStackTrace();
}
int responseCode = 0;
try {
responseCode = httpCon.getResponseCode();
} catch (IOException e) {
e.printStackTrace();
}
return responseCode;
}
中间方法的问题是,当我通过 S3 插入触发器读取 .xlsx
文件并将 PUT 放入 URL 时,当我下载上传的文件时 - 它会以一些乱码的形式下载。
当我尝试读取 .png
文件并 PUT 到 URL 时,当我下载上传的文件时 - 它被下载为带有一些乱码的文本文件(我确实看到了 PNG 这个词虽然它)
感觉我在以下方面犯了错误:
错误地创建了 OutputStreamWriter
,因为我不明白如何通过 HTTP 请求发送文件
假设每种文件类型都可以用通用的方式处理。
未在 HTTP 请求中设置 content-type
期望 S3 在 PUT 操作后神奇地理解我的文件类型
我想知道我的上述 4 个假设是否正确。
目的是,我正确地对文件数据执行 PUT,以便它与正确的文件类型/扩展名一起位于 S3 存储桶中。我希望我的努力值得获得一些帮助。我已经对 HTTP PUT 和文件/IO 进行了大量搜索,但我无法针对我的用例将它们链接在一起,因为我先执行文件 I/O,然后执行 HTTP PUT。
更新 1:
我添加了 setRequestProperty("Content-Type", "application/vnd.openxmlformats-officedocument.spreadsheetml.sheet")
,但该文件不在 S3 存储桶中文件扩展名。它只是作为一个对象坐在那里。
更新 2:
我认为这也与 setContentDisposition()
header 有关,尽管我不确定如何为 Excel 文件设置这些 header 。
更新 3:
这可能只与预签名 S3 URL 本身如何出售给我们有关。如问题中所述,我说过我们从其他团队获得了预签名 S3 URL。这个问题本身有多个部分需要回答。
Does the default Presigned S3 URL ALLOW clients to set the content-type
and content-disposition
in the HTTP header?: 我设置了另一个这里有一个单独的问题,因为它还不清楚:Can a client set file name and extension programmatically when he PUTs file content to a presigned S3 URL that the service vends out?
如果上述问题的答案是 TRUE,那么我们必须研究如何设置文件内容并将其写入 OutputStream
最佳答案
您正在使用 InputStreamReader 和 OutputStreamWriter,它们都是字节流和字符流之间的桥梁。但是,您将这些与字节数据一起使用,这意味着您首先将字节转换为字符,然后再转换回字节。由于您的数据不是字符数据,这种转换可能会解释为什么结果会出现乱码。
我开始尝试摆脱读取器和写入器,而是直接使用 InputStream(您已经从 s3Object.getObjectContent() 获得)和 OutputStream(您从 httpCon.getOutputStream() 获得)。 IOUtils.copy 也应该支持这个。
另请注意,当您构建 InputStreamReader 时,您将 StandardCharsets.UTF_8 设置为要使用的字符集,但当您构建 OutputStreamWriter 时,您没有设置字符集。如果默认字符集不是 UTF-8,这种转换也可能会导致乱码。
关于java - 使用 Java 从 S3 存储桶和 HTTP PUT 文件以模拟实际文件上传的方式读取文件到另一个存储桶的预签名 AWS S3 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61814582/
我遇到以下问题。我想读取一个包含数百万行和数百列的大型 csv。我想向下转换列的数据类型。我的方法是读取 csv,然后使用 pd.to_numeric() 对其进行向下转换。我不知道列数及其类型。在读
目前,我从 SQL server (2008) 数据库获取数据。 cyurrent的方法是使用DataTable,然后将其传递并使用。 if (parameters != null)
我有以下问题。我有一个巨大的 csv 文件,想用多处理加载它。对于一个包含 500000 行和 130 列不同数据类型的示例文件,Pandas 需要 19 秒。我试过 dask 因为我想多处理阅读。但
是否有关于用于序列化各种 MFC 数据结构的二进制格式的明确文档?我已经能够在十六进制编辑器中查看我自己的一些类,并使用 Java 的 ByteBuffer 类读取它们(使用自动字节顺序转换等)。 但
我正在使用 Selenium 进行测试,我们用 HTML 文件编写测试用例,并用它们制作测试套件,我们的要求是编写足够健壮的测试用例,以根据测试环境改变自身。 为此,我不希望在 HTML 脚本本身中包
我需要一个 JavaScript 代码来读取存储为 .txt 文件的字典(或者也可以保存为任何其他类型的文件。它也可以在线获得)并将其内容存储在一个变量中。我不能找到一种让 JavaScript 像
我正在尝试遍历包含 SSH 登录和其他日志的日志文本文件。 程序正在返回 SSH 登录的总数。 我的解决方案确实有效,但似乎有点慢(在 200mo 文件上大约需要 3.5 秒)。我想知道是否有任何方法
我正在将大量数据从一个电子表格复制到工作簿中的其他 160 个电子表格。目前,Excel (2013) 遇到错误,因为它没有足够的资源来完成操作。 我的目标是将工作表 4 中 V13:XI1150 范
我正在尝试读取一个有 1147 行的文本文件。下面的代码仅读取第 1050-1147 行。我的目标是读取整个文件并提取位于不同行的特定值以在脚本中使用。一个示例是包含“BlockList: 2”的行中
我正在为游戏编写解释器。用户将其移动输入解释器,程序执行该移动。 现在我想为每个决定实现一个时间限制。玩家不应该能够思考超过 30 秒来写一个移动并按下回车。 call_with_time_limit
以this file例如,我正在尝试读取 data.frame 中的数据。来自 the doc (pdf 文件,表 1),它遵循一些 fortran 约定。我尝试了以下但收效甚微: dir 0' 将
我正在使用 R 阅读 Outlook 附件。我的引用在这里:Download attachment from an outlook email using R 这是我的电子邮件的截图: 这每天都会发送
我不会从表格中读取行来将主题放在列表中 php脚本 $url_obj='http://'.$host.':8069/xmlrpc/object'; $sock=new xmlrpc_client($u
我有一个这样的 csv 文件: id,name,value 1,peter,5 2,peter\,paul,3 我如何读取此文件并告诉 R "\," 不表示新列,仅表示 ","。 我必须添加该文件
我正在尝试读取 ~/Library/Preferences/com.apple.mail.plist (在 Snow Leopard 上)以获取电子邮件地址和其他信息以进入“关于”对话框。我使用以下代
This question already has answers here: How do I use floating-point division in bash? (19个回答) 5个月前关闭
本练习的目标是读取输入文件并将其存储到表中,然后验证输入中的某些字段并输出任何错误记录。我需要读取并存储每个策略组,以便表中一次仅存储 5 条记录,而不是整个文件。 所以我需要读取一个包含 5 条记录
据我了解,LWT 插入始终以 SERIAL 一致性级别完成。如果为 true,这是否意味着读取作为 LWT 插入的行可以安全地以 ANY 的一致性级别读取? 换句话说,我假设 LWT 插入是完全一致的
我看到很多很多通过java脚本读取cookie的函数,但我只想在变量中使用它一次,我是JS新手。 这是我的代码 var TheNumber = (Math.random() + '') * 10000
我正在使用 asp.net 和 C#。我在服务器上部署了一个应用程序[已发布],现在我想查看该网站的代码,据我所知,我可以阅读程序集来查看代码。 请告诉我如何实现它。 提前致谢。 最佳答案 您可以使用
我是一名优秀的程序员,十分优秀!