java - 从 URL 下载 Java 文件 1) 您不知道扩展名[例如 .jpg] 或 2) 正在重定向到文件-6ren

java - 从 URL 下载 Java 文件 1) 您不知道扩展名[例如 .jpg] 或 2) 正在重定向到文件

转载作者：行者123 更新时间：2023-12-03 03:18:28

24

4

问题是虽然我知道如何从 URL 下载 File ，例如:

http://i12.photobucket.com/albums/a206/zxc6/1_zps3e6rjofn.jpg

<小时/>

当涉及到如下文件时:

https://images.duckduckgo.com/iu/?u=http%3......

我不知道如何下载它。

<小时/>

我用来下载带有 IOUtils 的文件的代码如果扩展名可见，则效果很好，但在上面的示例中返回:

java.io.IOException: Server returned HTTP response code: 500 for URL: https://images.duckduckgo.com/iu/?u=http%3A%2F%2Fimages2.fanpop.com%2Fimage%2Fphotos%2F8900000%2FFirefox-firefox-8967915-1600-1200.jpg&f=1

即使您删除 &f=1。

<小时/>

下载器的代码(用于测试目的......原型(prototype)):

import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.URL;
import java.net.URLConnection;

import org.apache.commons.io.IOUtils;

public class Downloader {

    private static class ProgressListener implements ActionListener {

    @Override
    public void actionPerformed(ActionEvent e) {
        // e.getSource() gives you the object of
        // DownloadCountingOutputStream
        // because you set it in the overriden method, afterWrite().
        System.out.println("Downloaded bytes : " + ((DownloadProgressListener) e.getSource()).getByteCount());
    }
    }

    /**
     * Main Method
     * 
     * @param args
     */
    public static void main(String[] args) {
    URL dl = null;
    File fl = null;
    String x = null;
    OutputStream os = null;
    InputStream is = null;
    ProgressListener progressListener = new ProgressListener();
    try {
        fl = new File(System.getProperty("user.home").replace("\\", "/") + "/Desktop/image.jpg");
        dl = new URL(
            "https://images.duckduckgo.com/iu/?u=http%3A%2F%2Fimages2.fanpop.com%2Fimage%2Fphotos%2F8900000%2FFirefox-firefox-8967915-1600-1200.jpg&f=1");
        os = new FileOutputStream(fl);
        is = dl.openStream();

        // http://i12.photobucket.com/albums/a206/zxc6/1_zps3e6rjofn.jpg

        DownloadProgressListener dcount = new DownloadProgressListener(os);
        dcount.setListener(progressListener);

        URLConnection connection = dl.openConnection();

        // this line give you the total length of source stream as a String.
        // you may want to convert to integer and store this value to
        // calculate percentage of the progression.
        System.out.println("Content Length:" + connection.getHeaderField("Content-Length"));
        System.out.println("Content Length with different way:" + connection.getContentType());

        System.out.println("\n");

        // begin transfer by writing to dcount, not os.
        IOUtils.copy(is, dcount);

    } catch (Exception e) {
        System.out.println(e);
    } finally {
        IOUtils.closeQuietly(os);
        IOUtils.closeQuietly(is);
    }
    }
}

DownloadProgressListener的代码:

import java.awt.event.ActionEvent;
import java.awt.event.ActionListener;
import java.io.IOException;
import java.io.OutputStream;

import org.apache.commons.io.output.CountingOutputStream;

public class DownloadProgressListener extends CountingOutputStream {

    private ActionListener listener = null;

    public DownloadProgressListener(OutputStream out) {
    super(out);
    }

    public void setListener(ActionListener listener) {
    this.listener = listener;
    }

    @Override
    protected void afterWrite(int n) throws IOException {
    super.afterWrite(n);
    if (listener != null) {
        listener.actionPerformed(new ActionEvent(this, 0, null));
    }
    }

}

我在发帖前读过的问题:

1) Download file from url that doesn't end with .extension

2) http://www.mkyong.com/java/how-to-get-url-content-in-java/

3) Download file using java apache commons?

4) How to download and save a file from Internet using Java?

5) How to create file object from URL object

最佳答案

正如评论中所指出的，扩展名无关紧要。

这里的问题是尝试下载可能是重定向或可能只是异步调用参数的内容。

您的没有扩展名的超大网址已损坏，但我可以回答其他类型的潜在解决方案。

如果您观察 URL:

https://images.duckduckgo.com/iu/?u=http%3A%2F%2Fimages2.fan‌pop.com%2Fimage%2Fph‌otos%2F8900000%2FFir‌efox-firefox-8967915‌-1600-1200.jpg&f=1

图像的 URL 确实存在。它只是经过编码，应该很容易解码。 Java 中包含了解码库(java.net.URLDecoder)，但是如果您想自己做，可以这样看:

http%3A%2F%2Fimages2.fan‌pop.com%2Fimage%2Fph‌otos%2F8900000%2FFir‌efox-firefox-8967915‌-1600-1200.jpg&f=1

编码部分为%XX哪里XX是任意两个字符。查看 HTML 编码表，您会看到 %3A显然，是一个冒号。 %2F是一个正斜杠。

如果替换所有编码实体，您最终将得到: http://images2.fan‌pop.com/image/ph‌otos/8900000/Fir‌efox-firefox-8967915‌-1600-1200.jpg&f=1

在这种情况下，您不需要额外的参数，因此您可以丢弃 &f=1并从原始 URL 下载图像。在大多数情况下，我想您可以保留额外的参数，并且它会被忽略。

--

简而言之:

提取原始网址
解码
下载

我想指出这是一个脆弱的解决方案，如果 URL 模式发生变化，就会崩溃，否则需要大量维护。如果您的目标用户不只是一小部分用户，您应该重新考虑您的方法。

HTML URL encoding table

关于java - 从 URL 下载 Java 文件 1) 您不知道扩展名[例如 .jpg] 或 2) 正在重定向到文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41905086/

24

4

0

文章推荐： Excel TODAY() 函数在 IF 公式中无法正常工作

文章推荐： azure - Windows Azure ServiceBus 中继澄清

文章推荐： sql - 无法在 SQL Azure for Mobile Services 上存储 Unicode 字符

文章推荐： sql - 比较数据库中一列存在但另一列不存在的记录

linux - 如何从证书文件(.crt 扩展名)生成证书请求和私钥文件(.pem 扩展名)
我有一个 .crt 文件。打开那个文件，我看到它以开头 -----BEGIN CERTIFICATE----- 如何从这个文件生成这 2 个文件？: 以-----BEGIN CERTIFICATE R
basic4android - 截断文件名 - 扩展名
我有一个文件被加载到 fd.ChosenName 并想知道是否有一个快速的解决方案，例如与 stringbuilder 相反的截断文件名(扩展名)以用于显示目的。因此，如果 fd.ChosenName
r - 将文件名拆分为名称、扩展名
我的文件名如下:name1.csv，我想提取该字符串的两个子字符串。一种将 name1 存储在一个变量中，另一种将扩展名 csv 存储在另一个变量中，但不带点。我一直在寻找是否有像 Java 的 i
java - 在java中确定上传文件的文件类型/扩展名
我正在尝试找出一种方法来确定我在 struts2 应用程序中上传的文件的文件类型。我的应用程序可以读取 CSV 和 XML 文件并根据上传的文件类型执行操作。我将该文件作为“File”类的实例。该文件
nlp - 如何自动检测首字母缩略词含义/扩展名
如何使用 NLP/信息提取 (IE) 方法检测/找出首字母缩略词的含义(扩展名)？我们希望检测自由文本中是否使用了单词或其首字母缩略词，并将其映射到相同的实体/标记。大多数在线论文都是关于医学缩略
检查 X11 扩展名
我正在编写一个 shell 脚本，该脚本需要改变其行为，并根据特定 X11 扩展的存在或不存在为被调用程序提供不同的选项。我有一个可行的解决方案，但我希望有一个更干净的解决方案。我愿意考虑一个简单的
python - 如何查找文件名的特定部分/扩展名？
我要查找文件名的扩展名，扩展名只能是3个字符。有点像， filename = str(input("Please enter filename: ")) 然后我想执行一个任务来查找扩展名，如果扩展名
php - 您允许文档管理应用程序使用哪些文件类型/扩展名？
我正在开发一种文档管理系统。最终用户是企业级用户。我目前仅检查并允许上传符合以下条件之一的文件: "png|jpe?g|gif|xls|doc|docx|csv|ppt|txt|pdf|rtf" 我
Java:jlist中的文件列表仅显示文件名+扩展名
尝试将文件列表添加到 Jlist，然后过滤 JList 中的文件以仅返回 .txt 文件和固定字符长度。还尝试删除返回的文件路径，并仅在文件 JList 中显示文件名+扩展名。到目前为止，除了删除文
python - 从二进制数据获取文件类型/扩展名
File.py file = fields.Binary('File') @api.multi def get_file(self): if self.file: xsl_fi
swift - 声明仅在文件范围内有效(扩展名)
我尝试使用导航 Controller 使我的应用程序处于纵向模式我收到此错误 iam usring Xcode7 and Swift 2 And Target System IOS 9.3 声明仅在文
linux - 检查目录中是否存在某种文件类型/扩展名
这个问题在这里已经有了答案: Test whether a glob has any matches in Bash (22 个回答) 关闭去年。您将如何使用 bash 判断目录中是否存在特定扩展名
curl - ffmpeg 仅返回视频类型(扩展名)
我正在开发转换器服务，我使用 FFMPEG 转换视频。我想检查输入文件，哪种真的是视频。我使用以下命令并获取文件类型。但是如果文件已经被操作过就无法理解了: curl -s -o /dev/nul
.htaccess - 重写规则以添加 .html 扩展名
我需要一个规则来添加 .html 扩展名，只要有“不”结尾的斜杠。一个新客户最近更改了电子商务脚本，新版本以不同的方式处理 SEO，并更改了他们所有 16,000 多个产品链接。这在站点被重新索引之
TYPO3 扩展名 : Generate a PDF
我正在尝试使用 Kickstarter 进行扩展以覆盖页面的正常呈现，并呈现 PDF 文件。为此我使用 FPDF。但我不确定该怎么做。我尝试这样做，但没有成功: AddPage();
processing - 哪种语言使用 .pde 扩展名？
在寻找巴恩斯利蕨分形的实现时，我遇到了一个具有 .pde 扩展名的实现。哪种编程语言使用此扩展？ Implementation Page 最佳答案此代码来自Processing.org，一个基于Ja
docker - 什么是 .dockerfile 扩展名？
Visual Studio Code (1.22.2) 提供了一个名为 .dockerfile 的文件扩展名。在保存对话框中。带有此扩展名的文件是什么？ Dockerfile 包含在所有文档和示例中，
gcc - GCC给出了一个没有错误的文件的错误，并说这是错误的文件格式/扩展名
我正在为32位计算机编译一个应用程序，因为该应用程序的创建者将其设置为64位。我确保所有库和DLL都是32位的。但是，我在编译时遇到问题。当我使用sh make.sh进行编译时，当它进入GCC构建部分
cakephp - 如何避免在下载或打开我的文件时附加 .html 扩展名
当我将文件保存在 img/upload 文件夹中时，文件会以正确的文件扩展名保存。但是，当我尝试下载该文件时，会附加一个 .htm 文件扩展名。我怎样才能避免这种情况？我在下面添加了我的代码； V
haskell - 为什么没有 `-XDeriveApplicative`扩展名？
GHC 有几种有用的语言 extensions用于机械派生各种常见的 Haskell 类型类(-XDeriveFunctor、-XDeriveFoldable、-XDeriveTraversable)

首页

博学

6Ren·AI

商城

java - 从 URL 下载 Java 文件 1) 您不知道扩展名[例如 .jpg] 或 2) 正在重定向到文件