gpt4 book ai didi

java - Apache Tika 从 FTP 文件流解析

转载 作者:行者123 更新时间:2023-12-01 09:53:10 24 4
gpt4 key购买 nike

我正在使用 Apache Tika 解析器使用以下代码读取本地文件系统中的文件内容

          ContentHandler textHandler = new BodyContentHandler();
Metadata metadata = new Metadata();
ParseContext context = new ParseContext();
InputStream input = new FileInputStream(file);

try {
_autoParser.parse(input, textHandler, metadata, context);
} catch (Exception e) {

log(String.format("File %s failed", file.getCanonicalPath()));
e.printStackTrace();
continue;
}

list.add(textHandler.toString);

现在我想从 FTP 位置获取文件,有什么方法可以在运行时解析 FTP 中的文件而不将它们下载到任何位置。

最佳答案

尝试Apache Commons Net库来获取 FTP 文件的 InputStream。

示例:

    String server = "www.myserver.com";
int port = 21;
String user = "user";
String pass = "pass";

FTPClient ftpClient = new FTPClient();

ftpClient.connect(server, port);
ftpClient.login(user, pass);
InputStream inputStream = ftpClient.retrieveFileStream("/test/test1.txt");

关于java - Apache Tika 从 FTP 文件流解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37466929/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com