java - Hadoop和jgit在java.io.file和dataoutputstream之间转换-6ren

java - Hadoop和jgit在java.io.file和dataoutputstream之间转换

转载作者：行者123 更新时间：2023-12-01 14:44:42

27

4

您好，我正在尝试在 git 存储库上运行映射缩减作业。我想使用映射作业首先将所有存储库同时克隆到 hdfs，然后对文件执行进一步的映射减少作业。我遇到了一个问题，因为我不确定如何将存储库文件写入 hdfs。我见过写入单个文件的示例，但这些示例位于映射器之外并且仅写入单个文件。 jgit api仅公开一个继承自file的文件存储库结构，但hdfs使用写入数据输出流的路径。有没有在两者之间进行转换的好方法或任何执行类似操作的示例？

谢谢

最佳答案

Hadoop Mapper 的输入数据必须位于 HDFS 上，而不是位于本地计算机或 HDFS 以外的任何位置。 Map-reduce 作业并不意味着将数据从一个地方迁移到另一个地方。它们用于处理 HDFS 上存在的大量数据。我确信您的存储库数据不是 HDFS，如果是，那么您首先不需要执行任何操作。因此，请记住，map-reduce 作业用于处理 HDFS(Hadoop 文件系统)上已有的大量数据。

关于java - Hadoop和jgit在java.io.file和dataoutputstream之间转换，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15553722/

27

4

0

文章推荐： c++ - 通过带有Visual Studio 2015的NuGet包的OpenCV，如何配置？

文章推荐： Java Awt 钢笔工具 : Graphic disappeared

文章推荐： java - 具有加权柏林噪声的 map 生成器

文章推荐： java.lang.NullPointerException

java - DataOutputStream() VS DataOutputStream(新缓冲输出流())
代码在Java Tutorials显示了使用 DataOutputStream 类和 DataInputStream 类的示例。代码片段如下所示: //.. out = new DataOutput
java - ByteBuffer 的 DataOutputStream.readBoolean 和 DataOutputStream.writeBoolean 等效吗？
我怎样才能做类似ByteBuffer.putBoolean和ByteBuffer.getBoolean的事情？与DataInputStream一样，有readBoolean，而DataOutputS
Java DataOutputStream 不向套接字发送数据
这个问题在这里已经有了答案: Java Socket why server can not reply client (4 个回答) 2年前关闭。我有一个使用套接字与另一台计算机通信的 java 应
java - DataOutputStream 不同的方法
我在应用程序中使用此代码来发送一些字符串并抛出套接字。 public class OutgoingData { public static DataOutputStream dos = null; p
java - DataOutputStream 仅在关闭时发送
当我在没有 close 方法的情况下运行此代码时，服务器无法接收消息! 客户: Socket con = new Socket(InetAddress.getByName("local
java - DataOutputStream 无法实例化
DataOutputStream salida; salida = new DataOutputStream(socket.getOutputStream()); Error:(35, 24) ja
java - DataOutputStream 在内部保存整个缓冲区？
在下面的代码中。我正在将文件读入一个小缓冲区(len = CHUNK_SIZE)，我只想将此缓冲区写入输出流。但即使我在每个 block 之后刷新，我也会遇到堆溢出异常。好吧，如果我想流式传输小文件，
java - DataOutputStream 好像没有发送参数
我尝试使用 DataOutputStream 发送 POST 数据并获取响应数据。我是这样编码的。 String urlParameters = "table=page&format=xml
java - DataOutputStream 不断给出空指针异常
所以我尝试将我的代码与 DataInputStream 和 BufferedReader 一起使用将字符串从客户端发送到服务器，并在整个互联网上查找资源来解决此问题。我正在使用一种从客户端读取字符串的
java - DataOutputStream 未清空缓冲区
我正在开发服务器/客户端通信程序，但遇到了一个问题。当我尝试从客户端发送消息时，它无法正常工作。初始化服务器后，我连接客户端并且成功。当我尝试从客户端发送消息时，服务器不会收到它们。关闭客户端连接后，
java - DataOutputStream 不生成字节作为输出？
DataOutputStream 类用于将原始数据类型写入二进制格式。我一直在使用DataOutputStream类的方法void writeChars(String s)，使用程序将其写入文件中..
java - 无法在套接字列表循环中获取套接字的 DataOutputStream
我正在尝试使用 Java 创建一个客户端/服务器程序，其中客户端将简单的字符串发送到服务器，并且连接到服务器的每个客户端都会获取此字符串。因此，我为服务器创建了 2 个服务器类，它们为每个客户端创建新
java - DataOutputStream-总是写入服务器？
对于简单的 2D 游戏，我需要我的客户端程序始终将坐标发送到服务器。因此，我创建了一个测试，看看是否可以通过从服务器发送和检索值来使两个玩家具有相同的速度。 package main; import
java - DataOutputStream 空指针异常
我在 Android 中的 DataOutputStream 上收到了一个 NullPointerException。我首先编写了一些代码，使用 DataOutputStream 在 Java 中写
java - DataOutputStream 模拟抛出的空指针异常
我正在为包装 TCP 套接字的类编写单元测试(使用 Mockito 作为我的模拟库)。问题是任何在 DataOutputStream 上调用 writeBytes 的测试都会抛出空指针异常。我在下面
Java DataOutputStream 只工作一次
我有一个基本的聊天应用程序。有 3 个类:服务器、客户端和 clientHandler。问题是服务器只能第一次读取(使用 DataInputStream)然后抛出异常。 Hello. I have a
java - DataOutputStream，它是否丢失了一些位
我正在编写一个客户端服务器应用程序，但是当它们从服务器端发送时，我在客户端没有收到相同的字节。在服务器端，我使用了 .write(bytes[]) 方法。在客户端，我使用了 .readFully(by
Java 将单个字节写入 DataOutputStream
我正在为 HTTP post 请求将单个字节写入 java 中的 DataOutputStream。帖子的结构如下: /* Init Post */ URL PostToLink = new URL(
android - DataOutputStream 的字符串太大
我正在尝试将一个大字符串写入我的 DataOutputStream，但是我收到了一个 UTFDataFormatException，上面写着: 长度超过 65535 个 UTF 字节的字符串当我打电
java - DataOutputStream 卡住
我制作了一个简单的服务器应用程序，用于将图像发送到连接的客户端。我在主线程中有一个循环，它接受传入的连接，并从相应的套接字创建一个 Client 对象。我有一份活跃客户名单。每次有新图片可用时，我都会

首页

博学

6Ren·AI

商城

java - Hadoop和jgit在java.io.file和dataoutputstream之间转换