- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在为我公司的 POC 实现一个小型 hadoop 集群。我正在尝试使用 Flume 将文件导入 HDFS。每个文件都包含这样的 JSON 对象(每个文件 1 个“长”行):
{ "objectType" : [ { JSON Object } , { JSON Object }, ... ] }
“objectType”是数组中对象的类型(例如:事件、用户...)。
这些文件稍后将根据“objectType”由多个任务处理。
我正在使用 spoolDir 源和 HDFS 接收器。
我的问题是:
是否可以在 flume 写入 HDFS 时保留源文件名(文件名是唯一的,因为它们的名称中包含时间戳和 UUID)
有没有办法将“deserializer.maxLineLength”设置为无限值(而不是设置一个高值)?
我真的不想丢失数据。哪个 channel 最好,JDBC 还是 File? (我没有高吞吐量的流程)
我的限制是我必须尽可能多地使用开箱即用的水槽(没有自定义元素)。
感谢您的帮助!
最佳答案
Is it possible to keep the source filename when flume write into HDFS (filenames are unique as they contains a timestamp and a UUID in their name)
是的。使用 spooldir 源,确保 fileheader 属性设置为 true。这将包括带有记录的文件名。
agent-1.sources.src-1.fileHeader = true
然后对于您的接收器,使用 avro_event 序列化程序在您的 avro flume 事件记录的 header 中捕获文件名。
agent-1.sinks.snk-1.serializer = avro_event
Is there a way to set "deserializer.maxLineLength" to an unlimited value (instead of setting a high value)?
deserializer.maxLineLength 没有无限配置。 https://github.com/apache/flume/blob/trunk/flume-ng-core/src/main/java/org/apache/flume/serialization/LineDeserializer.java#L143
I really dn't want to loose data. Which channel is the best, JDBC or File? (I do not have a flow with high throughput)
这可能取决于您的数据库或文件系统的弹性选项。如果你有一个带有备份的冗余数据库,那么 JDBC。如果你有一个有弹性的持久文件系统,那就去文件吧。
关于hadoop - 使用水槽将文件从假脱机目录移动到 HDFS,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27621671/
我注意到一些 PHP 框架只使用小写字母 true/false 而其他框架则使用大写字母。 这有什么区别吗?我个人更喜欢小写字母。 最佳答案 没什么区别,有些人认为 FALSE 是常量,因此使用旧的尖
在我看来,以下两种映射方式实际上没有区别。以下是基于 @MapsId javadoc 的示例: // parent entity has simple primary key @Entity publ
我想知道是否有人知道编译器如何解释以下代码: #include using namespace std; int main() { cout << (true && true || false &
我想知道为什么alert(new Boolean(false))打印 false 而不是打印对象,因为 new Boolean 应该返回对象。如果我使用 console.log(new Boolean
即使在 verify=False 时,Python 请求也会给我一个 ssl 握手失败(我知道不使用 SSL 是不可取的)。对于其他具有有效证书的站点,请求按预期工作。我正在使用2.7。 from l
TDPL 描述了 assert(false); 语句的行为。此类断言不会从发布版本中删除(与所有其他断言一样),并且实际上会立即停止程序。问题是为什么?为什么会有如此令人困惑的行为?他们可能会添加 h
如何确定文档是否存在于 Meteor 的集合中? 编辑:新代码。 mongodb 有一个 ProductName 的文档:Apples 输入产品是“苹果” var exists = Products.
我想在 R 中做一些相当复杂的事情,但我不确定从哪里开始。 我有一个看起来像这样的数据框: main_val sub_val bit_one bit_two one a 1
我正在尝试编写一个函数 long(S1,S2) 如果 S1 比 S2 长,则该函数应该为真,否则为假。到目前为止,我所拥有的是以下内容: longer(A,nil). longer(nil,B) :-
我想知道我在这里缺少什么我有一个代码可以检查图像是否基于 Canvas 是透明的。 function Trasparent(url, npc, clb) { var img = new Ima
我想在按下按钮时使其他类框架设置可见(false)。 有一个名为 DisplayScore 的类,该类获取 getContentPane().add(new ScoreInfo());来自 Score
我正在使用 TableLayout 和 TableRow 创建 6/6 网格按钮。 private Button myButton; private static final int
这个问题没有实际用途!我之所以问这个只是因为我很好奇! 在C++中,有一种方法可以通过在某处编写#define true false来将true伪造为false,然后在代码中到处的true都将被视为f
我不久前学习 java,所以也许我有一个愚蠢的问题。 我有一张表,我在其中存储了一些信息。我想在此表中检查一些信息的可用性(这将只有一行),如果是 - 从这一行中获取特定列中的信息,如果没有 - 做另
这是一个 JavaScript 问题... 我正在尝试返回完全不区分大小写的匹配项。例如,如果我在输入框中输入 "yo",我希望它返回 true,这在我当前的方法中是这样做的,但它也会返回 true
我认为,我在 JS 中写了一个直接的 if 语句,但它运行不正确。 function printLetter(LetterId) { var studentflag = $("#IsStude
我如何使用 Javascript 执行以下操作? var object function() { return { object: Return true if object
我试图让导航栏在向上滚动时向下滑动,并在单击#menu-bar 时保持固定。但是当我再次单击同一个按钮时,我不知道如何在自动隐藏时将值改回 false,就在我有两个按钮的时候。非常感谢任何帮助! $(
下面的代码 #include using namespace std; int main(){ char greeting[50] = "goodmorning everyone";
我正在使用数据源将数据填充到我的数据 GridView 中。但是,我正在尝试找到一种方法让用户能够隐藏他不想看到的列。 我可以在程序运行之前隐藏和显示列: [Browsable(false)] pub
我是一名优秀的程序员,十分优秀!