- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
由于某些原因,Hive无法识别以整数形式发出的列,但会识别以字符串形式发出的列。
Hive或RCFile
或GZ是否存在阻止int正确渲染的问题?
我的Hive DDL看起来像:
create external table if not exists db.table (intField int, strField string) stored as rcfile location '/path/to/my/data';
BytesRefArrayWritable dataWrite = new BytesRefArrayWritable(2);
byte[] byteArray;
BytesRefWritable bytesRefWritable = new BytesRefWritable(); intWritable.set(myObj.getIntField());
byteArray = WritableUtils.toByteArray(intWritable.get());
bytesRefWritable.set(byteArray, 0, byteArray.length);
dataWrite.set(0, bytesRefWritable); // sets int field as column 0
bytesRefWritable = new BytesRefWritable();
textWritable.set(myObj.getStrField());
bytesRefWritable.set(textWritable.getBytes(), 0, textWritable.getLength());
dataWrite.set(1, bytesRefWritable); // sets str field as column 1
Writables
中都有字节。
int
字段显示为
NULL
,
indicating some error。
SELECT * from db.table;
OK
NULL my string field
Time taken: 0.647 seconds
最佳答案
因此,我不确定为什么会这样,但是我可以使用以下方法使其工作:
在写代表整数值的字节数组的代码中,我不使用WritableUtils.toByteArray()
而不是Text.set(Integer.toString(intVal)).getBytes()
。
换句话说,我将整数转换为其String
表示形式,并使用Text
可写对象来获取字节数组,就好像它是字符串一样。
然后,在我的Hive DDL中,我可以将该列称为int
并正确解释它。
我不确定最初是什么原因引起的,可能是WritableUtils
中的错误,与压缩整数字节数组不兼容,还是对这部分内容的理解有误。无论如何,上述解决方案都能成功满足任务的需求。
关于hadoop - RCFile-发出GZip压缩的int列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18705296/
由于某些原因,Hive无法识别以整数形式发出的列,但会识别以字符串形式发出的列。 Hive或RCFile或GZ是否存在阻止int正确渲染的问题? 我的Hive DDL看起来像: create exte
我正在尝试将一个小的 RCFile(约 200 行数据)读入 HashMap 以执行 Map-Side 连接,但我在将文件中的数据变为可用状态时遇到了很多麻烦。 这是我目前所拥有的,其中大部分是从 t
尝试使用Hive读取Pig中的http://pig.apache.org/docs/r0.8.1/api/org/apache/pig/piggybank/storage/HiveColumnarLo
我不太理解Hadoop 中的NullWritable 的概念。它的用途是什么?为什么 RCFile 的 outputKeyClass 格式为 NullWritable.class 而 outputVa
在我的 django 项目中,我使用了一个写得很糟糕的外部编写的应用程序。现在我想从我的 pylint 报告中忽略这个应用程序,但是我不能让 pylint 忽略它。 Pylint 已经忽略了南迁,就像
根据 http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646 You can import data i
是否可以使用自定义 rcfile 和 仅错误标志运行 pylint?我希望 pylint 在典型用法中报告警告,但是当检查在我们的 CI 服务器上运行时,我想使用 --errors-only。 例如,
大家好。 我正在开发一个 python 项目,并负责清理 pylint 警告。事实是,代码的某些特定部分需要缩进或单词之间有间距,这与 Pylint 相悖。问题:有没有办法禁用 rcfile 中特定文
当我为类 org.apache.hcatalog.rcfile.RCFileMapReduceOutputFormat 运行作业时,我遇到了 ClassNotFoundException。 我尝试使用
考虑这段代码: def test(): """This line is longer than 80 chars, but, for me this is ok inside a DOCSTR
C:\Users\SCC\Desktop\xxx\web-shop\node_modules\antd\lib\upload\interface.d.ts (6,18): error TS2430:
我可以把它写成 ORC PARQUET直接和 TEXTFILE AVRO 使用来自数据块的附加依赖项。 com.databricks spark-csv_2.
我的 Pycharm 突然工作得很好,我看到了下面的错误消息。我有pycharm专业版 关于如何解决这个问题的任何建议 Cannot open Local Terminal Failed to sta
我是一名优秀的程序员,十分优秀!