hadoop - 确实从hdfs导入数据到hbase创建了一个副本-6ren

hadoop - 确实从hdfs导入数据到hbase创建了一个副本

转载作者：行者123 更新时间：2023-12-02 21:41:44

26

4

我对Hbase概念非常陌生。我了解HBase的基础文件系统仅是HDFS。

我只是想了解一下，如果在单个群集中，HDFS中已经有一些数据。我尝试将其导入HBase(使用Pig / Hive脚本)，它将以Hbase支持(HFiles)的形式在HDFS中创建相同数据的另一个副本(因为HBase的基础文件系统为HDFS)？

还是会创建对相同HDFS数据的引用？

最佳答案

是的，因为HBase只能使用自己的文件集进行操作，它将在HDFS中存储导入数据的副本(作为StoreFiles / HFiles)。也许您会发现这个nice overview很有趣。

您可以直接使用HDFS中存储的数据进行操作，而无需使用EXTERNAL HIVE table将其导入到HBase中:

CREATE EXTERNAL TABLE page_view(viewTime INT, userid BIGINT,
     page_url STRING, referrer_url STRING,
     ip STRING COMMENT 'IP Address of the User',
     country STRING COMMENT 'country of origination')
 COMMENT 'This is the staging page view table'
 ROW FORMAT DELIMITED FIELDS TERMINATED BY '\054'
 STORED AS TEXTFILE
 LOCATION '<hdfs_location>';

在Hadoop世界中，具有相同数据的多个副本(尽管格式不同)应该不是问题，因为存储不被视为限制因素，它便宜且易于扩展，因为它基于商品硬件。实际上，如果您有足够的输入数据，则很常见的是Hive / Pig / MapReduce作业仅需要数百或数千GB(中间数据)来处理您的作业。

关于hadoop - 确实从hdfs导入数据到hbase创建了一个副本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28266881/

26

4

0

文章推荐： java - Hadoop:获取特定 MapReuce 任务的机器主机名

文章推荐： RabbitMQ 问题 - 有没有办法将日志消息打印到控制台？

文章推荐： jhipster - 如何卸载generator-jhipster

文章推荐： hadoop - 无法从第二次Oozie工作流程作业中启动Hive Action

mysql - 比较两列 : <= does not work, 但 >= 确实
我要选择column1小于或等于 column2 的数据.但是，当我尝试使用 { console.log(notify) res.render('index', { title
Javascript 到空白文本框值不会工作，但 jquery 确实
我在页面中有一个更新面板，供用户指定事件的“所有者”。该所有者将是我们事件目录中的用户。该面板允许用户输入一些文本，然后单击搜索按钮以在我们的 Active Directory 中查找匹配的用户。当用
javascript - 确实 - window.document 和窗口内的文档不一样。 Chrome
我想知道为什么同一个实体在控制台中调用的浏览器 window 对象中有不同的表示: 如果我们仅在浏览器控制台内调用window，我们将获得完整的浏览器信息。其中文档将表示为类似对象的实体，包括各种 P
c# - “隐式”垃圾收集不会减少内存占用。 GC.Collect() 确实
我有一个正在处理大量数据的应用程序，我正在监视它的 .NET 内存性能计数器。基于性能计数器，所有堆中的#Bytes 正在缓慢增长(每 12 小时约 20MB)。所有 3 代也被收集(gen0 每秒几
objective-c - 确实-[CALayer drawInContext :] do something?
According to documentation 默认实现不执行任何操作。但是...我从 drawRect 方法中抛出异常并且我看到了下一个调用堆栈 3 EasyWakeup
java - Spring Boot 在远程服务器上立即关闭(确实)，没有错误
我使用 package maven 插件构建了一个 Spring 应用程序的 jar。在本地，我可以运行它java -jar -Dspring.profiles.active=dev target/m
c# - MediaFoundation 找不到视频捕获仿真器驱动程序。但 DirectShow 确实
我们正在开发一种软件，我们可以在其中预览和记录从视频采集卡采集的输入视频源。预览是用DirectShow实现的，录制是用Media Foundation实现的(老软件慢慢升级到MediaFound
php - symfony : setHttpHeader() doesn't work, header() 确实
我在 symfony 中构建了一个简单的操作，它通过 wkhtmltopdf 生成一个 PDF 文件并将其输出到浏览器。代码如下: $response = $this->getResponse(
python - pip 没有安装我的数据文件。但是 easy_install 确实
这将是一个简短的问题。来源在这里:https://github.com/exhuma/grc 标题解释了我的问题；) 我注册并上传了包到pypi。现在，如果我运行 easy_install grc，
linq-to-sql - LINQ to SQL-确实，SubmitChanges()自动启动事务吗？
我需要将事务与LINQ to SQL一起使用，并且正在阅读以熟悉它。确实已处理SubmitChanges吗？最佳答案当您调用SubmitChanges时，LINQ to SQL将检查一组已知对象
jquery - 为什么 Jquery fadeOut() 不起作用？ Hide() 确实
在 Ajax 结果之后，我试图淡出 html 按钮。这在大多数情况下都有效，但有时按钮不会淡出，我不明白为什么。 $.ajax({ type: frm.attr('method'),
javascript - Cesium.PolylineGeometry 不起作用。 Cesium.SimplePolylineGeometry 确实
我以这样的方式创建 Cesium.Primitive: _createPrimitive: function (linesNumber) { var instances = [
java - 确实<上下文:annotation-config/> handles HTTP requests
我正在 Spring 上构建一个 Web 应用程序。我很困惑是否应该在配置中使用 mvc:annotation-driven 还是 context:annotation-config 来扫描注释来处
c++ - String & 没有反射(reflect)所做的更改但是 String 确实……在传递参数时？
问题 - 给定一个字符串 '0'、'1' 和 '?'。生成所有可能的字符串，您可以在其中替换“？”用“0”或“1”？例如 - 输入 - “0??” 输出 - “000”、“001”、“010”、“0
c++ - wxwidgets Event Table/Bind() 事件似乎没有触发，Connect() 确实
总结: 修改wxwidgets Hello World tutorial中的代码后在 CppMicroServices 框架中的“模块”中，使用事件表或 Bind() 注册的事件似乎不会触发，但使用
ruby - File.read() 在我的 Capistrano 任务中失败(文件*确实*存在)
我的 Capistrano 任务失败了 No such file or directory @ rb_sysopen - /home/blog/pids/grantb.blog.staging.pid
git - 如果在 repo 中发生更改，是否可以停止跟踪您*确实*想要 pull 下的文件的本地更改？
我们在 repo 协议(protocol)中有一个配置文件，所有用户都根据他们的功能做出贡献。对于我的本地测试，我需要手动更改该配置文件中的两个值，但我不想将我的更改提交回服务器。但是，如果存储库中
jQuery .show ('slide' ，{ 方向 : 'right' }) doesn't work, 但 .show ('slide' ) 确实
我在顶部菜单(ListItems)的开头插入一个菜单选项并使用 $('#newMenuItem').show('slide'); 成功了。但是，我不喜欢它从左上角滑入的方式，所以我将其更改为 $('#
objective-c - NSWindows 的 setFrame :display:animate: doesn't work, setFrame:display: 确实
我尝试在我的 NSWindow 上调用 setFrame:display:animate: 并且没有执行任何操作，但是如果我在同一个窗口上调用 setFrame:display:，它有效。我需要做其

首页

博学

6Ren·AI

商城

hadoop - 确实从hdfs导入数据到hbase创建了一个副本