gpt4 book ai didi

java - HBase列宽扫描和抓取

转载 作者:行者123 更新时间:2023-12-02 20:21:26 25 4
gpt4 key购买 nike

假设我创建了一个表

rowkey(attrId+attr_value)//复合键

列=> 文档:文档1,文档:文档2,...

当使用扫描功能时,我每次都会在迭代器内获取1行,如果列限定符达到数百万个条目怎么办?你如何循环它,会出现缓存问题吗?

谢谢。

最佳答案

扫描获取行。您可以限定扫描,以便它仅获取给定的限定符或给定的系列,但这就是扫描返回的全部内容(并且您只能过滤扫描中包含的数据)。

如果单行中可能有数百万列,这可能是一个问题:这意味着返回该行可能是一个非常大的网络传输。如果您的行大小超过了区域大小,也可能会导致区域服务器上出现 OOM 错误,并且您的存储效率会很低(每个区域一行)。

但是,忽略所有这些,您可以在客户端中循环遍历列和列限定符。您可以从结果集中获取一个映射,该映射从系列映射到限定符再到值。但这可能不是您真正想做的

关于java - HBase列宽扫描和抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4790029/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com