gpt4 book ai didi

java - HBase 不存储所有记录

转载 作者:可可西里 更新时间:2023-11-01 16:33:28 24 4
gpt4 key购买 nike

我的 MongoDB 数据库中有 120 万条记录。我想以编程方式将所有这些数据存储在 HBase 中。基本上我尝试将每个检索到的记录循环放入 HBase。操作完成后,我在HBase上得到只有39912条记录。

这是我尝试过的:

Configuration config = HBaseConfiguration.create();
String tableName = "storedtweet";
String familyName = "msg";
String qualifierName = "msg";
HTable table = new HTable(config, tableName);
// using Spring Data MongoDB to interact with MongoDB
List < StoredTweet > storedTweetList = mongoDAO.getMongoTemplate().findAll(StoredTweet.class);
for (StoredTweet storedTweet: storedTweetList) {
Put p = new Put(Bytes.toBytes(storedTweet.getTweetId()));
p.add(Bytes.toBytes(familyName), Bytes.toBytes(qualifierName), Bytes.toBytes(storedTweet.getMsg()));
table.put(p);
table.flushCommits();
}

最佳答案

如果某些行键存在并且您再次放置它,HBase Put 将覆盖前者。我认为您的数据中有一些记录具有相同的推文 ID(您将其设置为行键)。这就是一些记录消失的原因。

关于java - HBase 不存储所有记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18459480/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com