java - 即时搜索 PB 级数据-6ren

java - 即时搜索 PB 级数据

转载作者：可可西里更新时间：2023-11-01 15:01:45

我需要在 CSV 甲酸盐文件中搜索超过 PB 的数据。使用 LUCENE 建立索引后，索引文件的大小是原始文件的两倍。是否可以减少索引文件的大小？？？ HADOOP中如何分发LUCENE索引文件以及如何在搜索环境中使用？或者是否有必要，我应该使用 solr 来分发 LUCENE 索引？？？我的要求是对 PB 级文件进行即时搜索....

最佳答案

Hadoop 和 Map Reduce 基于批处理模型。您不会从中获得即时响应速度，这不是该工具的设计目的。您也许可以使用 Hadoop 加快索引速度，但它不会执行您想要的查询操作。

看看Lucandra ，这是一个基于 Cassandra 的 Lucene 后端。 Cassandra 是另一个分布式数据存储，如果我记得的话，它是在 Facebook 开发的，旨在以比 hadoop 更面向查询的访问模型更快的访问时间。

关于java - 即时搜索 PB 级数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4791602/

文章推荐： amazon-s3 - 我无法让 Hadoop 开始使用 Amazon EC2/S3

文章推荐： javascript - jQuery - 每个计数重置问题

文章推荐： hadoop - HBase如何与PHP或其他连接

c - C 中的 Arctan Taylor 级数
我需要对反正切值执行泰勒级数 50 次。表示 arctan Taylor 级数的域之间的 50 个数字，即 [-1,1]。我已经用手动用户输入对其进行了测试并且它工作正常，但是我在代码中递增 0.01
java - 用 Java 编写一个程序来估计 PI (π) 使用 Leibniz 级数
我在网上看了几个小时，想看看我是否能找到解决方案，虽然我已经找到了很多解决方案，但我教授的指示如下: Write a program to estimate PI (π) using the foll
c - 级数:1 + 1/3 + 1/5 +...最多 N 项
我最近在编程测试中被问到这个问题。我似乎无法理解为什么我会得到答案“1”。我是 C 编程语言的初学者。这是我的代码: #include int main() { float c = 0;

可可西里

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

java - 即时搜索 PB 级数据