java - 我应该为 "com.datastax.driver.core.exceptions.ReadTimeoutException"做什么？-6ren

java - 我应该为 "com.datastax.driver.core.exceptions.ReadTimeoutException"做什么？

转载作者：行者123 更新时间：2023-11-30 03:09:11

25

4

我将近1.9亿条记录放入具有3个节点的Cassandra(2.1.11)集群中，复制因子为1，然后我编写客户端应用程序来计算所有记录均使用 datastax's Java Driver ，片段代码如下:

Statement stmt = new SimpleStatement("select * from test" );

System.out.println("starting to read records ");
stmt.setFetchSize(10000);
ResultSet rs = session.execute(stmt);

//System.out.println("rs.size " + rs.all().size());
long cntRecords = 0;

for(Row row : rs){
    cntRecords++;

    if(cntRecords % 10000000 == 0){
        System.out.println("the " + cntRecords/10000000 + " X 10 millions of records");
    }
}

上面的变量cntRecords超过3000万之后，我总是得到异常:

Exception in thread "main" com.datastax.driver.core.exceptions.ReadTimeoutException: 
Cassandra timeout during read query at consistency ONE (1 responses were required but only 
0 replica responded)

我在google上得到了几条结果，并更改了有关堆和GC的设置，以下是我的相关设置:

-XX:InitialHeapSize=17179869184 
-XX:MaxHeapSize=17179869184 
-XX:MaxNewSize=12884901888 
-XX:MaxTenuringThreshold=1 
-XX:NewSize=12884901888 
-XX:+UseCMSInitiatingOccupancyOnly 
-XX:+UseCompressedOops 
-XX:+UseConcMarkSweepGC 
-XX:+UseCondCardMark 
-XX:+UseGCLogFileRotation 
-XX:+UseParNewGC 
-XX:+UseTLAB 
-XX:+UseThreadPriorities
-XX:+CMSClassUnloadingEnabled

我用了GCViewer分析gc日志文件，吞吐量分别为99.95%、98.15%和95.75%。

更新开始:我使用jstat监控三个节点之一，发现当S1的值变为100.00时，我会得到上面的错误快点:

/usr/java/jdk1.7.0_80/bin/jstat -gcutil 8862 1000 
S0     S1     E      O      P     YGC     YGCT    FGC    FGCT     GCT   
0.00 100.00  28.57  36.29  74.66     55   14.612     2    0.164   14.776

而一旦S1变为100.00，S1就不再减少，不知道这和误差有关吗？或者我应该为此设置 cassandra.yaml 或 cassandra-env.sh 中的哪些属性？

如何完成统计所有记录的任务？提前致谢!

附加: 以下是其他选项:

-XX:+CMSEdenChunksRecordAlways 
-XX:CMSInitiatingOccupancyFraction=75 
-XX:+CMSParallelInitialMarkEnabled 
-XX:+CMSParallelRemarkEnabled 
-XX:CMSWaitDuration=10000 
-XX:CompileCommandFile=bin/../conf/hotspot_compiler 
-XX:GCLogFileSize=94371840 
-XX:+HeapDumpOnOutOfMemoryError 
-XX:NumberOfGCLogFiles=90 
-XX:OldPLABSize=16 
-XX:PrintFLSStatistics=1 
-XX:+PrintGC 
-XX:+PrintGCApplicationStoppedTime 
-XX:+PrintGCDateStamps 
-XX:+PrintGCDetails 
-XX:+PrintGCTimeStamps 
-XX:+PrintHeapAtGC 
-XX:+PrintPromotionFailure 
-XX:+PrintTenuringDistribution 
-XX:StringTableSize=1000003 
-XX:SurvivorRatio=8 
-XX:ThreadPriorityPolicy=42 
-XX:ThreadStackSize=256

最佳答案

检查为什么您需要知道行数。您的应用程序真的需要知道这一点吗？如果它可以“仅仅”有一个很好的近似值，那么创建一个计数器并在加载数据时递增它。

http://docs.datastax.com/en/cql/3.1/cql/cql_using/use_counter_t.html

您可以尝试的事情:

选择单个列而不是*。这可能会减少 GC 压力和网络消耗。最好选择字节数较少且属于主键一部分的列:select column1 from test
每 1M 条记录后添加一个短暂的暂停。每 1M 条记录让循环暂停 500 毫秒左右。这可能会让节点喘口气来处理 GC 之类的事情
编辑节点上的 cassandra.yaml 并增加 range_request_timeout_in_ms 和 read_request_timeout_in_ms
找出分配给每个节点的 token 范围，并对每个 token 范围发出单独的查询。添加每个查询的计数。这利用了 token 感知驱动程序将每个“ token 范围”查询直接发送到可以回答它的节点。看这个blog article获取完整说明和示例代码。

关于java - 我应该为 "com.datastax.driver.core.exceptions.ReadTimeoutException"做什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33993619/

25

4

0

文章推荐： java - Jersey Jetty Embedded 无法读取路径注释，错误 404

文章推荐： java - Hibernate HQL - query.list() 返回对象数组的对象数组

文章推荐： java - MapStruct:Object.class 到 Custom.class 映射

com - COM 内存泄漏的常见原因是什么？
COM 内存泄漏最常见的原因是什么？我读过将初始化的 CComBSTR 的地址作为 [out] 参数传递给函数会导致泄漏。我正在寻找像这样枚举其他常见的编程错误。最佳答案未能为 COM 对象使用
com - COM 中的内存管理
在COM服务器执行过程中分配一 block 内存，然后通过一个输出参数将该内存块传递给客户端是很常见的。然后，客户端有义务使用 CoTaskMemFree() 等方法释放该内存。问题是，这 bloc
com - MFC COM 或 ATL COM (ActiveX)
我有一些 MFC 代码(自定义 CWnd 控件和一些要公开的类)，我需要将它们制作成带有接口(interface)的 activex/COM 对象。使用 MFC 支持制作 ATL 项目并以这种方式制作
com - 制作一个 .com 程序来调用 .exe(比如 devenv.com)
Devenv.com 是 visual studio 命令行界面，当您键入 devenv/? 时，devenv 的帮助会出现在控制台上。但是，如果没有任何选项，devenv.com 只会调用 deve
com - 从 COM 库传递对 COM 接口(interface)的引用
如何将 COM 接口(interface)的引用作为 COM 库中的参数传递？这是示例: 1)客户端代码成功创建coclass并接收到pFunctionDiscovery中的接口(interface
django - 'foo.bar.com.s3.amazonaws.com' 不匹配 '*.s3.amazonaws.com' 、 's3.amazonaws.com'
我正在使用 django，我在 s3 中存储了诸如 imgs 之类的东西(为此我使用的是 boto)，但最近我收到了这个错误: 'foo.bar.com.s3.amazonaws.com' doesn
windows - 将 COM 对象导入 COM+ 应用程序，同时保留直接访问 COM 对象？
我已经使用组件服务 MSC 对话框创建了一个 COM+ 应用程序。我将一个现有的 COM 对象导入到这个新的 COM+ 应用程序中。我知道可以通过 COM+ 应用程序调用该 COM 对象。我可以简单
php - stackoverflow.com、airbnb.com、google+、facebook.com 等开发中使用的工具？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 11 年前。 Improve thi
c# - COM Interop 挂起会卡住整个 COM 系统。如何取消 COM 调用
我正在使用通过 COM Interop 包装器公开的第三方 dll。但是，其中一个 COM 调用经常卡住(至少从不返回)。为了至少让我的代码更健壮一些，我异步包装了调用(_getDeviceInfoW
php - 将 www.domain.com/example.com 重定向到 example.com
很多年前我读到有一个简单的 php 脚本可以将您的网站重定向到 http://example.com/google.com 到 google.com它适用于正斜杠右侧的任何域。我忘记了这个脚本是什么或
com - 进程外 COM 服务器的注册表项
我正在实现我的第一个进程外 COM 服务器(我的第一个 COM 服务器，就此而言)。我已经按照步骤编写了一个 IDL 文件，为代理/ stub DLL 生成代码，编译 DLL，并注册它。当我检查注册
com - COM RCW 上的地址
是否可以在未知接口(interface)上增加 RCW 引用计数？ (即不是底层 COM 对象的引用计数) 我有一些旧的 COM 服务器代码 int Method1(object comobject)
com - 大多数对象不支持 COM 聚合吗？
我注意到许多关于 COM 的书籍等都指出，在 COM 聚合中实现一个可用作内部对象的对象相对容易。但是，除非我遗漏了什么，否则聚合似乎只能在极其有限的场景中成功，因此只有在明确识别出这种场景时才应提供
com - 如何在运行时注册 COM 库？
假设我正在开发一个安装 COM 组件并安装程序注册它们的应用程序。这很好用。现在该软件需要从内存棒上运行。如何注册我的库运行时并确保在运行应用程序后清理注册表？最佳答案您总是在 XP 或更高版本
com - ActiveX/COM/VB6企业项目的生成过程
我们已经使用Microsoft的ActiveX/COM(VB6)技术开发了一个软件系统。去年，我对自动化构建过程和整个SCM越来越感兴趣。我集中搜索了网络的大部分内容，以获取有关如何使用基于COM的软
com - 避免 COM 编码
我对 com 线程模型有点困惑。我有一个 inproc 服务器，我想创建一个可从任何线程访问的接口(interface)，而不管 CoInitializeEx 中使用的线程模型和/或标志。当将接口
com - MSIX -> COM 服务器的本地激活权限
我的包以旁加载方式安装，并不断遇到特定于应用程序的权限错误。是的，许多人建议在 regedit 和组件服务中手动更改权限和所有者。我的应用实际上在组件服务(DCOMCNFG、DCOMCNFG -3
com - 应用程序不返回时指向 COM 对象的指针
我正在使用第三方应用程序，并调用创建的实例。我的 COM 对象。这个调用成功了，但是第三方应用程序上的函数没有返回指向创建对象的指针(我不知道为什么)。有没有办法获得指向我的对象的指针？为了澄清，
com - 使用 COM 互操作时如何管理对象生命周期？
我有一个用 C# 编写的托管 COM 对象和一个用 C++(MFC 和 ATL)编写的 native COM 客户端和接收器。客户端创建对象并在启动时向其事件接口(interface)提供建议，并在其
com - 为什么我不能注册我的 COM DLL？
我的应用程序需要注册两个 COM DLL。如果用户有必要的访问权限，它会自动完成，否则可以使用 regsvr32 完成。 . 现在在一些工作站上会发生以下情况: 开始cmd.exe作为管理员注册第一

首页

博学

6Ren·AI

商城

java - 我应该为 "com.datastax.driver.core.exceptions.ReadTimeoutException"做什么？