elasticsearch - ES 查询异常-6ren

elasticsearch - ES 查询异常

转载作者：行者123 更新时间：2023-12-03 02:21:09

25

4

我正在使用带有 Elasticsearch-7.2.0 的 Stormcrawler 1.16。 java 版本是 1.8.0_252 。 Storm 版本是 1.2.3，maven 版本是 3.6.3。

我已经使用 mvn 原型(prototype)创建了项目-

    mvn archetype:generate -DarchetypeGroupId=com.digitalpebble.stormcrawler - 
    DarchetypeArtifactId=storm-crawler-elasticsearch-archetype -DarchetypeVersion=LATEST

我创建了一个seeds.txt 文件并仅放置9 个用于测试的url，并使用REAEDME.md 文件中给出的命令在--remote 模式下提交了拓扑。

它成功运行并按预期抓取页面。

但是当我将 8000 个 URL 放入种子文件时出现问题。

我再次运行 ES_IndexInit.sh 文件并使用与之前相同的命令提交拓扑。
然后我得到这个错误 -

at java.lang.Thread.run(Thread.java:748) [?:1.8.0_252]
     2020-06-12 11:26:11.416 c.d.s.e.p.AggregationSpout pool-12-thread-1 [ERROR] [spout #1]  Exception with ES query
    java.net.ConnectException: Connection refused
at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method) ~[?:1.8.0_252]
at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:714) ~[?:1.8.0_252]
at org.apache.http.impl.nio.reactor.DefaultConnectingIOReactor.processEvent(DefaultConnectingIOReactor.java:174) [stormjar.jar:?]
at org.apache.http.impl.nio.reactor.DefaultConnectingIOReactor.processEvents(DefaultConnectingIOReactor.java:148) [stormjar.jar:?]
at org.apache.http.impl.nio.reactor.AbstractMultiworkerIOReactor.execute(AbstractMultiworkerIOReactor.java:351) [stormjar.jar:?]
at org.apache.http.impl.nio.conn.PoolingNHttpClientConnectionManager.execute(PoolingNHttpClientConnectionManager.java:221) [stormjar.jar:?]
at org.apache.http.impl.nio.client.CloseableHttpAsyncClientBase$1.run(CloseableHttpAsyncClientBase.java:64) [stormjar.jar:?]
at java.lang.Thread.run(Thread.java:748) [?:1.8.0_252]

然后我在 worker.log 文件中查找错误。我在那里发现了同样的错误。
然后我检查我的碎片的健康状况 -

      {
   "cluster_name" : "my-cluster1",
  "status" : "green",
  "timed_out" : false,
  "number_of_nodes" : 1,
   "number_of_data_nodes" : 1,
   "active_primary_shards" : 2,
    "active_shards" : 2,
   "relocating_shards" : 0,
    "initializing_shards" : 0,
    "unassigned_shards" : 0,
  "delayed_unassigned_shards" : 0,
   "number_of_pending_tasks" : 0,
   "number_of_in_flight_fetch" : 0,
    "task_max_waiting_in_queue_millis" : 0,
    "active_shards_percent_as_number" : 100.0,
   "indices" : {
     ".kibana_task_manager" : {
      "status" : "green",
      "number_of_shards" : 1,
       "number_of_replicas" : 0,
      "active_primary_shards" : 1,
       "active_shards" : 1,
      "relocating_shards" : 0,
      "initializing_shards" : 0,
      "unassigned_shards" : 0,
     "shards" : {
       "0" : {
      "status" : "green",
      "primary_active" : true,
      "active_shards" : 1,
      "relocating_shards" : 0,
      "initializing_shards" : 0,
      "unassigned_shards" : 0
       }
      }
    },
      ".kibana_1" : {
  "status" : "green",
  "number_of_shards" : 1,
  "number_of_replicas" : 0,
  "active_primary_shards" : 1,
  "active_shards" : 1,
  "relocating_shards" : 0,
  "initializing_shards" : 0,
  "unassigned_shards" : 0,
  "shards" : {
    "0" : {
      "status" : "green",
      "primary_active" : true,
      "active_shards" : 1,
      "relocating_shards" : 0,
      "initializing_shards" : 0,
      "unassigned_shards" : 0
            }
           }
         }
      }
    }

shards 的健康状况是绿色的。
现在，如果我在不同的或新的项目中提交爬虫拓扑，拓扑仍然是理想的，并且不会发出或传输任何元组。

我使用的是相互兼容的版本吗？我应该使用 java 11 进行 Elasticsearch 还是可以正常工作？

有关实例的详细信息 -
我正在使用具有 4 GB 内存的 ec2 中等实例 ubuntu 18.04。

有人请解释问题是什么？

最佳答案

除非您想删除状态索引中的 URL，否则您不需要再次运行 ESInitScript。如果您多次运行它，将不会有任何状态，这可能是拓扑空闲的原因。

没有理由在种子文件中有更多的 URL 会导致问题，我们通常有超过 1M 的 URL 的种子文件，这不是问题。

关于elasticsearch - ES 查询异常，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62346814/

25

4

0

文章推荐： java - 使用 Java 录制系统声音

文章推荐： java - 在 Java 桌面应用程序中播放声音

文章推荐： javascript - 使用内嵌在javascript函数中

django - 带有破折号的 LANGUAGE_CODE 不起作用 : "es-mx, es-es, es-ar" but "es" does
在 settings.py LANGUAGE_CODE = 'es-mx'或 LANGUAGE_CODE = 'es-ar'不起作用，但是 LANGUAGE_CODE = 'es'或 LANGUAGE
opengl-es - OpenGL ES 2.0 和 OpenGL ES 3.0 有什么区别
我想知道OpenGL ES 2.0和OpenGL ES 3.0之间有什么区别。 OpenGL ES 3.0的主要优点是什么？最佳答案总体而言，这些变化通过更大的缓冲区、更多的格式、更多的统一等提高
elasticsearch - 从 golang 服务器到 ES 的 ES 查询返回错误，而 postman 直接向 ES 请求返回预期结果
这是我为此端点使用 Postman localhost:9201/response_v2_862875ee3a88a6d09c95bdbda029ce2b/_search 的请求正文 { "_sour
opengl-es-2.0 - OpenGL ES 2.0 等效于使用 GL_POINT_SMOOTH 的 ES 1.0 圆？
OpenGL ES 2.0 没有 ES 1.0 那样的 GL_POINT_SMOOTH 定义。这意味着我用来绘制圆圈的代码不再有效: glEnable(GL_POINT_SMOOTH); glPoin
opengl-es - OpenGL es 中的纹理未声明标识符
我尝试编译这个着色器: varying vec2 TexCoords; varying vec4 color; uniform sampler2D text; uniform vec3 textCol
opengl-es - OPenGL ES 中的按位运算
我是 OpenGL ES 的新手，我使用的是 OpenGL ES 2.0 版本。我可以在片段着色器中使用按位操作(右移、左移)吗？最佳答案 OpenGL ES 2.0 没有按位运算符。 ES 3.0
opengl-es - OpenGL ES-仅用线条绘制三角形？
有没有办法只用线画一个三角形？我认为GL_TRIANGLES选项可使三角形充满颜色。最佳答案使用glPolygonMode(face, model)设置填充模式: glPolygonMode(G
opengl-es - 使用opengl es shader将YUV转换为RGB
我想用一个包含 yuv 数据的采样器在 opengl es 着色器中将 yuv 转换为 rgb。我的代码如下: 1)我将 yuv 数据发送到纹理: GLES20.glTexImage2D(GLES20
.htaccess 更改/es/到.es
我正在使用这样的域: http://www.domain.com/es/blabla.html 我想更改 .es 的/es 部分并将 URLS 转换为类似以下内容: http://www.domain
opengl-es - OpenGL ES GL_TEXTURE_RECTANGLE
有谁知道OpenGL ES是否支持GL_TEXTURE_RECTANGLE？我计划将它用于 2D 图形以支持非二次幂图像。我当前的实现使用 alpha=0 填充的 POT 纹理，对于拉伸(stretc
opengl-es - OpenGL ES 渲染到用户空间内存
我需要在具有 PowerVR SGX 硬件的 ARM 设备上实现离屏纹理渲染。一切都完成了(使用了像素缓冲区和 OpenGL ES 2.0 API)。唯一 Unresolved 问题是速度很慢glR
opengl-es - OpenGL ES 片段着色器显然不可能返回白色
这是一个奇怪的事情。我有一个片段着色器，据我所知只能返回黑色或红色，但它将像素渲染为白色。如果我删除一根特定的线，它会返回我期望的颜色。它适用于 WebGL，但不适用于 Raspberry Pi 上的
opengl-es - OpenGL ES glPushClientAttrib
我正在考虑将一些 OpenGL 代码移植到 OpenGL ES 并且想知道这段代码到底做了什么: glPushClientAttrib(GL_CLIENT_VERTEX_ARRAY_BIT) 因为 g
opengl-es - OpenGL ES glPushClientAttrib
我正在考虑将一些 OpenGL 代码移植到 OpenGL ES 并且想知道这段代码到底做了什么: glPushClientAttrib(GL_CLIENT_VERTEX_ARRAY_BIT) 因为 g
opengl-es - GLSL ES 中的最大程序
GLSL ES最多可以编译多少个程序？所以假设我创建了 100 个片段着色器，每个都有不同的效果。所以在运行时我编译所有这些并动态地我用 glUseProgram 交换它们。我假设每次我编译一个新的
shader - OpenGL ES 2.0 与 iPhone : GL_POINT_SMOOTH draws squares with ES 2. 0 但适用于 ES 1.0
我正在尝试使用顶点缓冲区对象来绘制圆，并在 iPhone 上的 OpenGL ES 2.0 中启用 GL_POINT_SMOOTH 来绘制点。我使用以下 ES 1.0 渲染代码在 iPhone 4
opengl-es - 为什么在 OpenGL ES 中缩小对象会导致对象变轻？
为什么在 OpenGL ES 1.x 中缩放(均匀)对象会导致对象变轻？更有意义的是它会更暗，因为法线被缩小是否也会使对象更暗？但由于某种原因，物体变轻了。当我放大时，对象变得更暗。在我看来，这应该
opengl-es - 如何有效地将深度缓冲区复制到 OpenGL ES 上的纹理
我正在尝试通过移植 some code 在 iOS 上的 OpenGL ES 2.0 中获得一些阴影效果。来自标准 GL。部分示例涉及将深度缓冲区复制到纹理: glBindTexture(GL_TEX
opengl-es - 在 OpenGL ES 中优化骨骼动画的顶点
所以我正在使用 2D 骨骼动画系统。有 X 个骨骼，每个骨骼至少有 1 个部分(一个四边形，两个三角形)。平均而言，我可能有 20 块骨头和 30 个部分。大多数骨骼都依赖于父骨骼，骨骼会每帧移动。
opengl-es - OpenGL ES 中的标识符、初始化和局部变量
我在使用 ES 着色器时遇到了一些晦涩难懂的问题，而且我现在几乎没有想法了。这是一些代码: .. precision mediump float; .. #define STEP (1f/6f) 5

首页

博学

6Ren·AI

商城

elasticsearch - ES 查询异常