elasticsearch - “index_already_exists_exception”-从Kafka到Elastic Search(SSL)-6ren

elasticsearch - “index_already_exists_exception”-从Kafka到Elastic Search(SSL)

转载作者：行者123 更新时间：2023-12-02 22:35:49

我们已经有kafka flex 搜索接收器连接器，用于将数据传输到 flex 搜索(v 5.6.3 )。

我正在使用融合v5.0.0，但没有看到其他错误。我已经删除了索引并重新启动了 flex 搜索连接器。但是仍然出现相同的错误

连接器配置如下:

{
"name":"elasticsearch_topic",
"config":
{       
    "connector.class":"io.confluent.connect.elasticsearch.ElasticsearchSinkConnector",
    "tasks.max":"3",
    "topics":"sample_topic",
    "connection.url":"https://127.0.0.1:9200,https://127.0.0.2:9200",               
    "connection.username":"elsatic_user",
    "connection.password":"elastic_user",
    "type.name":"log",
    "flush.timeout.ms":"60000",
    "connection.timeout.ms":"60000",
    "read.timeout.ms":"60000",
    "batch.size":"20",
    "topic.index.map":"sample_topic:elastic_search_index_test",
    "transforms":"extract,insertenv,inserttimestamp,convert_current_ts,routeTS",
    "schema.ignore": "true",
    "transforms.extract.type":"org.apache.kafka.connect.transforms.ExtractField$Key",
    "transforms.extract.field":"RE_NUM",
    "transforms.insertenv.type": "org.apache.kafka.connect.transforms.InsertField$Value",
        "transforms.insertenv.static.field": "_env",
        "transforms.insertenv.static.value": "dev",
        "transforms.inserttimestamp.type": "org.apache.kafka.connect.transforms.InsertField$Value",
        "transforms.inserttimestamp.timestamp.field": "date_time",      
            "transforms.convert_current_ts.type": "org.apache.kafka.connect.transforms.TimestampConverter$Value",
        "transforms.convert_current_ts.target.type": "Timestamp",
        "transforms.convert_current_ts.field": "date_time",
        "transforms.convert_current_ts.format": "yyyy-MM-dd HH:mm:ss.SSSSSS",
        "transforms.routeTS.type":"org.apache.kafka.connect.transforms.TimestampRouter",  
    "transforms.routeTS.topic.format":"elastic_search_index_test-${timestamp}",  
    "transforms.routeTS.timestamp.format":"yyyyMMdd"
 }
}

到现在为止还挺好。没有问题。

最近，我们在 flex 搜索上启用了SSL，为此，我在上述配置中添加了“用户名”，“密码”和“https”。然后重新启动了连接器和工作器。
从那时起，我可以看到“ index_already_exists_exception ”错误，如下所示:

[2018-12-06 03:36:21,487] ERROR WorkerSinkTask{id=elasticsearch_topic-1} 
 Task threw an uncaught and unrecoverable exception 
 (org.apache.kafka.connect.runtime.WorkerTask:177)
 org.apache.kafka.connect.errors.ConnectException: Could not create index 
 'elastic_search_index_test': {"root_cause": 
 [{"type":"index_already_exists_exception","reason":"index 
[elastic_search_index_test/QVgWV8E7RmuSArtIJt3m3g] already exists","index_uuid":"QVgWV8E7RmuSArtIJt3m3g","index":"elastic_search_index_test"}],"type":"index_already_exists_exception","reason":"index [elastic_search_index_test/QVgWV8E7RmuSArtIJt3m3g] already exists","index_uuid":"QVgWV8E7RmuSArtIJt3m3g","index":"elastic_search_index_test"}
    at io.confluent.connect.elasticsearch.jest.JestElasticsearchClient.createIndices(JestElasticsearchClient.java:238)
    at io.confluent.connect.elasticsearch.ElasticsearchWriter.createIndicesForTopics(ElasticsearchWriter.java:330)
    at io.confluent.connect.elasticsearch.ElasticsearchSinkTask.open(ElasticsearchSinkTask.java:157)
    at org.apache.kafka.connect.runtime.WorkerSinkTask.openPartitions(WorkerSinkTask.java:612)
    at org.apache.kafka.connect.runtime.WorkerSinkTask.access$1100(WorkerSinkTask.java:69)
    at org.apache.kafka.connect.runtime.WorkerSinkTask$HandleRebalance.onPartitionsAssigned(WorkerSinkTask.java:672)
    at org.apache.kafka.clients.consumer.internals.ConsumerCoordinator.onJoinComplete(ConsumerCoordinator.java:283)
    at org.apache.kafka.clients.consumer.internals.AbstractCoordinator.joinGroupIfNeeded(AbstractCoordinator.java:422)
    at org.apache.kafka.clients.consumer.internals.AbstractCoordinator.ensureActiveGroup(AbstractCoordinator.java:352)
    at org.apache.kafka.clients.consumer.internals.AbstractCoordinator.ensureActiveGroup(AbstractCoordinator.java:337)
    at org.apache.kafka.clients.consumer.internals.ConsumerCoordinator.poll(ConsumerCoordinator.java:343)
    at org.apache.kafka.clients.consumer.KafkaConsumer.updateAssignmentMetadataIfNeeded(KafkaConsumer.java:1218)
    at org.apache.kafka.clients.consumer.KafkaConsumer.poll(KafkaConsumer.java:1181)
    at org.apache.kafka.clients.consumer.KafkaConsumer.poll(KafkaConsumer.java:1115)
    at org.apache.kafka.connect.runtime.WorkerSinkTask.pollConsumer(WorkerSinkTask.java:444)
    at org.apache.kafka.connect.runtime.WorkerSinkTask.poll(WorkerSinkTask.java:317)
    at org.apache.kafka.connect.runtime.WorkerSinkTask.iteration(WorkerSinkTask.java:225)
    at org.apache.kafka.connect.runtime.WorkerSinkTask.execute(WorkerSinkTask.java:193)
    at org.apache.kafka.connect.runtime.WorkerTask.doRun(WorkerTask.java:175)
    at org.apache.kafka.connect.runtime.WorkerTask.run(WorkerTask.java:219)
    at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
    at java.util.concurrent.FutureTask.run(FutureTask.java:266)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)
 [2018-12-06 03:36:21,487] ERROR WorkerSinkTask{id=elasticsearch_topic-1} Task is being killed and will not recover until manually restarted (org.apache.kafka.connect.runtime.WorkerTask:178)

我到目前为止已经尝试过的步骤:

停止了 flex 搜索接收器连接器和工作程序

(通过Kibana)从 flex 搜索中删除了索引“elastic_search_index_test”

重新启动工作程序和 flex 搜索连接器

但是仍然出现相同的错误(如上所述)

有人可以提示出什么问题了吗？

提前致谢!!

最佳答案

当启动具有多个任务的连接器时，这是非常常见的错误(在当前情况下为“tasks.max”:“3”)。

内部步骤kafka-connect-elasticsearch

kafka-connect-elasticsearch将检查indexe是否不存在

如果ES缺少

，它将创建索引

问题:-

该存储区正在运行3个任务(意味着3个线程执行相同的代码)，并且有多个任务发现索引不存在并继续创建索引。
第一个任务成功执行，第二个任务将引发未找到索引异常，因为它已由第一个任务创建。

解决方案:-

通过一个任务“tasks.max”启动连接器:“1”(如果我们有大量数据，这是错误的选择)

在运行连接器

之前在Es中创建索引

使用分布式锁(如zookeeper)

关于elasticsearch - “index_already_exists_exception”-从Kafka到Elastic Search(SSL)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53650730/

文章推荐： python - 使用Python将数据帧索引到Elasticsearch中

文章推荐： elasticsearch - 如何在Elasticsearch中更改维护事件的时间

amazon-elastic-beanstalk - Elastic Beanstalk npm失败
我正在尝试将我的应用程序上载到Elastic Beanstalk，但是在节点预gyp安装--fallback-to-build上，npm安装失败。我尝试了各种版本的节点，但无济于事。似乎正在尝试获取一
amazon-elastic-beanstalk - 如何为环境创建 Elastic beanstalk 配置模板
每当我在 Elastic Beanstalk 中创建新环境时，我都会手动配置自定义 AMI ID、SNS 通知等，但我想自动完成，即，将设置(自定义 AMI ID、SNS、 key 对等)保存到一个配
amazon-elastic-beanstalk - 将文件从 Elastic beanstalk 复制到本地机器
我已使用以下方法连接到 Elastic Beanstalk: eb ssh XXXXXX --profile=xx 现在我想将一个文件复制到我的本地机器上，我该怎么做？最佳答案找出与 scp 一起
amazon-elastic-beanstalk - 手动部署与 Amazon Elastic Beanstalk
对于典型的 Java Web 应用程序，使用 Elastic Beanstalk 相对于手动创建 EC2 实例、设置 tomcat 服务器和部署等有哪些优势？负载平衡、监控和自动缩放是唯一的优势吗？
elasticsearch - Elastic Search:Elastic Search 7.1中扁平化数据类型的替代方法
我有两个Elastic Search版本，一个是 7.3 ，另一个是 7.1 。我正在将flattened数据类型用于 Elastic Search 7.3 ，并且我也想在 Elastic Searc
java - 如何使用 Spring-data-elastic 查询 Elastic
我是 Elastic 和 spring-data-elastic 的新手。我一直在此处和网络的其他区域进行搜索，但到目前为止尚未找到我的问题的答案。我希望 SO 能够提供帮助。我正在为我的Users
amazon-elastic-beanstalk - Elastic Beanstalk 环境不在 .ebextensions 文件夹中执行命令
我有一个运行 PHP 的弹性 beanstalk 环境。在我的项目中，我有一个 .ebextensions 文件夹和一个名为“15-memorymonitor.config”的文件，其中包含以下内容；
amazon-elastic-beanstalk - Elastic Beanstalk 不会自动从 ECR 更新镜像
我有 “更新”:Dockerrun.aws.json 中的“真” 当我更新 ECR 中的图像时，它应该自动更新 EC2 iontance 中的图像和容器。但是当我在推送新图像后通过 ssh 进入实例
amazon-elastic-beanstalk - 从 CloudFormation 模板扩展 Elastic Beanstalk
我有一个定义 Elastic Beanstalk 应用程序的 CloudFormation 模板。我想扩展这个应用程序，即我希望端口 80 上的监听器重定向到 HTTPS。 AWS::Elastic
amazon-elastic-beanstalk - Elastic Beanstalk 在 EbExtensionPostBuild 停止
我在使用自定义 .ebextensions 文件部署 EB 实例时遇到问题。这是该文件中的相关部分: container_commands: 01_migrate: command: 'p
amazon-elastic-beanstalk - 在 Elastic beanstalk 中将 ELB 设置为自动缩放健康检查类型
我已经使用带负载均衡器的 Elastic Beanstalk 创建了一个环境，并在各自的配置中分配了所有健康检查值我也为ELB设置了应用健康检查url 但是当我检查自动缩放组配置时，健康检查类型是
elasticsearch - 不使用 Elastic APM 将 OpenTelemetry 导出到 Elastic Search
我想使用 OpenTelemetry 将跟踪/指标数据导出到 Elastic Search，但我更愿意避免使用 Elastic APM。是否可以？opentelemetry 贡献 repo显然暗示这是
amazon-elastic-beanstalk - Elastic Beanstalk 找不到 server.js 文件
我正在尝试部署我的角申请通过GitHub Actions到 Elastic Beanstalk 。我正在使用这个 GitHub actions用于部署到 ELB。我的问题是，部署失败，因为 ELB
amazon-elastic-beanstalk - 如何通过 Elastic Beanstalk 部署(包括数据库补丁)避免停机？
我已阅读有关 Deploying Versions with Zero Downtime 的 AWS 文档，又名 CNAME 交换。如 yegor256在 this answer 中有解释: The
elasticsearch - 使用来自具有不同包结构的 2 个不同应用程序的相同 Elastic Index 来存储数据(HibernateSearch + Elastic)
我们在我们的一个应用程序服务器上安装了 Elastic 5.6.10 和 HibernateSearch ORM 5.11.4.Final，现在我们计划通过我们的一个微服务(spring boot，但
amazon-elastic-beanstalk - 在 AWS Elastic Beanstalk 中使用 SSM 参数存储
我正在使用 AWS Elastic beanstalk 并希望为不同的环境配置不同的 ENV 变量。我发现的唯一方法是使用 ebextensions，但如果我将同一个数据包部署到多个环境，则无法覆盖在
amazon-elastic-beanstalk - aws Elastic beanstalk 中同一环境中的 Nodejs 和 php
我有一个应用程序，其中包含 nodejs 和 php 代码。 nodejs 用于运行应用程序所需的几个脚本。我如何使用 aws Elastic beanstalk 部署此类应用程序？最佳答案有两种
amazon-elastic-transcoder - 使用 AWS Elastic 转码器将 MP4 转换为 HLS。
我打算将 MP4(1920x1080，比特率可能因 mp4 而异)转换为 HLS(不同类型的分辨率)。不同类型的分辨率，我正在寻找 1080p = 1920x1080 720p = 1280x720
amazon-elastic-beanstalk - AWS Elastic Beanstalk 通知 - 环境运行状况已从“正常”转变为“警告”
我不断收到以下消息。但是在我的 nginx 日志中没有任何内容表明返回的请求状态为 5xx。此外，应用程序似乎按预期工作。我可能会得到这些的任何指示？留言: Environment health h
amazon-elastic-beanstalk - Asp.net 核心 + Aws Elastic Beanstalk + Bitbucket 管道
我们如何使用 bitbucket 管道更新 aws elastic beanstalk 上的 asp.net 核心网站？最佳答案我知道这是迟到的答案，但几天前我做了同样的事情，所以这里是我是如何做

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

elasticsearch - “index_already_exists_exception”-从Kafka到Elastic Search(SSL)