postgresql - 无法使用 Kafka 将数据从 MySQL 流式传输到 Postgres-6ren

postgresql - 无法使用 Kafka 将数据从 MySQL 流式传输到 Postgres

转载作者：行者123 更新时间：2023-12-05 07:04:24

25

4

我是第一次尝试 Kafka 并使用 AWS MSK 设置 Kafka 集群。目标是将数据从 MySQL 服务器流式传输到 Postgresql。我使用 debezium MySQL 连接器作为源，并使用 Confluent JDBC 连接器作为接收器。

MySQL 配置:

  "connector.class": "io.debezium.connector.mysql.MySqlConnector",
  "database.server.id": "1",
  "tasks.max": "3",
  "internal.key.converter.schemas.enable": "false",
  "transforms.unwrap.add.source.fields": "ts_ms",
  "key.converter.schemas.enable": "false",
  "internal.key.converter": "org.apache.kafka.connect.json.JsonConverter",
  "internal.value.converter.schemas.enable": "false",
  "value.converter.schemas.enable": "false",
  "internal.value.converter": "org.apache.kafka.connect.json.JsonConverter",
  "value.converter": "org.apache.kafka.connect.json.JsonConverter",
  "key.converter": "org.apache.kafka.connect.json.JsonConverter",
  "transforms": "unwrap",
  "transforms.unwrap.type": "io.debezium.transforms.ExtractNewRecordState"

注册 Mysql 连接器后，其状态为“正在运行”并捕获 MySQL 表中所做的更改，并以以下格式在消费者控制台中显示结果:

{"id":5,"created_at":1594910329000,"userid":"asldnl3r234mvnkk","amount":"B6Eg","wallet_type":"CDW"}

我的第一个问题:表中的“金额”列是“十进制”类型并包含数值，但为什么在消费者控制台中它显示为字母数字值？

对于将 Postgresql 作为目标数据库，我使用了 JDBC 接收器连接器，配置如下:

"name": "postgres-connector-db08",
  "connector.class": "io.confluent.connect.jdbc.JdbcSinkConnector",
  "tasks.max": "1",
  "key.converter": "org.apache.kafka.connect.storage.StringConverter",
  "key.converter.schemas.enable": "false",
  "value.converter": "org.apache.kafka.connect.json.JsonConverter",
  "value.converter.schemas.enable": "false",
  "topics": "mysql-cash.kafka_test.test",
  "connection.url": "jdbc:postgresql://xxxxxx:5432/test?currentSchema=public",
  "connection.user": "xxxxxx",
  "connection.password": "xxxxxx",
  "insert.mode": "upsert",
  "auto.create": "true",
  "auto.evolve": "true"

注册 JDBC 连接器后，当我检查状态时出现错误:

{"name":"postgres-connector-db08","connector":{"state":"RUNNING","worker_id":"x.x.x.x:8083"},"tasks":[{"id":0,"state":"FAILED","worker_id":"x.x.x.x:8083","trace":"org.apache.kafka.connect.errors.ConnectException: Exiting WorkerSinkTask due to unrecoverable exception.
 org.apache.kafka.connect.runtime.WorkerSinkTask.deliverMessages(WorkerSinkTask.java:561)
 org.apache.kafka.connect.runtime.WorkerSinkTask.poll(WorkerSinkTask.java:322)
 org.apache.kafka.connect.runtime.WorkerSinkTask.iteration(WorkerSinkTask.java:224)
 org.apache.kafka.connect.runtime.WorkerSinkTask.execute(WorkerSinkTask.java:192)
 org.apache.kafka.connect.runtime.WorkerTask.doRun(WorkerTask.java:177)
 org.apache.kafka.connect.runtime.WorkerTask.run(WorkerTask.java:227)
 java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
 java.util.concurrent.FutureTask.run(FutureTask.java:266)
 java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
 java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
 java.lang.Thread.run(Thread.java:748)\nCaused by: org.apache.kafka.connect.errors.ConnectException: Sink connector 'postgres-connector-db08' is configured with 'delete.enabled=false' and 'pk.mode=none' and therefore requires records with a non-null Struct value and non-null Struct schema, but found record at (topic='mysql-cash.kafka_test.test',partition=0,offset=0,timestamp=1594909233389) with a HashMap value and null value schema.
 io.confluent.connect.jdbc.sink.RecordValidator.lambda$requiresValue$2(RecordValidator.java:83)
 io.confluent.connect.jdbc.sink.BufferedRecords.add(BufferedRecords.java:82)
 io.confluent.connect.jdbc.sink.JdbcDbWriter.write(JdbcDbWriter.java:66)
 io.confluent.connect.jdbc.sink.JdbcSinkTask.put(JdbcSinkTask.java:74)
 org.apache.kafka.connect.runtime.WorkerSinkTask.deliverMessages(WorkerSinkTask.java:539)
... 10 more
"}],"type":"sink"}

为什么会出现这个错误？我在接收器配置中遗漏了什么吗？

最佳答案

https://docs.confluent.io/kafka-connect-jdbc/current/sink-connector/index.html#data-mapping

The sink connector requires knowledge of schemas, so you should use a suitable converter e.g. the Avro converter that comes with Schema Registry, or the JSON converter with schemas enabled.

由于 JSON 是普通的(没有架构)并且连接器配置有 "value.converter.schemas.enable": "false"(禁用架构的 JSON 转换器)，Avro 转换器应该使用模式注册表设置:https://www.confluent.io/blog/kafka-connect-deep-dive-converters-serialization-explained/#applying-schema

关于postgresql - 无法使用 Kafka 将数据从 MySQL 流式传输到 Postgres，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62937670/

25

4

0

文章推荐： c# - 如何在 .Net Core 中根据环境控制 appsettings.json 部署

文章推荐： file-io - 接近文件末尾时 ftell/fseek 失败

gpu - CPU->GPU 传输 vs GPU->CPU 传输
我一直在做一些关于测量数据传输延迟的实验 CPU->GPU 和 GPU->CPU。我发现对于特定消息大小，CPU->GPU 数据传输速率几乎是 GPU->CPU 传输速率的两倍。谁能解释我为什么会这样
ruby-on-rails - Elasticsearch ::传输::传输::错误::未找到:[404]
我将 ElasticSearch 用作我的 Post 模型的 Rails pet 项目应用程序的全文引擎。在我的 posts_controller.rb 索引操作中: def index
Netty 框架学习 —— 传输
概述流经网络的数据总是具有相同的类型：字节，这些字节如何传输主要取决于我们所说的网络传输。用户并不关心传输的细节，只在乎字节是否被可靠地发送和接收如果使用 Java 网络编程，你会发现，某些时候当
共享点:服务器.传输？
我正在编写一些代码，以便将共享点从该页面转移到另一个页面: Server.Transfer("/DefectManagement/DefectList/default.aspx") 但是我遇到了这个问
android - LeakCanary ContentObserver$传输
我有这个泄漏，任何猜测？这个类有一些奇怪的引用。我的代码的任何地方都没有 contentobserver In com.example:1.5.0:27. com.example.ui.record
cuda - 点对点 CUDA 传输
我听说过点对点内存传输并阅读了一些关于它的内容，但无法真正理解与标准 PCI-E 总线传输相比它的速度有多快。我有一个使用多个 GPU 的 CUDA 应用程序，我可能对 P2P 传输感兴趣。我的问题
svn - 传输 FTP 忽略文件
ftping 文件时，Transmit 中是否有忽略或过滤器列表？我希望它忽略上传 .svn 文件等。最佳答案是的。转到首选项并选择 Rules标签。在那里您可以定义要跳过哪些文件的规则。实际上，
c - 动态 DMA 传输
我有以下片段来生成声音，在 while 循环中，我想动态更改它，以便它在声音生成期间创建不同频率的声音。 for(uint16_t i = 0; i < sample_N; i++) { da
delphi - 调试 SOAP 传输
我正在尝试使用 Delphi 2010 和 Indy 对 Web 服务进行概念验证。我此时的代码是: procedure TForm1.Log(const sEvent, sMsg: String);
java - 配置 ActiveMQ 传输
我有一个 ActiveMQ JMS 代理，在端口 61616 上使用默认的 openwire TCP 传输公开。我有许多远程客户端可以绑定(bind)到此代理来监听他们的消息。如果我想打开 kee
mule - 重新连接策略适用于哪些 mule 传输
reconnection strategies文档仅使用 JMS 示例，但是 FTP transport documentation确实说明了重新连接策略的使用，但没有任何细节或示例。进一步，如果你
java - 复选框状态下的 TreeView 传输
我有 2 个 TreeView，第一个填充有项目。 try { CheckBoxTreeItem treeRoot = new CheckBoxTreeItem("Root"); tr
python - Django:传输/访问表单完整错误消息
在我为学校开发的一个网站上，用户输入他们的学校电子邮件和密码，如果他们已注册，则登录。如果没有，则会显示登录的第二部分，要求输入笔名称并确认密码。正因为如此，以及我复杂的业余 Django 编程，我有
c# - 传输 LINQ 数据对象
我正在开发一个 Web 服务，我们在其中使用 LINQ-to-SQL 进行数据库抽象。当客户使用我们的网络服务时，对象被序列化为 XML，一切都很好。现在我们希望开发我们自己的使用本地数据类型的客户
java - 传输 DLList 的字符串时出现问题
我应该创建一个名为“Backwards”的方法，该方法将列表从尾部横向到头部，但是当我运行代码时，它出现说(第 88 行)它找不到光标 = cusor.prev;象征。我需要在循环中再次设置上一个链接
javascript - 传输 TypedArrays 的正确方法？
给定像 Uint8Array 这样的类型化数组，似乎有两种方法可以通过 worker 传输它们。选项 1 直接发送缓冲区并在接收端进行转换: 发件人:postMessage({fooBuffer:
Javascript 数据和 html 传输
在 PHP + jQuery 环境中，我和我的 friend 无法得出最佳解决方案。我们正在使用 Ajax 从数据库中获取数据。解决方案 1 - Ajax 应该只传输数据，而不是 HTML 好处:我
c++ - 传输 std::stringstream
大家好，非常感谢您的宝贵时间。有一个 std::stringstream 需要传输到远程机器。网络库允许我用以下方法构建数据包: CreatePacket( const void * DATA, s
c++ - 传输 libcurl 后损坏的二进制文件
我正在使用 libcurl 通过 FTP 传输二进制文件 (.exe)，并将其保存到本地文件。问题是文件传输后，它已被更改，不再是有效的 Win32 应用程序，因此无法运行。这是我的做法: CURL
javascript - 资源解释为样式表但使用 mime 传输
各位程序员，当我将它上传到我的 FTP 时，我的网站出现此错误:资源被解释为样式表，但使用 MIME 类型文本/纯文本传输 BlahBlahi

首页

博学

6Ren·AI

商城

postgresql - 无法使用 Kafka 将数据从 MySQL 流式传输到 Postgres