apache-kafka - 发布和使用不同类型消息的最佳方式是什么？-6ren

apache-kafka - 发布和使用不同类型消息的最佳方式是什么？

转载作者：行者123 更新时间：2023-12-01 06:15:23

25

4

卡夫卡 0.8V

我想发布/使用 byte[] 对象、java bean 对象、可序列化对象等等。

为这种类型的场景定义发布者和消费者的最佳方式是什么？当我消费来自消费者迭代器的消息时，我不知道它是什么类型的消息。任何人都可以为我提供有关如何设计此类场景的指南吗？

最佳答案

我为每个 Kafka 主题强制执行单一模式或对象类型。这样，当您收到消息时，您就知道自己收到了什么。

至少，您应该决定给定的主题是要保存 binary 还是 string 数据，并根据这些数据进一步编码。

例如，您可以有一个名为 Schema 的主题，其中包含存储为字符串的 JSON 编码对象。

如果您使用 JSON 和一种松散类型的语言(如 JavaScript)，可能很容易在同一主题中存储具有不同架构的不同对象。使用 JavaScript，您只需调用 JSON.parse(...)，查看生成的对象，然后弄清楚您想要用它做什么。

但是你不能用像 Scala 这样的严格类型的语言来做到这一点。 Scala JSON 解析器通常希望您将 JSON 解析为已定义的 Scala 类型，通常是 case class。他们不适用于此模型。

一个解决方案是保持一个模式/一个主题规则，但稍微作弊:将一个对象包装在一个对象中。一个典型的例子是一个 Action 对象，其中您有一个描述操作的 header ，以及一个具有依赖于 header 中列出的操作类型的架构的有效负载对象。想象一下这个伪架构:

{name: "Action", fields: [
  {name: "actionType", type: "string"},
  {name: "actionObject", type: "string"}
]}

这样，即使在强类型语言中，您也可以执行以下操作(同样这是伪代码):

action = JSONParser[Action].parse(msg)
switch(action.actionType) {
  case "foo" => var foo = JSONParser[Foo].parse(action.actionObject)
  case "bar" => var bar = JSONParser[Bar].parse(action.actionObject)
}

这种方法的一个巧妙之处在于，如果您有一个消费者只等待特定的 action.actionType，并且将忽略所有其他的，那么它是非常轻量级的只解码 header 并推迟解码 action.actionObject 直到需要的时候。

到目前为止，这都是关于字符串编码数据的。如果你想使用二进制数据，当然你也可以将它包装在 JSON 中，或者像 XML 这样的许多基于字符串的编码中的任何一种。但是也有很多二进制编码系统，比如 Thrift 和 Avro 。其实上面的伪schema是基于Avro的。您甚至可以在 Avro 中做一些很酷的事情，比如模式演变，除其他外，它提供了一种非常巧妙的方式来处理上述 Action 用例——而不是将对象包装在对象中，您可以定义一个schema 是其他模式的一个子集，只解码你想要的字段，在本例中只是 action.actionType 字段。这是对 schema evolution 的非常出色的描述.

简而言之，我推荐的是:

选择基于模式的编码系统(无论是 JSON、XML、Avro、随便)
每个主题规则执行一个模式

关于apache-kafka - 发布和使用不同类型消息的最佳方式是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36586251/

25

4

0

文章推荐： java - 线程安全类正在终止

文章推荐： jquery - 减少 jquery-steps 插件中的 'min-height'

文章推荐： java - 为什么Java类没有加载？

文章推荐： csv - 手动将 csv 文件的特定部分读入 SAS

c - 在英特尔 x64 汇编中执行函数的最快(CPU 方式)方式？
我一直在阅读有关汇编函数的内容，但对于是使用进入和退出还是仅使用调用/返回指令来快速执行，我感到很困惑。一种方式快而另一种方式更小吗？例如，在不内联函数的情况下，在汇编中执行此操作的最快(stdcal
解析元组的 Pythonic 方式
我正在处理一个元组列表，如下所示: res = [('stori', 'JJ'), ('man', 'NN'), ('unnatur', 'JJ'), ('feel', 'NN'), ('pig',
使用线程的 Pythonic 方式
最近我一直在做很多网络或 IO 绑定(bind)操作，使用线程有助于加快代码速度。我注意到我一直在一遍又一遍地编写这样的代码: threads = [] for machine, user, data
请求资源子集的 RESTful 方式
假设我有一个名为 user_stats 的资源，其中包含用户拥有的帖子、评论、喜欢和关注者的数量。是否有一种 RESTful 方式只询问该统计数据的一部分(即，对于 user_stats/3，请告诉我
接受选择的 RESTful 方式
我有一个简单的 api，它的工作原理是这样的: 用户创建一个请求 ( POST /requests ) 另一个用户检索所有请求 ( GET /requests ) 然后向请求添加报价 ( POST /
扩展构建器模式的 Pythonic 方式
考虑以下 CDK Python 中的示例(对于这个问题，不需要 AWS 知识，这应该对基本上任何构建器模式都有效，我只是在这个示例中使用 CDK，因为我使用这个库遇到了这个问题。): from aws
用于管理对象池的 Scala 方式
Scala 中管理对象池的首选方法是什么？我需要单线程创建和删除大规模对象(不需要同步)。在 C++ 中，我使用了静态对象数组。在 Scala 中处理它的惯用和有效方法是什么？最佳答案我会把它
将多个类方法应用于对象列表的 Pythonic 方式
我有一个带有一些内置方法的类。这是该类的抽象示例: class Foo: def __init__(self): self.a = 0 self.b = 0
返回和检查方法执行的 Pythonic 方式
返回和检查方法执行的 Pythonic 方式我目前在 python 代码中使用 golang 编码风格，决定移动 pythonic 方式例子: import sys from typing imp
处理丢失数据的 RESTful 方式
我正在开发一个 RESTful API。其中一个 URL 允许调用者通过 id 请求特定人员的记录。返回该 id 不存在的记录的常规值是什么？服务器是否应该发回一个空对象或者一个 404，或者其他什
加载具有相似文件名的文件的 Pythonic 方式
我正在使用 pathlib.Path() 检查文件是否存在，并使用 rasterio 将其作为图像打开. filename = pathlib.Path("./my_file-name.tif") 但
创建嵌套字典的 Pythonic 方式
我正在寻找一种 Pythonic 方式来从列表和字典创建嵌套字典。以下两个语句产生相同的结果: a = [3, 4] b = {'a': 1, 'b': 2} c = dict(zip(b, a))
处理异常后恢复的 Pythonic 方式
我有一个正在操裁剪理设备的脚本。设备有时会发生物理故障，当它发生时，我想重置设备并继续执行脚本。我有这个: while True: do_device_control() device
做组合别名的 Pythonic 方式
做组合别名的最pythonic和正确的方法是什么？这是一个假设的场景: class House: def cleanup(self, arg1, arg2, kwarg1=False):
在一个请求中创建多个项目的 RESTful 方式
我正在开发一个小型客户端服务器程序来收集订单。我想以“REST(ful)方式”来做到这一点。我想做的是: 收集所有订单行(产品和数量)并将完整订单发送到服务器目前我看到有两种选择: 将每个订单行发
动态调用静态方法的 Groovy 方式
我知道在 Groovy 中您可以使用字符串调用类/对象上的方法。例如: Foo."get"(1) /* or */ String meth = "get" Foo."$meth"(1) 有没有办法
复制没有不同属性的字典的 Pythonic 方式
在 ECMAScript6 中，您可以使用扩展运算符来解构这样的对象 const {a, ...rest} = obj; 它将 obj 浅拷贝到 rest，不带属性 a。有没有一种干净的方法可以在
函数中条件返回的 Pythonic 方式
我有几个函数返回数字或None。我希望我的包装函数返回第一个不是 None 的结果。除了下面的方法之外，还有其他方法吗？ def func1(): return None def func2(
处理资源之间双向关系的 RESTful 方式
假设我想设计一个 REST api 来讨论歌曲、专辑和艺术家(实际上我就是这样做的，就像我之前的 1312414 个人一样)。歌曲资源始终与其所属专辑相关联。相反，专辑资源与其包含的所有歌曲相关联。
有条件地使用上下文管理器的 Pythonic 方式
这是我认为必须经常出现的问题，但我一直无法找到一个好的解决方案。假设我有一个函数，它可以作为参数传递一个开放资源(如文件或数据库连接对象)，或者需要自己创建一个。如果函数需要自己打开文件，最佳实践通常

首页

博学

6Ren·AI

商城

apache-kafka - 发布和使用不同类型消息的最佳方式是什么？