- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试找出如何最好地将流数据从 Azure 事件中心集成到 Snowflake 中,例如具有低延迟和尽可能经济高效的特点。
我自己集思广益,想出了两种可能性,它们都有一些很大的缺点:
选项 1:设置“事件中心捕获”以将事件中心数据导出到 Blob 存储并导入到 Snowflake
这似乎是最直接的方法。通过启用事件中心捕获 ( https://learn.microsoft.com/en-us/azure/event-hubs/event-hubs-capture-overview ),事件中心的数据将自动导出到 Blob 存储。然后将生成的 Avro 文件通过 Snowpipe 导入到 Snowflake(外部表、使用 Snowflake 任务进行编排)。
缺点:
选项 2:创建一个 Azure 函数来监听事件中心事件并通过 Snowflake API 将数据直接写入 Snowflake
Azure 函数将监听事件中心事件并通过 Snowflake API 将事件数据直接写入 Snowflake(基本上:通过 Snowflake API 将 SQL INSERT 发送到数据库)。
优点:
缺点:
然后我阅读了有关流式传输/Ingest SDK 的 Snowflake 文档,因此基于此:
选项 3:使用 Snowflake Streaming (?)
读完文档后,我有点困惑。免责声明:我没有 Kafka 或任何其他流技术的经验。
Azure 事件中心文档指出:
"Azure Event Hubs provides an Apache Kafka endpoint on an event hub,which enables users to connect to the event hub using the Kafkaprotocol."
Snowflake 有一个 Snowflake Kafka 连接器。 Snowflake Kafka 连接器是否可用于连接到 Azure 事件中心以将数据直接流式传输到 Snowflake?
还有一个适用于 Java 的“Snowflake Ingest SDK API”。不幸的是我不懂Java。 :( 有什么方法可以将其与任何其他语言(例如 Python)一起使用吗?
我很高兴获得一些反馈/最佳实践/实际经验,了解如何最好地将数据从 Azure 事件中心实现到 Snowflake 中。
最佳答案
我心里有另一个想法:我想改进你的第三种方法
如果您想实现低延迟,那么 Kafka 可能是新行到达后立即处理实时事件的最佳选择。从 Azure 事件中心在 Kafka 主题中设置数据后。除了 JAVA/Python,您还可以尝试 Kafka Connector with Snowflake与 Snowpipe Streaming Configuration
Kafka 连接器配置文件中的设置。
snowflake.ingestion.method: SNOWPIPE_STREAMING
在这种方法中,更多的工作是设置配置。但这只是设置实时流媒体基础设施的一次性工作。
请检查雪花的链接文档。这可能会让您快速入门。
关于azure - 雪花: Recommendation how to integrate streaming data from Azure Event Hub,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76627562/
我目前是一群学生的团队负责人,他们正在为一门类(class)的项目工作,该类(class)目前由电气和计算机工程专业的学生组成。我是一名电气工程专业的学生,我还没有开始研究该项目的软件组件。我觉得
我们对 spring-integration 非常满意,除非事情没有按预期工作。然后真的很难找出发生了什么(我们使用的是xml配置)。有人可以将我指向 spring 集成组件背后的 java 组件以便
我需要评估几个积分,我正在使用正常 (0,1) 密度来测试。 在 python 中 import scipy.integrate as integrate import scipy.stats imp
我想保留原始请求的原始有效负载并将其放在 xslt-transformer 或其他操作中。我丢失了它,因为我使用了 xslt-transformer,并且我只需要转换中的一些元素。所以我的场景是: 1
我想知道在 Spring Integration 中使消息不可变的原因是什么。 仅仅是因为多线程环境中的线程安全吗? 表现?当您每次要向现有消息添加某些内容时都必须创建新消息时,您不会受到性能惩罚吗?
我有一个偶尔会返回 503 错误的 http 网关调用。我想配置 retry advice围绕那个调用,但我不想为每个错误都这样做,只是 503s。 我已经配
我们正在使用 Spring Integration 4.2.3 聚合器组件和定义的组超时,并期望组在给定的超时值内超时,同时向组添加消息和发布大小标准不满足。 但我们看到了不同的结果,当我们向服务输入
我需要轮询邮件服务器。由于我的项目已经在 Spring 中,我使用 Spring-Integration 来轮询邮件服务器。我在这方面很成功。但现在我必须轮询多封电子邮件。有人可以告诉我该怎么做吗。
现在,我正在从事的项目已经达到了一个复杂的水平,需要完成多个步骤(实际上,它变得不可思议!)才能生产出完整/可用的产品。不幸的是,我们并不是从Continuos Integration的心态开始的,所
哪些指标表明应该使用企业集成模式框架?另一方面,哪些指标表明应该坚持使用简单的旧代码进行逻辑流? 就我而言,我们将 Spring Integration 应用于映射/处理应用程序,该应用程序从数据库读
我们在 XML 中有以下工作配置,并正在尝试转换为 DSL。不确定它们是否等效,也尝试使用 inboundAdapter。但是,我无法弄清楚如何在那里设置与并发相关的值。有人可以建议他们是否在 DSL
所以我在玩这个: factors :: Integral a => a -> [a] factors n = filter (\d -> n `rem` d == 0) . takeWhile (\d
我是 Spring 集成的新手,正在尝试建模一个流程,其中我通过 HTTP 进行同步请求和响应,但也是交付的同一流程的一部分将响应发送到队列,对其进行后处理,并让一个单独的进程使用该响应。所以从调用流
我有一个 Spring Integration Flow 项目,它公开了一个 Rest 网关,在收到 Rest POST 请求后,它会执行一些小逻辑。基于一些有效负载参数,我想动态激活另一个 Spri
我浏览了 Internet,在 Spring 论坛上发帖,并阅读了几乎全部在线文档,但我无法弄清楚 Spring Integration 是否可以在单个多资源 (JTA) 事务中处理多个消息。这对于我
我正在查看 spring-projects/spring-integration-samples 中的聚合器示例。 https://github.com/spring-projects/spring-
我正在查看 spring-projects/spring-integration-samples 中的聚合器示例。 https://github.com/spring-projects/spring-
我有一个 spring-integration接受 org.w3c.dom.Document 并返回域对象的转换器。这很好。如果缺少元素,我会引发应用程序异常。 但是,我想将该异常放到错误 chann
我显然已经通读了 documentation , 但我无法找到更详细的幕后情况描述。具体来说,有几个行为我很疑惑: 一般设置 import numpy as np from scipy.integra
我正在使用 Spring Integration 使用以下配置从目录中读取文件。但是,我希望在找到任何文件后停止轮询,直到服务不再重新启动为止。有什么方法可以在运行时更改轮询器延迟或在运行时启动/停止
我是一名优秀的程序员,十分优秀!