- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
对于上下文,我从未使用过Beam。我试图了解如何将Beam模型应用于常见用例。
假设您有一个无限制的生产者集合和一个无限制的产品集合,这样每个产品都有一个生产者(一对多,从生产者到产品)。并且您具有产品生产者在其产品之前(或之后)出现的附加属性。但是生产者可能比其产品早几年出现。
如果您想与生产者一起生产无限制的产品集合,那么表达这一点的合适方法是什么?进行多年的窗口化连接似乎无法达到目标。但是,将生产者作为辅助输入似乎并不能解决生产者可能与产品出现时非常接近的情况。
是否有适当的方法来混合这两个概念?
最佳答案
由于Producer可能比其Product早几年出现,因此您可以使用一些外部存储设备(例如BigTable)来存储Producer并为产品流编写ParDo
来进行查找和执行联接。为了进一步优化性能,您可以利用有状态DoFn功能批量查找(结帐this博客)。
对于在生产者数据之前交付产品数据的情况,您仍然可以使用windowing和CoGroupByKey进行联接。但是,此处的窗口可能足够小,仅用于处理无序交付。
关于apache-beam - 您如何表达长时间分散的Apache Beam中的非规范化联接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47295746/
TL;DR:问题:是否有一种快速方法可以在特定坐标处插入分散的二维数据集? 如果是的话,有人可以提供一个示例,其中包含“当前解决方案”中使用的示例数据和变量(因为我自己实现它显然很愚蠢)。 问题:
我正在使用 n = 2 运行我的代码。我一直在尝试研究,但我不明白为什么当我尝试多次运行我的代码时会获得不同的输出。 在下面,您可以看到当我使用 n = 2 运行时的输出,并且我的 txt.file
我正在处理 BML 自动机的 MPI 版本,但 MPI_Scatter() 不会像我预期的那样工作。我读了here对于集体通信功能,每个进程都需要它的数组副本,只是没有初始化的分配空间。在我的代码中,
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 6 年前。 Improve
我需要将输入字符串拆分为输出字符串(按一定顺序)通过在输入字符串上应用一组正则表达式。我想实现这个功能与 akka Actor 集群一起使用,我将其分散正则表达式和输入字符串并收集字符串。不过我想知道
我在使用 MPI4Py Python 模块中的 Scatter 函数时遇到问题。我的假设是我应该能够向它传递发送缓冲区的单个列表。但是,当我这样做时,或者确实添加其他两个参数,recvbuf 和 ro
我的问题是,我想用与所有其他点不同的颜色绘制此结构的 0,0,0 点。但是绘图只显示所选颜色的轮廓,而这个球的内部仍然是相同的颜色其他的。我不明白这是怎么回事。 from mpl_toolkits.m
我正在尝试使用克隆调用两个端点并收集它们的信息以通过聚合发送,我必须将其与分散收集中介器一起使用。每个端点返回一个 json 字符串。但我一直遇到“期望 SOAP Envelope 的实现作为父级”错
我正在构建一个 Angular 元素,我在其中使用预先设计的 html 模板。我在加载页面时使用延迟加载,我不完全知道如何描述这个问题,我只能说当我加载页面时,css 得到分散,如我附上的 gif 所
plotly.js 新手(我处于 Angular 环境中) 我想将痕迹放在多选下拉菜单中。所有 y 轴都相同。能够切换这些的可见性。建议...简单/正确的方法。 我尝试用 css 影响 svg 容器,
我一直在尝试弄清楚我们应该如何使用 AVX512 中的分散指令来分散 16 位整数。我所拥有的是 8 x 16 位整数,存储在 __m256i 的每个 32 位整数中。我会使用 _mm512_i32e
我正在编写一个FUSE覆盖文件系统(notifyfs),它可以是一个数据库客户端可以从中获取数据通过查询。我的目的是使其成为缓存/overlayfs/数据库,客户端可以在显示条目及其属性(属性以及 m
我已经搜索了一段时间,但似乎无法在文档或 SO 上找到任何有用的信息。 This question并没有真正帮助我,因为它引用了修改程序集,而我正在用 C 语言编写。 我有一些代码进行间接访问,我想对
我正在通过分散模型、蓝图来重构我的 Flask 应用程序,但我遇到了运行时错误。 def create_app(): app = flask.Flask("app") app.conf
大多数 pyplot 示例都使用线性数据,但如果数据是分散的呢? x = 3,7,9 y = 1,4,5 z = 20,3,7 更好的 contourf 网格 xi = np.linspace(min
我可以合并 Mono> 的列表吗?数据源整合为单个Mono>包含所有项目而不阻塞? 在我的带有 Lombok 分散收集应用程序的 JDK 9 Spring Boot 2 中,此阻塞版本有效:
我正在使用 FFCalender .在那个 MonthView 中分散了 在模拟器 iPad 2 8.0、iPad 2 7.0、iPad Retina 7.0 和 iPad Retina 8.0 中没
我是一名优秀的程序员,十分优秀!