- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我通过 Scala API 使用 apache flink,在某个时候我获得了一个 DataSet[(Int, Int, Int)]
。使用 writeAsCSV()
和 writeAsText()
方法的结果是意外的。它创建一个目录。该目录具有方法调用的第一个参数的位置和名称(例如 filePath
)。在该目录中出现两个名为“1”和“2”的文件。在这些文件中我可以看到数据集数据。他们似乎将数据集内容划分为这两个文件。尝试重新创建此行为以显示更简洁的代码片段,但我做不到。也就是说,我目睹了在预期位置创建了一个具有预期名称的文件,但没有创建目录。 val mas = ma_ groupBy(0,1) sum(2) mas.writeAsCsv("c:\flink\mas.csv")
结果会创建一个名为“mas.csv”的目录,并在其中创建两个文件“1”和“2”。什么时候会发生这样的事情呢?使用flink 9.1本地模式,Windows 7,scala 2.10,eclipse3.0.3
最佳答案
这是预期的行为。如果你想得到单个输出文件,你需要将sink的并行度设置为1。
dataset = dataset.writeAsCsv("filename").setParallelism(1);
对于 DataStream API,您需要插入额外的 rebalane()
来打破运算符链。否则,整个链将以 dop=1 执行,否则 setParallelism()
可能会被忽略。
datastream = datastream.rebalance().writeAsCsv("filename").setParallelism(1);
关于scala - writeAsCSV() 和 writeAsText() 是意外的,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32580970/
我通过 Scala API 使用 apache flink,在某个时候我获得了一个 DataSet[(Int, Int, Int)]。使用 writeAsCSV() 和 writeAsText() 方
我在 scala 中有一个方法 counts.writeAsText(文件路径) 当文件已存在时抛出异常并建议指定文件或目录已存在。在 NO_OVERWRITE 模式下不会覆盖现有文件和目录。使用OV
我是一名优秀的程序员,十分优秀!