gpt4 book ai didi

java - 如何使用 KStreams 将 Kafka 主题的数据写入文件?

转载 作者:行者123 更新时间:2023-12-02 10:10:04 24 4
gpt4 key购买 nike

我正在尝试使用 Java 在 Eclipse 中创建 KStream 应用程序。现在我指的是互联网上可用的 KStreams 字数统计程序并对其进行修改。

我想要的是,我从输入主题读取的数据应该写入文件,而不是写入另一个输出主题。

但是当我尝试将 KStream/KTable 打印到本地文件时,我在输出文件中收到以下条目:

org.apache.kafka.streams.kstream.internals.KStreamImpl@4c203ea1

如何实现将 KStream 的输出重定向到文件?

下面是代码:

package KStreamDemo.kafkatest;

package org.apache.kafka.streams.examples.wordcount;

import org.apache.kafka.clients.consumer.ConsumerConfig;
import org.apache.kafka.common.serialization.Serdes;
import org.apache.kafka.streams.KafkaStreams;
import org.apache.kafka.streams.StreamsBuilder;
import org.apache.kafka.streams.StreamsConfig;
import org.apache.kafka.streams.kstream.KStream;
import org.apache.kafka.streams.kstream.KTable;
import org.apache.kafka.streams.kstream.KeyValueMapper;
import org.apache.kafka.streams.kstream.Produced;
import org.apache.kafka.streams.kstream.ValueMapper;

import java.util.Arrays;
import java.util.Locale;
import java.util.Properties;
import java.util.concurrent.CountDownLatch;
public class TemperatureDemo {
public static void main(String[] args) throws Exception {
Properties props = new Properties();
props.put(StreamsConfig.APPLICATION_ID_CONFIG, "streams-wordcount");
props.put(StreamsConfig.BOOTSTRAP_SERVERS_CONFIG, "34.73.184.104:9092");
props.put(StreamsConfig.CACHE_MAX_BYTES_BUFFERING_CONFIG, 0);
props.put(StreamsConfig.DEFAULT_KEY_SERDE_CLASS_CONFIG, Serdes.String().getClass().getName());
props.put(StreamsConfig.DEFAULT_VALUE_SERDE_CLASS_CONFIG, Serdes.String().getClass().getName());
System.out.println("#1###################################################################################################################################################################################");
// setting offset reset to earliest so that we can re-run the demo code with the same pre-loaded data
// Note: To re-run the demo, you need to use the offset reset tool:
// https://cwiki.apache.org/confluence/display/KAFKA/Kafka+Streams+Application+Reset+Tool
props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");

StreamsBuilder builder = new StreamsBuilder();
System.out.println("#2###################################################################################################################################################################################");
KStream<String, String> source = builder.stream("iot-temperature");
System.out.println("#5###################################################################################################################################################################################");
KTable<String, Long> counts = source
.flatMapValues(new ValueMapper<String, Iterable<String>>() {
@Override
public Iterable<String> apply(String value) {
return Arrays.asList(value.toLowerCase(Locale.getDefault()).split(" "));
}
})
.groupBy(new KeyValueMapper<String, String, String>() {
@Override
public String apply(String key, String value) {
return value;
}
})
.count();
System.out.println("#3###################################################################################################################################################################################");
System.out.println("OUTPUT:"+ counts);
System.out.println("#4###################################################################################################################################################################################");
// need to override value serde to Long type
counts.toStream().to("iot-temperature-max", Produced.with(Serdes.String(), Serdes.Long()));

final KafkaStreams streams = new KafkaStreams(builder.build(), props);
final CountDownLatch latch = new CountDownLatch(1);

// attach shutdown handler to catch control-c
Runtime.getRuntime().addShutdownHook(new Thread("streams-wordcount-shutdown-hook") {
@Override
public void run() {
streams.close();
latch.countDown();
}
});

try {
streams.start();
latch.await();
} catch (Throwable e) {
System.exit(1);
}
System.exit(0);
}

}

最佳答案

这不正确

System.out.println("OUTPUT:"+ counts);

您需要执行counts.foreach,然后将消息打印到文件中。

Print Kafka Stream Input out to console? (只需更新以写入文件即可)

<小时/>

但是,可能更好地将流写到一个主题。并使用 Kafka Connect 写入文件。这是更符合行业标准的模式。鼓励 Kafka Streams 仅在 Kafka 内的主题之间移动数据,而不是与外部系统(或文件系统)集成

使用所需的主题信息编辑 connect-file-sink.properties,然后

bin/connect-standalone config/connect-file-sink.properties

关于java - 如何使用 KStreams 将 Kafka 主题的数据写入文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55066840/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com