gpt4 book ai didi

twitter - 如何配置Apache Flume在特定时期从Twitter获取数据?

转载 作者:行者123 更新时间:2023-12-02 20:09:25 27 4
gpt4 key购买 nike

我有一个hadoop集群和Apache槽,用于将数据从Twitter集成到HDFS,默认情况下,它按时间顺序获取数据,就像将首先获取最新的Tweet一样,现在我有用例可以在特定时期从Twitter获取特定数据,例如说2013年2月。
请让我知道是否需要设置水槽或Twitter Handle中的任何配置或属性。

提前致谢。

最佳答案

您可能要使用定制的水槽源。

http://blog.cloudera.com/blog/2012/10/analyzing-twitter-data-with-hadoop-part-2-gathering-data-with-flume/

上面链接中提到的TwitterSource将帮助您基于关键字获取Twitter数据。

关于twitter - 如何配置Apache Flume在特定时期从Twitter获取数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18395989/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com