gpt4 book ai didi

python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水?有谁知道更好的方法吗?

转载 作者:行者123 更新时间:2023-12-03 11:20:50 27 4
gpt4 key购买 nike

我有一个关于重新整理推文文字的问题。任何帮助,将不胜感激。
这是我的数据来源;关于电晕鸣叫:
source of data set
我从照片中下载了一个数据集(名为2020年2月1日)
photo of my data set
然后,我将过滤这些数据以显示“GB”中仅有的24000条推文
totall number of my tweet id
我使用twarc来填充我的tweet文本,如下所示:
首先,使用pip安装twarc
然后,在命令行中键入:twarc configure然后,内部消费者 key 和 secret key
然后,编写一个命令:

twarc hydrate id.txt > tweet_hydrated.jsonl
但是,我在24000条推文ID中只得到18条推文
all that I could hydrate
我也使用了水化器应用程序,但结果是一样的。我究竟做错了什么?从大量数据中获取18个逻辑是否合乎逻辑?任何有关为tweet文本世界增 hydration 气的新建议都值得赞赏。 (对不起我的英语不好,我不是幼稚的演讲者)

最佳答案

我现在设法重现了这一点,并且我相信在将您的JSON输入转换为CSV/Excel到一系列Tweet ID转换为 hydration 的过程中,您可能正在使用JavaScript(?),并且Tweet ID失去了准确性。提示是当我在Excel列中注意到所有以0000结尾的Tweet ID时。您需要使用一种更精确的方法来将Tweet ID放入twarc。

关于python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水?有谁知道更好的方法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63254995/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com