python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水？有谁知道更好的方法吗？-6ren

python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水？有谁知道更好的方法吗？

转载作者：行者123 更新时间：2023-12-03 11:20:50

我有一个关于重新整理推文文字的问题。任何帮助，将不胜感激。
这是我的数据来源；关于电晕鸣叫:
source of data set
我从照片中下载了一个数据集(名为2020年2月1日)

然后，我将过滤这些数据以显示“GB”中仅有的24000条推文

我使用twarc来填充我的tweet文本，如下所示:
首先，使用pip安装twarc
然后，在命令行中键入:twarc configure然后，内部消费者 key 和 secret key
然后，编写一个命令:

twarc hydrate id.txt > tweet_hydrated.jsonl

但是，我在24000条推文ID中只得到18条推文

我也使用了水化器应用程序，但结果是一样的。我究竟做错了什么？从大量数据中获取18个逻辑是否合乎逻辑？任何有关为tweet文本世界增 hydration 气的新建议都值得赞赏。 (对不起我的英语不好，我不是幼稚的演讲者)

最佳答案

我现在设法重现了这一点，并且我相信在将您的JSON输入转换为CSV/Excel到一系列Tweet ID转换为 hydration 的过程中，您可能正在使用JavaScript(？)，并且Tweet ID失去了准确性。提示是当我在Excel列中注意到所有以0000结尾的Tweet ID时。您需要使用一种更精确的方法来将Tweet ID放入twarc。

关于python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水？有谁知道更好的方法吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63254995/

文章推荐： doctrine-orm - Zend Framework子集合无法正常保湿

文章推荐： php - 在隔离包中注册 Symfony Hydrators

文章推荐： php - 接收到的数据正确时，Doctrine2 hydration 不正确

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水？有谁知道更好的方法吗？