作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个关于重新整理推文文字的问题。任何帮助,将不胜感激。
这是我的数据来源;关于电晕鸣叫:
source of data set
我从照片中下载了一个数据集(名为2020年2月1日)
然后,我将过滤这些数据以显示“GB”中仅有的24000条推文
我使用twarc来填充我的tweet文本,如下所示:
首先,使用pip安装twarc
然后,在命令行中键入:twarc configure
然后,内部消费者 key 和 secret key
然后,编写一个命令:
twarc hydrate id.txt > tweet_hydrated.jsonl
但是,我在24000条推文ID中只得到18条推文
最佳答案
我现在设法重现了这一点,并且我相信在将您的JSON输入转换为CSV/Excel到一系列Tweet ID转换为 hydration 的过程中,您可能正在使用JavaScript(?),并且Tweet ID失去了准确性。提示是当我在Excel列中注意到所有以0000结尾的Tweet ID时。您需要使用一种更精确的方法来将Tweet ID放入twarc。
关于python - 为什么我不能使用TWARC/Hydrator 应用程序对24000个推文ID中的18个以上的推文进行补水?有谁知道更好的方法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63254995/
我是一名优秀的程序员,十分优秀!