- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已使用 Twitter ID 从 Twitter 中提取了推文。我使用的工具提取大量特征并将它们一起附加到 .csv 文件的一个单元格中。有多个文件,每个文件的大小各不相同,但包含大约一百万行。我现在正处于将每个字符串拆分为列的痛苦过程中,其中每列代表一个功能。
到目前为止,我已经能够使用以下 Excel 函数组合来拆分要素,因为每个要素名称都是唯一的(它在整个单元格中仅出现一次):
=MID(A4,FIND("retweet_count",A4)+15,FIND("favorite_count",A4)-FIND("""retweet_count",A4)-18)
在此示例中,我只能选择“retweet_count”和“fovourite_count”之间的文本,它是一个整数值,显示收到的推文的转发次数。数字(“+15”和“-18”)只是删除了功能名称本身。此方法不适用于推文坐标。
下面是我的文件示例(我的一个驱动器)的链接,其中包含 4 个字符串以及迄今为止我已成功拆分的功能:
https://1drv.ms/f/s!At39YLF-U90fhJwCdEuzAc2CGLC_fg
只有推文 3 和 4 包含坐标(其他 2 条没有地理标记)。使用上述方法不起作用,正如在单元格 M4 和 M5 中看到的那样,当单元格 A4 和 A5 包含坐标时,它们显示“null”。
如果有人能建议一种基于 A 列中字符串的结构从 A 列中的字符串中提取坐标的动态方法,我将非常感激。我说动态,因为您不能简单地选择固定位置在字符串中,因为每条推文的长度都会不同。到目前为止,我尝试使用包含多个功能的更大字符串,例如“点”、“坐标”而不仅仅是“坐标”,但这导致了处理语音标记的困难。然后我尝试使用 char(34),我在其他一些帖子中说过,但这种方法没有成功。
预先感谢您的帮助,
克里斯
最佳答案
您所做的不是解析 JSON 的正确方式,但仍然足以满足中小型需求。
此公式将从单元格 A4
中的推文中额外添加一组坐标:
=MID(A4,FIND("""coordinates"":[",A4)+15,FIND("]",A4,FIND("""coordinates"":[",A4)+15)-(FIND("""coordinates"":[",A4)+15))
...因此将其放入示例电子表格的 M4
中,它会返回:
-26.8321,-71.1199
但是,我怀疑你的最终目标...如果你的目标是实时地震位置数据,除非有特殊原因需要你专门使用 Twitter,否则它就是一个糟糕的数据源,由于许多原因,并且有许多比这更好的免费地方来获取(或抓取)实时地震数据。
另一方面,如果这是一个学习项目并且数据无关紧要,那么这是学习文本函数的好方法(但仅此而已!)。
<小时/>也许您专门抓取推文是有原因的,但为了以防万一,这里有一个(众多)实时(并且值得信赖)的示例)数据来源...
要检索包含今年阿拉斯加和不列颠哥伦比亚省沿海地区之间震级 >= 3.0 的所有地震事件的 XML:
或者,要获取与下载的 CSV 文件相同的数据(直接导入 Excel),只需将 URL 中的“XML”更改为“CSV”,或 click this link .
同一来源提供多种格式的数据。
最后要考虑的一件事:Excel 有各种内置的数据解析方法,例如 XML、JSON、CSV 等。您可能正在尝试重写 Excel 中已内置的功能。
关于excel - 尝试从推文中提取坐标[Excel 中字符串的子字符串],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48607719/
说真的,你怎么能在不发疯的情况下处理所有这些异常呢?我是不是读了太多关于异常处理的文章或什么?我尝试重构了几次,但每次似乎都以更糟糕的结果告终。也许我应该承认确实会发生异常(exception)情况,
背景 两者 try/rescue和 try/catch是 Elixir 中的错误处理技术。根据 corresponding chapter在介绍指南中。 Errors can be rescued u
每当我尝试在 Raspberry PI 上运行此 python 脚本时,我都会遇到问题: import socket import sys # Create a TCP/IP socket sock
我想知道一些关于 PHP 的 try , catch声明。 让我们考虑以下示例。 abstract class ExceptionA extends Exception {} class Except
我的 laravel v5.4 项目中有两个模型,user 和 admin。 在 config/auth.php 中,我向守卫和提供者添加了管理员,如下所示: 'guards' => [ 'w
try: r = requests.get(url, params={'s': thing}) except requests.ConnectionError, e: print e
我有以下代码。 但是,它并不能捕获所有错误,而我仍然会收到“throw er;//未处理的'错误'事件”。 为什么是这样? app.post('/api/properties/zip/:zip/bed
问题与细节 我正在使用自定义错误处理,遇到的错误之一是“路径中的非法字符”。我有一个自定义函数,旨在通过路径字符串查找此类非法字符,并在找到它们时引发自定义错误。但是我发现,取决于非法字符,Test-
This question already has answers here: How do I catch a numpy warning like it's an exception (not j
我正在使用其他人的代码,但我不熟悉try/catch,因此我举了一个类似的小例子。在第11行上,如果我写了error(''),似乎没有发现错误并增加了索引j。但是,编写error(' ')或error
我在我的一个程序中遇到了这个问题,在这种情况下,尝试/异常(exception)的错误使程序变得更好,以防用户意外输入了他们不应该输入的内容。它仍然给我错误,我为为什么感到困惑。如果对我的问题确实很重
我在尝试TRY ... CATCH块时遇到问题。有人可以解释为什么以下代码无法执行我的sp吗? DECLARE @Result int SET @Result = 0 BEGIN TRY SE
我有一个相当大的 powershell 脚本,其中包含许多(20 多个)执行各种操作的函数。 现在所有代码实际上都没有任何错误处理或重试功能。如果某个特定的任务/功能失败,它就会失败并继续。 我想改进
为什么我尝试时需要导入 inputmismatchException catch(InputMismatchException e){ System.out.println("
我对此感到困惑 - 我为辅助方法编写了一个 try/catch 。它的目的是捕获任何无效输入(任何不是“男性”或“女性”的内容(没有特定情况)。如果输入无效,它将通知用户,然后让他们重试。如果有效,则
我有时会发现自己处于如下场景。尽可能简单地陈述问题 “有时我会创建一段代码,Java 让我将其包含在 try/catch 语句中。我没有使用 catch,所以我将其留空。为什么这是错误的?” boo
我有点困惑为什么当我不使用 Try block 时会出现 Try block 错误。 我在代码块底部附近收到错误通知。如果我不使用 try/catch,有人可以向我解释为什么会发生这种情况吗? 它是否
我已经盯着我的电脑两个小时了,我不知道我做错了什么。谁能帮助我看到光明? package blackjack; import java.util.Random; import java.util.Sc
我想将方法保存在 Enum 中,但 Class.getDeclaredMethod 抛出 NoSuchMethodException,那么我该如何处理呢?我的代码: public enum Car
这个问题已经有答案了: Executing multi-line statements in the one-line command-line (18 个回答) 已关闭 3 年前。 如何使用try.
我是一名优秀的程序员,十分优秀!