- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我手头有一个有趣的问题,我想知道这里是否有更聪明、更有经验的人可以提供一些见解。
基本上,我需要几个 MTA 地铁线路列车的完整列车停靠站列表。以下是数据在 mta.info 网站上的显示方式,以第 3 行为例
http://web.mta.info/nyct/service/threelin.htm
我是否可以抓取这些数据,然后将其写入文本或 csv 文件?如果是这样,我将如何去做这样的事情?我觉得这可能可以用 Python 完成,但我不确定,因为我两天前才开始用 Python 创建东西(我是一个 Java 人)。
我试图避免手动将这些中的每一个都写到文档中,但如果没有其他选择,我想我将不得不这样做。我只需要数据
如果有任何脚本专家可以为我指明正确的方向,我将不胜感激 :)
最佳答案
有一个free API正如@rjbman 指出的那样可用。另见:
但是,这里有一个替代解决方案,涉及使用 BeautifulSoup
进行 HTML 解析。 :
from bs4 import BeautifulSoup
import requests
url = "http://web.mta.info/nyct/service/threelin.htm"
response = requests.get(url)
soup = BeautifulSoup(response.content)
table = soup.find('table', summary='Table of 3 Subway Line Stops')
stops = [tr('td')[2].text.strip().replace('\n', '').split(' /')
for tr in table('tr', height=25)]
print stops
将所有停靠点打印为列表列表:
[
[u'Harlem-148 Street', u'7 Avenue'],
[u'145 Street', u'Lenox Avenue'],
...
[u'Van Siclen Avenue', u'Livonia Avenue'],
[u'New Lots Avenue', u'Livonia Avenue']
]
为了获取我使用的页面内容 requests
模块。
关于python - 抓取 MTA 地铁数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25634764/
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 8年前关闭。 Improve this q
Closed. This question is off-topic。它当前不接受答案。 想改善这个问题吗? Update the question,所以它是用于堆栈溢出的on-topic。 7年前关
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 5年前关闭。 Improve this qu
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 6 年前。 社区 7 个月前审核了是否重新开放
关闭。这个问题是 off-topic 。它目前不接受答案。 想改进这个问题? Update the question 所以它是 Stack Overflow 的 on-topic。 9年前关闭。 Im
我使用 postfix 作为“myDomain.com”的邮件服务器。此外,我已经为 gmail 安装了转发服务。到目前为止效果很好。但是当有人向我发送电子邮件时,例如一个可执行文件,gmail 会退
我手头有一个有趣的问题,我想知道这里是否有更聪明、更有经验的人可以提供一些见解。 基本上,我需要几个 MTA 地铁线路列车的完整列车停靠站列表。以下是数据在 mta.info 网站上的显示方式,以第
在多线程代码中,当一个实例可能被多个线程读取或写入时,它们需要被锁定以安全地执行这些操作。 为了避免重复创建要锁定的对象和通过代码编写一堆锁定语句,我创建了一个通用类来处理锁定。 从概念上讲,我是否遗
我正在尝试创建 COM 组件,它会经常被 excel 应用程序调用(excel 将在其初始化时加载 COM)并且另一个进程(比如 procA)也会(以高频率)发送 windows 消息到这个组件。目前
我有一个使用 mail() 函数的 PHP 程序。我在 Linux 服务器上运行它。通常它被设置为运行 Linux sendmail 功能,但我的机器被设置为使用 Postfix。 我可以在 post
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 2 年前。
我已经回答了我自己的问题,稍后可能会更新这个问题以反射(reflect)我的出发点/我为获得解决方案所采取的步骤,但我想我会问一个我开始的问题和采取的结果我花费了不合理的大量时间进行研究,反复试验。请
是否有可能在 /etc/postfix/recipient_bcc_maps 中有多个收件人? ? /etc/postfix/recipient_bcc_maps : source@domain.tl
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 3年前关闭。 Improve thi
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 9 年前。 Improve this
我想用 aiosmtpd 在 python 中编写我自己的小型邮件服务器应用程序 a) 用于教育目的以更好地理解邮件服务器 b) 实现自己的特点 所以我的问题是,Mail-Transfer-Agent
有什么方法可以让我在运行时调试应用程序时检查线程的单元类型,无论是 MTA 还是 STA?我正在 visual studio 2008 IDE 中开发 winforms 应用程序。 最佳答案 您可以使
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve th
运行 [alternatives --config mta] 时出现以下屏幕。 There are 2 programs which provide 'mta'. Selection Com
我是一名优秀的程序员,十分优秀!