- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试将 html 页面中的值读入 python 脚本中的变量。我已经想出了一种使用 urllib 将页面下载到本地文件的方法,并且可以使用 bash 脚本提取值,但想在 Python 中尝试。
import urllib
urllib.urlretrieve('http://url.com', 'page.htm')
页面中有这个:
<div name="mainbody" style="font-size: x-large;margin:auto;width:33;">
<b><a href="w.cgi?hsn=10543">Plateau (19:01)</a></b>
<br/> Wired: 17.4
<br/>P10 Chard: 16.7
<br/>P1 P. Gris: 17.1
<br/>P20 Pinot Noir: 15.8-
<br/>Soil Temp : Error
<br/>Rainfall: 0.2<br/>
</div>
我需要 Wired: 行中的 17.4 值
有什么建议吗?
谢谢
最佳答案
从不使用 urlretrieve()
开始;您需要的是数据,而不是文件。
接下来,使用 HTML 解析器。 BeautifulSoup非常适合从 HTML 中提取文本。
使用 urllib2
检索页面将是:
from urllib2 import urlopen
response = urlopen('http://url.com/')
然后将数据读入BeautifulSoup:
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.read(), from_encoding=response.headers.getparam('charset'))
那里的 from_encoding
部分将告诉 BeautifulSoup Web 服务器告诉您该页面使用什么编码;如果网络服务器没有指定,那么 BeautifulSoup 将为您做出有根据的猜测。
现在您可以搜索您的数据:
for line in soup.find('div', {'name': 'mainbody'}).stripped_strings:
if 'Wired:' in line:
value = float(line.partition('Wired:')[2])
print value
对于您的演示 HTML 片段,它提供:
>>> for line in soup.find('div', {'name': 'mainbody'}).stripped_strings:
... if 'Wired:' in line:
... value = float(line.partition('Wired:')[2])
... print value
...
17.4
关于python - 使用python从网页中读取值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19175180/
这个问题在这里已经有了答案: final keyword in method parameters [duplicate] (9 个回答) 关闭 8 年前。 在此示例中,声明 Object fina
我的目标:是通过我的函数更新字段获取选定值并使用函数输出值运行它。 问题:当我从列表中选择值时,它不会触发函数,也不会更新字段。 感谢您的帮助。 HTML 12 14 16 18 20 22 24
我有一本具有这种形式的字典: myDict = {'foo': bar, 'foobar baz': qux} 现在,我想拆分字典键中的空格,使其成为下一个键并获取值(重复)。 myDictRev1
vector a; vector b; int temp_holder; cout > temp_holder) a.push_back(temp_holder); cout > temp_h
Java 的开发过程中免不了与 Date 类型纠缠,准备总结一下项目经常使用的日期相关操作,JDK 版本 1.7,如果能够帮助大家节约那么几分钟起身活动一下,去泡杯咖啡,便是极好的,嘿嘿。当然,我
我正在使用 jquery ui 日期选择器来获取 fromDate 和 toDate 以下是from日期的代码 $("#from_date").datepicker({
我是一名优秀的程序员,十分优秀!