- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试从“决赛比赛列表”表(第二张表)中删除 Year & Winners(第一列和第二列) http://en.wikipedia.org/wiki/List_of_FIFA_World_Cup_finals :我正在使用下面的代码:
import urllib2
from BeautifulSoup import BeautifulSoup
url = "http://www.samhsa.gov/data/NSDUH/2k10State/NSDUHsae2010/NSDUHsaeAppC2010.htm"
soup = BeautifulSoup(urllib2.urlopen(url).read())
soup.findAll('table')[0].tbody.findAll('tr')
for row in soup.findAll('table')[0].tbody.findAll('tr'):
first_column = row.findAll('th')[0].contents
third_column = row.findAll('td')[2].contents
print first_column, third_column
使用上面的代码,我能够很好地获得第一列和第三列。但是当我对 http://en.wikipedia.org/wiki/List_of_FIFA_World_Cup_finals
使用相同的代码时,它找不到 tbody 作为它的元素,但是当我检查元素时我可以看到 tbody。
url = "http://en.wikipedia.org/wiki/List_of_FIFA_World_Cup_finals"
soup = BeautifulSoup(urllib2.urlopen(url).read())
print soup.findAll('table')[2]
soup.findAll('table')[2].tbody.findAll('tr')
for row in soup.findAll('table')[0].tbody.findAll('tr'):
first_column = row.findAll('th')[0].contents
third_column = row.findAll('td')[2].contents
print first_column, third_column
这是我从评论错误中得到的:
'
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-150-fedd08c6da16> in <module>()
7 # print soup.findAll('table')[2]
8
----> 9 soup.findAll('table')[2].tbody.findAll('tr')
10 for row in soup.findAll('table')[0].tbody.findAll('tr'):
11 first_column = row.findAll('th')[0].contents
AttributeError: 'NoneType' object has no attribute 'findAll'
'
最佳答案
如果您通过浏览器中的检查工具进行检查,它将插入 tbody
标签。
源代码可能包含也可能不包含它们。如果您真的想知道,我建议您查看源代码 View 。
无论哪种方式,您都不需要遍历到 tbody,只需:
soup.findAll('table')[0].findAll('tr')
应该可以。
关于python - 如何从 python beautiful soup 的表中获取 tbody?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20522820/
我正在尝试从该网站上名为“燃料混合图”的表中提取数据:https://www.iso-ne.com/isoexpress/我正在使用 BeautifulSoup 读取 HTML 并提取下面列出的表格,
我一直在为这个问题伤脑筋。 我有一个 div 布局,其中某些 div 可以折叠或显示。在这些 div 下方是一个带有表格的 div。我想要的是当内容不再适合页面时,tbody 变得可滚动。我不能给 t
我试图在包含多个 tbody 元素的表的 tbody 部分之间创建一些空间,即间隙,但没有取得任何成功。怎么做到的? .
是否可以像这样在外部 tbody 中有一个内部 tbody: 这是一个示例 CSS: .class1 {background-color:#ff0000;} .class2 {b
我在 JavaScript 中添加行时遇到问题。一切正常,但在 tbody 标签之后添加了行。我需要在 tbody 中添加。 片段: function deleteRow(row) { var i
我有一个表,并使用 jquery 在我的表中添加了更多 tbody。现在我想在单击删除按钮时删除选定的 tbody,我的代码删除一行而不是删除所有选定的 tbody。怎么办?我的代码是:
我正在努力实现以下目标: 包含 div 内的 table 元素 table 没有设置width(可以是 100%),但它不能比包含的 div 宽 table 的单元格是固定宽度的(使用 width 和
我有一个表格,我需要在 tbody 中添加一个垂直滚动条。我看过一些代码但不适合我或者我不理解。我也不太擅长CSS。我添加了一个 div 并将我的 tbody 放在那里。它适用于滚动,但 tbody
我有一个带有滚动 tbody 的工作表,通过使用带有以下内容的 css。 tbody{ overflow:auto; } thread > tr, tbody{ display:block;
这是我的代码: test 运行上面的代码后,自动变成了这样: test
当我滚动浏览这个 overflow:auto; 时,我无法让这些 td 的边框跟随它们的行; .关于修复的任何想法? 注意:设置 table-layout:fixed 或使行 display:blo
嗨,我有一个问题。我想问一下如何让tbody子元素的大小与thead后第一行的大小相同? 这是我的代码..请帮助我..您可以编辑我的 fiddle 或给出答案 var theadFlag =
我知道这是一个非常简单的查询,但我花了一整天时间让它工作,但运气不好。我正在尝试删除任何带有其 ID 的 tbody,但它不是通过我在网上找到的任何方法删除的。我在这里犯了什么错误? $(do
这是固定外部高度的表格,我需要滚动开始时,thead 将被固定,tbody 将滚动显示每列的标题。是否有任何想法将表格的标题固定在顶部和表格的内部内容将滚动。 .max_height{max-heig
这个问题在这里已经有了答案: Why do browsers insert tbody element into table elements? (2 个答案) 关闭 9 年前。 我有一个非常简单的
我正在使用 xml-conduit 和 Text.XML.Cursor 来导航一些带有嵌套表的糟糕 html。有一个带有两个 tbody 标签的表,我想要第一个 tbody 的直接子 tr 标签。这是
对于某些数据集,数据表中不显示任何数据 - 仅显示列标题或列标签。即使页面上的代码没有更改,也会发生这种情况。有问题的数据在浏览器开发工具 Console.logs 中正确显示。 如下所示,DataS
我需要将 json 中的数据作为表中的行追加。我需要将 id="project"的行添加为自己的 tbody 中的第一行。如果检测到新项目,将创建新的 tbody,并且项目和任务将拥有自己的 tbod
我试图首先在页面加载时仅显示 thead 和几行数据(永久显示分组在 thead 下的数据)。加载页面后,我希望选定的对象选择(不显示任何 tbody 组)并通过选择顶部下拉菜单中的选项(以显示选定的
我已将以下 CSS 应用于我的表格。 thead, tbody { display: block; } tbody { height: 200px; overflo
我是一名优秀的程序员,十分优秀!