- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以我编写了一个代码,用于读取和打印 HTML 代码中指定文本之间的所有内容,例如,读取段落之间的所有内容<> - 这将被打印。这是来自 senddex 类(class) - here
代码没有问题,但是出来的东西有问题。我使用非常具体的标准进行过滤
paragraphs = re.findall(r'<div style="font-size: 23px; margin-top: 20px;" class="jsdfx-sentiment-present">(.*?)</div>',str(respData))
如前所述,它有效。稍后打印内容并打印 .据我了解,这是 HTML 中的非制动空间。我希望看到数字而不是空间。在此网站中,此位置的数字每隔几秒更新一次。
我怎样才能得到这些数字而不是接收 ?
问候!
最佳答案
这取决于您下载页面的准确程度以及从何处下载,但是因为您说在网络浏览器中查看时值会不断变化,所以我敢打赌,当您下载页面时,
正是该 div 中的内容 - 页面会在您实际查看页面时通过 javascript 或其他方式即时更改它。您的教程使用静态标记,每次加载页面时都使用相同的标记,而不是在页面已处于事件状态后动态设置的标记。
在 Web 开发中为动态值执行此操作相当常见 - 将占位符值放在 div 中,然后根据需要动态编辑内容。如果当然,如果您只是拍摄页面的快照(甚至更多,如果您在 javascript 代码之前拍摄该快照,并且填充该值的诸如此类的东西有机会运行),您将不会看到更改,你得到的只是默认值,没有填写数字。
根据您链接的教程,您可能正在使用 urllib
。如果您想从 HTML 页面获取动态内容,这可能不是最好的工具 - 您应该查看 selenium
和 BeautifulSoup
。 This StackOverflow Answer详细介绍了此问题的有效解决方案。
关于Python 3.7 urllib.request 返回   而不是内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53564465/
我有一个 HTML 文档,需要通过 XSL 进行转换。HTML 文档包括 的用法即, ation. All ... 首先,我遇到了麻烦,因为没有定义。所以我定义了它: "]> 我通过
我正在遵循一个教程,其中用 PHP 编写的 Web 应用程序将输入中的空格(“id”参数)列入黑名单。任务是添加其他字符,这基本上绕过了这个黑名单,但仍然由后端的 MySQL 数据库解释。考虑到 nb
我正在学习一个教程,其中一个用 PHP 编写的 Web 应用程序将输入(“id”参数)中的空格列入黑名单。任务是添加其他字符,基本上绕过了这个黑名单,但仍然被后端的 MySQL 数据库解释。有效的是这
对于以下 JavaScript: function EscapedString(str) { var obj = document.createElement("span"); obj.inn
每当我收到来自 MS outlook 的电子邮件时,我都会收到此标记 & nbsp ; (没有空格)哪个显示为?在 <>. 当我将其更改为 ISO-8859-1 时,浏览器页面字符集编码为 UTF-8
关闭。这个问题是off-topic .它目前不接受答案。 想改善这个问题吗? Update the question所以它是 on-topic对于堆栈溢出。 9年前关闭。 Improve this q
我需要你的帮助, 如何修改下面的现有代码,使其不仅考虑替换所有 与\n'以及所有 是在 JavaScript 中带有空格分隔符的字符串中的任何位置吗? 以下是需要修改的现有代码: var txt =
这可能非常微不足道,但我正在寻找一种方法来检查字符串是否仅包含 html 实体nbsp; 示例: // checking if string ONLY CONTAINS nbsp; 'nbsp;' -
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎偏离主题,因为它缺乏足够的信息来诊断问题。 更详细地描述您的问题或 include a mini
这个问题已经有答案了: Java Regex that only replaces multiple whitepaces with Non-Breaking Spaces (3 个回答) 已关闭 8
我有一个带有 的 HTML 内容我想删除 从内容的开头和结尾。无需在中间删除。 我试过用这个: el.innerHTML = el.innerHTML.replace(/\&
我正在尝试解析一个大的 HTML 字符串,以便我可以找到以任意数量的空格 ("") 或不间断空格 ("") 开头的句点的所有实例。然后我想用删除的空格替换所有这些实例。 到目前为止我已经尝试过: va
我有一个 HTML 文本,文本中必须包含 ,然后我使用 Javascript 获取 innerHTML 并进行比较,但它不起作用. var x = randomGen(); docume
我试图在两个带间距的按钮之间放置一个段落标记。小问题是当我添加“”命令时出现奇怪的符号。我只需要把它拿出来,或者我想知道是否有其他方法可以增加空间。 HTML: LOGIN &n
我一直在 Web 应用程序中使用 prototype.js。我在选择一些单选按钮时动态地填充一些 Div。在 Div 中填充内容之前,我使用原型(prototype)的更新方法清除以前的内容 - $(
我在 html 中看到过 并且除了创建一些空白之外不能完全说出它的作用。我想知道它到底有什么作用以及应该在什么时候使用? 最佳答案 (末尾应该有一个分号)是 non-breaking space
字符是不允许换行的空格。 lorem ipsum here are some words and so on | lorem ipsum
我有一个带有 " " 的 java 字符串,来自程序使用 Buffered Reader 对象访问的文本文件。我试过 string.replaceAll(" ","") 似乎不起作用。 有什么想法吗?
是否可以在 HTML 中插入制表符而不必键入四次 ? 最佳答案 这取决于您要使用的字符集。 在 ISO-8859-1 HTML 中没有定义选项卡实体 - 但除了 之外还有几个空白字符,例如 、
任务 用 替换任何标签内容中的所有空格. y.html (示例文件) · Kit Stro
我是一名优秀的程序员,十分优秀!