python - 如何获取lxml中html的源码？-6ren

python - 如何获取lxml中html的源码？

转载作者：太空狗更新时间：2023-10-30 02:48:06

25

4

import urllib
import lxml.html
down='http://blog.sina.com.cn/s/blog_71f3890901017hof.html'
file=urllib.urlopen(down).read()
root=lxml.html.document_fromstring(file)
body=root.xpath('//div[@class="articalContent  "]')[0]
print body.text_content()

当我运行代码时，我得到的是文本内容，我怎样才能得到它的html源代码，而不是文本内容？

最佳答案

使用

html = lxml.html.tostring(node)

请先阅读您正在使用的工具的基本文档。

关于python - 如何获取lxml中html的源码？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14098304/

25

4

0

文章推荐： python - 如何应用 ndimage.generic_filter()

文章推荐： python - 结合负前瞻和后正则表达式

文章推荐： python - 确保两个 Pandas DatetimeIndex 相同？

文章推荐： Python PyInstaller 和包含图标文件

【源码】蚁群算法TSP问题可视化
ACO.Visualization项目本项目演示蚁群算法求解旅行商问题的可视化过程，包括路径上的信息素浓度、蚁群的运动过程等。项目相关的代码：https://github.com/anycad/A
java - 在java环境下解析C++源码
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
php - 需要PHP票务系统源码
我需要用Sql数据库制作并包含的PHP票务系统源码用户客户端和管理员。我需要个人 CMS 的这个来源。谢谢你帮助我。最佳答案我在不同的情况下使用了 osticket。这里: http://ost
c# - 如何反编译pdb得到C#源码？
我的场景:我想在日志文件中写入发生异常的部分代码(例如，发生异常的行前 5 行和行后 5 行 - 或者至少是该方法的所有代码)。我的想法是用 C# 代码反编译 pdb 文件，并从该反编译文件中找到一
【RocketMQ】【源码】延迟消息实现原理
RocketMQ设定了延迟级别可以让消息延迟消费，延迟消息会使用 SCHEDULE_TOPIC_XXXX 这个主题，每个延迟等级对应一个消息队列，并且与普通消息一样，会保存每个消息队列的消费进度
SpringCloud-Hystrix服务熔断与降级工作原理&源码
先附上Hystrix源码图在微服务架构中，根据业务来拆分成一个个的服务，服务与服务之间可以相互调用（RPC），在Spring Cloud可以用RestTemplate+Ribbon和
selenium获取当前页面的url、源码、title的方法
此篇博客学习的api如标题，分别是： current_url　　　　获取当前页面的url； page_source 　　获取当前页面的源码； title　　　　　　获取当前页面的titl
LZW压缩算法 C#源码
? 1 2
详解MySQL多版本并发控制机制(MVCC)源码
1、前言作为一个数据库爱好者，自己动手写过简单的sql解析器以及存储引擎，但感觉还是不够过瘾。<<事务处理-概念与技术>>诚然讲的非常透彻，但只能提纲挈领，不能让你
一文读懂go中semaphore(信号量)源码
gory"> 目录运行时信号量机制 semaphore 前言作用是什么几个主要的方法如何实现
PHP+Mysql无刷新问答评论系统(源码)
自己写的一个评论系统源码分享给大家，包括有表情，还有评论机制。用户名是随机的针对某一篇文章进行评论 function subcomment() {
06、JDK 源码：StringBuilder
一、概述 StringBuilder是一个可变的字符串序列，这个类被设计去兼容StringBuffer类的API，但不保证线程安全性，是StringBuffer单线程情况下的一个替代实现。在可能的情
18、JDK 源码：System
一、概述 System是用的非常多的一个final类。它不能被实例化。System类提供了标准的输入输出和错误输出流；访问外部定义的属性和环境变量；加载文件和库的方法；以及高效的拷贝数组中一部分元素
03、JDK 源码：String
在JDK中，String的使用频率和被研究的程度都非常高，所以接下来我只说一些比较重要的内容。一、String类的概述 String类的声明如下： public final class Str
15、JDK 源码：Class
一、概述 Class的实例代表着正在运行的Java应用程序的类和接口。枚举是一种类，而直接是一种接口。每一个数组也属于一个类，这个类b被反射为具有相同元素类型和维数的所有数组共享的类对象。八大基本树
17、JDK 源码：Compiler
一、概述 Compiler这个类被用于支持Java到本地代码编译器和相关服务。在设计上，这个类啥也不做，他充当JIT编译器实现的占位符。放JVM虚拟机首次启动时，他确定系统属性java.comp
05、JDK 源码：StringBuffer
一、概述 StringBuffer是一个线程安全的、可变的字符序列，跟String类似，但它能被修改。StringBuffer在多线程环境下可以很安全地被使用，因为它的方法都是通过synchroni
12、JDK 源码：Enum
一、概述 Enum是所有Jav中枚举类的基类。详细的介绍在Java语言规范中有说明。值得注意的是，java.util.EnumSet和java.util.EnumMap是Enum的两个高效实现，
20、JDK 源码：Thread
一、概述此线程指的是执行程序中的线程。 Java虚拟机允许应用程序同时执行多个执行线程。每个线程都有优先权。具有较高优先级的线程优先于优先级较低的线程执行。每个线程可能也可能不会被标记为守
08、JDK 源码：Byte
一、抽象类Number 类继承关系这里面的原子类、BigDecimal后面都会详细介绍。属性和抽象方法二、概述所有的属性，最小-128，最大127，SIZE和BYTES代码比

首页

博学

6Ren·AI

商城

python - 如何获取lxml中html的源码？