作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想将网页(所有内容)保存为文本文件。 (就像您右键单击网页 -> “页面另存为” -> “另存为文本文件”而不是 html 文件一样)
我试过使用下面的代码:
import urllib2
url=''
page = urllib2.urlopen(url)
page_content = page.read()
file = open('file_text.txt', 'w')
f.write(page_content)
f.close()
我的目标是能够在没有 html 代码的情况下保存整个文本。(例如我想读“è”而不是“é”)
最佳答案
import urllib2
import html2text
url=''
page = urllib2.urlopen(url)
html_content = page.read()
rendered_content = html2text.html2text(html_content)
file = open('file_text.txt', 'w')
file.write(rendered_content)
file.close()
关于python - 如何将网页保存为文本文件[Python],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35166169/
我是一名优秀的程序员,十分优秀!