gpt4 book ai didi

c# - 从 mht 中提取文本

转载 作者:行者123 更新时间:2023-11-30 12:54:01 32 4
gpt4 key购买 nike

我有一个 mht 文件,我想得到 mht 的所有文本。我很难使用正则表达式,但我在 mht 中有除英语以外的其他语言,所以文本本身包含类似 A7=A98=D6 的内容...

选择在浏览器中查看的文件的所有文本,然后将其复制并粘贴到记事本中 - 这就是我需要的。

谢谢。

最佳答案

在 Internet Explorer 中打开文件并将其保存为纯文本 (UTF-8)。 :) 如果您需要自动化解决方案,请寻找适用于您的平台或编程语言的 mht 到 txt 转换器。

实际上,您也可以在 Powershell 中自动执行此操作:

$ie = New-Object -ComObject "InternetExplorer.Application"
$ie.Navigate2("file:///C:/MyFile.mht")
$text = $ie.Document.documentElement.innerText

关于c# - 从 mht 中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/869934/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com