gpt4 book ai didi

java - 如何计算 HTML 源代码中的字数(文本)

转载 作者:太空狗 更新时间:2023-10-29 13:23:14 25 4
gpt4 key购买 nike

我有一些 html 文档,我需要返回文档中的字数。此计数应仅包括实际文本(因此没有 html 标记,例如 html、br 等)。

任何想法如何做到这一点?自然地,我更愿意重新使用一些代码。

谢谢,

阿萨夫

最佳答案

  • 去掉HTML标签,获取文本内容,重用Jsoup

  • 逐行读取文件,按住 Map<String, Integer> wordToCountMap通读并操作Map

关于java - 如何计算 HTML 源代码中的字数(文本),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6029262/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com