java - 如何在 HTMLEditorKit 的帮助下检索 HTML 的标题-6ren

java - 如何在 HTMLEditorKit 的帮助下检索 HTML 的标题

转载作者：塔克拉玛干更新时间：2023-11-01 22:52:54

我想借助 java 的 HTMLEditorKit 检索 TITLE 属性？这是我写的，但它会一直返回“null”，而 Eclipse 中的检查器并没有多大帮助!

import java.io.FileReader;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.Reader;
import java.net.URL;
import javax.swing.text.MutableAttributeSet;
import javax.swing.text.html.HTML;
import javax.swing.text.html.HTMLEditorKit;
import javax.swing.text.html.parser.ParserDelegator;
public class testHTML

{
  public static void main(String args[]) throws Exception 
  {

    Reader reader = new FileReader("C:\\wamp\\www\\t\\index.html");

    new ParserDelegator().parse(reader, new LinkPage(), true);

  }
}
class LinkPage extends HTMLEditorKit.ParserCallback 
{
    public void handleSimpleTag(HTML.Tag tag,
            MutableAttributeSet attributes, int pos) {

        if (tag == HTML.Tag.TITLE)
        {
            System.out.println(attributes.getAttribute(HTML.Attribute.TITLE));
        }
    }
  public void handleStartTag(HTML.Tag t, MutableAttributeSet a, int pos) 
  {
//    if (t == HTML.Tag.A) 
//    {
//      //System.out.println("<BR>");
//      
//    }
//    if(t == HTML.Tag.TITLE)
//    {
//      System.out.println(t.toString());
//      System.out.println(t.TITLE);
//      System.out.println();
//      String text = (String)a.getAttribute(HTML.Attribute.TITLE);
//      Object o = a.getAttribute(HTML.Attribute.TITLE);
//      System.out.println(a);
//      System.out.println(o);
//      System.out.println(text);
//    }
// 
      handleSimpleTag(t, a, pos);
  }
}

HTML 的内容是:

<html>
<head>
<title>test</title>
</head>
<body>
test
<a href="http://localhost/t/1.html">link1</a>
sdf
<a href="http://localhost/t/2.html">link2</a>
sdf
<a href="http://localhost/t/1.html">link3</a>
sdf
<a href="http://localhost/t/2.html">link3</a>
</body>
</html>

p.s :我知道 XPATH 、 REGEX 和任何其他第 3 方组件可以轻松检索 HTML 属性，但我也想学习困难的方法。

最佳答案

import javax.swing.text.MutableAttributeSet;
import javax.swing.text.html.HTML;
import javax.swing.text.html.HTMLEditorKit;
import javax.swing.text.html.parser.ParserDelegator;
import java.io.Reader;
import java.io.StringReader;

public class Test2 {
    public static final String content = "<html> \n" +
            "<head> \n" +
            "<title>test</title> \n" +
            "</head> \n" +
            "<body> \n" +
            "test \n" +
            "<a href=\"http://localhost/t/1.html\">link1</a> \n" +
            "sdf \n" +
            "<a href=\"http://localhost/t/2.html\">link2</a> \n" +
            "sdf \n" +
            "<a href=\"http://localhost/t/1.html\">link3</a> \n" +
            "sdf \n" +
            "<a href=\"http://localhost/t/2.html\">link3</a> \n" +
            "</body> \n" +
            "</html> ";

    public static void main(String args[]) throws Exception {
        Reader reader = new StringReader(content);
        new ParserDelegator().parse(reader, new LinkPage(), true);
    }
}

class LinkPage extends HTMLEditorKit.ParserCallback {
    int startPos = -1;

    public void handleText(char[] data, int pos) {
        if (startPos >= 0) {
            startPos = pos;
        }
    }

    public void handleEndTag(HTML.Tag t, int pos) {
        super.handleEndTag(t, pos);
        if (t == HTML.Tag.TITLE) {
            System.out.println(Test2.content.substring(startPos, pos));
            startPos = -1;
        }
    }

    public void handleStartTag(HTML.Tag t, MutableAttributeSet a, int pos) {
        super.handleStartTag(t, a, pos);
        if (t == HTML.Tag.TITLE) {
            startPos = pos;
        }
    }
}

关于java - 如何在 HTMLEditorKit 的帮助下检索 HTML 的标题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/9580684/

文章推荐： java - 在 Spring Framework 3.0 中同时使用 Hibernate 和 Jdbc

文章推荐： java - 如何在 Eclipse 中定义 @since 标签？

文章推荐： java - 有多少对象符合垃圾收集器的条件

java - 格式化 HTMLEditorKit
我正在尝试在 JTextPane 中进行一些基本的格式化。为此，我决定使用 html(HTMLDocument 和 HTMLEditorKit)。这里是按钮的操作监听器代码，应使所选文本变为粗体 b
java - HTMLEditorKit insertHTML 向字符串添加换行符
HTMLEditorKit.insertHTML(doc, doc.getLength(), "Test", 0, 0, null); 结果: "Test " -添加'\n' HTMLEditorKi
java - 如何正确使用 `HTMLEditorKit.insertHTML()` ？
这是我的代码。 editPane 是一个 JEditorPane。HTMLKit 是分配给 editPane 的 HTMLEditorKit。 try { HTMLKit.insertHTML(
java - 如何从 HTMLEditorKit 获取特定的操作？
我想用 JEditorPane 创建一个简单的测试应用程序显示一些 HTML 内容和一个使所选文本加粗的按钮。 HTMLEditorKit已经为这个按钮提供了必要的操作，所以我可以像这样用复杂的代码来
java - HTMLDocument、HTMLEditorKit 和空格
当我运行以下代码时: import java.io.IOException; import java.io.Reader; import java.io.StringReader; import ja
java - 使用 HTMLEditorKit 工作
我是一个新手 Java 程序员，正在尝试使用 HTMLEditorKit 库遍历 HTML 文档并将其更改为我的链接(主要是为了好玩，我正在做的事情可以在手上完成而不会出现问题) 但我的问题是:在我修
java - JTextPane/HTMLEditorKit 内存泄漏
我的一个应用程序(一个基本的 IRC 工具)遇到以下问题，该工具使用“HTMLEditorKit”作为输出 GUI 将消息添加到“JTextPane”。我注意到，随着时间的推移，我的应用程序随机地使用
java - 奇怪的 HTMLEditorKit 问题
下面的代码片段存在问题，如果在包含小程序窗口的浏览器中按下重新加载按钮，它将无法工作。它在小程序第一次启动时起作用，但在重新加载时不起作用。同样的事情也发生在 AppletViewer 中。原因是
java - JEditorPane、HTMLEditorKit - 插入自定义标签的自定义操作
我相信 JEditorPane .我需要简单的编辑器。我已经解决了加载和修改包含自定义(两个)标签的 HTML 的问题(参见 my older post )。它可以正确显示文档，我现在甚至可以编辑它。
java - JEditorPane 中的 HTMLEditorKit 和自定义标签
我使用说明添加我自己的标签 http://java-sl.com/custom_tag_html_kit.html class MyParserDelegator extends ParserDele
java - 有没有办法过滤/搜索 HTMLEditorKit 中的内容？
我有一个普通的 HTMLEditorKit() 对象: historyKit = new HTMLEditorKit(); historyDoc = new HTMLD
java - 使用 HTMLEditorKit 缓慢解析动态 JTextPane
我遇到以下问题，即我将 JTextPane 与 HTMLEditorKit 结合使用，并向 Pane 动态添加内容。内容可以超过几行，还包含大量图像(小图标)。现在的问题是，如果我插入例如一堆带有图标
关于 HTMLEditorKit 的 Java 编程
我的源代码在下面。我只想控制字体颜色的 css。我像这样插入 HTML。 I love apple pie. 在 tag1 的情况下，我希望“我爱苹果”变成红色字体。但只有“我爱”变成红色字体。
java - HTMLEditorKit 是否根据 IE 版本呈现？
HTMLEditorKit 是否正确在呈现 HTML 内容时忽略如下所示的标签(用于在 IE7+ 浏览器中模拟 IE7)？有关 HTMLEditorKit 的文档提到它: ..supports H
java - 如何在使用 HTMLEditorKit 构建的 HTML 编辑器中提供更改文本部分背景颜色的功能
我的问题如下: 我想让我的小 HTML 编辑器的用户在两者之间切换输入文本的不同背景颜色。我第一次尝试为此目的使用 CSS 样式。不同的风格定义不同的背景颜色和通过一个JComboBox用户可以在这些
java - JEditorPane 和 HTMLEditorKit 的替代品——太慢了
我正在尝试实现一个基本的文本编辑器，其中包含字体、粗体、斜体、下划线和颜色选项。我使用了 JEditorPane 和关联的 HTMLEditorKit，但是当我加载一个 400K 的文档时，它需要整整
java - HTMLEditorKit 在 JEditorPane HTML 中修改我的文本
我正在使用 JTextPane 编辑 HTML，当我使用 getText() 和 setText() 方法时，它会更改我的文本。例如，如果我使用 setter 方法设置此文本。 ESTO E
java - 如何在 HTMLEditorKit 的帮助下检索 HTML 的标题
我想借助 java 的 HTMLEditorKit 检索 TITLE 属性？这是我写的，但它会一直返回“null”，而 Eclipse 中的检查器并没有多大帮助! import java.io.Fil
java - 为什么 HTMLEditorKit 不想在元素内插入 元素？
完整源代码可以在 here 找到. 如何在源中重现: 运行程序点击粗体按钮输入一些内容转到粗体文本内的某个位置点击斜体按钮输入更多内容请注意斜体文本不是粗体。 MCVE: 给你。大部分是由

Java Swing 的 HTMLEditorKit 删除了 SPAN 元素的嵌套
我正在使用 JTextPane 实现一个简单的 HTML 编辑器, HTMLDocument和HTMLEditorKit 。代码如下: public class SimpleHTMLEditor ex

塔克拉玛干

个人简介
我是一名优秀的程序员,十分优秀！

作者热门文章

iOS/Objective-C 元类和类别

objective-c - -1001 错误，当 NSURLSession 通过 httpproxy 和/etc/hosts

java - 使用网络类获取 url 地址

ios - 推送通知中不播放声音

滴滴打车优惠券免费领取

全站热门文章

巧用mask属性创建一个纯CSS图标库

Java代码覆盖率super-jacoco

armmattermost

Vulnhub经典靶机：from_sqli_to_shell_i386入门靶机

【Rive】波动文字

Vscode实现应用qss样式表

DocforDevNow

干掉EasyExcel！FastExcel初体验

爬虫自动化脚本+AI赋能

快手后端面试，被面试官秒挂了！

首页

博学

6Ren·AI

商城

java - 如何在 HTMLEditorKit 的帮助下检索 HTML 的标题