gpt4 book ai didi

java - 帮助 java 正则表达式

转载 作者:塔克拉玛干 更新时间:2023-11-02 07:56:22 25 4
gpt4 key购买 nike

嘿,我一直在与这个正则表达式作斗争,但我没有想法。我有这种类型的字符串(不是所有的都在这里,但只有这两种类型),我必须提取 th 标签之间的部分。

<th class="tip" title='manje'>manje</th>
<th class="tip" title='ne d.'>ne d.</th>
<th class="tip" title='manje'>manje</th>
<th class="tip" title='točno'>točno</th>
<th class="tip" title='više'>više</th>
<th class="tip" title='m./t.'>m./t.</th>
<th class="tip" title='v./t.'>v./t.</th>
<th class="tip">daje</th>
<th class="tip">X2</th>
<th class="tip">12</th>

我已经尝试了一些组合,但如果 th 标签中没有该属性“title”,我只会得到值。

此模式仅在 th 标签中没有“title”属性时提取内容:

Pattern pattern = Pattern.compile("<th class=\"tip\"[\\s*|[.]{0,20}]>(.*?)\\s*</th>");

这个还有:

Pattern patternType = Pattern.compile("<th class=\"tip\"[\\s*|[.]{0,20}]>(.*?)\\s*</th>");

有什么建议吗?发送

最佳答案

正则表达式并不适用于所有情况。改用 Jsoup:

package so6235727;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class PrintContent {

private static final String html = //
"<th class=\"tip\" title='manje'>manje</th>\r\n" + //
"<th class=\"tip\" title='ne d.'>ne d.</th>\r\n" + //
"<th class=\"tip\" title='manje'>manje</th>\r\n" + //
"<th class=\"tip\" title='točno'>točno</th>\r\n" + //
"<th class=\"tip\" title='više'>više</th>\r\n" + //
"<th class=\"tip\" title='m./t.'>m./t.</th>\r\n" + //
"<th class=\"tip\" title='v./t.'>v./t.</th>\r\n" + //
"<th class=\"tip\">daje</th>\r\n" + //
"<th class=\"tip\">X2</th>\r\n" + //
"<th class=\"tip\">12</th>\r\n";

public static void main(String[] args) {
Document jsoup = Jsoup.parse(html);
Elements headings = jsoup.select("th.tip");
for (Element element : headings) {
System.out.println(element.text());
}
}
}

看到这有多简单了吗?

关于java - 帮助 java 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6236417/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com