- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在尝试通过尝试获取信息的方式来提高应用程序的速度。
我阅读了一个 html 页面,从中获取了 URL
和其他信息。为此,我主要使用 String.contains()
和 String.split()
。但我想知道最有效的方法是什么。我看了一点并尝试了其中的一些,但结果对我来说非常相似:/
这是我的一些代码(某些部分只是用于测试):
Pattern p = Pattern.compile("\" title=\"Read ");
//Pattern p2 = Pattern.compile("Online\">");
//Pattern p3 = Pattern.compile("</a></th>");
Pattern p4 = Pattern.compile("Online\">(.*)</a></th>");
while ((inputLine = in.readLine()) != null)
{
if(inputLine.contains("<table id=\"updates\">"))
{
tmp = inputLine.split("<tr><th><a href=\"");
for(String s : tmp)
{
if(s.contains("\" title=\"Read "))
{
//url = s.split("\" title=\"Read ")[0].replace(" ", "%20");
//name = s.split("Online\">")[1].split("</a></th>")[0];
url = p.split(s)[0].replace(" ", "%20");
//name = p3.split(p2.split(s)[1])[0];
Matcher matcher = p4.matcher(s);
while(matcher.find())
name = matcher.group(1);
array.add(new Object(name, url));
}
}
break;
}
}
正如你所看到的,我在这里尝试了Pattern
、Matcher
、split
或pattern.split()
但是我还知道有replaceAll或replaceFirst
。
在这种情况下,对您来说最好的方法是什么?
非常感谢。
PS:我在这里读到:http://chrononsystems.com/blog/hidden-evils-of-javas-stringsplit-and-stringr Pattern.split
比 split()
更好,但我找不到更大的基准。
-----更新----
Pattern p1 = Pattern.compile("\" title=\"Read ");
Pattern p2 = Pattern.compile("Online\">(.*?)</a></th>");
Matcher matcher = p2.matcher("");
while( (inputLine = in.readLine()) != null)
{
if( (tmp = inputLine.split("<tr><th><a href=\"")).length > 1 )
{
for(String s : tmp)
{
if(s.contains("\" title=\"Read "))
{
url = p1.split(s)[0].replace(" ", "%20");
if(matcher.reset(s).find())
name = matcher.group(1);
arrays.add(new Object(name, url));
}
}
break;
}
}
最佳答案
任何使用正则表达式( matches(s)
、 replaceAll(s,s)
、 replaceFirst(s,s)
、 split(s)
和 split(s,i)
)的字符串函数都会编译正则表达式并每次都会创建一个 Matcher 对象,在循环中使用时效率非常低。
如果您需要加快速度,第一步是停止使用 String 函数,而直接使用 Pattern 和 Matcher。这是an answer我在其中演示了这一点。
理想情况下,您应该只创建一个单个 Matcher 对象,正如我在 this answer 中所述。 .
有关更多正则表达式信息,请查看 FAQ
关于java - 正则表达式模式,匹配器,split或pattern.split()哪个是最有效的,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22999122/
这个问题在这里已经有了答案: Difference between / and /* in servlet mapping url pattern (5 个回答) 4年前关闭。 web.xml 中的/
Scala 具有支持模式匹配中析取的语言功能(“模式替代”): x match { case _: String | _: Int => case _ => } 但是,如果审查满足 P
解释我的问题: 类别:玩具 特质 1:说话像男性 特质2:说话像女性 我能否在运行时更改 Toy 的行为(特征),以便有时同一个对象说话像男性,有时同一个对象说话像女性? 我想在运行时改变说话行为。
我已经能够找到很好的资源,这些资源告诉我 Java API 中的 MouseAdapter 没有使用适配器模式。问题是:MouseAdapter 是否实现了某种模式? 我知道它的作用:它为 Mouse
我有兴趣了解有关模式识别的更多信息。我知道这是一个广泛的领域,所以我将列出一些我想学习处理的特定类型的问题: 在看似随机的字节集中查找模式。 识别图像中的已知形状(例如圆形和正方形)。 注意给定位置流
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 8 年前。 Improve this ques
所以,问题很简单:在 awk 中,if (var ~/pattern/) 是否与 if (var ~ "pattern") 相同? 我已经对 csv 进行了一些基本测试,两者似乎都产生了相同的结果..
我的问题是 this 的 Scala (Java) 变体Python 上的查询。 特别是,我有一个字符串 val myStr = "Shall we meet at, let's say, 8:45
我最近一直在研究正则表达式并注意到了这一点。 Pattern pNoEmbed = Pattern.compile("[ a-z]+", Pattern.CASE_INSENSITIVE); Patt
在研究大型应用程序的 C++ 源代码时,我发现了这种模式(该示例的语法可能很粗略,但基本细节都在那里): class A : X friend B; B *parent; ...
有人可以举一个“中介者模式”在现实世界中有用的用例吗? 最佳答案 Mediator是一种添加第三方对象以控制一组(2 个或更多)对象之间交互的方法。 您能找到的最简单的示例是 Chat Room例如,
尝试编译以下代码片段时: type 'a frame = Empty | Frame of string * 'a * 'a frame let rec searchFrame f s = match
目标 我的目标是获得一个 servlet 过滤器来处理对主页的请求,然后再将它们转发到 index.jsp。 问题 我无法让过滤器接收来自“/”的请求。它的 URL 模式是 / 相反,对该模式的请求最
这个问题已经有答案了: Difference between / and /* in servlet mapping url pattern (5 个回答) 已关闭 6 年前。 我已经设置了一个具有此
第 6 章(代码重用模式)中有以下示例: // the parent constructor function Parent(name) { this.name = name || 'Adam
Pattern类中的pattern()方法和toString()方法有什么区别? 文档说: public String pattern() Returns the regular expression
我有脚本 here并且 ng-pattern 工作正常,因为 scope.subnet 仅在输入匹配模式后才显示在输出中。但是如果 ng-pattern 不匹配,ng-show 不会显示任何错误
我想知道为什么当提供相同的正则表达式和相同的字符串时,java regex pattern.matcher() 和 pattern.matches() 的结果会不同 String str = "hel
This SO answer引用“患有模式综合症的小男孩”。虽然我可以通过上下文推断出一些含义,但我并不完全理解。 “有模式综合症的小男孩”的良好定义是什么? 最佳答案 它只是意味着寻找将模式注入(i
我有以下微服务架构的用例。 我的问题是,在当前情况下,我有 3 个微服务和一个 APIGateway。 最后,网关必须在聚合(组合)来自 3 个服务的数据之前进行大量查询。因为这 3 个微服务只提供基
我是一名优秀的程序员,十分优秀!