- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章java正则表达式解析html示例分享由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
代码如下
package work,
。
import html">java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.util.regex.Matcher; import java.util.regex.Pattern,
import org.apache.commons.httpclient.DefaultHttpMethodRetryHandler; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.HttpException; import org.apache.commons.httpclient.HttpStatus; import org.apache.commons.httpclient.methods.GetMethod; import org.apache.commons.httpclient.params.HttpMethodParams,
public class chuanboyi { 。
public static void main(String[] args){ // TODO Auto-generated method stub StringBuffer html = new StringBuffer(); HttpClient httpclient = new HttpClient(); //创建GET方法实例 GetMethod getMethod = new GetMethod("//www.zzvips.com"); //使用系统提供的默认恢复策略 getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, new DefaultHttpMethodRetryHandler()); try{ //执行GET方法 int statusCode = httpclient.executeMethod(getMethod); if(statusCode != HttpStatus.SC_OK){ System.out.println("Method is wrong " + getMethod.getStatusLine()); } InputStream responseBody = getMethod.getResponseBodyAsStream(); BufferedReader reader = new BufferedReader(new InputStreamReader(responseBody,"utf-8")); String line = reader.readLine(); while(line != null){ html.append(line).append("\n"); line = reader.readLine(); } reader.close(); //正则表达式 String regex = "<form name=\"compareForm\"[\\s\\S]+>[\\s\\S]+</form>.*<script.*>"; String regexa ="(?<=<li>)[\\s\\S]+?(?=</li>)"; Pattern pattern = Pattern.compile(regex); Matcher m = pattern.matcher(html); StringBuffer str = new StringBuffer(); int i = 0; while(m.find()){ str.append(m.group()); } pattern = Pattern.compile(regexa); m = pattern.matcher(str); while(m.find()){ attrs(m.group()); i++; } System.out.println("共有"+i+"条数据!"); }catch (HttpException e) { // TODO: handle exception System.out.println("Please check your provided http address!"); e.printStackTrace(); }catch (IOException e) { // TODO: handle exception System.out.println("the line is wrong!"); e.printStackTrace(); }finally{ getMethod.releaseConnection();//释放链接 } } public static void attrs(String str){ //获取url的正则表达式 String regexURL = "[a-z]+-[0-9]+\\.html"; //获取Name的正则表达式 String regexName = "(?<=title=\")[[\\w-\\s][^x00-xff]]+(?=\")"; //获取图片的正则表达式 String regexPicture = "images.*\\.jpg"; Pattern patternURL = Pattern.compile(regexURL); Pattern patternName = Pattern.compile(regexName); Pattern patternPicture = Pattern.compile(regexPicture); Matcher mURL = patternURL.matcher(str); Matcher mName = patternName.matcher(str); Matcher mPicture = patternPicture.matcher(str); if(mName.find()){ System.out.println("名字:"+mName.group()); } if(mURL.find()){ System.out.println("链接:"+mURL.group()); } if(mPicture.find()){ System.out.println("图片:"+mPicture.group()); } } } 。
。
最后此篇关于java正则表达式解析html示例分享的文章就讲到这里了,如果你想了解更多关于java正则表达式解析html示例分享的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
直接上代码,可以写在公共文件common和继承的基础类中,方便调用 ?
1、php服务端环境搭建 1.php 服务端环境 安装套件 xampp(apach+mysql+php解释器) f:\mydoc文件(重要)\dl_学习\download重要资源\apache
如下所示: Eclipse快捷键 Ctrl+1 快速修复 Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加) Ctrl+Alt+↑ 复制当前行到上一行(复制增加)
第一步:conn.PHP文件,用于连接数据库并定义接口格式,代码如下: php" id="highlighter_808731">
本篇文章整理了几道Linux下C语言的经典面试题,相信对大家更好的理解Linux下的C语言会有很大的帮助,欢迎大家探讨指正。 1、如果在Linux下使用GCC编译器执行下列程序,输出结果是什么?
安装完最新的Boost库 官方说明中有一句话: Finally, $ ./b2 install will leave Boost binaries in the lib/ subdirecto
为了梳理前面学习的《spring整合mybatis(maven+mysql)一》与《spring整合mybatis(maven+mysql)二》中的内容,准备做一个完整的示例完成一个简单的图书管理功
网站内容质量仅仅是页面综合得分里面的一项.不管算法如何改变调整,搜索引擎都不会丢弃网站页面的综合得分。 一般情况下我们把页面的综合得分为8个点: 1、标题的设置 (标题的设置要有独特性)
最近事情很忙,一个新项目赶着出来,但是很多功能都要重新做,一直在编写代码、debug。今天因为一个新程序要使用fragment来做,虽然以前也使用过fragment,不过没有仔细研究,今天顺道写篇文
Android资源命名规范 最近几个月,大量涉及android资源的相关工作。对于复杂的应用而言,资源命名的规范很有必要。除了开发人员之外,UI设计人员(或者切图相关人员)也需要对资源使用的位置非常
以前一直使用Hibernate,基本上没用过Mybatis,工作中需要做映射关系,简单的了解下Mybatis的映射。 两者相差不多都支持一对一,一对多,多对多,本章简单介绍一对一的使用以及注意点。
如下所示: ? 1
如果想在自定义的View上面显示Button 等View组件需要完成如下任务 1.在自定义View的类中覆盖父类的构造(注意是2个参数的) 复制代码 代码如下: publ
实现功能:实现表格tr拖动,并保存因为拖动改变的等级. jsp代码 ?
代码:测试类 java" id="highlighter_819000"> ?
红黑树是一种二叉平衡查找树,每个结点上有一个存储位来表示结点的颜色,可以是red或black。 红黑树具有以下性质: (1) 每个结点是红色或是黑色 (2) 根结点是黑色的 (3) 如果一个
废话不多说,直接上代码 ? 1
码代码时,有时候需要根据比较大小分别赋值: ? 1
实际项目开发中,我们经常会用一些版本控制器来托管自己的代码,今天就来总结下Git的相关用法,废话不多说,直接开写。 目的:通过Git管理github托管项目代码 1、下载安装Git 1、下载
直接上代码: 复制代码 代码如下: //验证码类 class ValidateCode { private $charset = 'abcdefghkmnprstuvwxyzABC
我是一名优秀的程序员,十分优秀!