正则提取a标签以及href链接
代码如下:
string content = "<p>下载地址:<a title=" 持续更新补丁下载地址 " target=" _blank " href=" http: //pan.baidu测试数据/s/xxxx">持续更新补丁下载地址</a></p><p>"; pattern pattern_a = compile( "<a[^>]*href=(" ([^ "]*)" | '([^' ]*)'|([^s>]*))[^>]*>(.*?)</a>"); matcher matcher_a = pattern_a.matcher(content); system.out.println( "网站连接" ); while (matcher_a.find()) { for ( int i = 0; i < matcher_a.groupcount(); i++) { system.out.println(matcher_a.group(i)); } }
输出结果如下:
<a title= "持续更新补丁下载地址" target= "_blank" href= "http://pan.baidu测试数据/s/xxxx" >持续更新补丁下载地址</a> "http://pan.baidu测试数据/s/xxxx" http: //pan.baidu测试数据/s/xxxx null null
java 匹配正则表达式大全
java匹配字符串表达式在我们数据处理方面是及其重要的,现在就把我这几天数据处理比较常用的向大家介绍一下,常规的一些匹配方式就不介绍了,我们来学习一些特殊的
一.我们先举个例子来看看java匹配正则表达式
1 2 3 4 5 6 7 |
pattern pattern = pattern测试数据pile( "采购(人名称|人单位|名称).*" ); matcher matcher = pattern.matcher( "采购名称乒位" ); string datestr = null ; if (matcher.find()) { datestr = matcher.group( 0 ); system.out.println(datestr); } |
运行结果如下:
二.匹配表达式的特殊情况
(1)匹配中文字符
1 2 3 4 5 6 7 |
pattern pattern = pattern测试数据pile( "[u4e00-u9fa5]" ); matcher matcher = pattern.matcher( "2322购购购购232323" ); string datestr = null ; if (matcher.find()) { datestr = matcher.group( 0 ); system.out.println(datestr); } |
运行结果如下:
(2).匹配从规定字符开始所有非换行字符
1 2 3 4 5 6 7 |
pattern pattern = pattern测试数据pile( "1.*" ); matcher matcher = pattern.matcher( "2312购购购购232323" ); string datestr = null ; if (matcher.find()) { datestr = matcher.group( 0 ); system.out.println(datestr); } |
运行结果如图:
(3)使用字符串数组匹配多个条件匹配字符串,这是我在实习进行处理数据的一个例子,希望有助于大家理解:
(4).对于字符串匹配查找多个符合条件的字符字串,我们用到group(),
group(num=0) : 匹配的整个表达式的字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值的元组。
groups() : 返回一个包含所有小组字符串的元组,从 1 到 所含的小组号。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
原文链接:https://blog.csdn.net/u011781521/article/details/88936540
查看更多关于JAVA 使用正则提取A标签以及href链接的详细内容...