Bootstrap

Java中正则表达式及 Pattern 和 Matcher 类

        正则表达式一般用于对字符串的处理,能用字符串方法直接处理的一般有以下几个方面

1.校验(matches)

        用于检验字符串是否符合某一格式

String qq = "12345678"
qq.matches("[1-9]\\d{5,19}");//不以0开头,长度6-20

2.替换(replaceAll)

String s1 = "古力娜扎ai8888迪丽热巴999aa5566马尔扎哈fbbfsfs42425卡尔扎巴";
s1.replaceAll("\\w+", "-");//非中文字符替换成-

3.分割(split)

String s3 = "古力娜扎ai8888迪丽热巴999aa5566马尔扎哈fbbfsfs42425卡尔扎巴";
String[] names = s3.split("\\w+"); // 获取人名

Pattern 类与 Matcher 类 

        这两个类是处理正则表达式所需用的,首先Pattern类是用来将正则字符串预编译解析成一种模式,以便之后的复用。

// 定义规则,正则表达式
String regex = "";
// 把正则表达式封装成一个Pattern对象
Pattern pattern = Pattern.compile(regex);

        然后调用其中的 matcher() 方法,创建 Matcher 实例。在源码中可看到创建实例时,将调用者,也就是正则模式,也传入进去了。此时实例中拥有了 将要搜寻的原字符串 和 正则规则,这个实例也就是所谓的匹配器。

        最后根据所需调用匹配器中的方法。

// 通过pattern对象去获取查找内容的匹配器对象。
Matcher matcher = pattern.matcher(data);
// 定义一个循环开始爬取信息
while (matcher.find()){
    String rs = matcher.group(); // 获取到了找到的内容了。
    System.out.println(rs);
}

        观察Matcher类发现,其中也有 matches() 和 replaceAll() 方法,其实在调用String的这些方法时,Java也会进行 编译Pattern对象 ----->  创建Matcher实例 -----> 执行Matcher对应方法 这个过程。只是用String调用,更加便捷,但是不够灵活,效果单一,用 Pattern 类与 Matcher 类的话,可以先进行设定区域、查找等操作。

 

;