正则表达式一般用于对字符串的处理,能用字符串方法直接处理的一般有以下几个方面
1.校验(matches)
用于检验字符串是否符合某一格式
String qq = "12345678" qq.matches("[1-9]\\d{5,19}");//不以0开头,长度6-20
2.替换(replaceAll)
String s1 = "古力娜扎ai8888迪丽热巴999aa5566马尔扎哈fbbfsfs42425卡尔扎巴"; s1.replaceAll("\\w+", "-");//非中文字符替换成-
3.分割(split)
String s3 = "古力娜扎ai8888迪丽热巴999aa5566马尔扎哈fbbfsfs42425卡尔扎巴"; String[] names = s3.split("\\w+"); // 获取人名
Pattern 类与 Matcher 类
这两个类是处理正则表达式所需用的,首先Pattern类是用来将正则字符串预编译解析成一种模式,以便之后的复用。
// 定义规则,正则表达式 String regex = ""; // 把正则表达式封装成一个Pattern对象 Pattern pattern = Pattern.compile(regex);
然后调用其中的 matcher() 方法,创建 Matcher 实例。在源码中可看到创建实例时,将调用者,也就是正则模式,也传入进去了。此时实例中拥有了 将要搜寻的原字符串 和 正则规则,这个实例也就是所谓的匹配器。
最后根据所需调用匹配器中的方法。
// 通过pattern对象去获取查找内容的匹配器对象。 Matcher matcher = pattern.matcher(data); // 定义一个循环开始爬取信息 while (matcher.find()){ String rs = matcher.group(); // 获取到了找到的内容了。 System.out.println(rs); }
观察Matcher类发现,其中也有 matches() 和 replaceAll() 方法,其实在调用String的这些方法时,Java也会进行 编译Pattern对象 -----> 创建Matcher实例 -----> 执行Matcher对应方法 这个过程。只是用String调用,更加便捷,但是不够灵活,效果单一,用 Pattern 类与 Matcher 类的话,可以先进行设定区域、查找等操作。