正则十八式-第二式:控鹤擒龙
时间:2022-07-27
本文章向大家介绍正则十八式-第二式:控鹤擒龙,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
少年,见你骨骼精奇,是百年一遇的练武奇才,你我又是有缘人,随为师修炼吧
接上篇: 正则十八式-第一式:直捣黄龙
藏扇仙:"徒儿,悟得如何?"
捷特:"已忘去一半。"
半小时后...
藏扇仙:"现在呢?"
捷特:"已全部忘完。"
藏扇仙:"很好,现在为师教你:正则十八式-第二式:控鹤擒龙"
一、夹逼法则
1.贪婪模式(默认)
藏扇仙:现在要求,匹配到下面的书名。
捷特:《.*》不就行了?
藏扇仙:你但可一试。
捷特: 怎么会这样?看来会默认尽可能多的匹配。
藏扇仙:这就是贪婪模式。
2.非贪婪模式
捷特:师傅,何解?
藏扇仙:问号紧加限定尾,即非贪婪
捷特:师傅,这波稳,通过两个限定符进行夹逼
藏扇仙:所以这招名为-控鹤擒龙
二、Java中的正则
藏扇仙:这是为师的看家法宝之一,Java加工机。
捷特:早就听闻师傅用Java代码控制正则如行云流水,可谓天下无敌。
藏扇仙:不止Java,凡是一门语言都和正则撇不开关系,否则就太挫了。现在教你提取信息。
regex
├── src
│ ├── main
│ │ ├── java
│ │ │ └── com
│ │ │ └── toly1994
│ │ │ └── regex
│ │ │ └── Parser.java
│ │ └── resources
│ │ └── regx
│ │ ├── book.txt
│ │ └── regx.txt
1.字符流读取文件
为了使用方便,读取文件来解析,由于我们使用的是字符串,直接用
FileReader
来读即可
/**
* 作者:张风捷特烈 时间:2019-10-24 邮箱:1981462002@qq.com
* 说明:字符解析测试类
*/
public class Parser {
public static void main(String[] args) {
String dir = System.getProperty("user.dir");
File file = new File(dir,"regex/src/main/resources/regx/book.txt");
System.out.println(readFile(file));
}
//读取字符文件
private static String readFile(File file) {
StringBuilder sb= new StringBuilder();
try(FileReader fr= new FileReader(file) ){
char[] buff = new char[1024];
int len = 0;
while ((len = fr.read(buff)) != -1) {
sb.append(new String(buff, 0, len));
}
} catch ( IOException |RuntimeException e) {
e.printStackTrace();
}
return sb.toString();
}
}
2.字符匹配,过滤擒龙
上面的黄色匹配部位都可以通过代码获取。Java通过
Pattern
和Matcher
两类完成 下面这样就可以很轻松地获取文件中所有的书名,无论几十万行,几百万行,通行无阻
private static void regexBook(String target) {
String regex="《.*?》";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(target);
while (matcher.find()){
System.out.println(matcher.group());
}
}
三、举一反三,控鹤擒龙
1.模板匹配
藏扇仙:现在定义一个语法模板
${}
,要求提取所有符合要求的信息
捷特:这还不简单,看我-控鹤擒龙
private static void regexWidget(String target) {
String regex="\$\{.*?}";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(target);
while (matcher.find()){
System.out.println(matcher.group());
}
}
2.网页匹配
藏扇仙:听说你掘金有不少关注者,分析一下页面,获取他们的名字 捷特:这有点意思,最重要的还是分析结构进行夹逼。(这懒加载滑得好累,滑出4000多个,够用了)
private static void regexHtml(String target) {
String regex="username">.*?<";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(target);
while (matcher.find()){
System.out.println(matcher.group());
}
}
藏扇仙:这招控鹤擒龙,你可要多加练习,在提取信息时是非常有用的。
捷特:我也感到了,非常好用,特别是像网页这样规则固定的字符串。下一招呢?
藏扇仙:你先练着,为师歇会。下一招,正则十八式-第三式:龙跃于渊。
- CentOS6.5开放端口,配置防火墙
- JavaWeb(一)Servlet中乱码解决与转发和重定向的区别
- Java魔法堂:四种引用类型、ReferenceQueue和WeakHashMap
- Javascript中数组的使用
- JavaWeb(一)Servlet中的request与response
- 数据库18456错误怎么解决
- JavaWeb(一)Servlet中的ServletConfig与ServletContext
- 语义化HTML:p、h1-6、q、blockquote、hr、address、code、pre、var、cite、dfn和samp
- Win7系统 IIS 调试ASP(aspcmsgbk25) 错误号:3706 提示 “未找到提供程序 该程序可能未正确安装”解决办法
- 普通文件和数据库存储的对比
- JavaWeb(一)之细说Servlet
- jQuery Tools Scrollable使用的限制
- OOAD-设计模式(一)概述
- 导出表结构(数据字典)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- windows server 2012 r2 搭建文件服务器 问题记录 自用 实践笔记
- OpenGL ES 之uniform和varying
- OpenGL ES 绘制纹理
- Win10+Unlocker3+VMware15.5+MacOS10.14+xcode+QT for ios+虚拟机苹果系统 自用 实践笔记
- OpenGL ES 纹理过滤模式-glTexParameteri
- Jenkins时间修改为北京时间
- OpenGL ES for Android 绘制一个点
- OpenGL ES for Android 绘制线
- Jenkins自定义主题
- OpenGL ES for Android 绘制三角形
- Centos7 安装 Tomcat8 的正确姿势 并设置开机自启 实践笔记
- ASP.NET Core 使用 Google 验证码(reCAPTCHA v3)代替传统验证码
- Centos7 安装 Tomcat8 伪集群 的正确姿势 并设置开机自启 实践笔记
- 问题合集,持续更新
- ASP.NET Core Swagger接入使用IdentityServer4 的 WebApi