正则表达式

时间:2019-08-22
本文章向大家介绍正则表达式,主要包括正则表达式使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

正则表达式:  
定义:  
  正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。
作用:
  1、从大段的文字中找到符合规则的内容
   # 爬虫 从网页的字符串中获取你想要的数据
    # 日志分析 提取 2018-8-12 10:---- 花的所有钱
     # 什么是日志 :
     # 2018-8-12 10:00:00 楼下早点摊 3.00
  2、判断某个字符串是否完全符合规则
   # 表单验证 : 手机号 qq号码 邮箱 银行卡 身份证号 密码

规则:    正则表达式 只和字符串打交道,从字符串中找到符合规则的内容

# 字符组 : [] 写在中括号中的内容,都出现在下面的某一个字符的位置上都是符合规则的
   [0-9] 匹配数字
   [a-z] 匹配小写字母
   [A-Z] 匹配大写字母
   [8-9] 匹配8-9
   [a-zA-Z] 匹配大小写字母
   [a-zA-Z0-9] 匹配大小写字母+数字
   [a-zA-Z0-9_] 匹配数字字母下滑线

   65 - 90   ASCII中 A - Z
   97 - 122  ASCII中 a - z

# 元字符
   \w 匹配数字字母下滑线 word关键字 [a-zA-Z0-9_]
   \d 匹配所有的数字 digit [0-9]
  \s 匹配所有的空白符 回车/换行符 制表符 空格 space [\n\t  ]
    \n 匹配换行符 回车 
    \t 匹配制表符 tab 
       匹配空格
  \W \D \S 和\w \d \s取反
  [\s\S] [\d\D] [\w\W]是三组全集 意思是匹配所有字符
  \b 表示单词的边界

# 和转义字母相关的 元字符
  \w \d \s(\n\t) \b \W \D \S

# ^ $
   ^ 匹配一个字符串的开始
   $ 匹配一个字符串的结束

# . 表示匹配 除换行符之外的所有字符

# [] 只要出现在中括号内的内容都可以被匹配
# [^] 只要不出现在中括号中的内容都可以被匹配
   有一些有特殊意义的元字符进入字符组中会回复它本来的意义 : . | [ ] ( )


# a|b 或 符合a规则的或者b规则的都可以被匹配
  如果a规则是b规则的一部分,且a规则比b规则要苛刻/长,就把a规则写在前面
   将更复杂的\更长的规则写在最前面
# () 分组 表示给几个字符加上量词约束的需求的时候,就给这些量词分在一个组

原文地址:https://www.cnblogs.com/xiaomaziya/p/11393672.html