这或许是我见过的最简单的正则表达式教程(三)

时间:2022-05-08
本文章向大家介绍这或许是我见过的最简单的正则表达式教程(三),主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

五一劳动节来啦,小小挖掘机们小编们首先祝大家劳动节快乐!

作为中国放假大学的一员,除了趁着长达8天的五一春假好好休整之外,当然还要忙中偷闲补习一下python的基本知识,今天想带代大家补习的是python中的正则表达式。不论你是否掌握python中的正则表达式,相信你看了此次教程之后会对它有一个更深入的理解和掌握。

话不多说,直接上代码:

github链接:https://github.com/princewen/professional-python3

第五节:标记

"""
作者:文文
正则表达式中的标记
python版本:python3.5

"""

import re

"""
re.IGNORECASE | re.I :忽略大小写
re.DOTALL | re.S : .字符在正常情况下不会匹配换行符,但是使用re.S可以使其匹配换行符
re.MULTILINE | re.M : 多行模式,导致仅能够匹配字符串开始与结束的^和$字符可以匹配字符串内任意行的开始与结束
re.VERBOSE | re.X : 允许复杂的正则表达式以更容易阅读的方式表示。导致所有的空白(除了在字符组中的)被忽略,包括换行符,同时将#当作注释字符
re.DEBUG : 编译正则表达式时将一些调试信息输出到sys.stderr

在python2与python3中,一些字符快捷方式的工作机制存在区别,如w在python3中匹配几乎所有语言的单词,但是在python2中仅匹配英文字符
所以,为了使re模块强制遵循python2或者python3的标准,可以使用如下两个标记
re.Unicode | re.U :re模块强制遵循python3的标准
re.ASCII | re.A :re模块强制遵循python2的标准

使用多个标记:使用|操作符即可

"""
#output : <_sre.SRE_Match object; span=(0, 6), match='Python'>
print (re.search(r'python','Python is awesome',re.I))

#output : <_sre.SRE_Match object; span=(0, 3), match='foo'>
print (re.search(r'.+','foonbar'))

#output : <_sre.SRE_Match object; span=(0, 7), match='foonbar'>
print (re.search(r'.+','foonbar',re.S))

#output : None
print (re.search(r'^bar','foonbar'))

#output : <_sre.SRE_Match object; span=(4, 7), match='bar'>
print (re.search(r'^bar','foonbar',re.M))

#output : <_sre.SRE_Match object; span=(0, 8), match='873-2323'>
print (re.search(r"""(?P<first_three>[d]{3}) # the first three digits
                    -                        # a literal hyphen
                    (?P<last_four>[d]{4})# the last four code
        """,'873-2323',re.X))

第六节:替换

"""
作者:文文
正则表达式中的替换
python版本:python3.5

"""

import re

"""
使用re.sub方法进行字符串替换
"""

# 将匹配到的字符串利用第2、3、4个子匹配内容替换
# output : 2138675309

print (re.sub(r'(+?1)?[ .-]?(?([d]{3}))?[ .-]?([d]{3})[ .-]?([d]{4})',r'234','213-867-5309'))

第七节:预编译

"""
作者:文文
预先将正则表达式编译
python版本:python3.5

"""
import re

""" 使用re.comiple对正则表达式进行预先编译"""
pattern = re.compile(r'(+?1)?[ .-]?(?([d]{3}))?[ .-]?([d]{3})[ .-]?([d]{4})')

"""
可以使用如下两种方式进行调用,输出结果一样
<_sre.SRE_Match object; span=(0, 12), match='213-867-5309'>
"""
print (pattern.search('213-867-5309'))
print (re.search(pattern,'213-867-5309'))

想了解更多? 那就赶紧来关注我们